谷歌宣布开源多模态大模型Gemma3 媲美DeepSeek

新闻中心

您的位置：

谷歌宣布开源多模态大模型Gemma3 媲美DeepSeek

2025-03-15 05:50:21

来源：

谷歌宣布开源多，模态大模型Gemm。a3 媲美D，e"epSe"ek

[CNMO科技消息]日前，谷歌首席执行官SundarPichai宣布开源最新多模态大模型Gemma-3，主打低成本与高性能。Gemma-3提供四种不同参数规模的版本，分别为10亿、40亿、120亿和270亿参数。即便在参数量最大的270亿版本中，仅需一张H100显卡即可实现高效推理。相比之下，同类模型若要达到类似效果，至少需要提升10倍算力。因此，Gemma-3也是目前性能最强的小参数模型之一。

在性能测试方面，根据LMSYSChatbotArena的盲测数据，Gemma-3的表现仅次于DeepSeek的R1-671B，优于OpenAI的o3-mini和Llama3-405B等知名模型。

在架构设计上，Gemma-3延续了前两代的通用解码器Transformer架构，并进行了多项创新和优化。为解决长上下文带来的内存占用问题，Gemma-3采用了局部和全局自注意力层交错的架构：每5个局部层之间插入1个全局层，局部层的跨度仅为1024个token。由于只有全局层负责处理长上下文，局部层仅关注1024个token的小跨度，从而有效降低了内存占用。

多模态能力是Gemma-3的一大技术亮点。该模型能够同时处理文本和图像，并集成了定制版的SigLIP视觉编码器。这一编码器基于VisionTransformer架构，通过CLIP损失的变体进行训练。

为了评估Gemma-3的性能，谷歌在MGSM、Global-MMLU-Lite、WMT24++、RULER、MRCR等多个主流平台进行了测试。结果显示，Gemma-3在多模态任务中表现出色，例如在DocVQA、InfoVQA和TextVQA等任务中，其性能显著优于前代模型。在长文本处理方面，270亿参数版本的Gemma-3在RULER128K任务上达到了66.0%的准确率。

日常见肖战演员金世佳现场观看CBA焦点战所有学生本硕博连读不用内卷徐娇分享店员会主动劝烟的店电视剧《我叫赵出息》开播男子拍下神秘生物凌晨出警安抚74岁女儿照顾96岁妈妈护士自学飞针采血法减轻患者病痛感 43岁孙艺珍背部线条叙利亚要出现第二个阿萨德了吗

（内容来源：新京报）

作者： 编辑：丁欣彤

绍兴网版权与免责声明：

① 凡本网注明“稿件来源：绍兴市新闻传媒中心”的所有文字、图片和音视频稿件，版权均属绍兴网所有，任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站，在下载使用时必须注明“稿件来源：绍兴网”，违者本网将依法追究责任。 ② 本网未注明“稿件来源：绍兴市新闻传媒中心”的文/图等稿件均为转载稿，本网转载出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用，必须保留本网注明的“稿件来源”，并自负版权等法律责任。如擅自篡改为“稿件来源：绍兴网”，本网将依法追究责任。如对稿件内容有疑议，请及时与我们联系。③ 如本网转载稿涉及版权等问题，请作者在两周内速来电或来函与绍兴网联系。（联系电话：0575-88623761 ）

越牛新闻客户端
越牛新闻微信
绍兴发布微信
越牛新闻微博
绍兴发布微博

爆料

新闻热线

0575-88880000

投稿信箱

zjsxnet@163.com