8月1日,谷歌推出其Gemma 2系列新成员,即Gemma 2 2B模型。披露的资料显示,Gemma 2 2B利用了知识蒸馏技术,通过从更大、更复杂的模型中学习,将其知识传递到较小的模型中,取得了超出预期的性能表现。

图源:网络

根据谷歌公布的数据,在大模型竞技场LMSYS Chatbot Arena中,Gemma 2B得分高于GPT-3.5-Turbo。与Gemma 2B一同推出的包括安全内容分类器模型ShieldGemma和模型可解释性工具Gemma Scope。

据悉,Gemma 2 2B在“聊天机器人竞技场”排行榜上的表现尤为抢眼,以1130的高分,成功超越了包括GPT-3.5-Turbo-0613和Mixtral-8x7b在内的众多竞争对手,甚至能与一些体量十倍于它的模型抗衡。

图源:网络

得益于NVIDIA TensorRT-LLM库的优化,Gemma22B的部署十分高效,适用于从边缘设备到强大的云环境等多种场景。这使得它能够在数据中心、本地工作站和边缘AI应用中都能游刃有余。

在AI技术快速发展的背景下,谷歌的这一新发布无疑是在激烈竞争中的一次重要突破。对此,ML Commons的执行董事Rebecca Weiss表示,随着AI技术的成熟,整个行业都需要投入更多资源来开发高性能的安全评估工具,期待谷歌在这一领域的持续努力。

图源:网络

此外,Gemma 2 2B的发布正值Meta推出Llama3.1的时刻,该模型在大多数基准测试中也超越了OpenAI的GPT-4o。而OpenAI在上周也发布了更具性价比的GPT-4o mini,价格比GPT-40低了30倍,比GPT-3.5 Turbo便宜了60%。

(8888116)

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com