大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark
梦晨发自凹非寺量子位|公众号QbitAI让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中
微软发布 Babylon.js 7.0 网页 3D 渲染引擎:支持几何节点等特性
IT之家3月29日消息,由微软员工开发的Babylon.js是一款基于JavaScript的3D图形渲染引擎,可以在HTML5浏览器中运行,昨日发布7.0大版本更新。Babylon.js7.0版本带来了主要新特性如下:▲几何节点NodeGeometry几何节点NodeGeometry:Babylon.js现在支持几何
GitHub 最新 AI 工具可帮助用户自动修复代码中的漏洞和错误
IT之家3月21日消息,GitHub今天为所有AdvancedSecurity(GHAS)许可用户推出了全新的“代码扫描”功能(预览版),用于搜索GitHub代码中潜在的安全漏洞和编码错误。这项新功能可利用Copilot与CodeQL(IT之家注:CodeQL是GitHub开发的代码分析引擎,用于自动执行
麦当劳中国携手微软全球智能云 推进全流程数字化智慧创新研发
麦当劳中国选择微软作为其首个智能化深度创新伙伴,以微软全球智能云矩阵中的Azure云基础设施服务、Microsoft365现代办公服务、GitHub开发社区服务为基础,借助微软在前沿数据智能、自然语言互动、智能辅助办公、自动化编程等国际先进领域的研发能力和技术支持,共同拓展新一
用同样的Benchmark测试,Zilliz 急了?
3月15日,知乎用户“几点James”(Zilliz合伙人和技术总监栾小凡)对“零一万物笛卡尔(Descartes)包揽权威榜单ANN-Benchmarks6项数据集评测第一名”发表了看法,称“已经有一年多没关注这个排行榜(ANN-Benchmarks)了。主要是因为它测试的内容与用户的实际需求渐行渐远
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
鱼羊克雷西发自凹非寺量子位|公众号QbitAI马斯克说到做到:旗下大模型Grok现已开源!代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型——就是说,这是当前开源模型中参数量最大的一个。消息一出,Grok-1的GitHub仓库已揽获
突发:马斯克Grok开源!
作者|云鹏编辑|心缘6个月掏出3410亿参数自研大模型,马斯克说到做到!智东西3月18日消息,就在刚刚,马斯克的AI创企xAI正式发布了此前备受期待大模型Grok-1,其参数量达到了3140亿,远超OpenAIGPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型,遵照Apache2.0协议
GitHub热榜第一:百万token上下文,还能生成视频,UC伯克利出品
克雷西发自凹非寺量子位|公众号QbitAI今日GitHub热榜榜首,是最新的开源世界模型。上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini1.5,伯克利出品。强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。LWM支持处理
Nothing 正式推出 Glyph 手机背板 LED 灯组开发套件
IT之家2月13日消息,据Nothing官方新闻稿,Nothing公司今天推出了GlyphDeveloperKit开发套件,允许开发者在第三方App中控制NothingPhone背部的“Glyph”LED灯。IT之家注意到,目前相关SDK已经在GitHub中上线,但API密钥仅对部分社区成员开放,有相关开发兴
离大谱!网易云音乐这个大瓜,把我看傻了
2024年刚一到,网易云音乐也一改往日静悄悄的作风,风风火火宣布大改动。小雷之前和小伙伴们聊过的,就在1月9号,网易云音乐重磅官宣将全新改版。喏,网易云音乐这次全新改版的主题是「回归初心」,怎么个「回归」法呢?首先改变的是Slogan,从旧版的「音乐的力量」改回到初版