本报记者 张靖超 北京报道
AI框架被誉为AI时代的“操作系统”,其在连接算力、数据和算法方面扮演着桥梁的角色。据中国科学院科技战略咨询研究院近日公布的预测,2024年中国AI框架的新增市场中,昇思(MindSpore)的市场份额将达到30%,其已成为全球主流AI框架的第一梯队。
这是中国AI框架在智能时代的一次重要突围,体现出我国在自主创新道路上的坚定步伐。但与此同时,随着人工智能高速发展,大模型技术加速演进,参数量走向万亿级,序列长度迅速增长,模型结构走向多模态甚至全模态,模型计算过程从单模型单任务走向多模型多任务,深度学习和强化学习相融合,AI框架面临前所未有的挑战与机遇。
对此,在12月14日的昇思人工智能框架峰会上,华为ICT战略与业务发展部总裁彭红华表示,人工智能框架是AI时代的操作系统与软件底座,领先的AI框架需要同时具备“更高效、更敏捷、更开放”的技术与生态能力,未来华为将持续投入昇思,坚持以开源的方式,促进中国人工智能框架生态健康、高速发展。
AI框架的意义
《中国经营报》记者了解到,在AI技术体系中,AI框架处于“承上启下”的位置,南向使能多样化算力,北向孵化各类算法模型,是人工智能应用创新的土壤和源泉。
“在大模型时代需要什么呢?时间倒回去年,大家谈得更多的是需要卡、需要算力、需要硬件。有一位业界知名学者曾很幽默地说过:‘谈卡伤感情,不谈卡就没感情。’这是过去一年的真实写照。到了今天,经过这一年各方努力,把这个问题稍稍缓解,现在有了硬件资源,怎么把资源用好?就是AI大模型训练的框架。”智谱AI CEO张鹏这样说道,“对创业企业来说,卡不便宜,成本巨大。如何把千万元人民币的资源发挥到极致,依靠的就是AI框架和基础设施。首先提升大模型的训练性能,这是必须最优先考虑的事情。如何做到这一点,就是依靠框架的不断改进。硬件提升没那么容易,软件层面如何适配硬件和上层算法,这是我们能做的事情,也是昇思做得很好的事情。”
中国移动对此深有体会。今年,中国移动在哈尔滨建成了全球运营商最大的单体计算机群,但要驾驭好如此大规模的计算装置、发挥出最高性能,AI框架至关重要。
“在一年多的时间里,因为中国移动集群分阶段建设,并不是一次性交付这么大的集群,所以经常遇到集群的迁移和并行策略的迁移。如果并行策略发生迁移,就要重新做实验。”中国移动研究院人工智能与智慧运营中心高级总监王斌说,“我们跟昇思团队攻关了模拟模型编译技术,可以把并行策略的实现时间从原来以周而单位,缩短到以天为单位,这是巨大的跃升。由于训练任务需要做迁移,模型需要经常重新拉齐,拉齐的过程一开始耗时比较长。我们跟昇思团队一起打造了编译缓存和执行器调度技术,让模型任务重新拉齐的时间,从以小时为单位优化到以分钟为单位。综合来看,昇思加NPU的软硬件协同组合已经可以媲美业界最优秀的组合,而且更加稳定。”
王斌还认为,目前我国在半导体先进工艺方面受到了限制,突破需要一定时间。“我们可以基于昇思框架在算法和算子层面开展更多的创新。”
清华大学助理研究员、面壁智能首席研究员韩旭认为,模型脱离不了软件栈和硬件的发展,他所在团队与昇思在软件栈上的合作过程中感到,软硬协同的发展,一方面让端侧模型能在更低资源的设备上运行起来,另一方面,能把更大尺寸的模型在更小的硬件、更小的低资源场景上做到很好的部署。
“随着未来像昇思这样的软件栈的发展越来越快,可以想象,在未来一到两年内,包括具身智能和各种各样更加智能的穿戴设备,甚至更好的人机交互模式会越来越多,越来越有想象力。”韩旭说。
中国AI框架的突破
在过去数十年中,AI框架领域一直由谷歌(Google)和Meta(前身为Facebook)等国际巨头主导。但随着中国AI框架的迅猛发展,昇思、飞桨、BytePS等AI框架诞生,逐渐打破了这一格局。
其中,昇思被业内视为发展最快的AI框架之一。开源四年来,昇思开源社区已汇聚了超过3.7万个开发者,全球下载量突破1100万次。“近几年,昇思开源社区影响力快速提升,目前已跻身全球主流AI框架第一梯队,并将迅速发展成为具有全球影响力的开源社区。”中国人工智能学会副理事长、中国工程院何友说,“昇思不仅提供便捷的操作接口,还像变速箱和传动轴一般,调度算力激发系统最佳性能。昇思创新项目大模型孵化、科学研究、端侧应用等多个技术方向,部分实践已经在金融、能源、制造、科研等行业发挥着重要价值,促进了相关领域的科技和产业发展。”
市场调查企业Omdia发布的报告显示,昇思和飞桨在国产AI框架中的开发者认知度排名,目前已经超过了众多国外非常成熟的AI框架。
随着技术持续迭代创新以及应用场景层出不穷,国产AI框架展现出广阔的前景。当下,全球对AI行业的投入已呈现“井喷”态势,AI框架市场也呈现出蓬勃发展局面。
“中国AI框架市场规模正在呈现快速增长的态势,预计到2025年,整体市场规模有望超过数十亿元。”昇思MindSpore开源社区理事长丁诚说。
目前,昇思开源社区已经孵化支持50多个主流大模型。“我们和中国商飞上海飞机设计研究院联合打造了东方·翼风的仿真大模型,与南方电网深度合作打造了驭电大模型。接下来我们将引入更多的企业及科研机构,创新整体框架支撑更多场景应用与科学创新。”丁诚表示。
开源创新的作用
对于大模型的开源与闭源,业界有着许多争论。中国电信人工智能研究院高级算法总监宋双永认为,开源降低了行业科研人员的准入门槛,否则,从零训大模型成本太高。很多科研人员基于已经开源的大模型基础进行自己的科研,会加速整个行业的进步速度,对整个行业有益。
“从另一个角度来看,从社会意义来讲,无论是互联网大厂还是运营商,作为有能力训练基础模型的厂商,我们把自己花了这么多人力、数据和运算资源训练出来的模型开源,让大家免费使用,这是一种社会责任感,对行业起到了很好的推动作用。还有一个小点,开源是方便大家把开源模型的参数接口进行统一化、归一化,这样使得大模型方向更加标准化,大家的使用更加方便。”宋双永说。
对于AI框架而言,开源的意义也不言自明。据华为方面介绍,昇思自2020年开源以来,技术持续创新,生态繁荣发展。目前已孵化、支持50多个国内外主流大模型;开源版本已累计获得1100万次下载,覆盖全球130多个国家和地区的2400多个城市;3.7万多名开发者参与社区贡献;昇思与360多所高校科研院所展开教学及科研合作,联合1700多位生态伙伴,打造超过2000个解决方案;PaperwithCode网站显示,支持基于昇思原创论文发表累计超过1700篇,位列全球第二、中国第一。
“就我们自己的研究体会来说,在现在的情况下,我国的开源创新已经比较好地展开了。其中有几个代表性的企业和模型,有启智、启元、昇思、阿里Qwen、智谱等。这些生态和生态代表企业是我国做AI开源创新最重要的力量。”中国科学院科技战略咨询研究院学术委员会副主任刘海波提出了自己的观察,在开源发展的情况下,无论从基础、平台、算法和应用上,都有很多实质性得到了开展。在开源发展过程中,虽然我们看到了生态位已经基本齐聚,虽然我国与发达国家相比仍有一定的不足,但我们在AI框架内有自己的创新主导者,同时我们也推出了大量的政策,这些政策在发挥着实质的推动作用,有的已经开花结果。
记者了解到,在开源的发展过程中,技术内容开源对AI的发展至关重要,而技术内容的开源主要有三类主体,就是高校、企业和基金会。
“没有清华、北大等高校院所的基础研究,这些开源大概也走不远。同时企业的贡献也非常重要,像华为这样的科技企业在人工智能的基础软件、基础模型的创新与开源上投入了大量的资金与人才,做了很多重要工作与贡献,与开源基金组织共同加速开源生态发展和技术创新。”刘海波同时建议,“无治理体系开明、不持续。在开放创新里,无论是AI领域还是其他领域都有一个治理体系的问题。开源社区自发的共享、协同、合作、激励机制、人才培养,需要全体开发者和伙伴的共同参与,实现共建共治,开源与创新互补。”
(编辑:吴清 审核:李正豪 校对:颜京宁)
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com