新经济视界 | 前沿技术成果上线即开源大模型赛道开闭源之争加剧

(资料图片)

不懂中文的外国游客到医院看病，不知怎么去往对应科室。于是，他拍下楼层导览图，询问人工智能助手“骨科在哪层”“耳鼻喉科去哪层”，AI则会根据图片信息给出文字回复……AI大模型技术持续演进，图像问答、图文理解等能力正在加速开源。

8月25日，阿里云推出大规模视觉语言模型Qwen-VL，并对外宣布直接开源。据介绍，该模型除了具备基本的图文输入、识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等多模态信息理解能力，开发者可从魔搭社区直接下载，并投入商用。

全球科技巨头纷纷推出人工智能大模型，开源技术道路得到了国内大多数大模型开发者的响应。《中国人工智能大模型地图研究报告》显示，超过一半国内发布的大模型已经实现了开源，其中开源的主力是高校和科研机构。

除通义千问外，百度文心一言已在近期宣布将逐步开放插件生态给第三方开发者；知乎旗下面壁智能研发的中文基座大模型CPM-Bee 10b也在今年5月宣布全面开源。此外，还有清华大学的ChatGLM-68、复旦大学的MOSS也已实现开源。

不过，也有AI大模型头部产品选择闭源发展，筑牢自己的“护城河”。比如，ChatGPT在火遍全球之后，就选择了闭源发展；华为云也在此前表示，未来盘古大模型不会开源。

目前，开源和闭源谁是主流还无定论。中国信通院云计算与大数据研究所所长何宝宏表示，科技行业的特点是赢家通吃，剩下的企业只能抱团取暖，一起把开源的事情做起来。以移动互联网时代为例，苹果iOS系统出现后，接下来是安卓生态的建设，而这一幕会在AI时代重演。

从技术演进的角度，大模型能力开源是有利于行业整体水平提升的。有业内人士认为，多模态是通用人工智能的重要技术演进方向之一，可让AI从单一感官的的语言模型，变为“五官全开”的多模态模型，其中蕴含着大模型智能跃升的巨大可能。国盛证券也在一份报告中指出，开源有利于防止大公司垄断，破除商业禁用限制。

随着市场对于大模型的选择正在逐渐从“越大越好”转向“越便宜、越高效、越可定制越好”，开源模式被认为更容易搅动着大模型行业已有的竞争格局。百川智能CEO王小川预计，未来80%的企业会用到开源的大模型，因为闭源很可能没有办法对产品做更好的适配。智源研究院院长黄铁军也认为，开源开放正在成为塑造人工智能未来发展的主导力量，中国的开源经过30多年的发展，现在也进入到了蓄势发展的新阶段。