(资料图片)
不懂中文的外国游客到医院看病,不知怎么去往对应科室。于是,他拍下楼层导览图,询问人工智能助手“骨科在哪层”“耳鼻喉科去哪层”,AI则会根据图片信息给出文字回复……AI大模型技术持续演进,图像问答、图文理解等能力正在加速开源。
8月25日,阿里云推出大规模视觉语言模型Qwen-VL,并对外宣布直接开源。据介绍,该模型除了具备基本的图文输入、识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等多模态信息理解能力,开发者可从魔搭社区直接下载,并投入商用。
全球科技巨头纷纷推出人工智能大模型,开源技术道路得到了国内大多数大模型开发者的响应。《中国人工智能大模型地图研究报告》显示,超过一半国内发布的大模型已经实现了开源,其中开源的主力是高校和科研机构。
除通义千问外,百度文心一言已在近期宣布将逐步开放插件生态给第三方开发者;知乎旗下面壁智能研发的中文基座大模型CPM-Bee 10b也在今年5月宣布全面开源。此外,还有清华大学的ChatGLM-68、复旦大学的MOSS也已实现开源。
不过,也有AI大模型头部产品选择闭源发展,筑牢自己的“护城河”。比如,ChatGPT在火遍全球之后,就选择了闭源发展;华为云也在此前表示,未来盘古大模型不会开源。
目前,开源和闭源谁是主流还无定论。中国信通院云计算与大数据研究所所长何宝宏表示,科技行业的特点是赢家通吃,剩下的企业只能抱团取暖,一起把开源的事情做起来。以移动互联网时代为例,苹果iOS系统出现后,接下来是安卓生态的建设,而这一幕会在AI时代重演。
从技术演进的角度,大模型能力开源是有利于行业整体水平提升的。有业内人士认为,多模态是通用人工智能的重要技术演进方向之一,可让AI从单一感官的的语言模型,变为“五官全开”的多模态模型,其中蕴含着大模型智能跃升的巨大可能。国盛证券也在一份报告中指出,开源有利于防止大公司垄断,破除商业禁用限制。
随着市场对于大模型的选择正在逐渐从“越大越好”转向“越便宜、越高效、越可定制越好”,开源模式被认为更容易搅动着大模型行业已有的竞争格局。百川智能CEO王小川预计,未来80%的企业会用到开源的大模型,因为闭源很可能没有办法对产品做更好的适配。智源研究院院长黄铁军也认为,开源开放正在成为塑造人工智能未来发展的主导力量,中国的开源经过30多年的发展,现在也进入到了蓄势发展的新阶段。