(资料图片仅供参考)
周鸿祎表示,现在大家有个问题,谈起大模型,就是走openAI之路,但openAI真的完全适合企业发展吗?“如果各位用过ChatGPT,会发现它无所不知,但如果遇到一些深入的行业问题,就会发现其缺乏对行业的深刻理解。因为,通用大模型是用通用数据去训练的。”
周鸿祎认为,当通用大模型与企业业务深度结合时,会发现大模型并不了解企业,如果企业在大模型上上传数据,就可能会导致数据泄露,同时,训练大模型的成本也非常高。
周鸿祎以电脑发展为例,他认为,工业革命不会自然而然发生,比如电脑刚发明的时候并没有工业革命,因为只有少数精英团队在应用,当个人电脑被发明后,每个企业都买得起电脑,才产生了工业革命。“所以,我们应该把大模型拉下神坛,即把大模型做小,进行行业化、企业化、专业化、垂直化,我非常反对说大模型是操作系统,这样的话,全世界可能最多只有3套大模型,就被垄断了,大模型应该更像电脑发展,每个企业根据自身的应用场景,打造数个大模型,这样的大模型对企业更了解,未来,经过企业训练后的大模型将是企业数字化最核心的数字资产。”
此外,周鸿祎还认为,大模型不一定在云端,可以在终端,也可以在边缘,“把大模型做小后,只解决垂直领域的任务,因此,参数不一定要千亿、万亿,百亿模型就够用了,这样可以降低企业使用大模型的成本。”
对于算力,周鸿祎认为,企业可以在开源大模型的基础上进行微调,用小规模算力进行部署、推理和计算。“我国在原始创新上可能有点儿落后,需要时间追赶,但我国人口众多、企业众多,如果深圳几十万家企业都训练出来小规模的大模型,这其中就会产生很多产业创新。”
针对大模型的挑战问题,周鸿祎表示,大模型存在安全挑战,同时,还有大模型幻觉、模糊挑战的问题,这是未来需要在大模型应用中解决的问题。
编辑 张晓翀 校对 赵琳