【资料图】
【本文来自《谷歌前CEO施密特反对暂停高级AI研发,“这只会让中国受益”》评论区,标题为小编添加】
雨蓝之伤大语言模型是需要天量需要资料去训练,但想更进一步,那就需要更多高质量的语言资料去喂食,同时需要更多的人工去标注引导纠错。在高质量语言资料方面,西方也不是足够的,甚至需要人工编辑提供。我们也不是一点机会都没有。现在的强化学习确实支持AI根据自己生成的文本/信息进行学习,但这也得建立在AI能够生成较高质量文本的基础上。国内的专业语料库相较国外实在太少(两者去除糟粕以后),像国外的arXiv等论文资源库我们真的比较缺乏,本来知网能够对标这些学术搜索平台的,但现在的状况大家都清楚。