中国科学院院士何积丰：应对大模型的安全问题需设好“紧箍咒”_亚太时报网

【资料图】

新华财经上海9月7日电（记者王淑娟、杜康）大模型的通用能力让其能够应用到人类生产生活的各个场景中，可谓“无孔不入”，AI的发展因此带来了新的安全隐私问题。如何解决这一隐患，9月7日开幕的2023INCLUSION·外滩大会上，中国科学院院士何积丰开出了他的“药方”：利用对齐技术为大模型“戴上紧箍咒”。

何积丰认为，大模型的安全问题主要是在未经同意的情况下，收集、使用和泄露个人信息。隐私问题既可能发生在训练过程，也可能发生在使用过程中，而大模型的生成能力则让“隐私泄露”的方式变得多样化，造成隐私保护更加困难。

“为了应对这些问题，我们需要大模型对齐技术。”何积丰说，对齐（alignment）是指系统的目标和人类价值观一致，使其符合设计者的利益和预期，不会产生意外的有害后果。

不过，对齐技术同样面临挑战。首先，对齐的基础，人类的价值观是多元且动态变化的，需要保证大模型为人服务、与人为善；其次，大模型的有用性与无害性之间目标也不完全一致。如何对错误进行有效纠正，设好大模型的“紧箍咒”也是挑战。

因此，对齐技术已经成为了一项令人眼花缭乱的跨学科研究，不仅考验技术，也审视文化。何积丰介绍，反馈强化学习是实现对齐的技术途径，目前有两种方式，一种方式是通过人工反馈给模型不同的奖励信号，引导模型的高质量输出；另一种方式，事先给大模型提供明确的原则，系统自动训练模型对所有生成的输出结果提供初始排序。

编辑：林郑宏

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。

推荐内容

中国科学院院士何积丰：应对大模型的安全问题需设好“紧箍咒”

2023-09-07
国家原子能机构：推动核技术应用产业做大做强做优

2023-09-07
“银行系”公募上半年成绩单：农银汇理规模大跌永赢基金表现亮眼

2023-09-07
中化国际推出自主研发对位芳纶系列产品实现光纤光缆领域关键材料国产化替代

2023-09-07
【财经分析】中芯国际等晶圆股行情回调业内认为半导体仍未迎来景气周期

2023-09-07
挪威法院判决支持数据监管机构处罚美科技企业

2023-09-07
十一黄金周将至旅客出游热情持续增长

2023-09-07
恒生指数7日跌1.34% 内房股集体回调

2023-09-07
【高端访谈】期待与行业各方“双向奔赴”——专访特斯拉全球副总裁王昊

2023-09-07
志愿四川注册时组织选错了怎么办（志愿四川注册）

2023-09-01
上半年券商分仓佣金收入近百亿中信证券、中信建投证券分列榜单前二

2023-09-01
同济大学教授黄运成：交易所通过问询函持续督导上市公司再融资行为，力求再融资市场信息披露的准确充分

2023-09-01
锁定期轻松减半？百亿A股疑似“曲线”收购关联资产

2023-09-01
特斯拉“鲶鱼效应”再起不少新能源车企跟随降价以保市场份额

2023-09-01
基金上半年“债强股弱” 隐形重仓股透露调仓动向

2023-09-01
188股中期分红 51股系三年来首次

2023-09-01
中报转亏格力博等年内新股业绩“变脸”

2023-09-01
三六零大模型业务实现近2000万元收入高强度研发投入进入反哺期

2023-09-01
九成上市券商经纪业务收入下滑倒逼财富管理转型加速

2023-09-01
九成上市券商经纪业务收入下滑倒逼财富管理转型加速

2023-09-01
百货零售公司盈利修复显著数智化转型提速

2023-09-01
【看新股】如祺出行赴港IPO：背靠广汽、腾讯最新估值约53.6亿元

2023-09-01
南京新百4140万预付款背后交易对手疑为控股股东关联方

2023-09-01
124家食品饮料公司上半年赚1125亿元白酒上市公司贡献逾七成

2023-09-01
上市航司、机场业绩持续修复暑运收官积极部署迎接新航季

2023-09-01
【环球财经】伦敦股市31日下跌资源股领跌

2023-09-01
三爱三节图画作品_三爱三节画图片大全

2023-09-01
麒麟5G正式回归！一张图读懂华为Mate 60/Pro全系列对比

2023-09-01
【财经分析】数据要素与资产价值亟待释放资管行业数字化转型前景可期

2023-08-31
20130322天天向上完整（求天天向上20120323第二场歌曲）

2023-08-31
【新华财经调查】钢铁行业进入深度调整期兼并重组提速升级

2023-08-31
国家疾控局印发《传染病疫情风险评估管理办法（试行）》

2023-08-31
中信建投上半年分仓佣金收入行业第二打造投行+投研+投资复合“铁三角”

2023-08-31
辐射川陕甘渝首都医科大学附属北京安贞医院南充医院揭牌

2023-08-31
阿里云：持续助力河南打造数字经济新高地

2023-08-31
中国民航局推进亿航EH216-S型号审查亿航智能为投入商业运行做准备

2023-08-31
【高端访谈】专访中国平安谢永林：深化综合金融战略稳固“护城河”

2023-08-31
AI赋能投资终端加速大智慧打造投资因子化理念

2023-08-31
高能环境：上半年营收与利润双双实现两位数增长资源化布局与垃圾焚烧双线勾勒发展新优势

2023-08-31
缩量三连阳，汇川技术或将迎来大涨？看15次回测数据

2023-08-31
国铁集团上半年营收5807亿元同比增长19.6%

2023-08-31
五大行遭遇提前还房贷交行不良率原地踏步

2023-08-31
平顶山：积极探索银行业支持房地产新模式

2023-08-31
【数据图解】8月收官A股市场的真实表现如何？

2023-08-31
中国重汽2023年上半年归母净利润增长超八成

2023-08-31
2023个人社保缴费标准:2023年最新社保缴费基数，定了!

2023-08-31
【大湾区观察】华发股份：2023年上半年营收、现金流大增，盈利能力稳步提升

2023-08-31
中国重汽：加快产品结构优化提升盈利能力

2023-08-31
止跌回升！互联网企业前7个月利润同比增长29.1%

2023-08-31
【环球财经】日经225指数上涨0.88%

2023-08-31