软盟资讯2025年9月11日讯:2025 Inclusion·外滩大会在上海黄浦世博园区拉开帷幕。图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)在主论坛发表主题演讲,抛出震撼性观点:人类数据红利逼近极限,AI正进入以“经验”为核心的持续学习时代,智能体需通过与现实世界的动态交互生成知识,而非依赖静态数据集。这一论断为全球AI发展指明了技术突破方向,同时引发对人机协作伦理的深度思考。
数据红利见顶,AI亟需“经验革命”
萨顿指出,当前主流机器学习模式本质上是“知识迁移”——将人类积累的文本、图像等数据输入AI模型,但其静态、被动的特性导致两大瓶颈:
- 数据依赖性:人类可标注数据量已接近物理极限,模型性能提升空间收窄;
- 持续学习能力缺失:现有AI无法通过试错积累经验,例如ChatGPT无法根据用户反馈动态优化回答,AlphaGo虽能自我对弈,但需依赖预设规则。
“真正的智能应源于与世界的互动。”萨顿以AlphaGo的“第37手”神来之笔和AlphaProof在国际数学奥赛斩获银牌为例,强调智能体需通过“观察-行动-奖励”的闭环持续进化。他定义“经验”为三者构成的动态信号流,并断言:“经验是一切智能的核心,智能体的价值取决于其预测并控制输入信号的能力。”
技术瓶颈待破:持续学习与元学习成关键
尽管强化学习已为AI注入“经验基因”,萨顿坦言,释放其潜力仍需突破两大前沿技术:
- 持续学习(Continual Learning):使AI能像人类一样终身学习,避免“灾难性遗忘”;
- 元学习(Meta-Learning):赋予AI“学习如何学习”的能力,快速适应新任务。
他以DeepSeek通过正反馈循环训练AI的案例说明,当前技术仅实现“经验收集”,尚未达到“经验优化”阶段。“未来的超级智能体必须从经验中提炼知识,而非被动接受人类灌输。”萨顿强调,这将是AI跨越“工具”到“伙伴”的关键跃迁。
去中心化协作:人机共生的伦理答案
面对公众对AI失业、伦理失控的担忧,萨顿提出颠覆性观点:恐惧源于对“零和博弈”的误判,人机繁荣的出路在于去中心化协作。
他以经济市场类比,指出智能体目标多元化反而能激发创新:“当每个AI拥有独特目标,并通过协作实现资源最优配置,其效率将远超单一中心化控制。”萨顿呼吁建立“协作制度”,通过语言、货币等人类独有的协作工具,构建人机互信机制。
“人类最伟大的成就源于协作,AI不应成为对手,而应是放大人类潜能的‘认知外脑’。”他透露,阿尔伯塔大学团队正研发基于强化学习的协作框架,未来或应用于医疗、气候等领域。
宇宙视角:AI是“设计时代”的催化剂
萨顿将宇宙演化分为粒子、恒星、复制者、设计四大时代,认为人类正通过AI开启“设计时代”:“我们不仅是观察者,更是创造者。AI将帮助我们设计出能自我进化的系统,这或许是宇宙赋予人类的终极使命。”
他以勇气与冒险精神呼吁:“对AI的规制应基于科学而非恐惧,去中心化协作制度化是唯一出路。”这一观点与大会“重塑创新增长”的主题高度契合,为全球AI治理提供了哲学框架。
行业反响:持续学习成下一技术竞赛焦点
萨顿的演讲引发学术界与产业界热烈讨论。微软亚洲研究院院长周明表示:“持续学习是下一代大模型的核心能力,谁能率先突破,谁将主导AI下一个十年。”而OpenAI前研究员则指出:“元学习技术或颠覆现有训练范式,AI可能从‘数据驱动’转向‘经验驱动’。”
据大会组委会透露,本次外滩大会特设“持续学习技术专场”,谷歌DeepMind、华为盘古等团队将展示最新研究成果,一场关于“经验”的技术竞赛已悄然打响。
结语
在数据红利消退的临界点,萨顿的“经验时代”论断为AI发展注入新思维。当智能体开始像人类一样在试错中成长,当人机协作超越零和博弈,一个更高效、更包容的智能社会或许正加速到来。正如萨顿所言:“AI不是终点,而是人类认知革命的起点。”
关于文章版权的声明:
https://news.softunis.com/44331.html 文章来自软盟资讯
若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!
