中国市场巨大、数据丰富、应用场景丰富,完全可以用完善的应用生态来带动底座大模型的进步,走一条“农村包围城市”的路线。
作为人工智能产业发展过程中的里程碑事件,ChatGPT代表通用人工智能技术的成熟,宣告人类社会技术进步有可能进入快速增长期,甚至一个指数发展期。在类ChatGPT大模型领域,中国尚处于起步阶段,需做进一步战略规划并统筹发展。就相关问题,《瞭望东方周刊》近日专访了上海市数据科学重点实验室主任、复旦大学教授肖仰华,探讨我国大模型产业的发展路径。
知识底座
《瞭望东方周刊》:通用大模型一定程度上刷新了我们对人工智能领域的认知,如何理解它带来的变革?或者说大模型有哪些能力?
肖仰华:大模型是人类文明所积累的海量知识容器,其所具备的通识能力,就是开放世界的理解能力。现在跟ChatGPT聊天,聊任何行业、学科的问题,它都能给出一个看起来不错的答案,虽然其仍可能犯一些事实错误、一些逻辑错误,但基本不会太偏离问题主旨——比如问出生日期却答出生地点。它还具备一定的“自知之明”能力,对于超出范围或者伦理敏感的问题,会拒绝回答。大模型这种对人类开放世界的理解力,已达到甚至超越普通人的水平。传统人工智能产品的“智障”问题已基本解决,这种开放世界的理解能力,对垂直领域(垂域)的认知非常关键,因为垂域应用是建立在通用大模型的通用认知能力基础之上的。
大模型有组合创新能力。我们在指令学习阶段让它学了A任务、B任务,它以后有可能泛化出求解A+B任务的能力。这种组合泛化,以前做不到,今天能做到,通用大模型让“举一反三”成为可能。
大模型有忠实的指令理解和执行能力,尤其是超大模型。只要给它指令、要求、约束、规范、规则,它就一定能够按照要求一步步完成任务。这本质上是一种情境化生成能力。我甚至认为,大模型智能本质就是情境化生成能力,因为大模型在提示越来越丰富时,生成的效果越来越好。
大模型有复杂任务的分解能力和规划能力。现实中很多场景都是复杂任务,需要一步一步求解,先做什么,再做什么,按照顺序进行合理编排,这就是规划能力。
大模型还有强大的符号推理能力。以前人们只是把大模型当做知识容器来看待,只期望其提供需要的知识。但今天不得不承认大模型也一定程度上具备类似知识库(知识图谱)所具备的推理能力,比如常识推理、数值推理等能力,当然这方面能力还需要进一步提升。
《瞭望东方周刊》:为什么说单有通用大模型不足以解决行业领域很多问题,需要发展垂域大模型?
肖仰华:因为具有上述能力,通用大模型好比是一个宽广的知识底座,但仍然缺乏专业知识的深度,缺乏专业领域复杂应用的长程推理能力。ChatGPT这类大模型本质上只是实现了在开放环境下的人机对话,或者叫开放闲聊,但开放闲聊并不能帮我们解决实实在在的工作场景中的复杂决策任务,比如要做设备故障排查、疾病诊断,都是严肃复杂的决策场景。在这些场景中需要丰富的专业知识、复杂的决策逻辑、宏观态势的研判能力、综合任务的拆解与规划能力、复杂约束的取舍能力、未见事物的预见能力、不确定场景的推理推断能力等。
大模型的开放闲聊过程中可能存在两个问题:一是“幻觉”问题。与ChatGPT聊天,有时它说得头头是道,但仔细分析,会发现它正在胡编乱造一些不存在的事实。同时因为其语言风格一本正经,让普通人很容易相信它,即便是领域专家要从它有板有眼的文本中识别虚构和错误也是一件不易的事。
二是缺乏领域“忠实度”的问题。解决任何专业领域的问题都要求大模型不要自己根据通识去自由发挥,而要严格遵循这个领域的规范、用符合这个领域的知识体系来回答问题。但是我们去尝试了一些通用大模型,发现如果不做一些调教优化,它总是会超出你给定的领域文档自由发挥,进而犯错。
所以,一个基本的判断是:单单利用现在的通用大模型不足以解决行业很多问题。实际应用需要的是事实正确、忠实于领域知识与文本的垂域大模型。从这个判断出发,当下我们要发展面向垂域的大模型,要发展通用大模型的外围插件,要采取大模型和知识图谱、传统知识库相结合的策略。
赶上差距
《瞭望东方周刊》:面对ChatGPT所引发的通用人工智能产业变革,国内企业应该如何抓住大模型产业机会?
肖仰华:大模型绝不是宣传文案的噱头。我们正在见证由通用人工智能所带来的前所未有的技术革命。通用人工智能是人类历史上第一次关于智能本身的革命。历次技术突破都是人类智能的产物,而唯独通用人工智能是“智能”本身的革命。
大模型的诞生宣告了整个人工智能进入全新的重工业时代。回顾人类历史上的历次技术革命,多始于相对低级的手工作坊模式,经过漫长的发展周期,最终形成了成熟的重工业发展模式。重工业化的人工智能有三个鲜明的特征:大模型、大算力和大数据。
关于文章版权的声明:
https://news.softunis.com/17666.html 文章来自软盟资讯
若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!