肖仰华:不要让大模型变成一场华丽的烟花秀

2023-07-27 17:44:01    来源:人民邮电报


(资料图片)

国内大模型产业从表象上看热闹非凡、模型林立,但是剥开外壳,从内里看则是发展无序与内核空虚,不免让人担忧。大模型产业发展应该极力避免再走“大炼钢铁”的旧路,需要统一规划、合作协同、立法保障、有序发展、健康发展。

当前我国大模型产业发展在数据方面是有优势的,在算力方面是有基础的,在模型方面也不存在什么秘密,唯独大模型“炼制”的先进工艺是我们所缺乏的,是短期之内难以跟上或者超越的,是需要付出巨大代价进行摸索的。

近日,复旦大学教授、上海市数据科学重点实验室主任肖仰华在一次公开发言中表达了自己对于大模型产业发展的思考。肖仰华认为,ChatGPT所引发的通用人工智能产业变革才刚刚开始,我们要以深入的思考和扎实的实践抓住机遇,正视发展过程中出现的问题,积极规范与引导大模型产业的健康发展。大模型绝不是宣传文案中的噱头,也绝不能成为一场华丽的“烟花秀”。

肖仰华表示,作为亲身经历者,我们正在见证由通用人工智能所带来的前所未有的技术革命。通用人工智能是人类历史上第一次关于智能本身的革命。历次技术突破只是人类智能的产物,而唯独通用人工智能是“智能”本身的革命。我们有可能在人类历史上首次见证一个全新智能物种的出现,它具备人类水平的智能,甚至有可能超越人类的智能。如果机器智能仅限于实现人类的大脑,即便是超级大脑,其作用也仅限于逻辑世界,起到辅助决策作用,但是一个武装了身体的大脑,就完全有对物理世界进行肆意改造的可能。出于保障人类安全的考虑,必须足够重视通用人工智能,极力规范与控制其发展。

大模型的诞生宣告了整个人工智能进入全新的重工业时代。回顾人类历史上的历次技术革命,多始于相对低级的“手工作坊”模式,经过漫长的发展周期,最终形成了成熟的重工业发展模式。重工业化的人工智能有三个鲜明的特征:大模型、大算力和大数据。肖仰华表示,当前我国大模型产业发展在数据方面是有优势的,在算力方面是有基础的,在模型方面也不存在什么秘密,唯独大模型“炼制”的先进工艺是我们所缺乏的,是短期之内难以跟上或者超越的,是需要付出巨大代价进行摸索的。

反观国内大模型产业,从表象上看热闹非凡、模型林立,但是剥开外壳,从内里看则是发展无序与内在空虚,不免让人担忧。一方面,几乎所有国内人工智能产业的重要企业与研发机构纷纷推出了自己的类ChatGPT大模型。这说明,大家都意识到大模型的重要意义,认识到短板与落后,发奋图强、奋力追赶。另一方面却是大模型产业发展已经出现一些问题,包括同质化严重、数据生态不完善、算力掣肘、模型创新有限。当前的大模型产业发展很像20世纪50年代的“大炼钢铁”运动,轰轰烈烈的全民“大炼钢铁”运动造成了人力、物力、财力的极大浪费。大模型产业发展应该极力避免再走“大炼钢铁”的旧路,需要统一规划、合作协同、立法保障、有序发展、健康发展。全民大炼模型的后果一定是大模型成为一场代价高昂的华丽的“烟花秀”。

肖仰华指出,当前我国大模型产业主要存在四个方面的问题:一是技术路线同质化严重;二是数据生态不完善;三是算力掣肘;四是模型创新有限。针对这些问题,肖仰华认为,我们应从数据共享、算力协作、开源生态、人才培养、评测体系、成本控制、应用探索与技术研究等方面推动大模型发展。

肖仰华进一步提出了8个方面的应对措施推动我国大模型产业的发展。一是积极推动数据联盟(数据交易)的建设,促进优质数据的共享与传播;二是大力推动算力联盟建设,促进优质算力共享与协作;三是推动模型实现开源,完善国产大模型的开源生态;四是创新培养方式,培育大模型产业人才;五是建立大模型的诊断与评测体系,保障大模型产业健康发展;六是研究绿色可持续的大模型“炼制”与应用技术,降低大模型落地成本;七是积极探索大模型的应用模式,丰富大模型的应用场景;八是持续研究大模型“炼制”与应用关键技术,完善大模型技术体系。

关键词: