滚动:“擂响战鼓”的中国AI大模型
《中国经济周刊》 记者 孙冰 | 北京报道
(相关资料图)
谁是当下中国乃至全球的“科技顶流”?AI大模型几乎毫无争议。
5月28日,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国,目前中国10亿参数规模以上的大模型已发布79个。而从大模型区域分布来看,中国已有14个地区在开展大模型研发,其中,北京、广东、浙江、上海处于第一梯队,数量最多的北京有38个大模型,第二位的广东有20个。
在全球大模型竞赛中,中国科学院院士、中国计算机学会开源发展委员会主任王怀民表示,过去5年世界上参数量超过百亿的大模型大约有45个,其中有32个出现在美国,9个出现在中国,4个出现在欧洲。
但是,发展迅猛、一路“狂飙”的中国AI大模型们,仍然需要一些冷静的思考。
大模型“智能涌现”令人兴奋,
AI能力开始不可预测
人工智能技术已经发展了很多年,为什么大模型出现后,学界、产业界乃至社会大众会如此兴奋甚至害怕呢?北京智源人工智能研究院院长黄铁军教授告诉《中国经济周刊》记者,AI之前更像是人类的助手,根据人类的指令做着人类能够确定结果的工作,比如你设计AI打开电灯,AI就只会打开电灯。
“但是,大模型之所以现在如此受关注,是因为当人工智能的参数量达到了百亿级别之后,出现了拐点或者说突变,人工智能的能力开始不可预测了,就是所谓的‘智能涌现’现象,人工智能一些没有被预期到的能力开始出现,这种不可预知让大家都很兴奋。”黄铁军说。
黄铁军介绍,这一波人工智能浪潮的核心任务就是训练模型,所谓模型,在人工智能领域的意思很明确,就是一个神经网络,而神经网络并没有什么特别的地方,我们人脑就是个神经网络。
“但人脑是一个很庞大的神经网络,大约有800多亿个神经元通过100万亿个神经突触进行连接,所以人脑的能力非常强。对比一下,最接近人类的猩猩,其脑部神经元的数量和连接的数量差不多是人脑的1/3,猴子是人类的1/10,而一条虫子大概有300多个神经元,但其实也可以有很多生命活动了。”黄铁军解释说。
当然,目前人工智能模型的神经网络比人脑要简单很多。但是,随着数据规模的增长和算力的增加,模型的参数量也在不断增加,能力也就不断随之提高,于是就有了“大模型”,即参数量巨大的神经网络,当然其智能程度就更高。
大模型是有史以来最大平台革命,将10倍于移动互联网
“AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命,它将比Windows、安卓要大10倍甚至更多,它会让每个应用改写,会重构人类的工作,会让有创意的那些人的聪明才智被放大10倍或者更多。”创新工场董事长兼CEO李开复说。
李开复还表示,他非常认同美国著名VC机构投资人安德里森·霍罗维兹(Andreessen Horowitz)的观点:大模型的市场未来到底多大很难把握,它最小将是所有软件,最大可能将代表着人类所有的努力。
“人类历史上可能也就只有三四次这样的机会。大模型赛道是未来的兵家必争之地,因此,自主创新将是中国企业的必经之路和重大责任。”李开复告诉《中国经济周刊》记者。
李开复已经投身人工智能超过40年,他戏称自己是“投资人中最懂AI的,AI科学家中最懂投资的”。他从投资和产业发展的角度认为,随着大模型的崛起,人工智能的发展已经从AI 1.0时代进入AI 2.0时代。
李开复认为,在AI 1.0时代,单领域的数据集、数据集和模型各成孤岛,且数据标记工作量和成本非常可观;但AI 2.0时代大模型的出现可以解决这些瓶颈障碍,人们用超级巨量数据训练具有跨领域知识的单一大模型,微调后就可以执行五花八门的任务。这是一个全新且巨大的平台机会,所有的应用和界面都要重写,AI 2.0应用会进入爆发期。
“虽然目前大模型还是非完美的,但它已经拥有相当大的商业价值,甚至几十万亿规模的商业价值。”李开复预测。他表示,大模型目前还有“一本正经地胡说八道”的问题,因为AI的推理能力也来自同一个技术引擎,如果你把它的胡说八道降到接近零,它的推理能力也几乎没有了。也就是说,那些让它聪明的理由,也是让它胡说八道的理由。
“我们相信未来这是可以解决的问题。比如可以让AI与人类协作,我们不是把AI拿来作为一个终极的应用,而是把它当作一个人类‘助理’。比如可以先让AI起草法律文件或者新闻稿件的初稿,最后由人类的律师和记者进行把关和调整,这样就能够在享受AI强大能力的同时,又避免了AI会犯的错误。”李开复表示。
《中国经济周刊》记者 马铭悦I摄
大模型竞争没有绝对壁垒,但平台席位不会太多,成败关键在生态
黄铁军表示,大模型最终会成为未来社会的一种新型基础设施,其提供“智力”能力,输送给千行百业和千家万户。因此,人工智能进入大模型时代之后,会形成一个体系化的产业生态。
简单来说,就像电力时代的电网一样,千行百业、千家万户都在用电,但并不是自己发电,而是有专门的发电厂,发电方式也是多种多样,如煤电、火电、风电、核电……也有企业去生产各种各样的电器。
“有了大模型就像人类学会发电了,目前可能是一种技术路径走通了,但后续一定还会有各种各样‘发电手段’不断演进迭代、降本增效。这意味着,就像不会有国家或企业垄断发电一样,大模型也没有绝对壁垒和门槛,大家比拼的是成本和效率,竞争的是应用和生态。”黄铁军说。
李开复也表示,未来的AI 2.0时代会有三大生态层:基础模型层、中间层和应用层。“以大模型为代表的AI 2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面‘赛马’。”他说。
至于创业者和投资人如何选择自己在这个庞大生态中的地位和角色,李开复认为,需要基于不同的判断。
比如,基础模型层的大模型平台公司当然机会巨大,天花板会非常高,就像PC互联网时代的微软和移动互联网时代的谷歌,但风险也是最大的,因为平台公司一定是少数;如果是做应用层,风险就没有那么大,而且每一个生产力领域都可能成长出垂直领域的领先公司,但规模可能无法与平台公司相比。对于投资人来说,则永远是在风险和回报之间寻求平衡。
人工智能、智能制造业岗位颇受欢迎
中国大模型在“狂飙”,但“平台席位”不会太多,安全威胁也要警惕
聚焦到中国,李开复认为,大模型和AI 2.0也是中国不容错过的历史机遇,而且中国也有自身的优势。
“中国拥有丰富的中文语料和庞大的市场,通过发展AI大模型,中国可以推动创新产业的发展,实现科技与经济的双重红利。而且中国拥有庞大基数的年轻工程师和最坚韧的企业家,为发展AI大模型提供了强大的人才支持,技术领先、策略灵活、市场反应快、能打硬仗、落地执行力强,将是中国大模型公司的成功关键。”李开复表示。
黄铁军也对中国在大模型领域的发展充满信心。但也有一些现象需要格外关注。比如,大模型火了之后,还是出现了一哄而上、同质化竞争加剧的现象。
“数据就是这些数据,算力也就这么多,如果大家都去训练模型,一定很多工作是重复的,这其实也消耗了大量社会资源,不利于大模型生态的发展。”黄铁军说。
“如果类比PC互联网时代和移动互联网时代,全球范围内的大模型底层平台很有可能不会超过三个。就像移动互联网初期也曾有很多操作系统,但最后只剩下iOS和安卓。很多企业想要成为第三个,投入巨大但最终都铩羽而归。”黄铁军说。
黄铁军认为,中国甚至全世界大模型的运营体系都会是屈指可数的,虽然还不能预判是几个,但肯定不可能是十几个或几十个,根本没有市场可能性。“更多企业参与进来,不是运营平台,而是做应用。类似于苹果生态和安卓生态,会生发出很多应用。”他说。
因此,黄铁军建议,一方面要依靠“市场的手”,让市场的“大浪淘沙”发挥主要作用;但同时也需要“政策的手”予以引导和调节,推动、鼓励和统筹产学研进行合作,共建大模型的产业生态。
纵观全球,打造人工智能生态,有开源和闭源两种路线。王怀民表示,大模型因其不确定性形成开源模式和预研模式同时推进的基本格局。在美国32个大模型中,有15个开源。中国的9个大模型中,有5个开源。
但一位人工智能领域的资深投资人告诉《中国经济周刊》,现在国内确实有一些大模型就是把国外的开源代码进行“套壳”和微调,“GPT3.5人家可能还会开源给你,但GPT4.0短期内人家是不可能会给你用的”。所以,中国要发展大模型,还是要自主创新。而且因为大模型的发展涉及数据问题,从监管的角度,这几乎意味着中美一定是“平行宇宙”。
大模型越来越强大,担心安全风险和被AI替代不如学习与AI合作
随着人工智能技术,尤其是大模型的快速发展,安全问题也被提高到新的维度。“AI一定会给数字世界带来新的安全威胁。”奇安信集团董事长齐向东告诉《中国经济周刊》记者。
“这个安全威胁主要来自两个方面:一是AI可以模仿,甚至以假乱真地实施诈骗;二是AI能够帮助黑客提高攻击水平,帮助一些黑客写程序、写代码、制定攻击方案和提供攻击策略。这些都给数字世界带来新的威胁。”齐向东说。
齐向东表示,网络安全技术是一个伴生型技术,一定是先有数字化技术的创新,再有安全技术的创新,这是矛和盾的关系,就像没有一种特殊材料的矛出现,就不会出现特殊材料的盾。现在大模型等AI新技术还处在萌芽状态,应用还只是试探性的,发展还是第一要务。
但齐向东表示,他相信网络安全的技术和产品的创新,一定能够解决新时代AI带来的这些网络安全问题和风险。“奇安信正在抓紧跟进AI的各种场景,探索解决AI给我们带来的新的网络风险所需要的新技术和新的安全解决方案,我相信,未来安全不会拖AI发展的后腿。”他说。
至于大模型何时会影响到普通人的生活,黄铁军表示,其实已经在发生了。比如现在人工智能已经在替代人类的某些工作,尤其是不具备原创性的部分。
以绘画为例,黄铁军认为,像毕加索、齐白石这种开创性的创作,人工智能还无法替代,但如果只是模仿和组合之前的创作,那人工智能肯定是效率更高的。再比如像爱因斯坦、牛顿这种原创性的理论创新,人工智能也无法做到,但如果是常规编程和做数学题,那人工智能确实可以做得更好。
但黄铁军强调,AI和人类之间并不是简单替代,而是需要合作。“比如,一个企业原来需要1000名程序员,但接入了AI大模型能力之后,可能只需要几十个就够了,通过人和AI的合作来获得更高的效率和产生更好的效果。”
而且黄铁军认为,这种影响力会很快传递到教育领域。
“现在很多学生有疑问,不是先问老师,而是先问AI,因为AI掌握的知识和信息可能更全面、更丰富,然后自己根据AI给出的资料就可以学习了。这个会是非常大的冲击,未来教师在学生的成长过程中到底发挥什么作用?扮演什么角色?AI在不停学习,人自然也是要不停学习,教育肯定是会长期存在下去的,只不过我们教育的目的是什么?教育的方式是什么?都需要重新思考。”黄铁军说。
更为“可怕”的是,我们常说:读书破万卷,下笔如有神。“一个人一生能读完一万本书已经非常厉害了,但AI一天就能读100万本书,而全人类共有书籍约1亿部,AI再读3年左右就全读完了,那AI的能力提升速度可想而知,和人类完全不在一个尺度上。”黄铁军说。
科大讯飞副总裁章继东告诉《中国经济周刊》记者,AI技术尤其是大模型的发展,会对中国的教育带来巨大挑战。
“中国教育的核心在于知识的传递和知识的获取,尤其是考试的考核目标主要是以知识为主,那些记忆好、训练多的孩子就能得高分,而这些是最容易被AI替代的能力。未来,我们将更需要具有创造力、有批判思维和创新思维的人才。但我相信,随着大模型成为各行各业的好助手,其也会成为教育的好助手。”章继东说。
(本文刊发于《中国经济周刊》2023年第11期)
2023年第11期《中国经济周刊》封面
关键词: