大模型技术的快速发展将人工智能研究推向了新的波峰,其超出人们想象的性能表现让整个社会为之震撼。那么,目前大模型技术的真实性能究竟达到了怎样的水平?其技术发展面临怎样的挑战?发展趋势如何?
在7月12日的北大光华度小满大模型公开课上,IEEE Fellow、中国科学院自动化所研究员宗成庆指出,大模型技术的突出优点是其通用性,在各种任务上、各种问题上都有较好的回答,几乎是万能的。但目前在实际的应用场景里尚未看到大模型发挥巨大的作用,至少不像人们的预期那么令人惊艳,是因为大模型不是在所有情况下都强于具体任务场景下专门训练研发的工具。以机器翻译为例,对于资源丰富的语言,大模型的翻译能力与Google等专门研发的机器翻译系统的性能非常接近,如中译英、德译英等,特别是对于一些需要背景知识和常识的专业词语,大模型能够将它从互联网上学习到的世界知识融入到翻译过程中,译文的准确性、流畅性和对一些特殊语言现象的处理都更好,有很好的用户体验感,但是在资源较缺乏的语言上,大模型的翻译性能与专门训练出来的机器翻译系统相比仍有较大的差距。在其它的自然语言处理任务上可以得到类似的结论。
对于大模型发展带来的机遇和挑战,宗成庆认为,互联网和移动通讯技术的快速发展和全球化信息时代的到来,人类对高智能、高水平信息处理技术的需求越来越强烈。大量公司和政府投入的研究资金,也为大模型技术的快速发展提供了很好的机遇和前景。与此同时,大模型的出现也为相关领域和行业的发展带来了新机遇,因为大模型是一项通用的技术,无论哪个领域、何种任务都可以用大模型为行业服务,从而提高工作效率,减少人力劳动强度。
宗成庆认为,幻觉对 “AI for Science”等研究不见得一定是坏事。“大模型可以产生很多人想象不到的结论或答案,从坏的方面来看,它得到的结果可能是错误的。但是从另外一个角度来讲,它可以极大地扩展人的思维空间,而很多科学研究往往是在想象不到的情况下实际发生的。”
大模型对各个领域所带来的冲击是不可逆转的,接受和适应大模型技术的发展是大势所趋。那么,普通人如何拥抱大模型技术呢?
宗成庆表示,一方面,要掌握基于大模型的研究范式,为新技术研发提供帮助,另一方面,又不能盲从,要首先清楚自己的目标是什么。“是做基础研究、技术创新,还是做应用系统开发?要明确目标,找准定位,量力而行,不能一哄而上。大模型不是大跃进,更不能有病乱投医,沉下心来,做好自己的事情,做国家需要的事情,做不可替代的原创技术,才是立足之根本。”
北大光华度小满大模型公开课是北京大学光华管理学院与度小满联合推出大模型公开课。公开课邀请了国内多位大模型、人工智能领域专家,为AI技术从业者、大学生、科技爱好者等群体科普大模型技术的最新进展及应用,并深入分析人工智能对教育、就业等领域的影响。
标签: #模型