今日要闻!科技巨头纷纷“走火入模”

4月国内AI大模型遍地开花

2023年无疑是生成式人工智能的关键一年，就在今年4月，国内AI大模型已经遍地开花。科创企业争相入局的AI大模型究竟有何魅力？该领域的飞速发展将对企业产生哪些影响？近日，记者带着这些疑问采访了多位业界专家。

“百模大战”正式打响

(资料图)

从时间上来看，被称为中国版ChatGPT的百度“文心一言”于3月16日发布。

4月7日，在阿里云峰会上，阿里云大语言模型“通义千问”正式推出，现阶段该模型主要定向邀请企业用户进行体验测试。

4月10日，商汤科技董事长兼首席执行官徐立宣布推出商汤日日新大模型体系。同日，昆仑万维（300418）宣布，其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型“天工”3.5发布在即，于4月17日启动邀请测试。搜狗创始人王小川也在当天正式宣布入局中国大模型创业，和前搜狗COO茹立云联合创立人工智能公司。

4月11日，毫末智行正式官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型，中文名“雪湖·海若”。同日，科大讯飞（002230）在互动平台表示，关于讯飞预训练大模型的详细信息，将于5月6日产品发布会上进行发布。

4月13日，知乎创始人、董事长兼CEO周源在“2023知乎发现大会”上宣布，知乎联合面壁智能发布中文大模型“知海图AI”，邀请AI加入知乎“讨论场”。

“抢占AI大模型市场对于科创企业来说非常关键，同时，AI大模型一旦无法快捷发布，将对企业现有的生态造成很大冲击。”北京大学深圳研究院5G&6G课题组组长胡国庆表示，“因此，企业近期密集发布自家AI大模型，以便在未来市场抢占先机。”

究竟谁的AI大模型能够“跑赢”？胡国庆说：“首先看算力，也可以说是一个门槛；同时需要海量的数据和参数来供大模型进行学习。其次是应用生态，跑赢整个领域很难，企业可以考虑在一两个细分市场中抢占一席之地。”

AI大模型发展加速

在中国规模庞大的互联网用户的支撑下，国内企业在算法和算力上有望不断实现突破并取得领先。从算力到应用，已经按下了AI大模型发展的加速键。

相关专家表示，AI大模型的竞争很可能像20世纪90年代PC操作系统的竞争一样，具有“垄断性”的倾向和趋势。其本质还是和操作系统一样，都是一个技术新时代的“基础设施”。一旦某一个AI大模型或操作系统占领了市场，它将获得相对于其他后来者无可比拟的优势。

知名数字经济学者、DCCI互联网研究院院长刘兴亮说：“未来AI大模型的发展方向之一，一定是降低模型的规模和复杂度，提高运行效率，使其能够在更多设备上运行。其次，提高大模型在不同领域和任务上的适应性和泛化能力，使其能够更好地解决实际问题。此外，将大模型应用于多种数据类型，实现多模态信息融合和跨领域学习，同时提高大模型的可解释性，使其更容易被人理解和信任。”

大模型将引发产业变革

“随着AI技术应用到不同行业、不同领域，对AI模型的需求也日益多样化，这促使科创企业针对不同场景、不同需求开发定制化的AI大模型，以满足市场的多样化需求。”刘兴亮表示，大型AI模型的普及将推动AI技术在各个产业的应用，在医疗、教育、金融等领域，AI技术将有望带来更高效、更准确的服务，提高整体产业的效率。

除了最先拥抱AIGC（生成式AI）的游戏、营销等内容生产行业，AI大模型还将在智慧交通、智能制造等智慧城市的众多场景中促进效率提升。

在商汤科技智慧城市与商业事业群CTO赵瑞看来，AI大模型还将从算力、算法和平台范式等方面引发城市智能化、数字化进程的变革。“从算力的角度来看，由于AI大模型对算力的需求大幅增加，城市中算力中心的量级将从P（PetaFlops，每秒1000万亿次浮点运算）向E（ExaFlops，每秒100亿亿次浮点运算）跃变。从算法层面看，基于AI大模型能实现多个功能模型自动串联，快速完成复杂视觉任务，这种变革将在智慧城市的长尾业务如交通违章判定、工业智能制造等场景中带来效率提升。”

生态体系需要共建共享

据浙商证券（601878）研报，参照ChatGPT的初始投入与电量消耗，国内开发与之同等性能的大模型资金投入约为56亿元，每年电费投入约1.7亿元。与此同时，接入ChatGPT API（应用程序编程接口）的成本也相对较高。

普通企业如何以较低成本应用AI大模型？腾讯云行业生态总经理曹言表示，更好的方式是企业从大模型中蒸馏出相对较小的模型，应用到细分场景中，如企业客服、企业知识沉淀等。具体应用场景不可能由一家公司独立完成，需要繁荣的生态体系共建共享共生。他还表示，AI大模型作为一种语言助手，在多种语言翻译、文本缩放、识别编程语言等方面表现出了出色的能力，但具体到企业应用，大模型还需要其他能力的加持，如数据能力、制图能力等。