4月国内AI大模型遍地开花

2023年无疑是生成式人工智能的关键一年,就在今年4月,国内AI大模型已经遍地开花。科创企业争相入局的AI大模型究竟有何魅力?该领域的飞速发展将对企业产生哪些影响?近记者带着这些疑问采访了多位业界专家。

“百模大战”正式打响


(资料图)

从时间上来看,被称为中国版ChatGPT的百度“文心一言”于3月16日发布。

4月7日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出,现阶段该模型主要定向邀请企业用户进行体验测试。

4月10日,商汤科技董事长兼首席执行官徐立宣布推出商汤日日新大模型体系。同日,昆仑万维(300418)宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型“天工”3.5发布在即,于4月17日启动邀请测试。搜狗创始人王小川也在当天正式宣布入局中国大模型创业,和前搜狗COO茹立云联合创立人工智能公司。

4月11日,毫末智行正式官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。同日,科大讯飞(002230)在互动平台表示,关于讯飞预训练大模型的详细信息,将于5月6日产品发布会上进行发布。

4月13日,知乎创始人、董事长兼CEO周源在“2023知乎发现大会”上宣布,知乎联合面壁智能发布中文大模型“知海图AI”,邀请AI加入知乎“讨论场”。

“抢占AI大模型市场对于科创企业来说非常关键,同时,AI大模型一旦无法快捷发布,将对企业现有的生态造成很大冲击。”北京大学深圳研究院5G&6G课题组组长胡国庆表示,“因此,企业近期密集发布自家AI大模型,以便在未来市场抢占先机。”

究竟谁的AI大模型能够“跑赢”?胡国庆说:“首先看算力,也可以说是一个门槛;同时需要海量的数据和参数来供大模型进行学习。其次是应用生态,跑赢整个领域很难,企业可以考虑在一两个细分市场中抢占一席之地。”

AI大模型发展加速

在中国规模庞大的互联网用户的支撑下,国内企业在算法和算力上有望不断实现突破并取得领先。从算力到应用,已经按下了AI大模型发展的加速键。

相关专家表示,AI大模型的竞争很可能像20世纪90年代PC操作系统的竞争一样,具有“垄断性”的倾向和趋势。其本质还是和操作系统一样,都是一个技术新时代的“基础设施”。一旦某一个AI大模型或操作系统占领了市场,它将获得相对于其他后来者无可比拟的优势。

知名数字经济学者、DCCI互联网研究院院长刘兴亮说:“未来AI大模型的发展方向之一,一定是降低模型的规模和复杂度,提高运行效率,使其能够在更多设备上运行。其次,提高大模型在不同领域和任务上的适应性和泛化能力,使其能够更好地解决实际问题。此外,将大模型应用于多种数据类型,实现多模态信息融合和跨领域学习,同时提高大模型的可解释性,使其更容易被人理解和信任。”

大模型将引发产业变革

“随着AI技术应用到不同行业、不同领域,对AI模型的需求也日益多样化,这促使科创企业针对不同场景、不同需求开发定制化的AI大模型,以满足市场的多样化需求。”刘兴亮表示,大型AI模型的普及将推动AI技术在各个产业的应用,在医疗、教育、金融等领域,AI技术将有望带来更高效、更准确的服务,提高整体产业的效率。

除了最先拥抱AIGC(生成式AI)的游戏、营销等内容生产行业,AI大模型还将在智慧交通、智能制造等智慧城市的众多场景中促进效率提升。

在商汤科技智慧城市与商业事业群CTO赵瑞看来,AI大模型还将从算力、算法和平台范式等方面引发城市智能化、数字化进程的变革。“从算力的角度来看,由于AI大模型对算力的需求大幅增加,城市中算力中心的量级将从P(PetaFlops,每秒1000万亿次浮点运算)向E(ExaFlops,每秒100亿亿次浮点运算)跃变。从算法层面看,基于AI大模型能实现多个功能模型自动串联,快速完成复杂视觉任务,这种变革将在智慧城市的长尾业务如交通违章判定、工业智能制造等场景中带来效率提升。”

生态体系需要共建共享

据浙商证券(601878)研报,参照ChatGPT的初始投入与电量消耗,国内开发与之同等性能的大模型资金投入约为56亿元,每年电费投入约1.7亿元。与此同时,接入ChatGPT API(应用程序编程接口)的成本也相对较高。

普通企业如何以较低成本应用AI大模型?腾讯云行业生态总经理曹言表示,更好的方式是企业从大模型中蒸馏出相对较小的模型,应用到细分场景中,如企业客服、企业知识沉淀等。具体应用场景不可能由一家公司独立完成,需要繁荣的生态体系共建共享共生。他还表示,AI大模型作为一种语言助手,在多种语言翻译、文本缩放、识别编程语言等方面表现出了出色的能力,但具体到企业应用,大模型还需要其他能力的加持,如数据能力、制图能力等。

推荐内容