9月20日,百度首次发布“2022十大科技前沿发明”。
其中,AIGC被认为是颠覆现有内容生产方式的新一代技术。AI作画就是AIGC的一种,它可以实现以十分之一的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容。
AIGC背后是预训练大模型创新的突破。早在2019年3月 百度发布了国内首个开源预训练模型文心ERNIE 1.0。目前,百度文心已经升级成为产业级知识增强大模型家族,涵盖以鹏城-百度·文心为代表的语言大模型、计算机视觉、跨模态、生物计算领域的大模型,以及电力、金融、航天等行业大模型,能够从大规模知识和海量数据中融合学习,效率更高、效果更好,具备领先的理解和生成能力。
同时,百度的无人车多传感器融合处理系统专利组合的感知技术目前已经在自动驾驶车辆上得到大规模应用,实测效果漏检率总计减少60%,低矮障碍物漏检率减少83%。
百度CTO王海峰表示,百度一方面要在科技前沿领域加紧创新和探索,攻关核心关键技术,把发展主动权掌握在自己手里;另一方面,将创新成果与产业融合,促进产业发展,助力高水平科技自立自强。百度人工智能技术,全面应用于搜索、信息流以及地图、翻译、输入法、小度智能硬件等产品,助力智能驾驶持续创新,并通过百度智能云输出给各行各业,推动千行百业的数字化转型和智能化升级。
2022十大科技前沿发明,具体如下:
1.跨模态通用可控AIGC
该发明在业界首次提出语言与视觉统一的理解与生成模型,创新提出融合知识的生成,突破了通用可控内容生成技术瓶颈,实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。发明已落地业界首创的图文转视频、高精度数字人生成、文生图等创新产品,大幅提升了内容生产效率,开创了AI内容生成的新篇章。
2.无人车多传感器融合处理系统
该项发明以多传感器融合为核心,完善激光雷达感知能力,构建了环视视觉的独立闭环能力,已经在自动驾驶车辆上得到大规模应用,实测效果漏检率总计减少60%,低矮障碍物漏检率减少83%,有效支撑百度Robotaxi在各种城市复杂道路和场景上无人驾驶能力的构建。
3.知识增强大模型
该发明是百度文心大模型的核心技术,其从大规模知识和海量数据中融合学习,具备领先的理解和生成能力。包括了以全球首个千亿级知识增强大模型鹏城-百度·文心为代表的语言大模型、计算机视觉、跨模态等大模型,以及电力、金融、航天等行业大模型,在百余权威任务取得最好效果,目前已大规模应用于百度的各类产品,显著提升各类产品体验,并通过飞桨和百度智能云支持各行各业的产业智能化升级。
4.深度学习通用异构参数服务器架构
该项发明通过可扩展的架构设计,不仅可以支持基于CPU、GPU、XPU等不同类型硬件的参数服务器架构单独训练,还可以通过强化学习算法将同一深度学习模型训练任务分配到不同类型硬件的计算节点上进行混合硬件异构训练,实现计算资源最优搭配,从而可减少50%以上的深度学习模型训练成本,有效提升深度学习模型训练效率。
5.基于AI的生物计算平台PaddleHelix
该发明提出了一系列基于AI的生物计算创新技术,包括自主研发的高效mRNA疫苗设计LinearDesign算法,全球首个基于几何空间构象的化合物表征模型HelixGEM,端到端的单序列蛋白结构预测模型HelixFold-Single等,大幅提升了新药研发和疫苗设计效率,助力科技抗疫。
6.面向自动驾驶的车路协同关键技术
该项发明构建了车路协同自动驾驶的复杂技术体系与融合协同机制,通过协同感知,解决自动驾驶动静态盲区、超视距、遮挡等一系列感知长尾问题,通过协同决策规划和协同控制解决混行状态下的现实变更、博弈、阻塞和极端场景等问题,降低自动驾驶的接管次数和安全事故风险,保障自动驾驶安全连续运行。
7.全平台量子软硬一体
该发明围绕“量羲”布局,“量羲”是百度推出的基于“乾始”研发的全球首个全平台量子软硬一体化解决方案,提供私有化部署、云服务、硬件接入等一系列服务,最大程度上简化了量子硬件部署到量子服务的全流程。“量羲”具备适配超导、离子阱等多类型主流量子芯片,可实现量子芯片“即插即用”。
8.数字人智能化生产
该发明基于语音、语义和视觉等AI技术,以智能终端为载体,实现人机可视化语音交互服务。借助百度智能云曦灵平台,打通数字人生产、人设管理、内容创作到业务编排全流程。结合UNIT7.0跨模态对话引擎及AIGC技术,支持服务型和演艺型数字人多种人像(2D、3D、卡通)高效生产及运营。
9.智慧城市全要素双总线技术
该发明的全要素双总线包含智慧总线与知识总线,智慧总线构建城市服务的全资源协同开发与运行环境,统一纳管调度城市中的各类数据、算法、算力,为智能化应用开发提供综合技术供应;知识总线依托文心增强的城市多模态大模型及知识图谱、NLP等AI技术,搭建城市全要素融合知识图谱,支撑跨部门、跨应用、跨数据间的知识体系打通和资源共用。
10.自动驾驶多模态行人运动预测
该发明提出一种融合多模态输入特征以及多维度交互模式的深度学习模型,用于预测行人未来6s的运动轨迹,已在Robotaxi业务中落地应用,行人预测准召提升30%,VRU碰撞风险问题解决率95%。
活动现场,百度还为众多高质量专利进行了嘉奖。其中,“基于人工智能的人机交互方法和系统”,荣获第二十二届中国专利金奖,是迄今为止中国智能交互领域唯一的专利金奖。该专利技术运用知识图谱及深度学习等技术,以深度语义理解为基础,实现了跨越语言、语音、图像等模态的智能人机交互。“基于弱监督的字符检测器训练方法”,荣获第二十三届中国专利银奖,这是目前OCR光学字符识别领域唯一的专利奖项,实现了全场景覆盖、超高精度的光学字符检测。