首页 > 综合 > 正文

上海车展的科技底色:大模型背后的智能驾驶“新商机”

2023-04-21 21:32:32来源:21经济网  

21世纪经济报道记者张梓桐 上海报道

“智能电动汽车上半场的竞争是电动化,硬件决定体验,下半场将是智能化,软件决定体验,汽车行业正在从制造属性过渡到消费属性+科技属性。”日前,华为常务董事、智能汽车解决方案BU CEO余承东在一场演讲中作出如此判断。

在4月18日起举办的第二十届上海国际汽车工业展览会上,21世纪经济报道记者在实地走访中注意到,在整车之外,众多人工智能、游戏领域内的明星公司也在跨界亮相“上海车展”,这些企业大多涉及智能驾驶、智能座舱等细分赛道,利用自身的 AIGC(人工智能生成内容)、高清渲染、物联网等技术挖掘汽车市场新的商机。


(相关资料图)

多个参展企业告诉记者,随着智能汽车对人工智能的功能和需求不断提高,场景不断丰富,也对通用人工智能提出了要求。利用通用人工智能技术,一个模型能够输入语音、图像、文字,还有激光雷达的3D点云等多种类型的数据,并完成各种各样的任务。未来通用人工智能基于多模态的基模型可以做视觉的感知,语言的理解、内容的生成和决策的推理。

大模型颠覆汽车行业

作为通用人工智能的一大突出特点,多模态在汽车行业内也迎来了十分契合的落地场景。

“不同于以往的单一智能,单个AI模型输入的数据类型是单一的,只能完成单一任务、适应单一场景。通用模型的出现,能够帮助我们实现不同行业之间的融合,实现产品和场景应用的创新。”商汤绝影智能车舱副总裁许亮在现场告诉记者。

他为记者演示了商汤绝影智能座舱唇语识别功能,其能够噪声环境中利用唇语进行车内交互,避免人声干扰、播放音乐、高速风噪、高速胎噪等场景下语音交互的误触发。

商汤智能座舱,受访者提供)

据许亮介绍,在车舱内有乘员睡觉、或是危险无法发声的情况下,用唇语即可实现命令,触发救援,真正实现「此时无声胜有声」。

“换句话说,即使车内声音非常混杂,也不需要喊叫,只要轻轻地说,智能座舱系统便能精准识别。甚至极端情况下,可以只用唇语给车机下达指令,避免手忙脚乱去使用触屏、物理按键等,并且能减少语音交互带来的惊扰。当前商汤已设置超过40个命令词和唤醒词。”许亮说道。

据许亮介绍,感知和决策的数据闭环是商汤云影上述功能背后的核心能力之一。

他向记者解释了“闭环”的具体含义,“车端可以源源不断地获取大量数据,这些数据如果用手工标注,效率是非常低的。有了大模型,就可以自动进行数据的标注再反馈,去更新车端的模型,让系统的能力更加强大。”

而大模型的出现不仅仅在感知和决策领域改变着智能汽车的生态,许亮表示,AIGC可以生成困难的样本,模型去输入多模态数据。

其中,自动驾驶多模态的大模型可以做到感知和决策的一体化,输出则对3D的环境进行重建实现环境的可视化理解,系统的行为解码可以生成完整的路径的规划。动机的解码器也可以用自然语言去描述推理的过程,进而使自动驾驶的系统变得可以解释。

游戏引擎如何驱动汽车?

在人工智能领域的“硬核”企业外,记者在现场注意到,游戏引擎行业的公司也开始将自身能力输出到汽车行业。

Unity中国首席执行官张俊波在现场接受21世纪经济报道记者采访时表示,Unity在自动驾驶仿真领域的主要优势在于渲染能力,“我们可以帮助车企自动生成场景来设计各种测试,同时搭建不同的场景与环境,这是我们的一个很强的优势。”

unity引擎,受访者提供)

但他同时指出,车厂进行自动驾驶测试时更多是局限在区域进行预测,而在虚拟环境里面进行仿真就需要大量的场景,所以虽然有一些公司与Unity合作,但在目前还处于发展阶段。

但值得注意的是,汽车与游戏对于系统稳定性的要求不可同日而语,由于涉及到人类生命, 车企在选择合作伙伴时必然也会更加慎重。

“汽车不像游戏,游戏只是跑板针,但我们在与车厂合作时会针对车上的内容、性能和一些计算资源做很多的收缩,我们会根据车的单位状况来动态调整帧率和画质,以此来保证不会因为3D渲染而导致别的应用拿不到资源崩溃或者卡顿。”张俊波说道。

与此同时,张俊波也向记者坦言,汽车业务占Unity整体营收的比重并不高,这背后的原因在于,供应商与车企的合作更多依靠长期合作。而为车厂提供服务的市场比较“卷”,很“卷”的市场就意味着会与众多创新型企业一起竞争,同时营收的利润空间也相对较低。

“创新型企业一般都是烧钱,为了扩展市场它会不计成本。所以我们现在仍然处于一个并不稳定,相对早期的市场。”

但张俊波续称,汽车业务仍然是Unity众多业务中增长最快的一个点。

标签:

相关阅读

精彩推荐

相关词

推荐阅读