ChatGPT与汽车交互猜想：智能取代人工？_车家号_发现车生活

Will AI Replace Humans?

最近，人工智能再一次吸引了全世界的目光：一面是ChatGPT-4发布，微软继续追加投资，OpenAI估值突破290亿美元；另一面，百度发布了号称“中国版ChatGPT”的文心一言，再到微软最新发布据说可以取代10亿打工人的嵌入人工智能的Office。

人工智能这个概念自上个世纪开始就被人们讨论和幻想着，不过当时大家都觉得这个东西离现实很遥远，当ChatGPT突然被摆在大家面前时，人们在惊喜之余也开始思考这个东西会对自己的行业产生什么影响。今天，ICONA就从汽车交互设计的角度，来看一看ChatGPT会带来哪些冲击。

图1 Chat GPT官网介绍

图2 文心一言官网介绍

图3 微软Office Copilot 人工智能

类ChatGPT与“传统人工智能”

On-board AI

在ChatGPT诞生之前，汽车交互行业就已经在使用“人工智能”技术了，语音助手已经是现在车机的“标配”。所以在讨论ChatGPT的新冲击之前，有必要区分一下ChatGPT和现在已经被普及的“智能语音助手”到底有什么区别。

现在，大家在所有车上能用到的语音助手，其实离真正意义的人工智能相差甚远。业内经常有句调侃的话叫“有多少智能就有多少人工”，其实和你对话，帮你执行各种指令的其实并不是车里面的小A小B，而是站在背后的产品经理，交互设计师和程序员。

早期的语音助手，你要它做一件事需要你按照特定的语序/格式，字正腔圆的说出标准指令，以至于大家都觉得这个东西鸡肋，不好用，毕竟正常人平时哪会“像机器人”那样说话。后来，人们想到了一个新的办法—“自然语音识别”，也就是让语音助手可以接受人们更加随意口语化的表达，还能做出相应的指令。不过，这并不代表语音助手真的理解你的意图并且分析出要执行的命令，举个例子，比如你说“车里面好冷”，语音助手并没有天冷了开空调这样的认知，而是开发把“冷”定义为一个关键词，只要你提到了，就开始执行打开空调、调高温度等指令（当然也是提前就被定义好的）。可是人类的自然语言十分多样，语音助手到底“理解”你的能力到底有多强，其实取决于开发环节到底做了多少关键词定义——也就是有多少智能就有多少人工。

图4斑马智行语音助手

不过不管怎么说，这套做法给用户带来的直观感受就是与语音助手的对话更亲切了；感受语音助手更亲切了，用户自然也就更爱用了。除了自然语言识别，另一个让提升用户好感的因素就是形象设计，再加上各种语音助手动作的配合（当然也是按照既定算法播放的动画），让语音助手看起来更加“有生命有智慧”。所以，传统的智能语音助手主要就卷两个方向，一是让更多的人加更多的班，来不断优化关键词策略，二是设计越来越复杂的语音助手形象动画（甚至是硬件的动作），让其看起来更灵动。

图5 各类车载语音助手

ChatGPT一类的人工智能，则是直接换了一条路。这里先稍微讲一下创造“人工智能”的两条路数，其一就是上面讲的，按照标准的“算法”逻辑，从input人为规定一系列逻辑到output；但是毕竟人的语言和思维极其复杂，很难程序化。随着计算机算力的不断升级，有人想出了另外一条思路，就是深度学习和进化算法。比如前些年大火的阿尔法狗，并没有谁来教他下围棋，而是靠AI自己和自己对弈，并依靠一套筛选机制来自己掌握下棋的“技巧与思路”；这样的创造AI的方式当数据量突破一定值后，AI的能力会迎来井喷式的增长，虽然开发者也不知道阿尔法狗的围棋思路，但它就是会下而且下得很厉害。前一种AI就像智慧爷爷创造的海尔兄弟，生下来就会很多，但是智慧爷爷的上限在哪，海尔兄弟的上限就在哪；而后一种AI则是一个什么都不会但是学习能力超强的小孩，只要活的足够久（数据量够大）就可以创造奇迹。

ChatGPT与文心一言就是这样一种思路，虽然没有人教会它理解人类的语言并给出“正确的”回应，但是在海量数据的训练下，他就是学会了，而且表现出了一定的“类人智能”。

图6 阿尔法狗与李世石对弈

ChatGPT能改变什么

ChatGPT Era

对于这个话题，我们ICONA团队中的“科技潮人”们也一直议论纷纷。首先，可以肯定的是，那些琢磨关键词与响应策略的产品设计和开发们就都不需要了。抖个机灵，毕竟对汽车交互从业人员的影响也算对汽车交互的影响。言归正传，这个东西如果上车，到底会给汽车交互带来哪些想象的空间？笔者可以想到两点，一是语音助手在交互系统中的能力会得到大幅扩展，二是交互系统的层级框架也会有大的革新。

图7：全新的聊天机器人模型： ChatGPT

第一点很好理解，基于ChatGPT强大的理解和响应能力，基本可以说对于用户说的每一句话，语音助手都能够正确理解并分析出需要去执行的指令。除此之外，ChatGPT在多轮对话中也表现出强大的“联系上下文”能力，要知道现在的语音助手的多轮对话往往是针对多指令的，如果对于单一事情，聊的轮数一多，语音助手就很容易做出驴唇不对马嘴的回应。这样的体验提升会大大提高用户使用语音助手的信心。

另一方面，对于一些需要用户介入进行更多操作的功能，给予ChatGPT强大的编程和绘图能力，也能够自己现场拿出一套图形界面来给人操作。比如用户说调高音量，语音助手不是机械每次都升高特定的音量值，而是直接在屏幕上拎出一个音量条，让用户能够自己顺手调节，精确又高效；亦或是一些更复杂的语音指令，并不需要开发们提前做好一套固定GUI（图形交互）界面，而是让语音助手根据用户需要动态的给出当时最适合的交互。

图8：让Chat GPT写一个小游戏

除了对话与响应外，ChatGPT最强大的本领当属其处理大量数据的自学习能力，这样能够保证它能“审时度势”地给出最适合的回应，甚至结合车主的使用习惯和车辆整体状态为用户提供主动的服务。

伴随着语音助手能力的提升，也会对交互系统的框架层级产生很大的影响。基于目前语音助手的能力和可靠性（命中范围窄，命中准确性不高），语音交互在交互系统中基本是作为“锦上添花”的存在，语音交互只能覆盖一部分简单功能，当用户需求不在语音的可执行范围，或若干轮尝试下来语音都无法正确理解用户时，还得是要靠用户自己动手。这就要求交互架构上还是GUI（图形交互）主导，VUI（语音交互）辅助，一是屏幕空间的占用不能太大，二是语音要容易退出或者被其他GUI功能顶掉。当语音助手的能力范围和可靠性都得到质的飞跃后，以后的交互系统完全可以是VUI主导，GUI辅助的格局。

前面讲到ChatGPT的自学习能力，就可以接着聊一聊ChatGPT对交互系统架构的另一个影响了。最好的交互系统一定是层级很浅的，用户要用的功能就刚好被摆在那里，省的翻来翻去的去找。虽然现在的车机系统中场景推荐卡片（或语音主动推荐）越来越常见，但是这些推荐并不是真的“因人而异”，同样的，基于上面讲到的“传统”人工智能技术，也是当用户触发了某个特定条件，车辆就会推送特定的功能。

ChatGPT是会自我学习甚至是被教育的，这样可以要求这个系统理解了车上的所有功能后，结合用户习惯和场景选择性的推出最适合的功能，甚至可以优化用户多步骤操作的交互，让用户更快的达成想要执行的功能。

本土优势的“文心一言”

ERNIE Bot

讨论ChatGPT的话题，肯定绕不开文心一言。虽然被称为中国版ChatGPT，但是，根植中文和国内数据的文心一言或许能带给我们更大的想象空间。

图9 文心一言被认为是中国版ChatGPT

首先，文心一言对于中文的理解会更加优秀。毕竟是基于大数据训练的AI，文心一言对中文更加精通。相比于Chat-GPT通用化的语言模型，吸收国内数据的文心一言在理解中国式的表达上肯定会更占优势，一是国内“俚语”的理解，包括人们常用的口语化的不合语法的习惯表达；第二是国内不断更新的“网络语”与“流行语”；第三就是一直深耕中文语音的百度，对国内方言（毕竟中国的方言体系可以算是全世界最复杂的了）的理解要远远优秀于国外，这些点都会让文心一言成为更让国人感觉亲切的智能助手。

其次，百度在国内相关的信息知识上有更强大的数据优势。比如，百度一直在发展的3D城市和高精地图，会给文心一言带来更加丰富的国内城市/道路/地理知识，这会使得在面对特定问题时，文心一言能够给出更合适的回答。就目的地附近推荐而言，或者你有一天假期，可以让对国内道路/景点更加了解的文心一言规划一个从交通到吃喝一应俱全的自驾行程攻略。

图10 百度高精3D城市，甚至包含商场内各楼层信息

这个本土优势立竿见影，3月16日百度正式发布文心一言，两天后，长安逸达便带着“国内首款搭载文心一言的量产车型”的标签正式上市。而集度、吉利、岚图、红旗、长城、零跑等多家车企也已经确认将优先内测体验文心一言并接入其相关能力，文心一言的“朋友圈”其实早已悄然形成。智能座舱，则是目前阶段文心一言上车的最核心功能。

而在不久的将来，百度也计划将包括搜索、智能云、Apollo自动驾驶、小度智能设备等在内的多项主流业务与文心一言进行整合，融合成“文心一言”大生态，与更多车企共同推进智能汽车的进化。

ChatGPT还有多久能上车

How far ahead

前面讲了很多美好的畅想，但是从实际情况来看，如果要让ChatGPT上车，综合考量实际因素还是有很多问题有待解决。

图11 ChatGPT上车还有坎

首先聊一个最致命的短板，就是响应速度。如果大家去网页上玩过ChatGPT的话，相信都体会过他的反应速度了，不能算慢，但是和正常的人与人的对话速度相比显然是差了许多。上一代语音助手虽然不够智能，但这种明确的指向性的算法策略可以做到更少的代码量和运算代价。所以，很多车企除了联网的一些对话外，会将很多车辆功能的语音指令做到本地，这样就可以做到“秒响应”，毕竟驾驶时候的交互，效率还是非常重要的。

而ChatGPT目前对话都还要依赖于网络的通畅，这么庞大的一套智能对话体系做到本地显然对存储空间和算力都提出了极高的要求，高到综合考虑成本，能耗，产量等因素，短期内没办法普及到量产车这样的大批量工业产品上（总不能开一辆拉着大型服务器满街跑的车吧）。这么一看，一个虽然能力不行但是干活很快的语音助手，总归比能力很强但是拖拖拉拉还要看状态（网络好不好）的语音助手来得实惠的多。

第二个就是安全问题。目前，大部分车厂对语音助手能够去调用的功能接口都有严格的限制，尤其是一些涉及到安全性的功能。事实上整车对于功能模组之间的能力和权限都有着严格的定义和限制，鸡蛋都放在一个篮子里总归是不安全，这样能够防止一个模块出问题全车跟着遭殃，现在这里面语音显然是那个最容易出问题的功能。虽然ChatGPT能力很强，但这种智能产品出错的概率还是稍微大了点，毕竟对于车来讲，出错的代价可能就是人的生命安全，让ChatGPT接管全局这样的方案短时间内还是很难被接受的。

第三点就是市场接受度或者说用户习惯还是要循序渐进的改变。有很多人并不喜欢语音交互，可能是工作了一天觉得多说一句话都嫌累，下了班还得和车说话，想想就烦。还有人对于主动推荐，或者是软件的智能猜测会有心理上的反感，会有被监视或揣测了的感觉。不过这点一如传统手机到智能手机，燃油车到新能源，用户的习惯和认知是可以被改变和培养的，只是需要时间。

图12酷炫的未来人机交互

虽然仍有许多困难存在，但是我们认为， ChatGPT这类的技术会指向汽车交互系统下一阶段的完美形态（在脑机接口还没有完善成熟之前），毕竟谁不憧憬以后只要动动嘴就能享受更多方便和快乐的汽车生活呢, 想想都很酷。

*参考资料：图1/11引用自网易；图2引用自百家号；图3引用自Youtobe; 图4引用自猎云网；图5自制；图6/8/10/12引用自百度；图7引用自百家号：自由侠部落SF；图9引用自百度。

*本文为ICONA发表的设计观点分享，文章不含任何商业目的，其引用的图片、LOGO、车型名称和品牌均属各自法定著作权所有人。如有侵权，请联系我们删除。

*本文为ICONA原创文章，未经授权不得转载，否则ICONA将保留向其追究法律责任的权利。后台留言，获取相关转载须知。