百木园-与人分享,
就是让自己快乐。

HMI语音设计探索-入门篇(二)

回顾一下上一期我们讲诉了HMI的语音的介绍和车载语音交互(VUI)基本原则等内容,如果第一次看的小伙伴们,请回到我们入门第一篇开始阅读。

一、VUI&GUI的优缺点

再分析一下图形设计(GUI)和语音设计(VUI)之间的优缺点,那我们先从优点开始说起。

  • 前面我们有提到VUI只需要听and说,而GUI则需要触控屏幕内容,在效率和安全方面没有VUI好,触控操作比语音操作要相对会慢,语音交互方式中驾驶者无需离开方向盘。
  • 在对于整套车机系统而言,GUI学习的成本远高于VUI,因为VUI只要会交流即可,无须像GUI一样学习触控交互手势、在哪里点击等一系列问题。
  • 还有一点,图形设计是一种已经预设好了操作路径和交互方式,页面之间存在这层级交互的基本关系,用户需要根据指定的操作进行,而VUI则突破了GUI的限制,交互更快捷了,举个例子:“导航去虹桥机场”,VUI则一步到位,而GUI首先需要找到导航应用的入口,然后再点击搜索输入框,输入#虹桥机场,确认完毕之后,再点击导航,我的天呐我写的都很烦了,说真的还不如语音一步到位呢。
  • 说完优点后,我们在反思一下VUI还有那些没有GUI做的好的点。

  • 语音交互涉及到3块内容,语音识别,识别用户所说的内容,其次语言理解,这边会关乎到方言理解的问题,毕竟我国语言博大精深,难以参透哈哈哈,最后是语音的合成,这三块内容如果有一块出了问题,最后反馈的结果可能并不是用户想要的答案。而图形设计有这统一的执行操作指令,不会出现什么bug问题,如果有,那肯定就是这款车机在测试的时候测试人员遗漏的问题,可以投诉奥。
  • 整套车载的GUI设计都会有这一套严谨的操作逻辑,有这明确的信息分布和页面的层级关系,但是VUI的功能不可见(除非你看那个使用手册,哈哈哈哈哈)所有的场景VUI都需要去探索,在引导性方面会弱很多,所以在买车的时候抓住销售员使劲的问哈,毕竟你花了一大笔钱来买车了,在试驾的过程中也要多去询问,就先点到这里了。
  • GUI是可以全场景交互,不限制于任何场景,而VUI则会受到的场景因素较大,有较多场景中不适用语音交互,最直接的就是设置中的内容。
  • 语音设计对于用户的一个记忆力是一个考验,如果一个很长的TTS反馈,用户不知道哪里才是自己所需要的信息,因此在做VUI设计的时候尽量简短高效的句子,而GUI信息都会呈现在页面中,所以这个点要相对于优胜于VUI了。
  • 总结一下:

    以自然交互为主的,声音,显然是最自然的交互形式,但不能完全取代图形GUI,而是更好的协作。

    尽量减少界面的形式设计,加强情感化的交互形式体验,将智能化更好的融入到车载系统中去,让每一位用户能够更好,更便捷,更安全的驾驶着汽车,是我们全体设计师的初衷。

    想用一个成语总结一下“相辅相成”,就是这个意思。

    二、语音设计需要考虑几个要点

    1. 一定要想好从哪里开始,到哪里结束

    我们首先假设一个场景,调节空调温度的语音设计,那VUI设计师需要将这个场景的对话要贯穿该流程中去,那接下去要考虑这段对话可能出现的任何状况,以及相对应的解决反馈内容,再第二点设计VUI语法中,我给大家演示一下空调全方案案例。

    2. 设计VUI语法

    语法就是用户输入给机器的指令,VUI的设计师需要了解对话设计的意图,尽量要考虑用户可能表达的所有方式,将最常用的表达方式提取出来,作为指令的模版,当然越多越好,这样给用户体验带来的感受会更好,能够解决用户的问题概率也会提高,别到时候语音助手反馈:“已经超出我能力范畴 or 您换个说法试试”。

    我一听到这些就炸毛了,后面就不可能再去使用它了,因此VUI设计师一定要多考虑一下指令。

    语法我会在我工作实际案例有特别详细的讲解(在实际案例篇幅 – 使用语音场景分析里面),这个特别重要,大家要细细的品。

    空调案列分享:

    用户一开始的输入指令可能有 “打开制冷模式”、“打开加热模式”这些都会有点官方定义的语法感觉会很正式

    下面在延展一下用户轻松的说辞 :“有点热了帮我开一下空调”、“今天太冷了,车温度好低啊” 其实用户的说法有很多,但是空调的模式就这么几种。

    所以需要抓住关键词 #热、#冷、#高、#低,什么意思呢?

    因为这些关键词是起到决定性因素的内容,其他的修饰词语可能会千变万化,所以语音助手一旦检索到该词汇,就可以做出判断,到底是制冷、还是制热、还是通风等功能。

    先简单就介绍这一个,后面还有很多案列,大家好好看。

    3. 如何设计好回答用户的问题

    在语音基础介绍中也有提到过TTS,他是语音交互中最主要的回答方式,就是将VUI设计者撰写好的对话设计脚本,通过TTS转化为语音去播报。

    回答能够给用户带来最直接的感受,回复是好是坏,会直接影响到这款语音产品的体验,想要设计好我想谈两个大方向,设计脚本尽量简洁明了,全局系统语言特点保持统一,后续有案列可以叙述讲解的。

    三、国内外语音设计差异点

    国内的语音设计和国外也会存在差异点的,首先是地方语言的差异,国内语言多达80种以上,汽车智能语音的在方言这一块相对堪忧,能够支持的方言相对较少,这也成为了中文语音识别的一个难题。

    在设计语音之初我们就得定义好,需要支持那些方言,比如粤语、河南话、四川话等,现在的车载版本微信可以支持20多种方言。

    但是整体的车机系统可能难以做到这一点,这块内容是需要攻克的一个壁垒,据我查看国外报道,关于方言解决方案,宝马、三星和松下三家公司与语音识别公司 Nuance 合作开发新智能辅助技术,这项技术使得汽车语音系统在处理特定的方言时,可以更加容易。

    还有一点就是中西方语言文化差异,那就举一个例子,单从一个社会礼仪就可以展现出两者之间的差距,国人路过遇见熟人总爱嘘寒问暖 “吃饭了吗?”、“到哪儿去”、“最近怎们样呀?”等。

    在我们看来,这是一种有礼貌的打招呼用语,但你要跟西方人这样打招呼 “Have you had your meal?”、“Where areyou going? ”,他们则会认为,你想请他吃饭,或者干涉其私事,会引起误解,而西方人见面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn’t it? ”

    四、实际案列讲解篇幅

    1. 语音唤醒设计

    车载语音唤醒分为免唤醒和需要唤醒,免唤醒的定义就是无需说出唤醒关键词或者其他任何操作,就直接可以进行与语音助手交谈并处理任务。

    如需要唤醒的话,触发动作可分为点击、按压、语音等,目前市场上主流的车机唤醒方式有三种:

    实体按钮:好处就是能够给到用户触觉上的反馈,用户感知性强。

    虚拟按钮:此类的按钮一般都会在中控屏幕上面,唤醒的方式是点击。

    语音唤醒:在驾驶场景中双手被占用,不能远距离的操作中控屏幕,最佳的交互操作方式就是语音唤醒。

    五、语音助手形象

    在语音助手形象设计方面,会分为两种,一种是卡通化语音助手形象,而另外一种是抽象化语音助手,下面用实际案例展示一下,卡通形象我们就拿未来汽车的NOMI,抽象化Google的Android Auto语音形象。

    基于工业设计2021年01期的调查数据分析来看,卡通化的语音形象再亲和力上有很大的优势,能够被用户快速的接受。

    但是辨识度上可能存在同质化严重问题,所以在效果表现力上面有欠缺,也较难表达车企的品牌理念。

    抽象化的语音形象则通过造型的多变和动效丰富,从而在设计感和效果上相对突出,在传达性上也不满意,用户不容易知道当前语音是处在一个什么状态下,在亲和力上远也不如卡通化形象。

    六、使用语音场景分析(重点)

    关于车内可以延展很多应用的场景,要知道用户在驾驶过程中需要完成什么样的任务,接下来我们就围绕这几个核心的功能点:多媒体(娱乐)、车辆控制、导航、电话。

    顺带将每个模块语音基础话术指令带过一下外加TTS反馈,也是让初学者熟悉一下命令,这块内容很重要奥,都是我在实际项目工作中总结出来的,大家要上点心好好看,答应我好嘛。

    1. 多媒体(音乐、电台)

    播放音乐、电台或者是播客这些都是一辆车最为常见语音交互的功能之一吧,开车的时候都会听一些音频类内容,对于这个功能播放、暂停和切换歌曲等功能外,电台快速选择,针对这些功能我们可以划分一些子功能对应的典型话术。

    2. 播放音乐

    按歌手,我想听霉霉的歌、播放周杰伦的歌;

    歌曲名称搜索,播放天外来物、来一首七里香;

    歌手名称+歌曲名称组合精准定位(因为有很多翻唱的曲目),播放周杰伦的七里香;

    按照语种,我想听粤语歌、放一些英文歌;

    按照曲风,来点爵士音乐、播放摇滚音乐。

    3. 根据音源播放语

    在线音乐,播放qq、网易云、酷我音乐等等(因为每一家车厂合作的音乐供应商不一样);

    蓝牙音乐,播放蓝牙音乐、跳转到蓝牙音乐、放蓝牙歌曲、切换到蓝牙音乐、我要听蓝牙音乐;

    U盘音乐,播放U盘音乐、听U盘音乐的歌、跳到U盘音乐;

    4. 音乐播放控制命令

    切换当前播放列表上一首歌,切到上一首、上一首歌;

    切换当前播放列表下一首歌,放下一首音乐、切下一首;

    换一首歌播放,换一首歌、换一个音乐、换个歌;

    暂停歌曲,暂停音乐、音乐暂停、停止播放音乐、不想听歌了;

    继续播放,继续播放音乐、播放音乐。

    针对于音乐这个模块的基础语言先讲到这边了,因为在线音乐的功能相对比较多,所以后续我会对于QQ音乐、网易云、酷我音乐等在线音乐额外的语言控制命令再写一篇续集。

    5. 播放电台

    打开电台,打开/开启收音机、听广播、播放电台/收音机/广播/Radio;

    按频率收听,调频104.5、播放调频104.5、收听调频104.5、广播891;

    按频段+频率搜索收听,我想听 FM104.5&、FM&104.5&、收听/播放/我要听 FM104.5&、收听 AM1045;

    按电台频道搜索收听,我想听音乐类电台、我要听上海民生聊聊电台、收听交通/新闻广播;

    按在线音源+音频类型搜索并播放,播放喜马拉雅的相声;

    按艺术家+音频类别搜索并播放,我想听郭德纲的相声。

    6. 播放源

    喜马拉雅,收听/打开/我想听 喜马拉雅;

    FM,打开/收听/我想听/播放/我要听 FM;

    AM,打开/收听/我想听/播放/我要听 AM。

    7. 电台扫描

    扫描电台,扫描电台、搜索电台、重新搜台、搜寻电台、搜索频道、扫描频道。

    8. 电台轮播

    轮播电台,浏览电台、电台浏览、电台轮播、轮播电台、快速浏览。

    9. 电台播放控制命令

    上一个电台,上个频道、上一个台;

    下一个电台,下一个台、切到下一个台;

    换台,换一个台;

    暂停电台,暂停电台播放;

    收藏/订阅 节目,收藏、收藏这个、添加收藏、加入收藏;

    取消 收藏/订阅 节目,取消收藏、收藏取消。

    语音第三篇主要围绕语音场景分析后半一部分(车辆控制、电话的语音话术)和对话设计重点,也是最精彩的一部分,请大家敬请期待吧。

    文章中如有不足之处,欢迎补充交流,我们下期见。

    下期文章预告:HMI语音设计探索-实际案例篇(三)

    给作者点赞,鼓励TA抓紧创作!


    来源:http://www.woshipm.com/pd/5444418.html
    本站部分图文来源于网络,如有侵权请联系删除。

    未经允许不得转载:百木园 » HMI语音设计探索-入门篇(二)

    相关推荐

    • 暂无文章