人口老龄化是指人口出生率下降和人均寿命延长而导致的总人口中老年人口比例相应增长的动态。当一个地区60岁以上老年人口占人口总数的10%,或65岁以上老年人口占人口总数的7%,即标志着该地区处于老龄化社会。统计局在2019年8月发布的报告中指出,中国已经进入老龄化社会。马斯洛认为,人的需求由五个等级构成分别为生理需求、安全需求、爱和归属感的需求、尊重的需求及自我实现的需求。在科技迅速发展的今天,社会各界应该积极应对人口老龄化带来的挑战,全面保障老年人的生理和安全需求,给予老年人爱与尊重,为老年人提供展示自我的平台,让老年人拥有健康且充实的生活状态。
随着时代的进步,老年人的生理及心理需求日渐多元化,但是老年人身体素质退化,日常生活较为单调,娱乐活动也受到很多限制,缺少有效的方式满足精神需要。老年人在日常生活中的精神需要主要包括以下三个方面:(1)及时获取信息,掌握外界的动态,满足文化学习需要。(2)沟通表达自我情感,丰富精神文化需要。(3)有展示自我的平台,渴望通过自己的人生经验创造价值。随着人机交互技术的不断发展,老龄办提出“智能化养老”的理念,全力扶持“互联网+养老”、“智慧养老”等养老政策。
智能语音设备为满足老年人的精神需要提供了一种崭新的解决方式,应用科学技术成果积极应对人口老龄化,使老年人感受科技带来的乐趣是老龄产业发展的新思路。搭载语音交互系统的智能音箱、智能穿戴设备及陪伴机器人等设备都能在一定程度上给老年生活带来新的色彩,老年人可以使用智能语音设备聊天、监测身体状况及快速拨打电话等。将科技动力注入老龄产业,推动老龄产业持续健康的进步,才能实现老龄化背景下经济社会的协调统一发展。机器的语音识别研究始于20世纪50年代,目前人机语音交互已经成为市场巨大且蓬勃发展的领域。用户通过唤醒智能语音设备,发出相应的语音指令,就可以得到设备的语音反馈。相较于视觉交互界面较为复杂的信息结构设计逻辑,语音交互通过发出语音指令得到反馈信息,交互模式更加贴近日常生活,老年人也更容易接受这种自然的交互模式。在老龄化产业的发展和建设中,智能语音设备为老年人提供了新的生活服务方式,也为将来可能发生的其他老年问题提供了新的解决方案与思路。人机语音交互相较于视觉交互,信息传递更加自然、直观,适合认知功能退化的老年人。
但语音交互对于大多数老年人而言是一种全新的交互模式,老年人接受并应用这项技术需要一定的时间,老年人使用语音交互系统的优势和劣势主要表现在以下几个方面:(1)语音交互通过对话的方式传递用户意图,尽可能贴近人与人的交互模式。各种智能语音设备的交互模式同质性较高,老年人不需要花大量时间学习这种交互模式。(2)老年人不需要使用双手操作,对于一些行动、手部操作不方便的老年人有很大的帮助,语音交互操作简单、直接,解放其他通道器官,给予了他们更多互动的可能。(3)语音交流能够传递更丰富的情感,老年人能够感受到更高的趣味性。(4)只调用听觉通道,老年人的注意力分散较少。(5)相较于视觉交互,语音交互发展时间较短,对于大多数老年人来说是新技术,从接受到融入日常生活,需要一定时间学习、适应。(6)没有针对老年人的适老化设计,老年人在交互过程中容易因为听不清、记不住出现理解错误,交互可控性较差。(7)不占用其他通道,对语音通道的体验要求更高,必须保证老年用户听得清、记得住,能有效接收语音交互系统反馈的信息。
目前语音交互的目标对象和操作模式、功能模块等都以年轻用户的需求为主,很少以老年人作为目标用户,根据行业报告显示,在购买搭载语音交互系统的智能音箱时,协助老人这一原因仅占12%,无论是用户还是设计师都极易忽略语音交互技术在老龄化产业中的发展潜能。由于面向老年人的语音交互设计较少,老年人在使用智能语音设备时存在一定的认知困难,因此利用语音交互技术促进智慧养老产业的发展还面临很大的挑战。在老龄产业中运用语音交互技术,让智能语音设备融入老年人的生活,能够带给老年人全新的娱乐互动、健康监测及生活服务方式。但是语音交互技术在解决老龄化问题上还有巨大的发挥空间,因此减轻老年人在语音交互中的认知负荷,提高语音交互的有效性,优化老年人的使用体验,将是未来语音交互系统适老化设计的重点。语音交互的本质是模拟人与人之间的交互,从而使人机交互更加自然。本文从研究老年人的特征出发,结合语言学理论,提出并验证面向老年人的语音交互设计策略,提高语音交互的信息传递有效性,同时提升交互过程中的用户体验,给面向老年人的语音交互设计提供一定参考。通过对语音交互的适老化设计,将“智慧养老”落实到设计细节,为老龄产业与互联网技术的融合提供一些新的思路。
老年语音交互研究现状
随着机器学习技术的不断发展,语音交互中的自动语音识别(ASR)、自然语言生成(NLG)等技术都有重大进展,语音交互的识别率、准确率、任务达成率等都在不断提升。但是目前受限于自然语言理解技术(NLU)的发展,目前语音交互系统对用户语料信息的分析基本局限于当前对话中的孤立语料,无法结合对话环境、生活常识及上下文关系等影响日常对话的因素进行综合理解,因此目前人机语音交互主要集中在一问一答的对话模式,无法完全模拟人与人之间自然的开放对话模式。随着语音交互这一交叉领域不断发展,不同行业的公司和学者基于不同的探索方向提出了语音交互的设计指南和评价指标,但目前还没有统一的设计规范,还处于积极探索的阶段。Google的语音交互规范文档中提出关于语音交互的核心机制,并提供一个可测试的原型工具,优化对话体验以提升语音交互中的吸引力及愉悦度,AmazonAlexaVoiceDesignGuide基于其产品内置语音助理Alexa的上线提出语音交互的设计指导,提供了具体的设计流程规划,CathyPeal系统介绍了语音用户界面的设计原则,同时讲解了帮助汇报、修改和验证语音用户界面设计方案的方法。百度体验部门对语音交互的话术设计、反馈时间及语速等方面进行了探讨,旨在提升用户更富有情感的交互体验。
目前语音交互的设计规范及用户体验研究较为宏观,由于老年人与年轻人的认知能力有较大差异,将现有的语音交互设计规范应用于老年语音交互产品上,交互有效性不高。而在设计研究层面,主要分为了设计老年人适用的交互功能及探究老年人在语音交互中的体验设计,包括唤醒词、语音虚拟形象设计等。AntónioTeixeira等人通过收集老年人语言数据库,训练老年特定语言识别器,设计了一种面向老年人的多通道交互的智能系统,通过视觉、语音等通道的交互为老年人提供广泛的在线服务,尤其是信息服务和与社会互动相关的服务,鼓励老年人继续参与社会。LindaWulf等人研究老年人对纯语音交互的接受度,显示基于语音的系统交互得到了老年人的认可和广泛接受,为老年人与现代技术的交互提供了一种简单的方式。贾国忠基于SJTU用户研究体系构建老年人在进行语音交互时的场景,对唤醒词及语音技能进行设计,并通过实验进行评估。何俚秋分析了中国老年用户群体的生理、认知和心理的特征,研究老年市场现状,设计了面向老年用户的娱乐电子产品,通过语音提示给予老年人帮助信息。王攀凯通过建立面向老年人的语音交互框架,分析老年人在语音交互各个节点的认知负荷,提出了面向老年人的语音交互设计建议,测试了不同类别的唤醒词的易记忆性,以及使用老年人指向语和老年人进行交互时的可接受度。倪亚楠分析了老年人的认知特性,总结了语音交互在老龄化产业中应用的优势,从语音角色、交互模态及信息呈现方式等方面分析了面向老年人的语音交互设计要点。
老年人的信息加工能力将影响语音交互过程中信息反馈的有效性,语音交互系统的适老化设计直接影响老年人的使用体验。对现有的语音交互设计研究进行梳理发现,面向老年人的语音交互的用户体验研究较少,虽然己有很多学者针对老年人群的认知能力提出了一些设计优化方向,但是缺少设计细节的探讨。面向老年人的语音交互研究应充分调研用户需求,考虑老年人在使用过程中认知及心理特征变化,分析老年人在交互过程中的信息加工模型,提升语音交互过程中信息反馈的有效性,同时优化语 音交互的用户体验,才能使老年人更好的接受语音交互产品,让人工智能技术真正融入老年人的生活,为老年生活带来新的科技色彩。
老年语音交互产品现状
随着人工智能领域的不断发展,从可穿戴设备、智能家居到自动驾驶汽车等各种硬件设备搭载语音交互系统,语音交互产品不断推陈出新,市场需求量越来越大,智能语音设备在不同的生活场景中被广泛运用。随着语音生态系统的不断扩展,语音产品各产业的合作迎来了新的发展浪潮与设计方向,同时语音交互也迎来了全产业生态链。在家时,用户通过智能音箱播放音乐、提醒待办事项及控制其他家居设备。运动时,用户通过智能手环的语音提醒关注自己的运动状态。开车出行时,用户通过车载语音导航系统了解出行路线。设备通过语音对话的方式帮助用户解决日常生活需求,对于身体机能及认知功能退化的老年人更加友好,当老年人手脚不便利或者眼睛看不清时,语音交互将是最便捷的交互模式,因此智能语音设备的目标用户应该逐步向老年人扩散,帮助解决老龄化问题。
以色列的研发团队发布了一款名为“Elli•Q”的智能语音设备,“Elli•Q”由机器人和平板电脑两部分组成。机器人可以为老年人提供生活服务,如提醒老年人按时吃药、为老年人播放新闻等。在使用过程中,机器人的设置会越来越贴近用户的使用习惯。
“小布1号”智能手机是专为老年人设计的手机,界面结构简洁,要素清晰。根据老年人的认知特点,手机字体较大,布局简单,尽可能的操作简洁化。老年人可以通过其语音交互系统进行功能选择,同时手机可以通过语音播放信息,降低了老年人的视觉负担,减少了手部操作。
2017年阿里巴巴发布了“天猫精灵”智能终端品牌,通过语音交互的方式为用户提供音乐娱乐、信息播放、查询服务等功能。2018年“天猫精灵”内置的交互系统“AliGenie”实现升级,添加视觉界面交互,同时为老年人提供药盒识别功能,帮助用户识别药盒信息,提醒老年人药品功能、生产日期及注意事项等信息。
2019年9月25日,360科技推出一款智能健康手表。该款手表为老年人的身体状况提供多方面的监测渠道,推出生理信号扫描、健康提醒等功能。视觉界面设计简洁清晰,同时语音用户界面自然高效,减少老年人的视觉及听觉负担,通过与子女的手机进行定位,全方面保障老年人的身体安全。
综合来看,面向老年人的交互产品形式多样,从视觉交互、语音交互多维度进行设计。语音交互产品现在已有部分适老化设计,集中在手机、智能手表、陪护机器人、智能音箱等产品领域,老年人使用智能手机的语音助手快速便捷的联系亲属、启动应用,佩戴智能手环监测身体状况,和语音机器人互动娱乐。老年语音产品的出现,帮助解决了健康监测、异常报警及控制家居等问题,在老龄产业中有广泛的利用空间。然而大多数产品的语音交互系统设计集中在功能设计和需求分析上,功能设计同质性较高,对于老年人的用户体验研究较浅,老年人使用语音交互系统还存在很多难点。从用户访谈中发现老年人接触语音交互产品较少,即使智能手机的使用已较为普及,老年人也只会使用拨打电话等基础功能,很少注意到手机中的语音助手,对于语音助手提供的功能了解甚少,语音交互系统在老年群体中的使用率较低。同时老年语音交互产品的设计面临着使用环境多变、老年人个体性差异大及任务场景不确定等问题,因此相较于传统视觉交互模式,老年语音交互产品没有特定的设计规范。在提升老年人在使用语音交互的用户体验上,基于不同使用场景及用户特征灵活使用设计策略,成为了语音交互适老化设计的关键,也是本研究尽力达到的目标。