1. 导行概述
信息障碍是盲人敢于走出家门,参与社会生活,平等融入社会的最大障碍。
当前盲人出行主要凭借经验和记忆,靠手杖摸索探路,部分盲人还通过导盲犬出行。专用畅通的盲道可以满足盲人关于安全行走这一最基础的导向需求,但无法满足他们获取更多信息的需求:我在哪里?我周围的环境如何?我如何安全到达目的地?
通过进一步分析调查,我们可以了解到盲人在出行中更为详细的需求。譬如:提示方向;提示盲道旁与生活密切相关的场所(如车站、厕所、医院、银行、商店)的具体方位;提示出行中必要的即时信息(如哪趟车即将在哪个站区进站,与自己密切相关的公告、新闻);在通过复杂危险区域(如地下通道、十字路口)时给予更详细的指引,等等。
在分析盲人的生理特点后,我们发现:与触摸等方式相比,使用听觉来获取信息具有传播快速、限制条件少、获取方式灵活的优势。我们希望借助先进的信息技术,研制出系统的、可以普遍适用的语音导盲系统,将该系统与盲道、盲文指示设施和周边环境结合起来,通过信息的互相印证,为出行中的盲人提供一双可以方便获取正确信息的“电子眼”。
2. 现有导行方案分析
在基础设施方面,现有的城市盲道系统为盲人提供了最基础的道路指示信息,使盲人的出行变为可能。在此基础上,有人提出了“感知盲道”的思路,即通过路砖面上针对性的特征变化来传递不同的信息,如方向、方位、导盲路牌所在方向。该方案制造、使用、维护费用低,使用寿命长。它可以增强盲人通过触觉获取信息的能力,具备了未来盲道的雏形。但是该方案在易用性和表示信息的多样性以及道路信息变化时的可修改性存在一些问题。
在辅助设备方面,目前市场上的产品主要是避免碰撞和辨别方向的电子助行器。它们一般使用超声波分辨前方一定区域内的障碍物,将监测到的可能障碍物信息反馈给盲人。这些助行器在一定程度上解决了现实生活中盲道不畅通、有异物或没有盲道的问题,是无障碍基础设施的重要补充。它们在帮助盲人安全行走方面有不可替代的作用,但是它们无法提示更多与生活密切相关的周边环境信息。
在中国内地一些城市,出现了一些协助盲人出行的装置或设施。例如,有些城市使用盲人站牌,或者采用按钮加广播的方式,要求盲人自己摸索;在上海和广州出现了盲人手持的与公交车通讯的设备,但是仅限于告知车次。以上设施的应用或是要求盲人必须首先找到车站、站牌,或是要求盲人知道有公交车到站等前提条件才能使用,因此在易用性上有比较大的问题。
更为高级的语音导盲终端的主要开发思路是利用GPS定向技术、语音合成技术、嵌入式控制技术等多种技术手段帮助盲人完成出行、乘车等目标。其中大部分还处于原型研制阶段。比较有特色的有:
英国诺丁汉大学的“PAL”系统。该系统由PIII便携式PC、GPS接受器、RDS广播数据接收器和电子罗盘组成,综合GPS、RDS和罗盘的数据,通过语音指导盲人进行。目前该产品实验效果较好,但产品体积较大、终端价格比较昂贵,难于推广。
芬兰技术研究中心(VTT)的“Noppa”系统将手机、互联网、全球定位系统以及语音技术整合在一起,形成一套完整的系统。盲人能根据手机的语音提示,自如地在街上行走,并安全地使用公交系统。与PAL系统相比Noppa增加了语音交互功能和互联网功能,使得系统功能大大加强,但产品更加昂贵,终端成本高达数千美元。
3. 语音导盲系统(E-eye)简介
语音导盲系统(E-eye)是香港新世界集团成员——新世界(中国)科技传媒科技有限公司自主研发的数字公交车站(DBS)的子系统,是专为解决盲人无障碍乘车而开发的资讯服务系统。
3.1. 技术运用
该系统综合运用了专用短程通讯技术、嵌入式控制技术、TTS语音技术以及MP3音频解码、USB传输等技术,可使盲人在手持终端的帮助下,及时有效地获取出行所需的公共交通服务信息。
3.1.1. 专用短程通信技术
专用短程通信(Dedicated Short Range Communication,简称DSRC)协议,DSRC是国际上为发挥ITS的功能,实现ITS对车辆的智能化、实时、动态管理而专门开发的适用于ITS领域道路与车辆之间的通信协议
DSRC系统主要包括3个部分:车载单元(On-Board-Unit,简称OBU)、路旁单元(Road-Side-Unit,简称RSU)和专用通信协议。
3.1.2. 文本到语音(TTS)技术
文本到语音(Tex-to-Speech,简称TTS)转换,是同时运用语言学处理、韵律学处理和声学处理技术,通过神经网络的设计,把文字智能地转化为自然语音流。是人机交互智能化的重要功能之一
在语音导盲应用上,手持导盲终端作为一种特殊的车载单元OBU,通过DSRC的技术特性实现导盲功能。
作为导盲应用的DSRC工作原理如下:RSU所在的位置固定,周期性的检测其周围一定区域内是否有手持导盲终端的存在。当有手持导盲终端进入RSU的信号覆盖范围内时,通过专用的通信协议和身份(ID)识别功能,手持导盲终端仅接收符合自己ID的数据,MCU对接收的文本数据进行处理,将有效的文本数据通过SPI传输给TTS功能单元。TTS功能单元从MCU接收到的需要转换成语音的文本数据和相应的控制指令,经过自身处理器的处理,转换为语音信号,通过音频处理单元播放出来,完成一次导盲信息的播报。
对于语音信号的传输处理,由于导盲功能是DBS系统的一部分,不允许占有很多的DBS系统资源,同时又要求达到理想的语音效果,采用了导盲信息以文本格式传输,在导盲终端实现文本到语音的合成及语音播放。
语音合成(TTS)需要大规模的真实录音的语音库和复杂的基于韵律层级匹配的算法,比较多的应用是结合操作系统,利用计算机强大的运算功能通过软件来实现。这里采用嵌入式专用处理器,将TTS功能集成为硬件模块来实现。节省了对系统资源的要求,降低环境对语音效果的干扰。
3.2. 系统构成及功能
标准的语音导盲系统由信息管理中心、道边设备、手持终端三部分构成。
图3.1 语音导盲系统
3.2.1. 信息管理中心
信息管理中心是整个系统的信息处理中心。它对即时信息进行分类编辑后,通过有线方式或CDMA等无线方式向道边设备发送,并可通过道边设备、有线网络搜集信息。
3.2.2. 道边设备
道边设备是整个系统的连结点。它接受信息管理中心发来的即时信息后通过DSRC无线通信方式发送给信号区域内(该区域范围可调)的手持终端。它还可触发手持终端,使之自动播放事先存放在MMC卡(Multi-media Card)上的固定资讯。
3.2.3. 手持终端
手持终端可以播放两类信息:从道边设备接收的即时信息;储存在本机、由道边设备发送的数位标签触发的固定信息。手持终端内嵌的TTS功能单元可清晰地将接到的文本转换为语音。
手持终端通过DSRC专用短程通信技术完成与DBS电子站亭的通讯,获取以文本方式表示的语音播报数据。然后通过RS232接口,将接收的数据发送给MCU处理单元。TTS单元将从MCU单元发送的控制指令和文本信息,基于大规模真实录音的语音库,采用片上语音合成技术,转换为语音信号,通过耳机(或扬声器)输出转换后的语音信息,实现导盲语音播报功能。
图3.2 手持导盲终端结构
3.3. 典型应用
3.3.1. 巴士语音导乘系统
当盲人走到巴士车站附近,手持终端会接收到巴士车站上的道边设备发出的站区提示信号。
当巴士进站,道边设备会接收到巴士进站信号,并转发到站区内盲人的手持终端上。
DBS信息管理中心将搜集到的巴士运行数据进行处理,做出巴士到站时间预报,传送到相应的道边设备上,由道边设备转发到站区内的盲人手持终端上。
在站区内的手持终端用TTS技术把各种乘车信息和公告、通知、新闻、天气等即时文本信息转化为语音并播放。
图3.3 站点提示和到站提示示意
3.3.2. 环境提示系统
在路口等交通交汇点设置道边设备,可向盲人提示所在地的名称、当前路口交通状况 (如:红绿灯)。
图3.4 环境提示示意
3.3.3. 区域导盲系统
在学校、商场、机构大楼、博物馆、图书馆等盲人经常出入的公共场所,设置区域性导盲系统,根据需要设置道边设备,使持手持终端的盲人在这些地方可以得到所在区域的介绍和提示。
图3.5 楼宇场所提示示意
3.4. 系统特色
利用专用短程无线通信技术,手持终端接受道边设备信息不用支付任何通信费用,节省盲人获取信息的成本。
3.4.1. 投资少,可扩展性强
系统建设整体成本低廉,尤其是巴士导乘服务,在全面建成使用DBS(Digital Bus Stop)系统的情况下,只需增加一个手持终端即可实现系统的巴士导乘服务。
在未建设DBS系统的情况下,也可独立建设“看不见的DBS系统”,通过信息管理中心、车站设备、车载设备和手持终端实现盲人导乘服务。
该系统功能还可以扩展为区域性导游,为游客和观光客服务。
3.4.2. 设计人性化、功能多样化
手持终端体积小巧,符合盲人操作的生理学设计,使用简便,出行携带方便。
手持终端在使用中无需另外支付任何通信费用。
盲人可根据环境和需求来选择是用耳机还是用扬声器来听取语音资讯。
盲人可根据自己出行或学习、娱乐的具体需求来使用手持终端上集成的其它功能:FM收音机、MP3播放器、U盘等。
3.4.3. 技术成熟、运行稳定
采用成熟的有线及无线通讯技术,系统运行稳定可靠。
道边设备的资讯传输过程采用文本方式处理,既保证了资料传输的速度和稳定性,又节约了系统资源。