如果你是一位盲人,那么你用智能手机拍下的图像就不仅只是一张漂亮的图片而已。在安装适当的应用程序后,这些图片能够增强你的独立能力。
对于大多数人来说,了解包装袋中装的是什么食品或者刚刚送到家门口的邮包中装的是些什么是每天都要处理的理所当然的事。
盲人通常是通过家人与朋友或者雇佣的个人助理那儿获取视觉信息,但这就意味着必须占用他人的时间或者花大笔的钱去寻求帮助。现如今,盲人有了越来越多的选择。
随着智能手机的无障碍化,一些智能手机具备了内置语音与盲文输出功能。有了这些手机,盲人们在周边无人可以询问的情况下也能获得视觉信息帮助。
想知道你所穿衬衫的颜色?就使用颜色探测应用软件。想知道外面是否还有日光?就使用光线探测应用软件。想了解公司公告栏中的通知?当然使用文本识别软件。
罐子里装的是什么?
近期,应用软件商店中最炙手可热的是一款名为“VizWiz”的应用程序。它不仅可以利用智能软件的自动图象识别功能拍下图片,而且它还能将图片与你的问题发送给在因特网上随时候命的一小群志愿者——称为“人云”。无论他们身处何处,他们都愿意花几十秒的时间帮助你描述图片上的内容。
在“VizWiz”的网站上,它被描述为:“拍一张照片,问一个问题,得到一个回答。”
此款免费的应用程序与服务由纽约“罗彻斯特大学”研发提供。该应用程序推出的前两个月共收到了约一万到一万两千个问题。志愿者们由公司职员与学生组成。当有人通过“Twitter”上的文本信息或者网络发送问题时,他们会听到提示声,然后他们就会回复信息给问题发送者。
该服务负责人之一的杰夫·比格汉姆教授说道:“最常见的问题就是询问写有文字信息的产品以及带有使用说明书的商品标签。他们想知道上面具体写些什么,想知道如何烹调该食品,或者食品何时过期。”
“我们可以非常清晰地记录下具体的时间,”比格汉姆说道。
“早晨,人们问衣服、颜色与款式,还有一些人询问他们的衬衫是否可以与裤子搭配。东部时间下午1点或2点左右,就开始有人提问关于酒的问题,如英国人喝什么酒、酒的商标、年份等等。
对于这些主观问题,软件无法给予解答,只有人类可以。但是人类需要睡觉。比格汉姆承认说,虽然计算机科学家通常可以工作到三更半夜,不过早晨6至7点这个时段是个缺口,因为这个时段很难找到大学生志愿者。
人云
他说:“开发无障碍科技是一件令人十分兴奋的事。一个绝妙的新资源就是许多人都在网络上。他们被相连到一起,我们可以利用这个资源做许许多多有趣的事情。”
“人们杜撰出诸如:“人云”与“云中的人群”等新词汇已有一段时间了。“
“在人云资源出现之前,许多工作需要耗费很多时间。例如“维基百科”,需要“等待”新文章的出现。我们服务的有趣之处就在于时效性。有人在云端中需要帮助,瞬间他即可得到帮助。“
由于用户们知道服务的另一端是人,有人也会提出一些“荒唐”的问题。这些问题根本无法通过自动识别软件拍摄的图像来解答。
比格汉姆教授说道:“曾经有一个用户,他一连几个小时不断拍下天空的照片,每隔五分钟就发出‘这是什么’的问题。”
“我不知道到底发生了什么。这种情况在我们少有监控的“Twitter”上面也常有发生。之后有人在上面留言道:“VizWiz”刚刚帮我看日落了。”
盲人摄影学
在瞬息万变的二十一世纪,盲人们发现自己有必要学习一些基本的摄影技术,以便能够更好地利用智能手机中与日俱增的文字与图像识别服务。
你应该如何拿照相机?你应该把照相机靠得多近才能拍到物体上的更多信息?对于一个从未看到过世界的人来说,要理解角度、透视, 距离与光线等这些概念并不容易。
史蒂夫·纳特先天失明,他是来自赫特福德郡的一名IT咨询师。他花了两周时间掌握了拍照的技能。他拍照的方式非常实用,与普通明眼人所采取的方式不同。
他解释说:“如果你在拍一张图片,就拿罐子为例,你需要确定你的镜头对准了整个罐子。我会将它立起来,这样就可以拍到贴有标签的各个面,并且要从八英寸的高度往下拍。”
“如果你正在拍摄纸上的文本信息,对准所要拍摄的物体,从约十英寸的高度往下拍。手绝对要直、不能抖。”
“你还必须要知道你所要拍的物体的大小:越小的东西,你得靠得越近拍……坦白说,这并不容易。”
杰夫·比格汉姆团队看到了史蒂夫等用户拍摄下的图片。但并不是每个人在刚开始拍照时都能掌握拍照技巧。
“用户拍摄时有时确实要做多次尝试。拍照并不总是那么容易。有时,照片没有找准焦点。如果他们问在一个汤罐的标签上写着什么时,我们通常回答:‘我们无法告诉你,因为标签可能贴在这个罐头的另一面。’”