编辑注: 今天,我们与剑桥大学长期合作,签署了为期多年的研究合作协议,并为该大学的新 人类启发AI中心 提供了谷歌资助,以支持大胆、负责任和合作的人工智能发展,造福于每个人。我们的资助将用于资助来自弱势群体的学生在CHIA中进行博士研究。Aleesha就是其中的一名学生。
五年前,我的堂姐,一个处在人生黄金时期的美丽年轻女子,经历了一场可怕的折磨。她遭受了残忍的袭击,导致创伤性脑损伤和严重的身体残疾。奇迹般地,她幸存了下来,但她的生活永远变了样。她突然发现自己瘫痪了,无法说话。随着她逐渐恢复认知功能,我们必须与她建立一种沟通渠道,以了解她的需求、思想和情感。
第一丝希望来自于她的眼睛:她可以向上凝视来表示“是的”。她的颈部肌肉很弱,但她逐渐开始有意识地凝视来告诉我们她想要什么。在她的旅程中,她接触到了一台配备了凝视交互技术的电脑。通过眼球追踪,她能够看向屏幕上的特定字母来输入文字。但这样做很慢,也很累人。借助人工智能的进步,有巨大的潜力通过提高凝视检测的速度和准确性来改变这一点。
实现高效沟通的道路远非简单。这通常是一个令人沮丧和心碎的过程。为了让技术起作用,她必须集中精力看向每个字母一段时间,但有很多时候她的专注力会动摇,或者她的脖子不会保持稳定。整个过程很慢,错误很多,很多尝试都以痛苦告终。
我堂姐的困境并不是独特的。对于许多像她一样因伤致残的人,以及患有脑性麻痹或多发性硬化等神经系统疾病的人来说,凝视交互是唯一有效沟通的方式。尽管诸如眼球输入法等辅助技术有着改变生活的潜力,但目前最好的眼球输入系统的文字输入速度相对较慢,大约为每分钟7-20个词,而典型的口语速率为每分钟125-185个词。这是一个显著的差距,并突显了改善辅助技术以提升生活质量和赋予依赖它们进行沟通的所有个体权力的必要性。
这就是我的研究旨在解决的问题。目标是使沟通对于无数因运动障碍而无法行动的个体来说既高效又易于实现,而这些技术对他们来说可能成为改变生活的现实。通过了解如何最好地使用人工智能,我想重新想象用户如何使用眼睛高效输入。
我非常幸运能够获得谷歌和剑桥大学人类启发人工智能中心(CHIA)的支持,今年早些时候我开始了我的博士学位,由Per Ola Kristennson教授指导,他的开创性研究成果——一种名为“无停留”的AI技术为这些系统的设计带来了可能发生重大改变的希望。
眼球输入系统取得进展的一个明显差距是缺乏与最终用户直接参与。为了了解他们的需求、期望和障碍,我已经开始访问那些依赖眼球输入进行日常交流的不能言语的运动障碍患者,以便设计出更好地满足眼睛输入用户目标的技术。这体现了CHIA在人工智能创新方面的方法,将最有可能受到人工智能影响的人们放在发展过程的核心位置。
通过将眼球输入技术与人工智能相结合,我们的目标是赋予像我的堂姐这样的人表达自己、与世界联系,并重新获得独立感的能力。