AI助手“偷听”装上硬件开关就能解决吗
2019年10月11日  来源:齐鲁晚报
【PDF版】
  有报道称,亚马逊一个负责评估智能音箱Alexa用户指令的团队获取了用户定位数据。
     从今年4月开始,苹果、亚马逊、谷歌等多家科技公司都被爆出收集用户谈话,再通过人工对语音做标注和反馈,以训练人工智能语音助手。这意味着利用无孔不入的电子产品,用户在生活中的隐私对话,可能在不经意间被这些公司“监听”。
  齐鲁晚报·齐鲁壹点 
记者 任志方        
 
互联网巨头们的
小秘密被发现

  今年7月份,英国《卫报》首先报道了苹果承包商每人每天监听约1000条Siri录音的新闻,并披露这些承包商还会将录音发送回苹果公司进行研究。在整个过程中,苹果并未明确告知用户被录音和分析的情况,这些录音行为也没有排除用户无意中触发Siri的情况,甚至可能听到用户的姓名、位置、联系方式等隐私信息。
  当时苹果回复称,用户被录音的比例不到Siri日活的1%,而且大多数录音内容仅持续几秒钟。同时,这些录音进行人工分析的目的,只是改善服务质量,用户请求与用户的账号信息没有关联。
  更早一些时候,有报道称,有知情人士透露亚马逊的一个负责评估智能音箱Alexa用户指令的团队获取了用户定位数据,某些情况下还可以找到用户家庭住址。该团队分布于三个大洲,他们负责抄录、注释和分析Alexa记录的一部分录音。该部门的目的是帮助亚马逊的数字语音助手更好地理解和响应用户指令。
  员工表示,能够接触Alexa用户地理坐标的团队成员只要在第三方地图软件中输入这些数据,便可轻而易举地查找到用户住址。在媒体看到的演示中,一位亚马逊团队成员将软件中存储的用户经纬度数据输入谷歌地图。不到一分钟,这名员工就能从一个人的Alexa指令录音跳转到此人的房屋照片,还附带相应的地址。
  此外,亚马逊还有一套内部软件工具可供更少的员工使用,他们负责给录音文本增加标签,帮助Alexa对请求进行分类。该工具中存储了更多用户个人数据。
  在关联了用户ID后,这些员工还可以看到用户设置设备时输入到Alexa应用里的家庭和工作地址,以及手机号码。如果一个用户选择与Alexa分享联系信息,其姓名、号码和邮箱地址也会出现在控制面板上。存储这些数据后,当用户说“给劳拉发条短信”时,人类审核员就可以确定系统抄录的姓名准确无误,从而让软件学习将这条请求与通讯录中的劳拉匹配起来。
  在这场风波中,连微软也未能幸免。美国科技网站The Verge报道称,微软的承包商利用人工方式,审查通过Skype自动翻译功能和Cortana语音助手收集来的语音录音,这些内容可能包括用户的私密对话,如讨论情感关系、减肥等话题。报道称,微软此举是为了改进语音助手的服务。
第三方外包公司
身影频现

  在几大科技巨头被爆陷入“偷听门”的事件中,都可以看到第三方外包公司的身影,这是数据标注的特点决定的。
  目前的机器学习,通常使用的是监督学习,这需要有标注的数据来作为经验。而“数据标注”的对象则集中在文本、图片、音频、视频四个种类。
  比如,图片标注包括了图像分割、物体检测、图像语义理解、图像生成、图片加注等标注方式;音频标注包括对方言、特殊情景语音进行识别标注等。
  AI并不是魔术,各大科技公司推出的语音助手背后,都是机器学习算法模型在提供支持,而在训练算法模型的过程中,必须收集足够数量的语音数据,并交给人进行标注,数据标注得越准确、数量越多,模型的效果越好。
  简而言之,语音助手的进步,离不开人的介入,而人在介入过程中,又势必会接触到原始语音数据。
  问题是,作为语音助手的用户,势必不愿意自己和AI对话的内容,在自己毫不知情的情况下被另一个陌生人听到。
  在数据标识的过程中,到底会不会泄漏隐私?毕竟,从媒体曝光的内容来看,科技公司所掌握的录音,内容太过“丰富”。比如,苹果外包公司的员工透露,他们所听到的录音内容有数不清的毒品交易、医患交谈、商务谈判甚至还有夫妇性行为的音频,亚马逊的外包商也经常能听到,诸如女人在淋浴时唱歌、孩子大声呼救,甚至被认为是与性侵等犯罪有关的声音。
  上述被曝光的公司,即便是为了收集数据进行软件训练以提升用户体验,在用户不知情的情况下,偷偷地收集用户语音信息,也是对用户隐私赤裸裸的侵犯。事实上,在人们日常的语音交流中,往往含有大量的个人信息、商业信息甚至是其他更重要的信息,如果推出语音助手软件的公司出于恶意或者间谍目的收集语音信息,其危害后果更不堪设想。
  此外,如果语音助手软件后台在特定条件下,以恶意目的向智能终端上的语音控制应用程序发出指令,比如打开特定网站、关闭智能警报系统、恶意购物等,必然会带来严重的安全问题。
  相对于文本和声音,地理定位数据比其他很多用户信息都更为敏感,因为其他信息难以追踪到真实的人。任何时候,有人收集你的定位数据时,就意味着有其他人可以在你不希望被找到时找到你。大范围获取地理位置数据对用户来说是一个巨大的危险信号。
用物理方式
来禁用产品传感器

  相比于软件,无法卸载的硬件如果偷听更让人防不胜防。因此,就隐私保护而言,或许“物理切断”才是最安心的。在5月初开幕的I/O开发者大会上,谷歌推出了一款智能屏幕。这是一款内置Google Assistant的智能屏幕,顶部带有前置摄像头,可用于视频通话和家庭安全监控。
  这款设备可以在厨房或者客厅等空间使用。另外它还有一个目前电子设备很少具备的隐私功能——硬件开关,可以在物理上断开设备的摄像头和麦克风。这样谷歌无法偷听你的谈话,当然除非你自愿这样做。
  这款硬件开关看起来像普通电灯开关,只不过更高端更优雅一点,这代表了一种发展趋势,即为用户提供一种物理方式来禁用产品传感器。在层出不穷的数据泄露和隐私丑闻中,谷歌、苹果和亚马逊等科技公司正试图通过这一简单的功能来解决用户的担忧。与软件设置不同,硬件开关是一种简单、直观的方式,让人们确信公司无法窃听你的私人生活,而在软件设置下用户必须仔细检查才能防止公司收集大量的个人数据。
  对于互联网巨头来说,通过添加一个硬件开关来解决这些丑闻,算是一种非常便利的方式。然而,对于大多数硬件设备来说,关闭了开关就等于关闭了设备的大部分功能。而且对于那些在意隐私保护的使用者,也会经常忘记关它,或者在一些情况下不关闭这些功能会更方便。从这个意义上讲,尽管硬件开关为用户提供了一种更简单的方法来禁止入侵,但它并不是一个实用的解决方案——人们是否会经常使用这个功能仍有待观察。
  此外,今年3月,谷歌推出一种差异化隐私技术,利用在用户数据上训练出的AI模型对用户数据进行标注,不会学习或记住特定用户的详细信息,能更加保护用户的隐私。
  谷歌还表示,正在开发不需要人类介入数据标注的技术,这也是一种让人放心的解决方案。


本稿件所含文字、图片和音视频资料,版权均属齐鲁晚报所有,任何媒体、网站或个人未经授权不得转载,违者将依法追究责任。
网友为此稿件打分的平均分是:
齐鲁晚报多媒体数字版
按日期查阅
© 版权所有 齐鲁晚报
华光照排公司 提供技术服务