聊什么来什么,你跟我说手机没偷听

沈知涵

你和朋友坐在一起聊天,随手把手机扔在桌上。你问他,家里暖气不热怎么办?夜晚,你便在小红书的信息流里刷到“教你给暖气放气”。你一惊,心想“难道又被手机窃听了”?因为你从未主动搜索过类似话题。

“App监听谈话”,被反复提及,原因是用户总能发现“巧合”,却难以将其证实。相关商业公司也只是否认,拿不出反驳证据。如果App真的通过麦克风一直监听我们,到底可不可行?

语音助手先遭质疑

人们的确抓到过智能音箱和语音助手的把柄,亚马逊Alexa曾因为错误理解指令,把“偷听”来的谈话录音发给用户通讯录里的好友,证明麦克风偷听并非臆想。

2020年,一位产品经理在hackernoon(一个技术分享社区)写过一篇文章专门解释这个困惑。他拿Siri举例,说Siri确实在“听”,但它“听不懂”,直到被“Hey Siri”触发后,它才开始理解你的指令。

因为Siri只是听懂你在喊它,就已经耗费很多“力气”。落到麦克风上的声音会以0.01秒为一帧,每次20帧(0.2s),被输入深度神经网络,进行本地计算。深度神经网络将这些声音转换成概率密度函数。当函数值达到阈值,主处理器被激活。在主处理器激活之前,处理声音的是协处理器。

所谓协处理器可以理解为,具备有限的功能和电量消耗的辅助处理器,允许用户在屏幕关闭时,访问一些“始终开启”的功能。“Hey Siri”功能推出后,它就帮着Siri处理声音。Siri理解,你不想让它听的声音,它就“左耳进右耳出”。

那App会不会跟语音助手一样呢?如果它“左耳进”,但“没右耳出”呢?

“Hey Siri”可被看作苹果的“底层应用”,是写在系统内部的,相比之下,iOS系统之上的应用,调用系统权限的时候,用户不会那么“无感”。

技术上可以,但算不过账来

2019年,国内的一个开发者团队写了一个安卓App,在演示中,App获取“录音”权限后,锁屏在后台监听。开发者对麦克风说:“今晚吃什么?”服务器端就收到App上传的语音转文字后的信息。他们为了证明,抛开所有限制条件,仅从技术角度来说,“App在后台监听到用户说什么”是可行的。

为什么强调“仅从技术上”?因为想要完全绕过用户的注意,实现“偷”听,难度可就大了。2017年,Facebook广告负责人加西亚·马丁内斯在《连线》上撰文。他说,如果Facebook通过麦克风记录听到的所有内容,在功能上等同于用户和Facebook在“一直通电话”。

有人做了实验,录音一小时,消耗电量6%。低功耗长时间的录音,耗电量不是很大。如果多个 App,多个SDK同时使用该方式,手机会变得又热又烫。

你难以想象“实时传输”能产生多少用户数据。马丁内斯假设用户每天使用手机时长为半天,以当时来计算,“网络通话”的单向传输速率平均24kbps,每人每天传输数据大约130MB。当时Facebook仅在美国的日活是1.5亿,每天产生大约20PB数据。Facebook数据库中存储了300PB的数据,每天处理的数据量大约为600TB。这样一算,监听所产生的音频数据就是每天要处理的33倍了。即便公司体量如Facebook,也难承其重。

也许有人仍有疑问。既然这条路行不通了,手机、App厂商可以在本地将“语音转文字”,过滤后提取有价值的信息,再上传到后台服务器。抛开这样做后台运算会“吞噬”CPU,造成手机性能下降不说,担负的成本也不低。

Google以0.006美元/15秒向第三方出售其“语音转文字”服务。(一个用户)每天转写24小时的成本是12614美元,即便每天转写1小时也得525美元。

来,我们简单测試下

根据各个平台的隐私政策,获取麦克风权限,淘宝是为了与AI客服对话,抖音是为了拍摄短视频作品,百度是为了语音搜索。

我做了一次从个人消费者出发的测试,想去证实两个怀疑,这三款主流的App有没有在无感知(没有启用麦克风)的情况下,录下我的对话;并将此用于App的个性化推荐和广告系统。

为此我尽可能规避其他变量,用一部抹掉所有内容和设置,并升级到iOS15以上的iPhone 7 Plus进行测试。并且注册了以上三款App的新账户。

至少在这次实验中,App调用麦克风时无法不被察觉,也没有将我的谈话内容,和周围环境声音,“转化为”个性化推荐。

以为麦克风在偷听,是我的问题吗

就像开篇提到的“供暖”例子,基于社交媒体对用户的了解,你可能已经被准确打上“年轻女性”“北漂”标签,恰好“北京供暖”这个话题搜索热度高。帖子可能被推给了10万打着同样标签的人,其中恰好包括你,你理所当然地认为自己被监听了。

这可能是证实偏差(confirmation bias)在作祟。证实偏差是一个心理学上的概念,它就像脑中的过滤器,留下你认为正确的,而把那些与需要不相关的其他信息无意识地过滤掉,选择性注意。它也被称作“视网膜效应”或“孕妇效应”。

类似例子非常常见。你与男朋友在外散步,讨论起最近搬家,谈及买什么牌子的投影仪好。结果你晚上回家刷手机,不仅在社交媒体上被推荐中介看房,淘宝还给你推送了新款投影仪。这时候,你刚准备跟男朋友炫耀“我就说,手机一定在窃听我们”。等等,冷静了一下,回忆起自己出门根本没带手机。

这种情况之所以发生,也许是你的男朋友已经在网上浏览过搬家,如何挑选投影仪。而你们因为在网络上互为好友,被监测到相互转发等行为,已经被广告系统标注为“有共同兴趣”。

所以广告系统已经这样成熟了吗?没必要!真的没必要!

至少在商业消费领域,通过“偷”听获得的用户数据,质量不见得高,但需要付出的成本极其高昂,公司没必要为此买单。

大部分主流App都表明类似立场。因为对于第三方App来说,它们想不被用户发觉,或突破系统权限进行监听几乎不可能。

2019年,澎湃新闻的记者发现,在今日头条App中关闭程序化广告后,用户看到的广告数量保持不变,但广告相关度会降低。南都在2020年的《个人信息安全年度报告》中对50款头部App进行测评,发现六款没有提供个性化推荐关闭选项。两年之后,这些头部App均增加了这一选项。

好了,这下手机不会“抢答”了。