关于ZAKER 一起剪 合作 加入
差评 2021-12-08

想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。

前几天, Meta 公司推出了一个据说开发了 4 年的鉴黄工具,为了阻止别人在社交网络上传你的私密照。

功能简单来讲是这样:

用户需要先通过第三方运营的网站上传照片给工具,提取照片的数字指纹,之后这个数字指纹会共享到社交平台,用于检测是否有人分享这些照片。

听起来是不是挺厉害?但这里面有个前提条件,就是得先把自己的落照上传给这个工具。

不是,你们搞了 4 年,就搞出了这么个玩意?

要说这个项目,还得追溯到 2017 年。

当时还叫 Facebook 的 Meta 公司,为了帮助身陷色情报复的受害者,开始研究起了网络鉴黄,这一项目还获得了社会各界的认同。

最初版本的工具于 2018 年推出,需要用户通过邮件上传自己的私密照片,由工作人员审核,进行照片的数字指纹提取,用于检测平台上是否存在相似图片。

征集也就算了,还打算依靠人工审核,这波操作当时就收获了一大片问号。

过了一年, Facebook 打了一个补丁。这一次,后续检测平台图片的任务,交到了 AI 手上。

然而,前期搜集照片数字指纹的步骤,还是得依靠人工审核。。。

前前后后四年过去了, Meta 公司终于憋出了工具的新版本。

审核人员终于下岗了,提取照片数字指纹的工作,总算交给了 AI 。

为了挽救一下被搞臭的名声, Meta 公司还把提取数字指纹的工具搭建在了第三方网站上,只共享包含数字指纹的数据库。

这个怎么都绕不开的数字指纹,其实就是哈希值,也相当于一张图片独一无二的数字信息。两组图片哈希值差异越小,图片的相似度就越高。

搞出这么一套东西的原因,也是因为单张图片信息量太大了,直接拿来比对非常困难,所以需要一个更简单的方式。

想要把数据量压缩下来,就得抓取出来图片的关键特征,用特征点来代表这张图。

而对于图片而言,最关键的特征,就是线条。

之所以选择线条,原因也很简单。以下面这张图为例,去掉颜色和明暗细节,只保留线条,我们就可以得到第二张图。

看到没有?只要保留线条,就算是简单的黑白线条,查重率还是 100% 。而且线条的数据量一看就比颜色小得多,处理起来更容易。

所以说,哈希值的核心,就是通过 " 线条 " 这一关键特征来识别图片。

知道要提取哪方面的特征之后,我们还得把特征量化成数字。咱们再来看看下面这张图,系统会先砍掉大部分色彩及尺寸数据,得到 32 * 32 像素的灰度图。

接下来,对这张黑白马赛克的线条特征进行一次信息提取。

可以看出来,线条部分像素灰度变化大( 红圈内 ),相同灰度像素点出现的频次较低。

而大面积着色部分像素灰度变化小( 绿圈内 ),相同灰度像素点出现频次较多。

根据这个特征,我们就可以对像素点进行一次重排,把出现频次低的像素点扔到左上角的位置。

这样一来,我们就可以用左上角的这些像素来表示这张图片的线条,这一下子又省事了不少。

但这还不够,还得想办法把它变成一个字符串。

处理办法也不难,系统会在这一步计算出这堆像素点的平均灰度值。

像素点灰度低于这个平均值的计为 0 ,高于平均值的计为 1 ,之后我们就会得到一串字符串,它就是图像的二进制哈希值代表,当然,实际运用中还会继续换算成十六进制哈希值。

从图片变成一小段字符,数据比对的工作效率一下子就高多了。

这项技术最早由微软与 Hany Farid 教授共同开发,如今已经发展得非常成熟,特别是在打击违法文件传播的工作中应用十分广泛。

没错,如果有人用网盘传给你的远古色图被夹了,那一定就是这项技术的功劳。

几个月前,苹果为了打击儿童色情犯罪行为,扫描用户相册使用的也是哈希技术。只要通过对比 CSAM ( 儿童性虐待材料 )数据库中已存在的哈希值序列,就可以检测用户手机中是否存在违规照片。

但它只能在广泛流传的文件中奏效,如果想用同样的方法毙掉网上的私密照片,不好意思,服务器上没有你裸照对应的哈希值。

这也就意味着要用这招,你要么给他们送一份裸照的哈希值,要么就得往服务器上送一份自己的裸照,让他们帮你把哈希值算出来。

很不幸的是,Meta 这次用的就是后面这招,也就是说,虽然后台没有审核人员了,但你依旧需要往服务器上发一张裸照。

这波啊,以毒攻毒了属于是。

而且虽然他们保证自己不会保存照片,但是中间万一被黑客给截了呢?只要联了网,没有人能保证中间的任何一个步骤,不会被人拦截窃取。

与 StopNCII.org 和合作的技术平台

仅共享哈希值,而不是图像本身 ▼

而且我就想不明白了,线上算是算,到本地算不也是算嘛?干嘛不直接搞个离线工具包,让用户自己提取哈希值上传呢?

看不懂。

况且就算在本地计算哈希值,这套方案的破解方法,也简单到令人发指。

因为哈希值检测的技术核心是提取图片轮廓信息,所以只需要在线条上做点手脚,数字指纹分分钟比对失败。

比如,简简单单给图片加个涂鸦,立刻 " 查无此图 ",想要对你展开色情报复的人,随手就能绕过这一道坎。

Meta 公司四年时间搞出来这么一份形同虚设的工具,说真的,实在有点说不过去。

以至于网友们直接提议,干脆一刀切算了,全网禁止色图上传绝对保险。

再不济, Facebook 的人脸识别玩得那么溜,直接比对脸部特征也比拿裸照搭建数据库强啊。

以上内容由"差评"上传发布
一起剪

一起剪

ZAKER旗下免费视频剪辑工具

一起剪