AI假新闻满天飞,打假神器GROVER帮你看清一切

640?wx_fmt=jpeg


最近AI换脸术与AI假新闻叠加在一起,造成了不少乌龙事件,比如最近美国的议长南希·佩洛西就的一段醉酒视频就在Facebook上流传甚广,视频中的议长明显是状态晕沉,醉意十足,不过这后来被证明是一段是由deepfake生成的假视频。


640?wx_fmt=png


后来Facebook创始人马克.扎克伯格的一段视频也开始疯传,在其中小扎说“让我们快速地想象一下,一个人手握偷窃来的数十亿人的隐私信息,他们的所有秘密、生活和未来等等 ”,不过这也是deepfake的杰作。


640?wx_fmt=png


无独有偶,一名叫做Katie Jones的女政治家,似乎正在美国政坛冉冉升起,她在顶级智库工作,拥有由一批专家和权威人士组成的关系网。她与一名助理国务卿、一名参议员的高级助理以及经济学家 Paul Winfree 都有联系,而且搜索引擎上也能查到相应的新闻报道,不过这位女士其实并不存在,对此美联社已经作出确认,其面部信息是合成的,其相关新闻都是AI捉刀写的。


640?wx_fmt=png


打假神器 GROVER 横空出世


在OpenAI 推出文本生成模型 GPT-2 后,其文稿所中流畅自然的文笔引发各界广泛的关注,尤其是最近《权力的游戏》烂尾,硬核程序员用GPT-2重写了比电视剧更好的结局,这也让GPT-2算法名声大噪,不过由于这个模型内置 15 亿个参数(你没看错15亿个),其算力门槛让我们这些普通玩家望而却步。不过一种简化的GP2-2-SIMPLE模型已经在 GITHUB 上开源,有机会笔者也会向读者们分享一下这个项目的使用心得。


那么面对这些假新闻包装出来的假人、假事,华盛顿大学和艾伦人工智能研究所的研究者提出了一种名为Grover 的鉴定模型,这个模型本身并没有什么特别值得一提的创新,其思路就是把AI写的文章与人工写的文章分为两组,喂给GPU进行模型训练。论文中最重要的一段如下:“Training Grover-Mega is relatively inexpensive: at a cost of $0.30 per TPU v3 core-hour and two weeks of training, the total cost is $25k”也就是人家为了训练Grover花了20万人民币。所以这又是一次算力上的碾压。


不过虽然Grover的作者并没有开源模型,不过读者还是可以通过他们提供的网页,来感受Grover的强大,


在GENERATE的标签下,随便输入一个标题,点击generate,一会AI就能给你一篇完整的文章,我输入的标题是why china will win the trade war而且写的有理,有据,甚至比很多大V的观点更有见识。所以打假能手,本身也是个造假能手,大家也可以去感受一下。


地址:

https://grover.allenai.org/



640?wx_fmt=png


GENERAT旁边的标签DETECT则可以发现假新闻。随便把我们刚刚让GROVER写的假新闻拷进去,点击“DETECT FAKE NEW"就能得到结果


640?wx_fmt=png


GROVER的打假原理


由于Grover是使用典型深度学习模型,开发者也并不能了解其工作的具体机制,其原文是这么说的“Why does Grover perform best at detecting its own fake news? We hypothesize that the reason may be due in part to exposure bias”.也就是本文的作者认为Grover是通过检测exposure bias来预测文章是否是由AI生成。


其实到底是不是exposure bias并不重要,我们上次说的VP-VAE-2当中VP其实就是一种压缩算法,而每种机器学习算法中几乎都存在池化或者非全链接层,以此来减低计算量,这样的存在也就给AI赋予了风格,而Grover其实就是通过海量的训练,来感知AI的风格(style)并以此给出自己的预测概率。


参考阅读:

https://blog.csdn.net/BEYONDMA/article/details/92143438

https://blog.csdn.net/BEYONDMA/article/details/91129700

(*本文为 AI科技大本营转载文章,转载请联系原作者)


公开课精彩推荐



想跟NVIDIA专业讲师学习TensorRT吗?扫码进群,获取报名地址,群内优秀提问者可获得限量奖品(定制T恤或者技术图书,包邮哦~)


NVIDIA TensorRT是一种高性能深度学习推理优化器和运行时加速库,可以为深度学习推理应用程序提供低延时和高吞吐量。通过TensorRT,开发者可以优化神经网络模型,以高精度校对低精度,最后将模型部署到超大规模数据中心、嵌入式平台或者汽车产品平台中。


640?wx_fmt=png

640?wx_fmt=png

推荐阅读:


640?wx_fmt=png 你点的每个“在看”,我都认真当成了喜欢

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/92666673