本周AI热点回顾：AI首次发现超级抗生素、YOLO之父退出CV界

AI首次发现超级抗生素，能杀灭多种全球超级耐药菌

来自 MIT 合成生物学中心的研究者开发了一种可以预测抗生素分子活性的深度学习方法，从超过 1.07 亿种分子中识别出了强大的新型抗生素分子——halicin。halicin 可以对抗多种细菌，如肺结核以及被认为无法治疗的菌株。而且，这种新发现的分子在结构上与已知的抗生素分子有很大不同。

在小鼠实验中，该分子对多种病原体具有抗菌活性，包括艰难梭菌（Clostridioides difficile）、肠杆菌科（Enterobacteriaceae）和有「广泛耐药性」并迫切需要新抗生素的鲍曼不动杆菌（Acinetobacter baumannii）。其中，后两者被世界卫生组织（WHO）列为高优先级病原体，是新抗生素三大研究目标中的两个。

在寻找新抗生素的过程中，研究者训练了一个深度神经网络，以寻找抑制大肠杆菌生长的分子。在训练过程中，他们用到了 2335 个已知具有抗菌活性的分子，包括大约 300 种已获批的抗生素和 800 种从植物、动物和微生物中得到的天然产物。在这项研究中，模型不需要知道关于药物机理的假设，也不需要化学基团的标注就能执行预测。该模型能够学习人类专家未知的新模式。

目前，这项研究工作由麻省理工学院（MIT）的合成生物学家 Jim Collins 主导，已发表在权威学术期刊《Cell》上，并成为当期封面文章。

信息来源：机器之心

NeurIPS 2020：五大变化需要注意、YOLO之父退出CV界

1. 截稿日期提前

今年的摘要提交截止日期已提前至 2020 年 5 月 5 日，而论文提交截止日期为 2020 年 5 月 12 日（较去年提前 11 天）。这一改变是为了让组委会能够处理提交量增加的情况，并适应审查流程的早期拒稿阶段（参见下一点）。

2. 早期拒稿

领域主席将会用两个星期的时间来筛选早期拒稿的论文，组委会预计将有多达 20％的论文会被选中。

然后，高级领域主席用一个星期的时间来批准该决定，届时将通知被拒绝论文的作者，他们的论文将不再进行任何进一步的审查。

3. 作者即审稿人

组委会要求每篇论文的每位（共同）作者都同意审稿。这一要求有助于增加审阅者数量，并在提交论文的社区成员中更公平地分配审阅的工作任务。

4. 需要讨论更广泛的影响

要求作者在自己的意见书中包括一个部分，讨论其工作的更广泛影响，包括可能的社会影响（包括正面和负面）。

5. 上传 Video spotlight

要求所有的作者在 camera-ready 提交截止前，都上传论文的 spotlight 演示视频。NeurIPS 正在研究启用远程演示和远程参会的方法。

其中第4点要求候选论文的作者在他们提交论文的文件中加入新的讨论部分，阐述其新工作可能产生的广泛影响，包括一些可能造成的正面和负面社会影响，这似乎影响到了「YOLO 之父」Joseph Redmon 。

在社交网络上，这位 YOLO 等知名 AI 算法的发明者昨天突然声明：出于道德上的考虑，他决定停止一切有关计算机视觉的研究。

在有关「不应该发表的重要研究」的长篇讨论中，Redmon 现身发表了自己的看法：「我现在已经停止了计算机视觉研究，因为我看到了自己工作造成的影响。我热爱自己的作品，但我已经无法忽视它在军事领域的应用以及给个人隐私带来的风险。」

他还表示，一些学者的想法是错误的，他们认为，「我们不必考虑新研究的社会影响，因为这很困难，而且其他人也会帮我们做。」

作者Joseph Redmon曾凭借该算法获得过2016年CVPR群众选择奖（People’s Choice Award）、2017年CVPR最佳论文荣誉奖（Best Paper Honorable Mention）。

YOLO及其改进算法在学术圈被广泛引用，Redmon三篇一作相关论文总引用量已经超过1万。

信息来源：HyperAI超神经、量子位

印度议会选举，候选人用 DeepFake 伪造方言视频拉票

近日，DeepFake 首次现身印度选举，被候选人用在了竞选拉票的宣传材料上。

印度刚结束的德里邦议会选举中，印度人民党（Bharatiya Janata Party，简称 BJP ）的候选人之一 Manoj Tiwari，为了拉拢小语种选民，用视频造假技术，「说」了一段自己并不会的语言进行拉票。

Manoj Tiwari 的涉事视频截图

2 月 7 日，德里议会选举前一天，印度人民党的 Manoj Tiwari，在社交媒体上分享了两段短视频，出镜为自己的党派做宣传。这两段视频的语言，一段使用的英语，另一段用的是哈里亚纳语（Haryanvi，一种印度方言），主要是批评现任德里首席部长 Arvind Kejriwal，并鼓励选民们为印度人民党投票。

视频中，并不擅长哈里亚纳语的 Tiwari，讲着流利的哈里亚纳语，呼吁大家向印度人民党投票，这一举动在使用该语言的人群中引起了热烈的反响，随即引发了视频在 WhatsApp 上的大量传播。

可随后就有细心的人，发现了视频中的一些蹊跷。通过仔细观察 Tiwari 的视频，网民指出人物的嘴部动作，带有一种别扭的感觉，似乎并非是自然录制而来。随后著名科技媒体 Vice 以及纽约罗切斯特理工学院（RIT）的研究人员，也在视频中察觉出了异常。

通过证实，第二个哈里亚纳语的视频，确实不是实际拍摄，而是印度人民党的 IT 部门，与公关公司 The Ideaz Factory 合作而来的 DeepFake 制品。The Ideaz Factory 声称，他们是根据 Tiwari 视频，进行了其他语言的语音匹配过程。具体而言，使用了有唇动技术的 Deepfake 算法，通过 Tiwari 的语音进行训练，最后将外部音频和嘴形动作进行融合。在得到训练好的模型后，该公司雇用了一名配音演员，模仿 Tiwari 用哈里亚纳语读出写好的台词，最后将声音注入视频中。

可惜造化弄人，即便在 AI 的加持下，宣传达到了一定的推动效果，但 BJP 最终还是在选举中落败，仅获得了邦内议会席位的 8 位（共 70 位）。

信息来源：HyperAI超神经

谷歌开源新方法 LaserTagger，直击 seq2seq 三大缺陷！

目前，在序列到序列（ seq2seq ）的自然语言生成任务中，主流预训练模型仍然面临一些重大缺陷，例如：生成输出与输入文本之间长度匹配问题、需要大量训练数据才能实现较高性能、推断速度慢等。

近日，Google 的《Encode, Tag, Realize: High-Precision Text Editing》一文介绍了⼀种新颖的、开源的⽂本⽣成模型，旨在专⻔解决上述三个缺陷。由于该模型的速度快、精度高，因此该模型名为 LaserTagger。

该模型的核心思想在于：不从头开始⽣成输出⽂本，⽽是通过使⽤预测的编辑操作标注单词来⽣成输出；然后在单独的实现步骤中将这些单词应⽤于输⼊单词。这是处理⽂本⽣成的⼀种不太容易出错的⽅法，而且它可以通过更易于训练和更快执⾏的模型架构来处理文本。

许多⽂本⽣成任务的显着特征是输⼊和输出之间经常存在⾼度重叠。例如：在检测和纠正语法错误、或者是在融合句⼦时，⼤多数输⼊⽂本可以保持不变，并且仅⼀⼩部分单词需要修改。因此，LaserTagger 会产⽣⼀系列的编辑操作，⽽不是实际的单词。我们使⽤的四种编辑操作类型是：Keep（将单词复制到输出中），Delete（删除单词）和 Keep-AddX / Delete-AddX（添加短语 X）标注的单词之前，并可以选择删除标注的单词）。

下图说明了此过程，该图显示了 LaserTagger 在句⼦融合中的应⽤：

研究人员在实验中对 LaserTagger 实现的四个文本生成任务进行了评估，四个任务分别为：句⼦融合、拆分和改述、抽象总结和语法纠正。在所有任务中，LaserTagger 的性能与使⽤⼤量训练示例的基于 BERT 的强⼤seq2seq 基线相当；并且在训练示例数量有限时，其结果明显优于该基线。

由此可见，LaserTagger 的优势在⼤规模应⽤时变得更加明显。研究人员表示：通过减少响应的⻓度并减少重复性可以用于改进某些服务中语⾳应答格式。因此，Google 提出的文本生成模型 LaserTagger，一定程度上解决了seq2seq 模型运行过程中的缺陷，可以预测将将源文本转换为目标文本的一系列生成操作。

信息来源：AI开发者

本周论文推荐

ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object Detection

作者：Zhenbo Xu, Wei Zhang, Xiaoqing Ye, Xiao Tan, Wei Yang, Shilei Wen, Errui Ding, Ajin Meng, Liusheng Huang

论文概要：该论文提出了一个全新的双目3D检测框架ZoomNet，通过巧妙的利用自适应缩放来降低远距离的深度估计误差，以及学习部位特征来进一步提高3D检测的表现。在主流的KITTI数据集3D检测任务上，ZoomNet在验证集上的平均精度（IoU阈值为0.5）超过Pseudo-LiDAR（CVPR19）近10个百分点。对于远距离（>40m）的车辆，3D检测精度比Pseudo-LiDAR高了120% 。

论文表示，对于每一个实例，ZoomNet在获取左右边界框后，首先对该实例在2D上做细粒度的分析。然后，2D上的前景像素点会被投影到3D空间中用于位姿的回归。为了充分利用RGB图像中丰富的纹理提示来进行更准确的视差估计，ZoomNet引入了一个概念简单的模块——自适应缩放，该模块同时将2D实例边界框的大小调整为统一的分辨率，并相应地调整了相机的固有参数，以实现从调整分辨率后的图像中估计出更高质量的视差图，以及对不同深度的实例构建相似密度的点云。此外，论文还提出通过学习实例的部位特征来提高对遮挡的鲁棒性，极大的提高了3D检测的性能。

飞桨PaddlePaddle

发布了456 篇原创文章 · 获赞 56 · 访问量 15万+

私信关注

本周AI热点回顾：AI首次发现超级抗生素、YOLO之父退出CV界

猜你喜欢