几个有趣的开源Github项目

在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第  55 篇文章

InsightFace

#基于MXNet的人脸识别开源库

InsightFace 是 DeepInsight 实验室对其论文 ArcFace: Additive Angular Margin Loss for Deep Face Recognition 的开源实现 。本文工作将 MegaFace 的精度提升到 98%,超过俄罗斯 Vocord 公司保持的 91% 的纪录。

此外,该项目还包括打包对齐好的人脸训练数据(MS1M 和 VGG2)、 网络框架(ResNet,InceptionResNet_v2,DenseNet,DPN 和 MobiletNet)和 loss 设计 (Softmax,SphereFace,AMSoftmax,CosFace 和  Triplet Loss)。

在此基础上,研究人员可以专注于人脸识别的算法实验,工业界也可以方便地根据自身需求训练,或者凭借该项目提供的高精度预训练模型进行产品化。

论文链接

https://www.paperweekly.site/papers/1785

项目链接

https://github.com/deepinsight/insightface

#Python图像增强库

Augmentor 是一个 Python 图像增强库,减少了使用图像库自己编写代码的繁杂工序,能够批量完成图像的旋转,放大,缩小,添加噪音以扩充数据量。

▲ 输入图像

▲  输出图像

项目链接

https://github.com/mdbloice/Augmentor

#序列距离测算

TextDistance 是一个包含 30+ 种算法的 Python 库,用于计算两个或多个序列之间的距离。

项目特性如下: 

  • 30+ 种算法

  • 纯 Python 实现

  • 操作简便

  • 支持两种以上序列对比

  • 部分算法具备多种实现

  • 支持 Numpy 获取最大速度优化

项目链接

https://github.com/orsinium/textdistance

Neural Network Voices

#模仿Kate Winslet说话

本项目是 Siraj Raval 在 YouTube 上发布的神经网络语音合成教学视频对应代码,如何使用深度神经网络将普通人的声音转化为英国著名女演员 Kate Winslet 的声音 。本项目使用的数据集为 Kate Winslet 朗读的有声书音频。

教学视频

https://youtu.be/6KHSPiYlZ-U

项目链接

https://github.com/llSourcell/Neural_Network_Voices

Personae

#强化、监督学习在金融市场中的应用

Personae 基于 TensorFlow 和 PyTorch 对深度强化学习、监督学习算法和论文进行实现,并尝试将其应用于金融市场(股市)。该项目已实现的算法包含 DDPG,Policy Gradient 和 DualAttnRNN。

▲  股票交易收益对比

▲  股价预测结果

项目链接

https://github.com/ceruleanacg/Personae

NNDial

#端到端对话系统开源工具包

NNDial 是一个用于构建端到端可训练任务型对话模型的开源工具包,本项目来自剑桥大学,使用的数据集为 CamRest676。

▲  测试结果

项目链接

https://github.com/shawnwun/NNDIAL

Voice Activity Detection Toolkit

#语音端点检测工具包

本项目是论文  Voice Activity Detection Using an Adaptive Context Attention Model  的开源实现 ,此外还包含作者团队自行录制的语音数据集。

该工具包支持 4 种基于 MRCG 的分类器:

  • 自适应上下文注意模型(ACAM)

  • 增强型深度神经网络(bDNN)

  • 深度神经网络(DNN)

  • 基于LSTM的循环神经网络(LSTM-RNN)

项目链接

https://github.com/jtkim-kaist/VAD

Knowledge Graph Representation

#用PyTorch实现知识图谱表示

该项目整理了知识图谱表示常用的四个数据集,提供了数据清洗整理的代码,用 PyTorch 实现了四种基于平移的算法 。在评估阶段,使用了多进程加速,将 MeanRank 和 Hits@10 的评估时间压缩到小于 1 分钟。

项目链接

https://github.com/jimmywangheng/knowledge_representation_pytorch

PyHanLP

#HanLP的Python接口

本项目是汉语言处理包 HanLP 的 Python 接口 ,支持自动下载与升级 HanLP,兼容 py2 和 py3。

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用 。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

HanLP 可提供中文分词、词性标注、命名实体识别、关键词提取、文本推荐、依存句法分析、文本分类、word2vec 和语料库工具等功能。

HanLP主页

http://www.hankcs.com/nlp/hanlp.html

项目链接

https://github.com/hankcs/pyhanlp

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击阅读原文 即刻加入社区!

#作 者 招 募#

让你的文字被很多很多人看到,喜欢我们不如加入我们

我是彩蛋 

 解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot02)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 |  阅读原文 | 加入社区刷论文

猜你喜欢

转载自juejin.im/post/6844903585088536583