HENYA系统论文解读 - 代码天地

HENYA系统论文解读

企业开发 2018-07-27 00:39:49 阅读次数: 0

作者从五大类开始，这五大类是人物，位置，组织，时间和艺术品。在这五大类下，每一大类细分为100个小类。所以HENYA系统共有505种实体类型。小类的甄选取决于其热度，作者按属于每一类的在YAGO中实体数量进行排序，取前一百种实体。这505种实体构成了一个有向无环图，最深的地方有9层。

作者发文时，还没有这种分类方法，HENYA可以加入其他种分类，如从DBpedia和FreeBase的FIGER系统或者其他手工标注的资料（WordNet）。

特征集

作者只使用了自动从文本中获取的特征，没有使用任何手工标记的特征。

包括提及字符串

提及周围的的字符串

提及段落

语法特征

位置特征

分类器

多级分类器

作者根据YAGO定义的实体自动从WIKI获得训练数据。

每个WIKI中的提及及其上下文都被当作正实例。为了判别学习，当前类型的同属的其他类型都被当作负实例。作者给每一个非叶实体加了一个子类，others，others的实例是类型t的不属于其他任何类的实例。

HENYA的分类是从上到下的方式，如果某一类型不被分类信号接受，则它的分类就停在这一级了。

元分类器

HENYA使用全局阈值接收一个类。使用一个参数对所有类型显然不合适，因为不同的类有不同的特征，可能最优的阈值有高类型依赖性。为了克服这个限制，作者制作了一个元分类器，它通过降低置信度进行排序，以获得正确的top-n标签。我们利用特定类型分类器集合的置信度值作为元特征，训练多类Logistic回归分类器，得到合适的特征值n。我们将基分类器和元分类器结合起来，首先沿类型层次运行整个集成自上而下的分类器，然后让元模型决定我们接受多少个得分最高的类型。

猜你喜欢

转载自blog.csdn.net/weixin_39773661/article/details/81126879

HENYA系统论文解读

基于Java的酒店管理系统论文

推荐系统论文学习

基于ssm框架仓库系统论文

推荐系统论文笔记（6）：Social Recommendation: A Review

基于深度强化的推荐系统论文讲解(链接整合)

对话系统论文集(17)-jiweiGAN闲聊型

对话系统论文集（6）-liubing

基于知识图谱的医疗诊断系统论文

基于jsp的航空票务系统论文(含源文件)

EMNLP2021对话系统论文合集

推荐系统论文11月组队学习

ssm基于JAVA的网上药品售卖系统论文

基于ssm的大型商场会员管理系统论文

基于ssm连锁经营商业管理系统论文

基于ssm乐购游戏商城系统论文

基于SSM的乡镇篮球队管理系统论文

系统论

linux系统论坛

系统论-理论

【推荐系统论文】推荐系统的监督优势 Actor-Critic

基于ssm农产品仓库管理系统系统论文

推荐系统论文学习——第一篇

推荐系统论文笔记（5）：Tag-Aware Recommender Systems:A State-of-the-art Survey

推荐系统论文笔记（4）：Comparison of Collaborative Filtering Algorithms:Limitations of Current Techniques .....

推荐系统论文笔记（2）：Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art ....

推荐系统论文笔记（1）:Hybrid Recommender Systems:Survey and Experiments

推荐系统论文笔记（7）：A survey of collaborative filtering based social recommender systems

带你重读Youtube深度学习推荐系统论文，惊为神文

推荐系统论文笔记（12）：Deep Learning based Recommender System: A Survey and New Perspectives

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)