Bootstrapping算法的过程 - 代码天地

Bootstrapping算法的过程

其他 2018-06-07 05:08:26 阅读次数: 0

参考文献：
程紫光. 面向领域知识库构建的实体识别及关系抽取技术[D]. 哈尔滨工业大学, 2014.

Bootstrapping过程形式化描述为：
对于给定的自然语言处理任务，选取特定的有指导的训练分类模型的方法。然后需要两个数据集，一般是少量的标注数据集L和为标注的数据集U。然后逐步通过未标注的数据集U来扩大标注的数据集。从而训练处最终的分类器实现具体的自然语言处理任务。

通过未标注数据集扩大标注数据集的过程如下：
1.使用已经标注的数据集L（可能是非常少量的数据集），应用选择的分类方法训练分类器h,h的作用主要是用于标注未标注数据集中的标注分类，通常可能是一些启发式规则等。
2.使用h对U进行标注分类目的是从U中获取到标注的数据。
3.在（2）中获取的标注数据中选择置信度较高的数据作为标注数据加入到标注数据集；
4.重复上述过程直到满足迭代结束条件。

Bootstrapping是一个能利用较少的标注语料获取到置信度较高的多量的标注语料的反复迭代的过程。Bootstrapping方法是通过两个主要的过程实现的，首先是提供一个少量语料就能够有效的进行分类的启发式规则或者时其他分类方法，其次是对分类器产生的新的标注语料进行评价的方法。通过评价来获得置信度较高的标注语料，这样通过迭代就可以获取到更大的标注数据集。迭代终止条件是给定一个迭代次数的阈值，或者时产生新的标注数据的数目过少等。

猜你喜欢

转载自blog.csdn.net/u012485480/article/details/80227240

Bootstrapping算法的过程

BootStrapping

What is Bootstrapping?

[JavaEE] Bootstrapping a JavaEE Application

Netty(引导 Bootstrapping)

TFHE拓展：Programmable Bootstrapping

spack install failed with bootstrapping

Kubernetes TLS bootstrapping

安装cmake过程出错：Error when bootstrapping CMake: Cannot find a C++ compiler that supports both C++11 and the specified C++ flags.

7 Multi-step Bootstrapping

CKKS自举笔记（CKKS Bootstrapping）

AdaBoost算法思想及算法过程

Apriori算法实现过程

理解KMP算法过程

DBSCAN算法的实现过程

KMF算法的实现过程

算法的泛化过程

算法过程学习

KNN算法的实现过程

AES算法过程解析

PBFT算法实现过程

RSA算法过程

bp算法推导过程

排序算法过程理解

Chapter 7 n-step Bootstrapping

Bootstrapping Face Detection with Hard Negative Examples

[转]Kubernetes TLS bootstrapping 那点事

Bootstrapping Entity Alignment with Knowledge Graph Embedding理解

「Deep Learning」Note on Noisy Labels with Bootstrapping

Bootstrapping NLU Models with Multi-task Learning

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)