Bi-lstm+CRF实现NER（训练生成词向量） - 代码天地

Bi-lstm+CRF实现NER（训练生成词向量）

其他 2020-03-16 17:27:47 阅读次数: 0

尊敬的读者您好：笔者很高兴自己的文章能被阅读，但原创与编辑均不易，所以转载请必须注明本文出处并附上本文地址超链接以及博主博客地址：https://blog.csdn.net/vensmallzeng。若觉得本文对您有益处还请帮忙点个赞鼓励一下，笔者在此感谢每一位读者，如需联系笔者，请记下邮箱：[email protected]，谢谢合作！

最近又是准备组会报告、所会报告，又是安排支部发展会、转正会，因此直到今天才有时间继续往下谈另一版用于实现NER的bi-lstm+CRF程序，该版本中的词向量不是随机生成的，而是训练生成的，且该版本的代码写的也甚是规范，所以非常想跟大家分享一下该版本的bi-lstm+CRF。

1、如果需要本文源码请自行转向“https://download.csdn.net/download/vensmallzeng/11237257”。

2、该版本主要包括以下几个部分：

data_path文件夹用于存放训练数据、测试数据、以及word2id.pkl文件，其中word2id.pkl是对给单词进行编号，以便查找词向量；

data_path_save文件夹用于保存训练好的模型以及参数，其中每一个以数字命名的文件夹代表一次训练好的模型以及参数；

pics文件夹用于存放图片以展示模型的效果

3、data.py文件包含一些语料数据预处理的函数如read_corpus、build_vocab、sentence2id、read_dictionary、pad_sequences以及batch_yield等，各函数具体功能见注释。

4、utils.py文件包含一些功能函数如str2bool、get_entity、get_PER_entity、get_LOC_entity、get_ORG_entity以及get_logger，各函数具体功能见注释。

5、model.py文件主要是用于搭建bi-Lstm+CRF模型。

首先对模型的基本参数进行初始化

建立张量计算图

添加并导入数据

根据训练好的词向量，通过word2id查找得到对应词向量

搭建bi-lstm+CRF模型

计算损失函数

优化损失函数，更新模型参数

测试模型函数

调整数据格式以适应于模型输入

评估模型的训练效果

6、main.py主要用于调用各种函数，并实现NER功能。

对超参数进行初始化

与随机生成词向量的Bi-lstm+CRF不同的是，这里的词向量是要训练生成(可用word2vec生成)且固定不变的。在该版本中既可选择随机生成词向量也可以选择训练生成词向量。

获取训练数据并用于训练模型(训练模型时，需对'--mode'超参数设置成train)

获取测试数据并用于测试模型(训练模型时，需对'--mode'超参数设置成test)

实际应用部分，即实现输入一句话，自动提取出人名、地点和机构（应用模型时，需对'--mode'超参数设置成demo）

实际效果如下：

日积月累，与君共进，增增小结，未完待续。

发布了152 篇原创文章 · 获赞 147 · 访问量 11万+

私信关注

猜你喜欢

转载自blog.csdn.net/Vensmallzeng/article/details/91490340

Bi-lstm+CRF实现NER（训练生成词向量）

Bi-lstm+CRF实现NER（随机生成词向量）

Bi-LSTM+CRF理解

Bi-LSTM+CRF在文本序列标注中的应用

TensorFlow——Bi-LSTM+CRF进行序列标注（代码浅析）

Bi-LSTM+CRF模型精度提升记录

nlp系列（7）三元组识别（Bi-LSTM+CRF）pytorch

信息抽取实战：命名实体识别NER【ALBERT+Bi-LSTM模型 vs. ALBERT+Bi-LSTM+CRF模型】（附代码）

文本分类实战（四）—— Bi-LSTM模型文本分类实战（一）—— word2vec预训练词向量

BI-LSTM and CRF using Keras

Bi-LSTM-CRF算法详解

学习：Bi-LSTM-CRF for Sequence Labeling

序列标注之Bi-LSTM-CRF

pytorch之BI-LSTM CRF（六）

知识图谱3-LSTM+CRF for NER

NLP（二十五）实现ALBERT+Bi-LSTM+CRF模型

NER -- 词向量与标注预处理阶段

Python3.6和tensorflow1.14实现Bi-LSTM+Self-Attention+CRF实现命名实体识别

CRF层说明（以BI-LSTM为例）

训练词向量

词向量训练原理

转载训练词向量

glove训练词向量

训练词向量实战

词向量训练

词向量的训练

训练集预处理以及词向量的生成

BILSTM+CRF实现命名实体识别NER

使用gensim训练词向量

训练自己的词向量模型

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)