电子病历命名实体识别NER - 代码天地

电子病历命名实体识别NER

其他 2018-08-31 12:12:32 阅读次数: 0

生成数据集

医生给的标签格式

将命名实体和标签当成jieba分词中的分词和词性，更新到jieba词典中，然后对病历文档进行分词，按照BIO标注每个字，每句话结束用空格分开。

按照1:2:12的比例将病历数据保存到dev/test/train三个文件中

数据加工

1、将数据转换成BIOES标注，增加了ES，因为标注信息变多了特征会更丰富。

2、给每个char和tag分配一个id，得到一个包含所有字的字典dict，以及char_to_id, id_to_char, tag_to_id, id_to_tag, 将其存在map.pkl中

3、将数据按照sentences按长度排序，划分为若干batch，每批按最长句子的长度进行padding

模型创建

model_inputs

字符特征（batchsize,100）通过embedding_lookup字向量字典得到

分词位置特征（batchsize,20）通过分词后字的位置得到

embedding=字符特征（batchsize,100）+分词位置特征（batchsize,20）

embedding=dropout(embedding)

2、IDCNN_layer

模型是4个大的相同结构的Dilated CNN block拼在一起，每个block里面是dilation width为1, 1, 2的三层Dilated卷积层，卷积核个数100，padding=same

IDCNN对输入句子的每一个字生成一个logits，这里就和biLSTM模型输出logits之后完全一样

3、logits for tags

idcnn_outputs= [batch_size, num_steps, emb_size]

return= [batch_size, num_steps, num_tags]

4、loss_layer

crf_log_likelihood在一个条件随机场里面计算出每个词分类的最大似然概率

5、viterbi_decode

维特比解码出序列概率最大时每个词对应的标签

模型训练

迭代100epoch

每100batch打印一下平均loss，在验证集上做一次验证

模型保存

猜你喜欢

转载自blog.csdn.net/qq_15111861/article/details/81319111

电子病历命名实体识别NER

命名实体识别（NER）

命名实体识别(NER)

命名实体识别NER

命名实体识别（NER）全解析

命名实体识别—NER——CRFPP

命名实体识别（NER）的发展历程

命名实体识别NER论文调研

命名实体识别(NER)发展简史

NLP（五）命名实体识别（NER）

命名实体识别（NER）算法

【论文笔记】命名实体识别(NER)论文整理

NLP入门（四）命名实体识别（NER）

主流的中文命名实体识别（ner）系统

BILSTM+CRF实现命名实体识别NER

【NLP】命名实体识别NER——BiLSTM+CRF方法

【NLP】命名实体识别NER——CRF方法详解

知识图谱——命名实体识别(NER)

自然语言处理（NLP）：命名实体识别-NER

自然语言处理（NLP）：命名实体识别-NER

浅谈嵌套命名实体识别（Nested NER）

命名实体识别NER-通用序列标注-pytorch

利用BERT进行命名实体识别(NER)

NER（命名实体识别）的介绍与使用--附源码

NER命名实体识别文章或文献整理

Python BiLSTM_CRF实现代码，电子病历命名实体识别和关系抽取，序列标注

命名实体识别

命名实体的识别

基于Python实现CCKS2019医渡云4k电子病历数据集命名实体识别

中文电子病例命名实体识别项目

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)