【NLP】BERT中文实战踩坑 - 代码天地

【NLP】BERT中文实战踩坑

企业开发 2018-12-07 00:08:13 阅读次数: 0

终于用上了bert，踩了一些坑，和大家分享一下。

我主要参考了奇点机智的文章，用bert做了两个中文任务：文本分类和相似度计算。这两个任务都是直接用封装好的run_classifer,py，另外两个没有仔细看，用到了再补充。

1. DataProcessor

Step1：写好自己的processor，照着例子写就可以，一定要shuffle！！！

Step2：加到main函数的processors字典里

2. Early Stopping

Step1：建一个hook

early_stopping_hook = tf.contrib.estimator.stop_if_no_decrease_hook(
            estimator=estimator,
            metric_name='eval_loss',
            max_steps_without_decrease=FLAGS.max_steps_without_decrease,
            eval_dir=None,
            min_steps=0,
            run_every_secs=None,
            run_every_steps=FLAGS.save_checkpoints_steps)复制代码

Step2：加到estimator.train里

estimator.train(input_fn=train_input_fn, max_steps=num_train_steps, hooks=[early_stopping_hook])复制代码

3. Train and Evaluate

需要用tensorboard查看训练曲线的话比较好

Step1：创建train和eval的spec，这里需要把early stopping的hook加到trainSpec

train_spec = tf.estimator.TrainSpec(input_fn=train_input_fn, max_steps=num_train_steps,
                                                hooks=[early_stopping_hook])
eval_spec = tf.estimator.EvalSpec(input_fn=eval_input_fn, throttle_secs=0)
tf.estimator.train_and_evaluate(estimator, train_spec, eval_spec)复制代码

4. Batch size

默认Eval和Predict的batch size都很小，记得改一下

<-未完待续->

猜你喜欢

转载自juejin.im/post/5c093c04f265da611d667584

【NLP】BERT中文实战踩坑

BERT中文任务实战(文本分类、预测下一句)踩坑记录

NLP实践——Bert转onnx格式简介与踩坑记录

NLP实战：Pytorch实现6大经典深度学习中文短文本分类-bert+ERNIE+bert_CNN+bert_RNN+bert_RCNN+bert_DPCNN

ngrok实战踩坑

Hbase实战踩坑

BERT中文实战（文本相似度）

详解谷歌最强NLP模型BERT（理论+实战）

NLP进阶，Bert+BiLSTM情感分析实战

SCI-bert 使用过程（踩坑记）

pytorch_pretrained_bert换成transformers踩坑

swagger实战踩坑1

谷歌NLP BERT

【NLP】Google BERT详解

最强NLP模型-BERT

【NLP】彻底搞懂BERT

【NLP】使用bert

NLP新秀 - Bert

NLP：Bert使用

NLP（十）Bert

nuxt.js实战踩坑记录

实战人脸比对项目----踩坑过程

openlayers5实战--踩坑总结

ThreadLocal实战之踩坑笔记

deno + mongodb 实战踩坑记

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

【视频】超越BERT的最强中文NLP预训练模型艾尼ERNIE官方揭秘

NLP新秀：BERT的优雅解读

NLP_BERT模型的介绍

[NLP] BERT模型参数量

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)