《自然语言处理综述》-第三版读书笔记01

文本规范化(Text Normalization):任何一种NLP模型,都需要先进行文本规范化

文本规范化至少包含如下三个部分:
(1)分词(Segmenting/tokenizing words from running text)
(2)单词规范化(Normalizing word formats)
(3)分句(Segmenting sentences in running text)

未完待续。。。

发布了41 篇原创文章 · 获赞 14 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/weixin_43685844/article/details/99975881