在处理英文文本时要注意的一点问题

1.去标点符号,不然happy。这样会认为是一个词。

方法:

str = 'i,am,ok'

str= str.translate(str.maketrans('', '', string.punctuation))

2.改小写,不然大写后会认为和小写不是同一个词。

3.不能用csv,因为逗号会出问题

发布了54 篇原创文章 · 获赞 36 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/aaalswaaa1/article/details/89442350
今日推荐