python进行NLP用法总结(一)

       最近在某网站上看到了一个NLP的课程,对一些方法的使用讲解的很详细,用例也很容易看懂,所以就想要通过博客来记录一下,正巧自己对机器学习、NLP等等这些方向都很感兴趣,只是每次都学一点皮毛,希望可以通过这种方式加深理解,也希望看到这篇博客的大家可以帮忙指出哪里不足,一起进步~

1.统计字符串中某字符出现次数时可以通过调用.count()方法完成

可以看到执行这段代码之后成功统计出了字符串中出现了几次“好”这个字

2.我们还需要一些方法对获取到的语句进行一些处理,比如删除掉语句中的空格或者换行符

这里可以调用.strip()函数对字符串首尾的一些字符进行删除,默认是删除空格

可以看到通过调用对于字符串的strip方法实现了删除字符串首空格的功能,那么如果指定一个特定的字符是不是也能达到预期的效果呢

可以看到这里通过将字符参数‘1’传入函数中实现了对于字符串首尾的字符‘1’删除的功能,另外要说的一点在于这个函数不是在原来的字符串上做修改,所以如果先执行比如seq.strip('1'),再输出seq的话是没有效果的。

3.如果只是去除首部的字符,而不想要去除尾部的特定字符,那么可以调用lstrip()函数来实现这个功能,同理如果想要去除尾部的字符而不去除首部的字符,可以调用rstrip()函数来完成,这里的“l”和“r”暂且理解为在字符串的左端或者右端实现类似于strip函数的功能,比较好理解。

可以看到分别完成了对于字符串左右两端的字符‘1’的删除

4.如果遇到将字符串拼接起来这种情况,可以直接使用运算符+来完成

可以看到这里将三个字符串拼接成了一个字符串(只是个例子哈,虽然我是火箭球迷)

同样也可以实现这样的拼接

5.那么如果我们需要将一些字符串通过字符连接起来,比如日期要通过 ‘-’来连接,时间要通过 ‘:’来连接,这时可以通过调用.join()函数来完成

.

这样就完成了使用特定字符的字符串拼接

6.比较字符串,这里的比较应该是基于字符大小来完成的,这里我们引入了一个python的标准库operator,并通过其中的le方法完成了字符串的比较,可以看到如果第二个传入的字符串参数较大一点会返回true,否则返回false,事实上我们可以直接输出比较的结果,不需要任何的方法

这里对于operator中的比较方法详细记录一下,我的代码中使用的.le()函数是比较小于等于关系的,如果判断相等关系要使用.eq()方法,使用.lt()方法判断小于关系,使用.ne()方法判断不相等关系,使用.gt()方法判断大于关系,使用.ge()方法判断大于等于关系,这里就不一一举例验证了。

7.将字符串/文本中的字母全转化为大写字母或者小写字母,可以通过调用.upper()或者.lower()函数完成

可以看到通过调用这两个方法完成了对字符串中大小写字母的统一转换,而对其中的数字字符没有作用效果

猜你喜欢

转载自blog.csdn.net/LieberVater/article/details/88094295
今日推荐