NLP基础技能

字符串操作

回归一下python字符串的相关操作,这是非常基础的知识,但却是使用频度非常高的一些功能。

去空格及特殊符号

s = ' hello, world!'
print(s.strip())
print(s.lstrip(' hello, '))
print(s.rstrip('!'))
hello, world!
world!
 hello, world
View Code

连接字符串

sStr1 = 'strcat'
sStr2 = 'append'
sStr1 += sStr2
print sStr1
#strcatappend

 查找字符

# < 0 为未找到
sStr1 = 'strchr'
sStr2 = 'r'
nPos = sStr1.index(sStr2)
print(nPos)#2

 比较字符串

sStr1 = 'strchr'
sStr2 = 'strch'
print(cmp(sStr2,sStr1))
print(cmp(sStr1,sStr2))
print(cmp(sStr1,sStr1))

 注意:Python 3.X 的版本中已经没有 cmp 函数,如果你需要实现比较功能,需要引入 operator 模块。

字符串中的大小写转换

sStr1 = 'JCstrlwr'
sStr1 = sStr1.upper()
#sStr1 = sStr1.lower()
print sStr1
#JCSTRLWR

 翻转字符串

sStr1 = 'abcdefg'
sStr1 = sStr1[::-1]
print sStr1
#gfedcba

 查找字符串

sStr1 = 'abcdefg'
sStr2 = 'cde'
print sStr1.find(sStr2)#2

 分割字符串

sStr1 = 'ab,cde,fgh,ijk'
sStr2 = ','
sStr1 = sStr1[sStr1.find(sStr2) + 1:]
print sStr1
#或者
s = 'ab,cde,fgh,ijk'
print(s.split(','))
cde,fgh,ijk
['ab', 'cde', 'fgh', 'ijk']
View Code

计算字符串中出现频次最多的字幕

 

猜你喜欢

转载自www.cnblogs.com/tianqizhi/p/9852344.html