目录
<1>添加元素("增"append, extend, insert)
<2>查找元素("查"in, not in, index, count)
字符串
字符串描述:有限字符的序列。数据元素为字符的线性表,是一种数据结构等。
例如:a="求关注“,双引号或者单引号中的数据,就是字符串。
相关操作:
字符串输入输出:
userName = input('请输入用户名:')#input获取的数据,都以字符串的方式进行保存,即使输入的是数字,那么也是以字符串方式保存
print("用户名为:%s"%userName)
password = input('请输入密码:')
print("密码为:%s"%password)
下标和切片:
字符串中"下标"的使用
列表与元组支持下标索引好理解,字符串实际上就是字符的数组,所以也支持下标索引。
如果有字符串:name = 'abcdef'
,在内存中的实际存储如下:
如果想取出部分字符,那么可以通过下标
的方法:
name = 'abcdef'
print(name[0])
切片的使用:
切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
切片的语法:[起始:结束:步长]
注意:选取的区间属于左闭右开型,即从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身)。
name = 'abcdef'
print(name[0:3]) # 取 下标0~2 的字符
字符串其他常见操作 :
<1>find
检测 str 是否包含在 mystr中,如果是返回开始的索引值,否则返回-1
mystr.find(str, start=0, end=len(mystr))
<2>index
跟find()方法一样,只不过如果str不在 mystr中会报一个异常.
mystr.index(str, start=0, end=len(mystr))
<3>count
返回 str在start和end之间 在 mystr里面出现的次数
mystr.count(str, start=0, end=len(mystr))
<4>replace
把 mystr 中的 str1 替换成 str2,如果 count 指定,则替换不超过 count 次.
mystr.replace(str1, str2, mystr.count(str1))
<5>split
以 str 为分隔符切片 mystr,如果 maxsplit有指定值,则仅分隔 maxsplit 个子字符串
mystr.split(str=" ", 2)
<6>lower
转换 mystr 中所有大写字符为小写
mystr.lower()
<7>upper
转换 mystr 中的小写字母为大写
mystr.upper()
<8>lstrip
删除 mystr 左边的空白字符
mystr.lstrip()
<9>rstrip
删除 mystr 字符串末尾的空白字符
mystr.rstrip()
<10>strip
删除mystr字符串两端的空白字符
>>> a = "\n\t itcast \t\n"
>>> a.strip()
'itcast'
<11>join
mystr 中每个字符后面插入str,构造出一个新的字符串
mystr.join(str)
列表
列表是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。序列都可以进行的操作包括索引,切片,加,乘,检查成员。列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型。
例如:变量A的类型为列表
A= ['xiaoWang','xiaoZhang','xiaoHua']
列表的循环遍历:
for:
namesList = ['xiaoWang','xiaoZhang','xiaoHua']
for name in namesList:
print(name)
while:
namesList = ['xiaoWang','xiaoZhang','xiaoHua']
length = len(namesList)
i = 0
while i<length:
print(namesList[i])
i+=1
列表其他常见操作函数:
<1>添加元素("增"append, extend, insert)
append
通过append可以向列表添加元素
#定义变量A,默认有3个元素
A = ['xiaoWang','xiaoZhang','xiaoHua']
print("-----添加之前,列表A的数据-----")
for tempName in A:
print(tempName)
#添加元素
temp=xiaoWang
A.append(temp)
print("-----添加之后,列表A的数据-----")
for tempName in A:
print(tempName)
extend
通过extend可以将另一个集合中的元素逐一添加到列表中
>>> a = [1, 2]
>>> b = [3, 4]
>>> a.append(b)
>>> a
[1, 2, [3, 4]]
>>> a.extend(b)
>>> a
[1, 2, [3, 4], 3, 4]
insert
insert(index, object) 在指定位置index前插入元素object
>>> a = [0, 1, 2]
>>> a.insert(1, 3)
>>> a
[0, 3, 1, 2]
<2>查找元素("查"in, not in, index, count)
所谓的查找,就是看看指定的元素是否存在
in, not in
python中查找的常用方法为:
- in(存在),如果存在那么结果为true,否则为false
- not in(不存在),如果不存在那么结果为true,否则false
#待查找的列表
nameList = ['xiaoWang','xiaoZhang','xiaoHua']
#获取用户要查找的名字
findName = input('请输入要查找的姓名:')
#查找是否存在
if findName in nameList:
print('在字典中找到了相同的名字')
else:
print('没有找到')
类比现实生活中,如果某位同学调班了,那么就应该把这个条走后的学生的姓名删除掉;在开发中经常会用到删除这种功能。
<3>列表元素的常用删除方法有:
- del:根据下标进行删除
- pop:删除最后一个元素
- remove:根据元素的值进行删除
movieName = ['加勒比海盗','骇客帝国','第一滴血','指环王','霍比特人','速度与激情']
print('------删除之前------')
for tempName in movieName:
print(tempName)
del movieName[2]
movieName.pop()
movieName.remove('指环王')
print('------删除之后------')
for tempName in movieName:
print(tempName)
<4>列表嵌套
类似while循环的嵌套,列表也是支持嵌套的
一个列表中的元素又是一个列表,那么这就是列表的嵌套
schoolNames = [['北京大学','清华大学'],
['南开大学','天津大学','天津师范大学'],
['山东大学','中国海洋大学']]
元组
Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。
>>> aTuple = ('et',77,99.9)
>>> aTuple
('et',77,99.9)
字典
- 字典和列表一样,也能够存储多个数据
- 列表中找某个元素时,是根据下标进行的
- 字典中找某个元素时,是根据'名字'(就是冒号:前面的那个值,例如上面代码中的'name'、'id'、'sex')
- 字典的每个元素由2部分组成,键:值。例如 'name':'班长' ,'name'为键,'班长'为值
字典的常见操作:
<1>修改元素
字典的每个元素中的数据是可以修改的,只要通过key找到,即可修改
info = {'name':'班长', 'id':100, 'sex':'f', 'address':'地球亚洲中国北京'}
newId = input('请输入新的学号')
info['id'] = int(newId)
print('修改之后的id为%d:'%info['id'])
<2>添加元素
访问不存在的元素/添加新的元素
info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
print('id为:%d'%info['id'])
添加新的元素
info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
# print('id为:%d'%info['id'])#程序会终端运行,因为访问了不存在的键
newId = input('请输入新的学号')
info['id'] = newId
print('添加之后的id为:%d'%info['id'])
<3>删除元素
对字典进行删除操作,有一下几种:
- del
- clear()
demo:del删除指定的元素
info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
print('删除前,%s'%info['name'])
del info['name']
print('删除后,%s'%info['name'])
del删除整个字典
info = {'name':'monitor', 'sex':'f', 'address':'China'}
print('删除前,%s'%info)
del info
print('删除后,%s'%info)
注:注意python中下标从 0 开始
enumerate函数及运算符函数
enumerate()
>>> chars = ['a', 'b', 'c', 'd']
>>> for i, chr in enumerate(chars):
... print (i, chr)
常见运算符
运算符 | Python 表达式 | 结果 | 描述 | 支持的数据类型 |
---|---|---|---|---|
+ | [1, 2] + [3, 4] | [1, 2, 3, 4] | 合并 | 字符串、列表、元组 |
* | 'Hi!' * 4 | ['Hi!', 'Hi!', 'Hi!', 'Hi!'] | 复制 | 字符串、列表、元组 |
in | 3 in (1, 2, 3) | True | 元素是否存在 | 字符串、列表、元组、字典 |
not in | 4 not in (1, 2, 3) | True | 元素是否不存在 | 字符串、列表、元组、字典 |
总结:
大家了解字符串、列表、字典,元组相关用法即可,这是程序书写的核心,其中包含了大量关键字(或者说函数)的用法,需要在实战中大量练习复杂问题。一般来说这些在自然语言处理领域应用的比较多。
Python在解决自然语言处理问题时常用的内置函数
序号 | 方法 | 描述 |
---|---|---|
1 | cmp(item1, item2) | 比较两个值 |
2 | len(item) | 计算容器中元素个数,比如返回一系列文本的长度。 |
3 | max(item) | 返回容器中元素最大值 |
4 | min(item) | 返回容器中元素最小值,比如返回一系列文本的最小长度。 |
5 | del(item) | 删除变量 |
作为视频替代者,我认为各种视频虽然经过精简,但是还是冗余啰嗦。如果需要认真学习,对应视频讲解链接:https://download.csdn.net/download/weixin_40651515/12369335