字符串

字符串描述：有限字符的序列。数据元素为字符的线性表，是一种数据结构等。

例如：a="求关注“，双引号或者单引号中的数据，就是字符串。

相关操作：

字符串输入输出：

userName = input('请输入用户名:')#input获取的数据，都以字符串的方式进行保存，即使输入的是数字，那么也是以字符串方式保存
print("用户名为：%s"%userName)

password = input('请输入密码:')
print("密码为：%s"%password)

下标和切片：

字符串中"下标"的使用

列表与元组支持下标索引好理解，字符串实际上就是字符的数组，所以也支持下标索引。

如果有字符串:name = 'abcdef'，在内存中的实际存储如下:

如果想取出部分字符，那么可以通过下标的方法：

name = 'abcdef'
print(name[0])

切片的使用：

切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。

切片的语法：[起始:结束:步长]

注意：选取的区间属于左闭右开型，即从"起始"位开始，到"结束"位的前一位结束（不包含结束位本身)。

name = 'abcdef'
print(name[0:3]) # 取 下标0~2 的字符

字符串其他常见操作：

<1>find

检测 str 是否包含在 mystr中，如果是返回开始的索引值，否则返回-1

mystr.find(str, start=0, end=len(mystr))

<2>index

跟find()方法一样，只不过如果str不在 mystr中会报一个异常.

mystr.index(str, start=0, end=len(mystr))

<3>count

返回 str在start和end之间在 mystr里面出现的次数

mystr.count(str, start=0, end=len(mystr))

<4>replace

把 mystr 中的 str1 替换成 str2,如果 count 指定，则替换不超过 count 次.

mystr.replace(str1, str2,  mystr.count(str1))

<5>split

以 str 为分隔符切片 mystr，如果 maxsplit有指定值，则仅分隔 maxsplit 个子字符串

mystr.split(str=" ", 2)

<6>lower

转换 mystr 中所有大写字符为小写

mystr.lower()

<7>upper

转换 mystr 中的小写字母为大写

mystr.upper()

<8>lstrip

删除 mystr 左边的空白字符

mystr.lstrip()

<9>rstrip

删除 mystr 字符串末尾的空白字符

mystr.rstrip()

<10>strip

删除mystr字符串两端的空白字符

>>> a = "\n\t itcast \t\n"
>>> a.strip()
'itcast'

<11>join

mystr 中每个字符后面插入str,构造出一个新的字符串

mystr.join(str)

列表

列表是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置，或索引，第一个索引是0，第二个索引是1，依此类推。序列都可以进行的操作包括索引，切片，加，乘，检查成员。列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型。

例如:变量A的类型为列表

   A= ['xiaoWang','xiaoZhang','xiaoHua']

列表的循环遍历:

for:

 namesList = ['xiaoWang','xiaoZhang','xiaoHua']
 for name in namesList:
        print(name)

while:

namesList = ['xiaoWang','xiaoZhang','xiaoHua']
    length = len(namesList)
    i = 0
    while i<length:
        print(namesList[i])
        i+=1

列表其他常见操作函数：

<1>添加元素("增"append, extend, insert)

append

通过append可以向列表添加元素

    #定义变量A，默认有3个元素
    A = ['xiaoWang','xiaoZhang','xiaoHua']
    print("-----添加之前，列表A的数据-----")
    for tempName in A:
        print(tempName)
    #添加元素
    temp=xiaoWang
    A.append(temp)
    print("-----添加之后，列表A的数据-----")
    for tempName in A:
        print(tempName)

extend

通过extend可以将另一个集合中的元素逐一添加到列表中

>>> a = [1, 2]
>>> b = [3, 4]
>>> a.append(b)
>>> a
[1, 2, [3, 4]]
>>> a.extend(b)
>>> a
[1, 2, [3, 4], 3, 4]

insert

insert(index, object) 在指定位置index前插入元素object

>>> a = [0, 1, 2]
>>> a.insert(1, 3)
>>> a
[0, 3, 1, 2]

<2>查找元素("查"in, not in, index, count)

所谓的查找，就是看看指定的元素是否存在

in, not in

python中查找的常用方法为：

in（存在）,如果存在那么结果为true，否则为false
not in（不存在），如果不存在那么结果为true，否则false

    #待查找的列表
    nameList = ['xiaoWang','xiaoZhang','xiaoHua']

    #获取用户要查找的名字
    findName = input('请输入要查找的姓名:')

    #查找是否存在
    if findName in nameList:
        print('在字典中找到了相同的名字')
    else:
        print('没有找到')

类比现实生活中，如果某位同学调班了，那么就应该把这个条走后的学生的姓名删除掉；在开发中经常会用到删除这种功能。

<3>列表元素的常用删除方法有：

del：根据下标进行删除
pop：删除最后一个元素
remove：根据元素的值进行删除

    movieName = ['加勒比海盗','骇客帝国','第一滴血','指环王','霍比特人','速度与激情']

    print('------删除之前------')
    for tempName in movieName:
        print(tempName)

    del movieName[2]
    movieName.pop()
    movieName.remove('指环王')
    print('------删除之后------')
    for tempName in movieName:
        print(tempName)

<4>列表嵌套

类似while循环的嵌套，列表也是支持嵌套的

一个列表中的元素又是一个列表，那么这就是列表的嵌套

    schoolNames = [['北京大学','清华大学'],
                    ['南开大学','天津大学','天津师范大学'],
                    ['山东大学','中国海洋大学']]

元组

Python的元组与列表类似，不同之处在于元组的元素不能修改。元组使用小括号，列表使用方括号。

>>> aTuple = ('et',77,99.9)
>>> aTuple
('et',77,99.9)

字典

字典和列表一样，也能够存储多个数据
列表中找某个元素时，是根据下标进行的
字典中找某个元素时，是根据'名字'（就是冒号:前面的那个值，例如上面代码中的'name'、'id'、'sex'）
字典的每个元素由2部分组成，键:值。例如 'name':'班长' ,'name'为键，'班长'为值

字典的常见操作：

<1>修改元素

字典的每个元素中的数据是可以修改的，只要通过key找到，即可修改

    info = {'name':'班长', 'id':100, 'sex':'f', 'address':'地球亚洲中国北京'}
    newId = input('请输入新的学号')
    info['id'] = int(newId)
    print('修改之后的id为%d:'%info['id'])

<2>添加元素

访问不存在的元素/添加新的元素

    info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
    print('id为:%d'%info['id'])
添加新的元素
    info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
    # print('id为:%d'%info['id'])#程序会终端运行，因为访问了不存在的键
    newId = input('请输入新的学号')
    info['id'] = newId
    print('添加之后的id为:%d'%info['id'])

<3>删除元素

对字典进行删除操作，有一下几种：

del
clear()

demo:del删除指定的元素

info = {'name':'班长', 'sex':'f', 'address':'地球亚洲中国北京'}
print('删除前,%s'%info['name'])
del info['name']
print('删除后,%s'%info['name'])

del删除整个字典

info = {'name':'monitor', 'sex':'f', 'address':'China'}
print('删除前,%s'%info)
del info
print('删除后,%s'%info)

注：注意python中下标从 0 开始

enumerate函数及运算符函数

enumerate()

>>> chars = ['a', 'b', 'c', 'd']
>>> for i, chr in enumerate(chars):
...     print (i, chr)

常见运算符

运算符	Python 表达式	结果	描述	支持的数据类型
+	[1, 2] + [3, 4]	[1, 2, 3, 4]	合并	字符串、列表、元组
*	'Hi!' * 4	['Hi!', 'Hi!', 'Hi!', 'Hi!']	复制	字符串、列表、元组
in	3 in (1, 2, 3)	True	元素是否存在	字符串、列表、元组、字典
not in	4 not in (1, 2, 3)	True	元素是否不存在	字符串、列表、元组、字典

总结：

大家了解字符串、列表、字典，元组相关用法即可，这是程序书写的核心，其中包含了大量关键字（或者说函数）的用法，需要在实战中大量练习复杂问题。一般来说这些在自然语言处理领域应用的比较多。

Python在解决自然语言处理问题时常用的内置函数

序号	方法	描述
1	cmp(item1, item2)	比较两个值
2	len(item)	计算容器中元素个数，比如返回一系列文本的长度。
3	max(item)	返回容器中元素最大值
4	min(item)	返回容器中元素最小值，比如返回一系列文本的最小长度。
5	del(item)	删除变量

作为视频替代者，我认为各种视频虽然经过精简，但是还是冗余啰嗦。如果需要认真学习，对应视频讲解链接：https://download.csdn.net/download/weixin_40651515/12369335

就是求关注

原创文章 54 获赞 252 访问量 20万+

关注私信

python基础进阶1.4：字符串、列表、字典，元组相关用法代码讲解

字符串