第 2 章 Python3 编程的基础(下)

一、字符串

1、字符串基本特点
    字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任 何修改。
但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。 
    Python 不支持单字符类型,单字符也是作为一个字符串使用的。
2、字符串的编码
Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。
Python3 的字符 默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。 
使用内置函数 ord()可以把字符转换成对应的 Unicode 码; 
使用内置函数 chr()可以把十进制数字转换成对应的字符。

示例代码:

>>> ord("A")
65
>>> ord("佳")
20339
>>> chr(99)
'c'
>>> chr(1)
'\x01'
3、引号创建字符串
单引号或双引号都可以创建字符串;
三个单引号或者双引号可以创建多行字符串。
注:使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符

示例代码:

>>> a = "中国"
>>> b = '香港'
>>> c = """厉害了我的国,
中国加油!!!"""
>>> d = ''' 香港!
澳门!
台湾!'''
>>> a
'中国'
>>> b
'香港'
>>> c
'厉害了我的国,\n中国加油!!!'
>>> d
' 香港!\n澳门!\n台湾!'
4、字符串操作

1、空字符串和 len()函数

Python 允许空字符串的存在,不包含任何字符且长度为 0,例如: c=''
len()用于计算字符串含有多少字符, 例如:len(c) = 0

2、转义字符/////字符串拼接/////字符串复制/////不换行打印

以使用“\+特殊字符”,实现某些难以用字符表示的效果,例如 “\t” 代表 “回车”
  1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’。
    (1) 如果+两边都是字符串,则拼接。
    (2) 如果+两边都是数字,则加法运算。
    (3) 如果+两边类型不同,则抛出异常。
  2. 可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb’

示例代码:

>>> a = "中国"
>>> b = "加油"
>>> c = 3
>>> d = 4
>>> a + b
'中国加油'
>>> c + d
7
>>> a + c
Traceback (most recent call last):
  File "<pyshell#49>", line 1, in <module>
    a + c
TypeError: must be str, not int
>>> "aa""bb"
'aabb'
  1. 使用可以实现字符串复制, 例如:a = “A” ,a5 输出:‘AAAAA’。
  2. 用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行 符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容。

示例代码:

print("中国", end='--')
print("加油", end='!!!')
print('......')
输出结果:中国--加油!!!......

3、从控制台读取字符串

以使用 input()从控制台读取键盘输入的内容,例如:youname = input("请输入你的名字:")

4、str()实现数字转型字符串

str()可以帮助我们将其他数据类型转换为字符串。例如: str(5.20) ==> ‘5.20’

5、使用“[ ]”提取字符

    字符串的本质就是字符序列,我们可以通过在字符串后面添加“[ ]”,
在“[ ]”里面指定偏移量, 可以提取该位置的单个字符。
    正向搜索: 最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。 
    反向搜索: 最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str) 为止。

示例代码:

>>> a = 'i love you very much!!!'
>>> a[5]
'e'
>>> a[-1]
'!'
>>> c = len(a)
>>> c
23
>>> a[c - 1]
'!'
>>> a[-c]
'i'

6、replace()实现字符串替换

示例:
a = ‘love’
a = a.replace(‘L’, ‘–>’) # L替换为“–>”
输出a:
‘–>ove’

7、字符串切片 slice 操作

切片 slice 操作可以让我们快速的提取子字符串。
标准格式为: [起始偏移量 start:终止偏移量 end:步长 step]

字符串切片slice

注:切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。
起始 偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成-1。
例如:‘abcdefg’[2:40] 输出:‘cdefg’

8、split()分割和 join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。
如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符)。

示例代码如下:

>>> a = 'i love you very much!!!'
>>> a.split()
['i', 'love', 'you', 'very', 'much!!!']
>>> a.split('o')
['i l', 've y', 'u very much!!!']
join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。

示例代码如下:

>>> a = ['I', 'Love', 'You']
>>> " - ".join(a)
'I - Love - You'
>>> 
注:拼接字符串要点:
    使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。
推荐 使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,
然后逐一拷贝, 仅新建一次对象。

测试“+”拼接符和 “join()”,不同的效率,示例代码测试:

import time

t1 = time.time() # 起始时间
a = ""
for i in range(1000000):
    a += "love"
t2 = time.time() # 终止时刻

print("'+'运算时间:" + str(t2 - t1))

t3 = time.time() # 起始时间
b = []
for i in range(1000000):
    b.append("love")
a = "".join(b)
t4 = time.time() # 终止时刻

print("'join'运算时间:" + str(t4 - t3))

输出结果:
	'+'运算时间:0.7430133819580078
	'join'运算时间:0.12566399574279785

9、字符串驻留机制和字符串比较

    字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 
Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母
和数字)会启用字符串驻留机制驻留机制。

示例代码:

>>> a = "love"
>>> b = "love"
>>> a is b
True
a 与 b 变量值相等,字符驻留在驻留池中,是同一个对象,即id地址是相同的。
>>> c = "sss!"
>>> d = "sss!"
>>> c is d
False
由于 c 与 d 变量值虽然相等,但是不符合字符串驻留在驻留池的规则(字符串含有“!”),所以id的地址不相同。
注释:
==,!= 对字符串进行比较,是否含有相同的字符;
is / not is,判断两个对象是否同一个对象,即id(obj)地址是否相同;
in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中;

10、常用查找方法、去除首尾信息、大小写转换、格式排版

示例代码:


**常用查找方法**

>>> a = "李克强主持召开应对疫情工作领导小组会议"
>>> len(a) # 字符串长度
19
>>> a.startswith("李克强") # 以指定字符串开头
True
>>> a.endswith("会议") # 以指定字符串结尾
True
>>> a.find("开") # 第一次出现指定字符串的位置
6
>>> a.rfind("会") # 最后一次出现指定字符串的位置
17
>>> a.count("会议") # 指定字符串出现了几次
1
>>> a.isalnum() #  所有字符中不含有特殊字符(除了中文,数字,字母)
True

**去除首尾信息**

    我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息, 
rstrip()去除字符串右边指定信息。

>>> a = "#I#Love#You#"
>>> a.strip("#")
'I#Love#You'
>>> a.lstrip("#")
'I#Love#You#'
>>> a.rstrip("#")
'#I#Love#You'
>>> a = " #I#Love#You# "
>>> a.strip() # 默认去除空格
'#I#Love#You#'

**大小写转换**

>>> a = "gaoqi love programming, love SXT"
>>> a.capitalize() # 产生新的字符串,首字母 大写
'Gaoqi love programming, love sxt'
>>> a.title() # 产生新的字符串,每个单 词都首字母大写
'Gaoqi Love Programming, Love Sxt'
>>> a.upper() # 产生新的字符串,所有字 符全转成大写
'GAOQI LOVE PROGRAMMING, LOVE SXT'
>>> a.lower() # 产生新的字符串,所有字 符全转成小写
'gaoqi love programming, love sxt'
>>> a.swapcase() # 产生新的,所有字母大小 写转换
'GAOQI LOVE PROGRAMMING, LOVE sxt'

**格式排版** 

center()、ljust()、rjust()这三个函数用于对字符串实现排版。
示例如下: >>> a="SXT" 
>>> a.center(10,"*") 
>'***SXT****' 
>>> a.center(10) 
' SXT ' 
>>> a.ljust(10,"*") 
'SXT*******' 

**其他方法** 

1. isalnum() 是否为字母或数字 
2. isalpha() 检测字符串是否只由字母组成(含汉字)3. isdigit() 检测字符串是否只由数字组成。 
4. isspace() 检测是否为空白符 
5. isupper() 是否为大写字母 
6. islower() 是否为小写字母

11、字符串的格式化

Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的 功能。 
基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序。

示例代码:

>>> a = "名字是:{0},年龄是:{1}" 
>>> a.format("张三",18) 
'名字是:张三,年龄是:18' 
>>> a.format("张三",6) 
'名字是:张三,年龄是:6' 
>>> b = "名字是:{0},年龄是{1}。{0}是个好小伙" 
>>> b.format("张三",18) 
'名字是:张三,年龄是 18。张三是个好小伙' 
>>> c = "名字是{name},年龄是{age}" 
>>> c.format(age=19,name='张三') 
'名字是张三,年龄是 19'

12、填充与对齐

填充常跟对齐一起使用 ^、<、>分别是居中、左对齐、右对齐,后面带宽度 
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

示例代码:

>>> "{:#>9}".format("love")
'#####love'
>>> "{:#<9}".format("love")
'love#####'
>>> "{:#^9}".format("love")
'##love###'

13、数字格式化

浮点数通过 f,整数通过 d 进行需要的格式化。案例如下:

数字格式化
14、可变字符串

    在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,
只能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 
io.StringIO 对象或 array 模块。

示例代码:

>>> import io
>>> a = 'hello, marry'
>>> sio = io.StringIO(a)
>>> sio
<_io.StringIO object at 0x000002330F145678>
>>> sio.getvalue()
'hello, marry'
>>> sio.seek(11)
11
>>> sio.write('s')
1
>>> sio.getvalue()
'hello, marrs'

学习来自:北京尚学堂高琪老师 Python 400集

发布了20 篇原创文章 · 获赞 6 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/XuanAlex/article/details/104495736