编码
默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。 当然你也可以为源码文件指定不同的编码:
# -*- coding:utf-8 -*-
关于字符编码
ASCII编码和Unicode编码的区别:ASCII编码是1个字节,而Unicode编码通常是2个字节
UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间
字符 | ASCII | Unicode | UTF-8 |
---|---|---|---|
A | 01000001 | 00000000 01000001 | 01000001 |
中 | x | 01001110 00101101 | 11100100 10111000 10101101 |
ASCII编码实际上可以被看成是UTF-8编码的一部分
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码
用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:
浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器:
很多网页的源码上会有类似<meta charset="UTF-8" />
的信息,表示该网页正是用的UTF-8编码
1个中文字符经过UTF-8编码后通常会占用3个字节,而1个英文字符只占用1个字节
在最新的Python 3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言
在操作字符串时,经常遇到str
和bytes
的互相转换。
为了避免乱码问题,应当始终坚持使用UTF-8编码对str
和bytes
进行转换
标识符
- 第一个字符必须是字母表中字母或下划线 _ 。
- 标识符的其他的部分由字母、数字和下划线组成。
- 标识符对大小写敏感。
在 Python 3 中,可以用中文作为变量名,非 ASCII 标识符也是允许的了
python保留字
保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:
1
|
>>>
import
keyword
>>> keyword.kwlist
[
'False'
,
'None'
,
'True'
,
'and'
,
'as'
,
'assert'
,
'break'
,
'class'
,
'continue'
,
'def'
,
'del'
,
'elif'
,
'else'
,
'except'
,
'finally'
,
'for'
,
'from'
,
'global'
,
'if'
,
'import'
,
'in'
,
'is'
,
'lambda'
,
'nonlocal'
,
'not'
,
'or'
,
'pass'
,
'raise'
,
'return'
,
'try'
,
'while'
,
'with'
,
'yield'
]
|
注释
Python中单行注释以 # 开头,实例如下:
多行注释可以用多个 # 号,还有 ''' 和 """:
1
2
3
4
5
6
|
#!/usr/bin/python3
# 第一个注释# 第二个注释
'''第三注释
第四注释'''
"""第五注释
第六注释"""
print
("Hello, Python!")
|
行与缩进
python最具特色的就是使用缩进来表示代码块,不需要使用大括号 {} 。
缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数。实例如下:
1
2
3
4
|
if
True
:
print
(
"True"
)
else
:
print
(
"False"
)
|
缩进不一致,会导致运行错误
多行语句
Python 通常是一行写完一条语句,但如果语句很长,我们可以使用反斜杠(\)来实现多行语句
1
2
3
|
total
=
item_one
+
\
item_two
+
\
item_three
|
在 [], {}, 或 () 中的多行语句,不需要使用反斜杠(\),例如:
1
2
|
total
=
[
'item_one'
,
'item_two'
,
'item_three'
,
'item_four'
,
'item_five'
]
|
数字(Number)类型
python中数字有四种类型:整数、布尔型、浮点数和复数。
- int (整数), 如 1, 只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。
- bool (布尔), 如 True。
- float (浮点数), 如 1.23、3E-2
- complex (复数), 如 1 + 2j、 1.1 + 2.2j
字符串(String)
- python中单引号和双引号使用完全相同。
- 使用三引号('''或""")可以指定一个多行字符串。
- 转义符 '\'
- 反斜杠可以用来转义,使用r可以让反斜杠不发生转义。。 如 r"this is a line with \n" 则\n会显示,并不是换行。
- 按字面意义级联字符串,如"this " "is " "string"会被自动转换为this is string。
- 字符串可以用 + 运算符连接在一起,用 * 运算符重复。
- Python 中的字符串有两种索引方式,从左往右以 0 开始,从右往左以 -1 开始。
- Python中的字符串不能改变。
- Python 没有单独的字符类型,一个字符就是长度为 1 的字符串。
- 字符串的截取的语法格式如下:变量[头下标:尾下标:步长]
- 在字符串前面添加一个 r,表示原始字符串,不会发生转义
1
2
3
4
5
6
7
8
9
10
11
12
|
#!/usr/bin/python3
str
=
'Runoob'
print
(
str
)
# 输出字符串
print
(
str
[
0
:
-
1
])
# 输出第一个到倒数第二个的所有字符
print
(
str
[
0
])
# 输出字符串第一个字符
print
(
str
[
2
:
5
])
# 输出从第三个开始到第五个的字符
print
(
str
[
2
:])
# 输出从第三个开始的后的所有字符
print
(
str
*
2
)
# 输出字符串两次
print
(
str
+
'你好'
)
# 连接字符串
print
(
'------------------------------'
)
print
(
'hello\nrunoob'
)
# 使用反斜杠(\)+n转义特殊字符
print
(r
'hello\nrunoob'
)
# 在字符串前面添加一个 r,表示原始字符串,不会发生转义
|
空行
函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。类和函数入口之间也用一行空行分隔,以突出函数入口的开始。
空行与代码缩进不同,空行并不是Python语法的一部分。书写时不插入空行,Python解释器运行也不会出错。但是空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。
记住:空行也是程序代码的一部分
等待用户输入
执行下面的程序在按回车键后就会等待用户输入:
1
2
|
#!/usr/bin/python3
input
(
"\n\n按下 enter 键后退出。"
)
|
以上代码中 ,"\n\n"在结果输出前会输出两个新的空行。一旦用户按下 enter 键时,程序将退出。
同一行显示多条语句
Python可以在同一行中使用多条语句,语句之间使用分号(;)分割
多个语句构成代码组
缩进相同的一组语句构成一个代码块,我们称之代码组。
像if、while、def和class这样的复合语句,首行以关键字开始,以冒号( : )结束,该行之后的一行或多行代码构成代码组。
我们将首行及后面的代码组称为一个子句(clause)。
1
2
3
4
5
|
if
expression :
suiteelif expression :
suite
else
:
suite
|
Print 输出
print 默认输出是换行的,如果要实现不换行需要在变量末尾加上 end="":
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/python3
x
=
"a"
y
=
"b"
# 换行输出
print
( x )
print
( y )
print
(
'---------'
)
# 不换行输出
print
( x, end
=
" "
)
print
( y, end
=
" "
)
print
()
|
import 与 from...import
在 python 用 import 或者 from...import 来导入相应的模块。
将整个模块(somemodule)导入,格式为: import somemodule
从某个模块中导入某个函数,格式为: from somemodule import somefunction
从某个模块中导入多个函数,格式为: from somemodule import firstfunc, secondfunc, thirdfunc
将某个模块中的全部函数导入,格式为: from somemodule import *
导入 sys 模块
1
2
3
4
5
6
|
import
sys
print
(
'================Python import mode=========================='
)
print
(
'命令行参数为:'
)
for
i
in
sys.argv:
print
(i)
print
(
'\n python 路径为'
,sys.path)
|
导入 sys 模块的 argv,path 成员
1
2
3
|
from
sys
import
argv,path
# 导入特定的成员
print
(
'================python from import==================================='
)
print
(
'path:'
,path)
# 因为已经导入path成员,所以此处引用时不需要加sys.path
|
命令行参数
很多程序可以执行一些操作来查看一些基本信息,Python可以使用-h参数查看各参数帮助信息:
小结:
#!/usr/bin/python3
第一行注释标的是指向 python 的路径,告诉操作系统执行这个脚本的时候,调用 /usr/bin 下的 python 解释器
推荐写法
#!/usr/bin/env python3
这种用法先在 env(环境变量)设置里查找 python 的安装路径,再调用对应路径下的解释器程序完成操作
关于 import 的小结,以 time 模块为例:
1、将整个模块导入,例如:import time,在引用时格式为:time.sleep(1)。
2、将整个模块中全部函数导入,例如:from time import *,在引用时格式为:sleep(1)。
3、将模块中特定函数导入,例如:from time import sleep,在引用时格式为:sleep(1)。
4、将模块换个别名,例如:import time as abc,在引用时格式为:abc.sleep(1)。
<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">