03-笔记:Python 基本语法

编码

默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。 当然你也可以为源码文件指定不同的编码:

# -*- coding:utf-8 -*-

 

关于字符编码

ASCII编码和Unicode编码的区别:ASCII编码是1个字节,而Unicode编码通常是2个字节

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间

 

字符 ASCII Unicode UTF-8
A 01000001 00000000 01000001 01000001
x 01001110 00101101 11100100 10111000 10101101

ASCII编码实际上可以被看成是UTF-8编码的一部分

 

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码

用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:

浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器:

很多网页的源码上会有类似<meta charset="UTF-8" />的信息,表示该网页正是用的UTF-8编码

1个中文字符经过UTF-8编码后通常会占用3个字节,而1个英文字符只占用1个字节

 

在最新的Python 3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言

 

在操作字符串时,经常遇到strbytes的互相转换。

为了避免乱码问题,应当始终坚持使用UTF-8编码对strbytes进行转换

 

 

标识符

  • 第一个字符必须是字母表中字母或下划线 _ 。
  • 标识符的其他的部分由字母、数字和下划线组成。
  • 标识符对大小写敏感。

在 Python 3 中,可以用中文作为变量名,非 ASCII 标识符也是允许的了

 

python保留字

保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:

1
>>>  import  keyword
>>> keyword.kwlist
[ 'False' 'None' 'True' 'and' 'as' 'assert' 'break' 'class' 'continue' 'def' 'del' 'elif' 'else' 'except' 'finally' 'for' 'from' 'global' 'if' 'import' 'in' 'is' 'lambda' 'nonlocal' 'not' 'or' 'pass' 'raise' 'return' 'try' 'while' 'with' 'yield' ]

 

 

注释

Python中单行注释以 # 开头,实例如下:

多行注释可以用多个 # 号,还有 ''' 和 """

1
2
3
4
5
6
#!/usr/bin/python3
  # 第一个注释# 第二个注释
  '''第三注释
第四注释'''
  """第五注释
第六注释""" print  ("Hello, Python!")

 

行与缩进

python最具特色的就是使用缩进来表示代码块,不需要使用大括号 {} 。

缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数。实例如下:

1
2
3
4
if  True :    
     print  ( "True" )
else :    
     print  ( "False" )

 

缩进不一致,会导致运行错误

多行语句

Python 通常是一行写完一条语句,但如果语句很长,我们可以使用反斜杠(\)来实现多行语句

1
2
3
total  =  item_one  +  \
         item_two  +  \
         item_three

在 [], {}, 或 () 中的多行语句,不需要使用反斜杠(\),例如:

1
2
total  =  [ 'item_one' 'item_two' 'item_three' ,
         'item_four' 'item_five' ]

 

数字(Number)类型

python中数字有四种类型:整数、布尔型、浮点数和复数。

  • int (整数), 如 1, 只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。
  • bool (布尔), 如 True。
  • float (浮点数), 如 1.23、3E-2
  • complex (复数), 如 1 + 2j、 1.1 + 2.2j

 

 

字符串(String)

    • python中单引号和双引号使用完全相同。
    • 使用三引号('''或""")可以指定一个多行字符串。
    • 转义符 '\'
    • 反斜杠可以用来转义,使用r可以让反斜杠不发生转义。。 如 r"this is a line with \n" 则\n会显示,并不是换行。
    • 按字面意义级联字符串,如"this " "is " "string"会被自动转换为this is string。
    • 字符串可以用 + 运算符连接在一起,用 * 运算符重复。
    • Python 中的字符串有两种索引方式,从左往右以 0 开始,从右往左以 -1 开始。
    • Python中的字符串不能改变。
    • Python 没有单独的字符类型,一个字符就是长度为 1 的字符串。
    • 字符串的截取的语法格式如下:变量[头下标:尾下标:步长]
    • 在字符串前面添加一个 r,表示原始字符串,不会发生转义
1
2
3
4
5
6
7
8
9
10
11
12
#!/usr/bin/python3
str = 'Runoob'
print ( str )                  # 输出字符串
print ( str [ 0 : - 1 ])            # 输出第一个到倒数第二个的所有字符
print ( str [ 0 ])               # 输出字符串第一个字符
print ( str [ 2 : 5 ])             # 输出从第三个开始到第五个的字符
print ( str [ 2 :])              # 输出从第三个开始的后的所有字符
print ( str  *  2 )              # 输出字符串两次
print ( str  +  '你好' )         # 连接字符串
print ( '------------------------------' )
print ( 'hello\nrunoob' )       # 使用反斜杠(\)+n转义特殊字符
print (r 'hello\nrunoob' )      # 在字符串前面添加一个 r,表示原始字符串,不会发生转义

 

空行

函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。类和函数入口之间也用一行空行分隔,以突出函数入口的开始。

空行与代码缩进不同,空行并不是Python语法的一部分。书写时不插入空行,Python解释器运行也不会出错。但是空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。

记住:空行也是程序代码的一部分

 

等待用户输入

执行下面的程序在按回车键后就会等待用户输入:

1
2
#!/usr/bin/python3
  input ( "\n\n按下 enter 键后退出。" )

以上代码中 ,"\n\n"在结果输出前会输出两个新的空行。一旦用户按下 enter 键时,程序将退出。

 

 

同一行显示多条语句

Python可以在同一行中使用多条语句,语句之间使用分号(;)分割

 

多个语句构成代码组

缩进相同的一组语句构成一个代码块,我们称之代码组。

像if、while、def和class这样的复合语句,首行以关键字开始,以冒号( : )结束,该行之后的一行或多行代码构成代码组。

我们将首行及后面的代码组称为一个子句(clause)。

1
2
3
4
5
if  expression : 
    suiteelif expression : 
    suite 
else 
    suite

 

Print 输出

print 默认输出是换行的,如果要实现不换行需要在变量末尾加上 end=""

1
2
3
4
5
6
7
8
9
10
11
#!/usr/bin/python3
x = "a"
y = "b"
# 换行输出
print ( x )
print ( y )
print ( '---------' )
# 不换行输出
print ( x, end = " "  )
print ( y, end = " "  )
print ()

 

import 与 from...import

在 python 用 import 或者 from...import 来导入相应的模块。

将整个模块(somemodule)导入,格式为: import somemodule

从某个模块中导入某个函数,格式为: from somemodule import somefunction

从某个模块中导入多个函数,格式为: from somemodule import firstfunc, secondfunc, thirdfunc

将某个模块中的全部函数导入,格式为: from somemodule import *

导入 sys 模块

1
2
3
4
5
6
import  sys
print ( '================Python import mode==========================' )
print  ( '命令行参数为:' )
for  in  sys.argv:    
     print  (i)
print  ( '\n python 路径为' ,sys.path)

导入 sys 模块的 argv,path 成员

1
2
3
from  sys  import  argv,path   #  导入特定的成员
print ( '================python from import===================================' )
print ( 'path:' ,path)  # 因为已经导入path成员,所以此处引用时不需要加sys.path

命令行参数

很多程序可以执行一些操作来查看一些基本信息,Python可以使用-h参数查看各参数帮助信息:

 

小结:

 

#!/usr/bin/python3

第一行注释标的是指向 python 的路径,告诉操作系统执行这个脚本的时候,调用 /usr/bin 下的 python 解释器

 

推荐写法

 

#!/usr/bin/env python3

这种用法先在 env(环境变量)设置里查找 python 的安装路径,再调用对应路径下的解释器程序完成操作

 

关于 import 的小结,以 time 模块为例:

1、将整个模块导入,例如:import time,在引用时格式为:time.sleep(1)

2、将整个模块中全部函数导入,例如:from time import *,在引用时格式为:sleep(1)

3、将模块中特定函数导入,例如:from time import sleep,在引用时格式为:sleep(1)

4、将模块换个别名,例如:import time as abc,在引用时格式为:abc.sleep(1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

猜你喜欢

转载自www.cnblogs.com/bog-box/p/python-basic-grammar.html