Python基础学习二
1.编码
utf-8编码:自动将英文保存为1个字符,中文3个字符。ASCll编码被囊括在内。
unicode:将所有字符保存为2给字符,容纳了世界上所有的编码。
2.字符串内置函数
ord()函数:获取字符的utf-8编码的整数形式。
ord('A') #输出65
ord('中') #输出20013
chr()函数:将utf-8的整数形式转换为对应字符。
chr('67') #输出'C'
chr('25991') #输出'文'
encode()函数:获取字符对应编码方式的16进制形式。
'我'.encode('utf-8') #输出b'\xe6\x88\x91'
其中b表示以字节的方式存储,在utf-8编码中,中文有3个字节,转化为三个16进制数。
扫描二维码关注公众号,回复:
8776211 查看本文章
decode()函数:解码函数,将上述得到的数字按照对应的编码形式翻译为对应字符
b'\xe6\x88\x91'.decode('utf-8',errors='ignore') #输出'我'
其中errors='ignore'表示忽视错误字节,如输入四个字节时,默认读取前三个。
len()函数:用于计算字符串的长度或字节数
3.指定utf-8编码
为了确保解释器以utf-8编码读取文件,需要在文件开头写上两行注释
# !/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行用于告诉Linux操作系统,这是Python文件,第二行说明文字编码方式。
4.变量输出
与C语言相同,用“%”获取,格式如下
'Today is %s , i have $' % ('good','10000')
格式 | 内容 |
---|---|
%d | 整数 |
%f | 浮点数 |
%s | 字符串 |
%x | 16进制数 |
%% | % |
format()函数:用于传入参数
'Hello, {0}! You have ${1}'.format('li',100000)