"""
网上有很多API接口, 直接可以返>回json格式的数据, 通过处理, easy搞定……
根据IP查询所在地、运营商等信息的一些API如下:
1. 淘宝的API(推荐):http://ip.taobao.com/service/getIpInfo.php?ip=110.84.0.129
2. 国外freegeoip.net(推荐):http://freegeoip.net/json/110.84.0.129 这个还提供了经纬度信息(但不一定准>)
3. 新浪的API:http://int.dpool.sina.com.cn/iplookup/iplookup.php?format=json&ip=110.84.0.129
4. 腾讯的网页查询(返回的非json格式): http://ip.qq.com/cgi-bin/searchip?searchip1=110.84.0.129
5. ip.cn的网页(返回的非json格式):http://www.ip.cn/index.php?ip=110.84.0.129
6. ip-api.com: http://ip-api.com/json/110.84.0.129
上述的API接口,大多有一个特点是, 返回的直接是个json格式;
# Json数据: JavaScript Object Notation, 一种轻量型数据交换格式, 便于阅读和交换数据.
"""
#一个简单的爬虫
from urllib.request import urlopen#urlopen模块是解析url地址的
import json
url='http://ip.taobao.com/service/getIpInfo.php?ip=110.84.0.129'
#解析url地址后返回的是一个url对象
urlobj=urlopen(url)
#读取对象里的信息并编码为字符串信息
pageContent=urlobj.read().decode('utf-8')
#处理json数据,将json数据格式解码为python可以识别的对象;
dict_data=json.loads(pageContent)
print(dict_data)
print("""
所在城市: %s
所在国家: %s
""" %(dict_data['data']['city'], dict_data['data']['country']))
"""
使用 JSON 函数需要导入 json 库:import json。
json.dumps 将 Python 对象编码成 JSON 字符串
json.loads 将已编码的 JSON 字符串解码为 Python 对象
json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
allow_nan=True, cls=None, indent=None,
separators=None, encoding="utf-8", default=None,
sort_keys=False, **kw)
# 案例:
print(json.dumps({'a': 'Runoob', 'b': 7}, sort_keys=True, indent=4, separators=(',', ': ')))
"""
import json
#python对象编码成为json数据格式
d={'key%s' %i:'value%s'%i for i in range(100)}
jsonStr=json.dumps(d)
print(jsonStr)
print(type(jsonStr))
#无论是字典还是列表,都不影响数据的转换
l=[1,2,3,'hello']
jsonLi=json.dumps(l)
print(jsonLi)
print(type(jsonLi))
# python对象编码为json格式, 并保存到制定文件中;
with open('doc/text1.json' , 'w') as f:
# indent: 是否设置缩进;
# sort_keys: 是否对key值进行排序;
# separators = {"每个元素之间的分隔符", “key和value值之间的分隔符”}
json.dump(d,f,indent=4,sort_keys=True,separators=(',',':'))
# json对象解码成为python的数据格式
python_dict=json.loads(jsonStr)
print(python_dict,'\n',type(python_dict))
# json对象(存储在json文件)解码成为python的数据格式;
with open('doc/text1.json','r') as f:
python_Dict=json.load(f)
print(python_Dict,'\n',type(python_Dict))
#load与loads,dump与dumps
"""
load是文件在读取.json时,需要直接生成python数据时使用
loads是一个json的数据对象直接转换为python的数据格式,非文件
dump是将一个python的数据格式转化为json数据格式并写入文件,第一个参数是python的数据,第二个参数是函数的写入,即 .write()
dumps是直接将一个python数据转化为json数据直接使用
"""
"""
# 1. 什么是difflib? 用来做什么?
difflib为python的标准库模块,无需安装。作用时对比文本之间的差异。
并且支持输出可读性比较强的HTML文档,与LInux下的diff 命令相似。
在版本控制方面非常有用。
# 2. 符号理解
符号 含义
'-' 包含在第一个系列行中,但不包含第二个。
'+' 包含在第二个系列行中,但不包含第一个。
' ' 两个系列行一致
'?' 存在增量差异
'^' 存在差异字符
"""
import difflib
#以每行分离,并以字符串格式存储在列表中
text1="""1. Beautiful is better than ugly.
2. Explicit is better than implicit.
3. Simple is better than complex.
4. Complex is better than complicated.
""".splitlines(keepends=True)
text2 = ''' 1. Beautiful is better than ugly.
3. Simple is better than complex.
4. Complicated is better than complex.
5. Flat is better than nested.
'''.splitlines(keepends=True)
# 实现linux里面的diff命令的功能;
d = difflib.Differ()
print("".join(list(d.compare(text1, text2))))
#以html格式来查看差异更为直观;
d = difflib.HtmlDiff()
htmlContent = d.make_file(text1, text2)
with open('doc/diff.html','w') as f:
f.write(htmlContent)
非html格式查看对比
html格式的对比查看
"""
查看那两个文件之间的对比:对比复制之后的文件相比原文件改变了什么
"""
import difflib
with open('/etc/passwd') as f1,open('/tmp/passwd') as f2:
content1=f1.read().splitlines(keepends=True)
content2=f2.read().splitlines(keepends=True)
#实例化一个对比的html对象
d=difflib.HtmlDiff()
#传入两个文件,将对比结果写入对象里,以文件方式
File_html=d.make_file(content1,content2)
with open('doc/File_html.html','w') as f:
f.write(File_html)
"""
sys模块:全称system,指的是解释器(os指的是操作系统)
常用操作,用于接收系统操作系统调用解释器传入的参数
- sys.argv 命令行参数List,第一个元素是程序本身路径
- sys.exit(n) 退出程序,正常退出时exit(0)
- sys.version 获取Python解释程序的版本信息
- sys.maxsize 最大的Int值
- sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
- sys.platform 返回操作系统平台名称
"""
import os
import sys
print(sys.argv)
# 获取脚本名称 sys.argv[0]
# 获取脚本传递的第一个参数 sys.argv[1]
# 获取脚本传递的第二个参数 sys.argv[2]
#获取Python解释程序的版本信息
print(sys.version)
# 作用, 根据python版本编写符合不同版本的程序, 使得程序可兼容;
if sys.version[0] == '2':
print("running in python2.......")
elif sys.version[0] == '3':
print("running in python3........")
print(sys.maxsize)
print(sys.path)
# 可以实现跨平台;
print(sys.platform)
if sys.platform == 'linux':
os.system('ifconfig')
else:
os.system('ipconfig')
"""
实现自己mydiff命令,在命令行中运用
mydiff /etc/passwd /tmp/passwd > /home/kiosk/Desktop/test.html
首先得将程序写到/usr/local/bin/mydiff
在给予文件权限 chmod +x /usr/local/bin/mydiff
同时在文件的第一行加上使用的python解释器的地址
#!/home/kiosk/anaconda3/envs/virtl/bin/python3.6
"""
import difflib
import sys
if len(sys.argv) !=3:
print('%s 比较的文件1 比较的文件2 [>导出的文件路径 ]'%sys.argv[0])
else:
filename1 = sys.argv[1]
filename2 = sys.argv[2]
try:
with open(filename1) as f1, open(filename2) as f2:
content1 = f1.read().splitlines(keepends=True)
content2 = f2.read().splitlines(keepends=True)
except Exception as e:
print("比较错误, 错误原因: ", e)
else:
d = difflib.HtmlDiff()
htmlContent = d.make_file(content1, content2)
print(htmlContent)
运行mydiff /etc/passwd /tmp/passwd > /tmp/hello.html
在/tmp下有hello.html文件产生