json数据格式与文件对比difflib模块

"""

  网上有很多API接口, 直接可以返>回json格式的数据, 通过处理, easy搞定……

    根据IP查询所在地、运营商等信息的一些API如下:
    1. 淘宝的API(推荐):http://ip.taobao.com/service/getIpInfo.php?ip=110.84.0.129
    2. 国外freegeoip.net(推荐):http://freegeoip.net/json/110.84.0.129 这个还提供了经纬度信息(但不一定准>)
    3. 新浪的API:http://int.dpool.sina.com.cn/iplookup/iplookup.php?format=json&ip=110.84.0.129
    4. 腾讯的网页查询(返回的非json格式): http://ip.qq.com/cgi-bin/searchip?searchip1=110.84.0.129
    5. ip.cn的网页(返回的非json格式):http://www.ip.cn/index.php?ip=110.84.0.129
    6. ip-api.com: http://ip-api.com/json/110.84.0.129

上述的API接口,大多有一个特点是, 返回的直接是个json格式;




# Json数据: JavaScript Object Notation, 一种轻量型数据交换格式, 便于阅读和交换数据.



"""
#一个简单的爬虫
from urllib.request import urlopen#urlopen模块是解析url地址的
import json

url='http://ip.taobao.com/service/getIpInfo.php?ip=110.84.0.129'

#解析url地址后返回的是一个url对象
urlobj=urlopen(url)

#读取对象里的信息并编码为字符串信息
pageContent=urlobj.read().decode('utf-8')

#处理json数据,将json数据格式解码为python可以识别的对象;
dict_data=json.loads(pageContent)
print(dict_data)
print("""
所在城市: %s
所在国家: %s

""" %(dict_data['data']['city'], dict_data['data']['country']))

在这里插入图片描述

"""

使用 JSON 函数需要导入 json 库:import json。

json.dumps      将 Python 对象编码成 JSON 字符串
json.loads      将已编码的 JSON 字符串解码为 Python 对象

json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
            allow_nan=True, cls=None, indent=None,
            separators=None, encoding="utf-8", default=None,
            sort_keys=False, **kw)

# 案例:
print(json.dumps({'a': 'Runoob', 'b': 7}, sort_keys=True, indent=4, separators=(',', ': ')))
"""
import json

#python对象编码成为json数据格式

d={'key%s' %i:'value%s'%i for i in range(100)}
jsonStr=json.dumps(d)
print(jsonStr)
print(type(jsonStr))

#无论是字典还是列表,都不影响数据的转换
l=[1,2,3,'hello']
jsonLi=json.dumps(l)
print(jsonLi)
print(type(jsonLi))

# python对象编码为json格式, 并保存到制定文件中;
with open('doc/text1.json' , 'w') as f:
    # indent: 是否设置缩进;
    # sort_keys: 是否对key值进行排序;
    # separators = {"每个元素之间的分隔符", “key和value值之间的分隔符”}
    json.dump(d,f,indent=4,sort_keys=True,separators=(',',':'))


# json对象解码成为python的数据格式
python_dict=json.loads(jsonStr)
print(python_dict,'\n',type(python_dict))


# json对象(存储在json文件)解码成为python的数据格式;
with open('doc/text1.json','r') as f:
    python_Dict=json.load(f)
    print(python_Dict,'\n',type(python_Dict))

#load与loads,dump与dumps
"""
load是文件在读取.json时,需要直接生成python数据时使用
loads是一个json的数据对象直接转换为python的数据格式,非文件

dump是将一个python的数据格式转化为json数据格式并写入文件,第一个参数是python的数据,第二个参数是函数的写入,即 .write()
dumps是直接将一个python数据转化为json数据直接使用
"""

在这里插入图片描述

"""
# 1. 什么是difflib? 用来做什么?
difflib为python的标准库模块,无需安装。作用时对比文本之间的差异。
并且支持输出可读性比较强的HTML文档,与LInux下的diff 命令相似。
在版本控制方面非常有用。

# 2. 符号理解
符号    含义
'-'     包含在第一个系列行中,但不包含第二个。
'+'     包含在第二个系列行中,但不包含第一个。
' '     两个系列行一致
'?'     存在增量差异
'^'     存在差异字符

"""
import difflib

#以每行分离,并以字符串格式存储在列表中
text1="""1. Beautiful is better than ugly.
       2. Explicit is better than implicit.
       3. Simple is better than complex.
       4. Complex is better than complicated.
""".splitlines(keepends=True)

text2 = '''  1. Beautiful is better than ugly.
       3.   Simple is better than complex.
       4. Complicated is better than complex.
       5. Flat is better than nested.
     '''.splitlines(keepends=True)

# 实现linux里面的diff命令的功能;
d = difflib.Differ()
print("".join(list(d.compare(text1, text2))))
#以html格式来查看差异更为直观;
d = difflib.HtmlDiff()
htmlContent = d.make_file(text1, text2)

with open('doc/diff.html','w') as f:
    f.write(htmlContent)

非html格式查看对比
在这里插入图片描述
html格式的对比查看
在这里插入图片描述

"""
查看那两个文件之间的对比:对比复制之后的文件相比原文件改变了什么
"""

import difflib

with open('/etc/passwd') as f1,open('/tmp/passwd') as f2:
    content1=f1.read().splitlines(keepends=True)
    content2=f2.read().splitlines(keepends=True)
#实例化一个对比的html对象
d=difflib.HtmlDiff()
#传入两个文件,将对比结果写入对象里,以文件方式
File_html=d.make_file(content1,content2)
with open('doc/File_html.html','w') as f:
    f.write(File_html)

在这里插入图片描述

"""
sys模块:全称system,指的是解释器(os指的是操作系统)
常用操作,用于接收系统操作系统调用解释器传入的参数

- sys.argv           命令行参数List,第一个元素是程序本身路径
- sys.exit(n)        退出程序,正常退出时exit(0)
- sys.version        获取Python解释程序的版本信息
- sys.maxsize         最大的Int值
- sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
- sys.platform       返回操作系统平台名称
"""

import os
import sys
print(sys.argv)
# 获取脚本名称  sys.argv[0]
# 获取脚本传递的第一个参数  sys.argv[1]
# 获取脚本传递的第二个参数  sys.argv[2]

#获取Python解释程序的版本信息
print(sys.version)

# 作用, 根据python版本编写符合不同版本的程序, 使得程序可兼容;
if sys.version[0] == '2':
    print("running in python2.......")
elif sys.version[0] == '3':
    print("running in python3........")

print(sys.maxsize)
print(sys.path)

# 可以实现跨平台;
print(sys.platform)
if sys.platform == 'linux':
    os.system('ifconfig')
else:
    os.system('ipconfig')

在这里插入图片描述

"""
实现自己mydiff命令,在命令行中运用
mydiff /etc/passwd /tmp/passwd > /home/kiosk/Desktop/test.html
首先得将程序写到/usr/local/bin/mydiff
在给予文件权限 chmod +x /usr/local/bin/mydiff
同时在文件的第一行加上使用的python解释器的地址
#!/home/kiosk/anaconda3/envs/virtl/bin/python3.6
"""
import difflib
import sys

if len(sys.argv) !=3:
    print('%s 比较的文件1  比较的文件2  [>导出的文件路径 ]'%sys.argv[0])
else:
    filename1 = sys.argv[1]
    filename2 = sys.argv[2]
    try:
        with open(filename1) as f1, open(filename2) as f2:
            content1 = f1.read().splitlines(keepends=True)
            content2 = f2.read().splitlines(keepends=True)
    except Exception as e:
        print("比较错误, 错误原因: ", e)
    else:
        d = difflib.HtmlDiff()
        htmlContent = d.make_file(content1, content2)
        print(htmlContent)

运行mydiff /etc/passwd /tmp/passwd > /tmp/hello.html
在/tmp下有hello.html文件产生
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/GLH_2236504154/article/details/87566397
今日推荐