jsonpath é uma ferramenta de extração de valor-chave usada em dados no formato json. Em python, a biblioteca jsonpath foi empacotada para instalarmos e usarmos. Veja como usá-lo——
Instalar:
pip instalar jsonpath
Ou baixe o pacote de instalação no interpretador pycharm
Definição de função:
def jsonpath(obj, expr, result_type='VALUE', debug=0, use_eval=True): """atravessar objeto JSON usando jsonpath expr, retornando valores ou caminhos"""
Significado do parâmetro:
obj: os dados reais que precisam ser processados
expr: expressão jsonpath
result_type: O tipo do resultado retornado, o padrão é 'VALUE' indicando o valor dos dados retornados, 'IPATH' indicando a chave dos dados retornados
debug: se deve ativar o modo de depuração. O valor padrão é 0, o que significa que está fechado. Se não for 0, significa que está habilitado.
use_eval: quando debug=1, coopere com a depuração
(Os dois últimos parâmetros não são comumente usados. Se quiser saber mais, consulte a documentação oficial)
Sintaxe comumente usada:
jsonpath | explicar |
$ | elemento raiz |
. ou [] | elemento filho |
.. | consulta recursiva |
@ | elemento atual |
* | todos os elementos |
?() | Aplicar expressão de filtro; geralmente precisa ser usado em conjunto com [?(@ )] |
[] | (matriz) operador subscrito |
[,] | Selecionar vários campos Você também pode fatiar [m:n], mas não pode usá-lo assim [-1] |
() | Expressão de script, usada no mecanismo de script |
** Adicionar parâmetros result_type='IPATH' pode retornar o nome da chave
Exemplo de código:
import jsonpath
a = {
"score": [
{"name": "张三",
"语文": 75,
"数学": 90,
"英语": 91, },
{"name": "李四",
"语文": 78,
"数学": 95,
"英语": 90, },
{"name": "王五",
"语文": 90,
"数学": 95,
"英语": 90, },
{"name": "王六",
"语文": 90,
"数学": 95,
"英语": 90,
"extra": 80},
{"name": "老李",
"语文": 90,
"数学": 95,
"英语": 90,
"extra": 90}
],
"school": "社会大学"
}
# 字典对象[键名],可以获取到对应键值。
# 所以,a["name"]可以取到'张三',a["score"]["语文"]
# $ 表示根键,键和键之间使用 . 链接,如 $.score 表示根键下的score键中的所有的值
print(jsonpath.jsonpath(a, "$.score"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]]
# $.score[0] 表示根键下的第一个score值
print(jsonpath.jsonpath(a, "$.score[0]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}]
# $.score[0] 表示根键下的第一个score中的语文的值,下面两种写法都可以
print(jsonpath.jsonpath(a, "$.score[0].语文"))
print(jsonpath.jsonpath(a, "$.[score][0]['语文']"))
# [75]
# $.score[1,3],表示根键下的第2个和第4个score键,一次性取多个数组下标的值
print(jsonpath.jsonpath(a, "$.score[1,3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]
# $.score[1:3],表示根键下的第2个和第3个score键,使用切片取值,注意区别于 $.score[1,4],二者得到的结果不一样
print(jsonpath.jsonpath(a, "$.score[1:3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]
# $.score[0:3:2],表示根键下的从第0个score键开始、到第4个score键结束(不包括)、每2个取1个,即取的是第0和第2个score键
print(jsonpath.jsonpath(a, "$.score[0:3:2]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]
# 条件筛选:?()为应用条件筛选器,@表示当前键,一般结合使用?(@ )
# 取name为 ’张三‘ 的 ’数学‘成绩
print(jsonpath.jsonpath(a, "$.score[?(@.name=='张三')].'数学'"))
# [90]
# 取成绩中有 extra 键的数据,如果key为中文 $.score[?(@.'数学')],则筛选表达式返回结果会为 False ,哪位大神知道是为什么?可以评论区告诉我一下答案
print(jsonpath.jsonpath(a, "$.score[?(@.extra)]"))
# [{'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]
# 取成绩中有 extra 分数大于85的数据
print(jsonpath.jsonpath(a, "$.score[?(@.extra>85)]"))
# [{'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]
# 递归取值,获取所有键为 extra 的值
print(jsonpath.jsonpath(a, "$..extra"))
# [80, 90]
# * 表示所有 $.* 表示获取根键下所有的值
print(jsonpath.jsonpath(a, "$.*"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']
# 加上参数 result_type='IPATH' 可以返回键名
print(jsonpath.jsonpath(a, "$.*", result_type='IPATH'))
# [['score'], ['school']]
# 加上参数 debug=1 开启调试模式,默认为 debug=0 关闭
print(jsonpath.jsonpath(a, "$.*", debug=1))
# trace * / $
# * <class 'dict'>
# trace score; / $
# score <class 'dict'>
# trace / $;score
# trace school; / $
# school <class 'dict'>
# trace / $;school
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']