クレジットのpythonは、ディスクのソースは処理のJSONファイルをビルド販売している読んで

三本のパンダのJSONの論文は読み
信用販売のソースディスク構造Q <115.28.8.00.9.9>を
インポートjson_normalize pandas.io.jsonから
PD ASインポートパンダ
インポートJSON
インポート時間

#读入数据
data_str =オープン( 'AgriculturalDisease_train_annotations.json')。(読んで)

#--------------------测试json_normalize --------------------
START_TIME = time.time()
:Iの範囲内(0、300)のための
DATA_LIST = json.loads(data_str)
DF = json_normalize(DATA_LIST)
END_TIME = time.time()
耗时109秒-プリント(START_TIME END_TIME)

#--------------------测试自己构造--------------------
のstart_time = time.time( )
Iの範囲内(0、300)のための:
DATA_LIST = json.loads(data_str)
データ= [D [ "disease_class"]、D [ "image_idは"]] DATA_LISTにおけるDについて]
DF = pd.DataFrame(データ、カラム= [ "disease_class"、 "image_idは"])
END_TIME = time.time()
プリント(END_TIME - START_TIME)#耗时22秒

#--------------------测试read_json --------------------
START_TIME = time.time()
:Iの範囲内(0、300)のための
DF = pd.read_json(data_str、オリエント= '記録')
END_TIME = time.time()
プリント(END_TIME - START_TIME)#耗时36秒

#read_json
DF2 = pd.read_json(data_str、オリエント= '記録')

#自己构造
DATA_LIST = json.loads(data_str)
データ= [D [ "disease_class"]、D [ "image_idは"]] DATA_LISTにおけるDについて]
DF = pd.DataFrame(データ列= "disease_class"、 " image_idは"])
df.head(5)

コード出力の3種類を以下の通りです
image_idはdisease_class
0 62fd8bf4d53a1b94fbac16738406f10b.jpg 1。
1。1 0bdec5cccbcade6b6e94087cb5509d98.jpg。
2 8951e940341f77c8d361c1872c67b16d.jpg 1。
3. 1 7ed158da58c451f75fb790530d6f19cc.jpg。
4. 1 9b7399aa-1c3c-4137-ae4e-196cd23fe573 ___ FREC_Sc ...。
技術:文字列照合複雑なJSON再読み込み、次の形式にし、次に読み取るため= json.loads(data_str)を使用DATA_LIST
{「ERROR_CODE」:40007、「 ERROR_MSG」を「認識できません」}

[{ "部署" "ABCDEF"、
"query_result":{ "コード": "1000"、 "説明": "1000"}、
"is_invoice" :. 1、
"imagenameの":」./imgs/8888888.jpeg "
"reco_result ":{"合計":""、" invoice_no ":" 123 "" CREATE_DATE ":" "" check_code ":"「}}]
バルク読取JSONファイル(中国語JSON)
./out_file JSON二つのファイルを次のよう
out_01.txt内容: "{" NAME_ID ":" 12343 ""名前":" サン""識別コード":"不明"}"
out_02.txt内容: " { "NAME_ID": "12344" 、 "名前": " ジョン・ドウ"、 "識別コード": "98983"} "

おすすめ

転載: www.cnblogs.com/yanxiayan/p/11275195.html
おすすめ