データクリーニング(追加州)

名前地方と一致するように、使用のpython、

設計思想:使用BaiduのAPIは、緯度と経度、緯度と経度の位置を達成した後、地方にマッチ

 

テキストから場所の名前をお読みください。

抽出領域の
DEFのdiqu():
    Fは(codecs.open = ' kjcg.txt '、MODE = ' R&LT ' =コード、'UTF-8 ''UTF-8'コード読み取りにオープンtxtファイルを 
    行= f.readline()   は、行のファイルを読み取るつつ:ライン
        A = line.split()
        B = [0 :. 1]   ビットを選択読まれるべきである 
        (B)をlist.append   リストにそれを追加 
        ライン= f.readline()
    f.close()を
    

 

2.コール百度APIは、緯度と経度の位置を達成------

抽出緯度と経度
DEF geocodeB(アドレス):
     "" " 名列アドレス@ 
    戻り値@:緯度、経度
    " "" 
    BASE_URL = " http://api.map.baidu.com/geocoder?address={address} &出力= JSON&キー=あなたの鍵は" .format(アドレス= アドレス)

    レスポンス = requests.get(BASE_URL)
    の答え = response.json()
    緯度 =答え[ ' 結果' ] [ ' LOCATION ' ] [ ' LNG '] によって 
    経度応答= [ '結果' ] [ ' 場所' ] [ ' LAT ' ] 

    list_lag.append(緯度)
    list_lng.append(経度)

 

3.また、百度、API緯度と経度-------州を使用します

省、都市、地区抽出物位置情報を解析するために百度マップAPIにおける緯度及び経度情報に基づいて、

DEF :のgetLocation(LAT、LNG)

    URL = requests.get(' http://api.map.baidu.com/geocoderか? LOCATION = ' + LAT + ' ' + LNG + ' &出力= JSON&キー=あなたの鍵' 
    結果 = url.json()
    印刷(結果) 
    [市は=結果' 結果' ] [ ' addressComponentを' [] ' ]  =結果[ 結果' ] [ ' addressComponent ' ] [ ' ' ] 
    地区 =結果[ ' 結果' ] [ ' addressComponent ' ] [ ' ' ]
     #のプリント(都市、州、地区) 
    list_all = [
         ' \ n ' +結果[ ' その結果' ] [ ' addressComponent ' ] [ ' ' ] + ' "+
        結果[ ' 結果' ] [ ' addressComponent ' ] [ ' ' ] + ' ' + 
        結果[ ' 結果' ] [ ' addressComponent ' ] [ ' ' ] プリント(list_all)

    

 

4.データストレージ(リストは、テキストファイルに格納された文字列に変換されます)

= res_all ' ' .join(list_all)
    オープン(と' 科学技術の成果のテリトリー.TXT '' A + '、エンコード= " UTF-8 " )F AS:
        f.write(res_all)

 

:(データ))------変換データを変換する効果を示す(ただし、データのいくつかのうちのAPIからの双方向変換がでない理由がわかりません

例えば、科学技術の天津大学:天津Dagu南路、河西区、1038 

しかし、それらを達成するためのAPIは、Baiduの北京経由で

 

 

 

おすすめ

転載: www.cnblogs.com/birdmmxx/p/12483789.html