limpeza de dados (províncias ADD)

Use python para coincidir com nomes províncias,

Projeto ideia: use Baidu api alcançar o posicionamento de latitude e longitude, latitude e longitude e, em seguida, acompanhado por províncias

 

1. Leia o nome do local a partir do texto

# Extração área 
DEF Diqu (): 
    F = codecs.open ( ' kjcg.txt ' , MODE = ' R & lt ' , codificando = 'UTF-8 ' )   # arquivo txt aberta ao código 'utf-8' lendo 
    line = f.readline ()    # lido o ficheiro em linhas a enquanto linha: 
        um = line.split () 
        B = uma [0 :. 1]    # que é para ser lido de selecção bits de 
        list.append (B)   # o adicioná-lo na lista de 
        Linha = f.readline () 
    f.close ()
    

 

2. Chamada Baidu api alcançar localização de latitude e longitude ------

# Latitude e longitude Extract 
DEF geocodeB (endereço):
     "" " 
    @ endereço: string nome 
    @ Return Value: latitude, longitude 
    " "" 
    o base_url = " http://api.map.baidu.com/geocoder?address={address} & output = json & key = sua chave " .format (endereço = endereço) 

    Response = requests.get (a base_url) 
    resposta = response.json () 
    Latitude = resposta [ ' Resultado ' ] [ ' LOCALIZAÇÃO ' ] [ ' LNG '] # Por 
    resposta longitude = [ 'resultar ' ] [ ' localização ' ] [ ' lat ' ] # 

    list_lag.append (latitude) 
    list_lng.append (longitude)

 

3. Também usar Baidu api latitude e longitude ------- províncias

# Província Extract, cidade, distrito 
# com base em informações de latitude e longitude em Baidu Maps API para analisar as informações de localização 

DEF getLocation (LAT, LNG): 

    url = requests.get ( ' http://api.map.baidu.com/geocoder? LOCALIZAÇÃO = ' + LAT + ' , ' + LNG + ' & Output = JSON & key = sua chave ' ) 
    Resultado = url.json ()
     # impressão (Result) 
    Cidade = Resultado [ ' Resultado ' ] [ ' addressComponent ' ] [ ' cidade ' ] 
    Província = Resultado [ ' Resultado' ] [ ' AddressComponent ' ] [ ' província ' ] 
    distrito = resultado [ ' resultado ' ] [ ' addressComponent ' ] [ ' distrito ' ]
     # impressão (cidade, província, distrito) 
    list_all = [
         ' \ n ' + resultado [ ' resultar ' ] [ ' addressComponent ' ] [ ' cidade ' ] + ' , '+
        resultar [ ' resultado ' ] [ ' addressComponent ' ] [ ' província ' ] + ' ' + 
        resultado [ ' resultado ' ] [ ' addressComponent ' ] [ ' distrito ' ]] impressão (list_all)

    

 

4. Armazenamento de dados (a lista é convertida para uma string armazenado em um arquivo de texto)

= Res_all ' ' .join (list_all) 
    com Open ( ' realizações científicas e tecnológicas Território .txt ' , ' A + ' , codificando = " UTF-8 " ) como F: 
        f.write (res_all)

 

:( dados mostram o efeito a ser convertido ------ dados de conversão) (mas não sei por que os dois sentidos de conversão de api alguns dos dados não está ligado)

Por exemplo, Tianjin University of Science and Technology: Tianjin Dagu South Road, Hexi District, 1038 

Mas api para alcançá-los é com Baidu Beijing

 

 

 

Acho que você gosta

Origin www.cnblogs.com/birdmmxx/p/12483789.html
Recomendado
Clasificación