Atitit HTTPClientのインターフェイスの概要を休みます
ディレクトリ
1. HttpClientを使用して、HTTPプロトコルのクライアントライブラリやアート方法1
6.1。一見のgzipサポートのためのインポートurllib.requestエラーは、良いではありません4
ポストメソッドを取得します。
- 機能の目的は、なぜ
- アップロードしたファイルをダウンロードします
- テキスト、HTML、爬虫類取得
- フォームを送信する、など
- どのように特定のプロセス
HTTPServerの接続、受信バイトストリーム、テキストが文字列にトランスコーディング(GBKのUTF)を必要とするかもしれない場合
コマンド= "D:\\ prgrm \\ビン\\ curl.exeにhttp:// localhost:8080 / REG" ;
文字列のRZT = IOUtils。toString(ランタイムgetRuntime().exec(コマンド).getInputStream()、"GBK" )。
システム。アウト .println(RZT )。
Doctrineのデフォルトカール使用GBKコード読み取り。。もしそうであれば、URLの出力GBK
iconvのテストコーディングやないATI変換を用いました。
カール http://www.baidu.com | iconv -f 2312 -t UTF-8 のiconv
//実行要求を取得します。
CloseableHttpResponseの応答 = HttpClients。createDefault().execute(新しい HTTPGET(URL ));
//応答エンティティを取得します。
文字列HTML = EntityUtils。toString(応答.getEntity())。
リターン のhtml;
BS4インポート BeautifulSoup、コメント
インポート urllib.requestの
インポート要求
応答= urllib.request.urlopen( 'http://www.qq.com/' )
## HTML = response.read()。( 'UTF-8'を復号、 '無視する')
#html = response.read()。、 '2312'(デコード'無視')
#プリント(HTML)
R = requests.get('http://www.qq.com/' )
プリント(r.text)
Atititのpython GET HTMLソースコード