レッドブルブランチpart01の基本データをクロールするだけです

レッドブルブランチpart01の基本データをクロールするだけです

このチュートリアルでは、requests、re、pandasの3つのモジュールを使用して、クロールを完了します。

モジュールをインポートします。

import requests
import re
import pandas

获取URL:

url = requests.get('http://www.redbull.com.cn/about/branch')

コード:

import requests
import re
import pandas


url = requests.get('http://www.redbull.com.cn/about/branch')

# 打印是否能获取URL请求
# print(url.text)

# 公司名称
title_list = re.findall('<h2>(.*?)</h2>',url.text)
# print(title_list)
# 公司地址
addr_list = re.findall("<p class='mapIco'>(.*?)</p>",url.text)
# print(addr_list)
# 公司邮箱
email_list = re.findall("<p class='mailIco'>(.*?)</p>",url.text)
# print(email_list)
# 公司电话
phone_list = re.findall("<p class='telIco'>(.*?)</p>",url.text)
# print(phone_list)

data_dict={
    
    
"公司名称":title_list,
"公司地址":addr_list,
"公司邮箱":email_list,
"公司电话":phone_list
}

df = pandas.DataFrame(data_dict)
df.to_excel(r'company.xlsx')

関係者を見ていただきありがとうございます、私たちは後で更新し続けます!

おすすめ

転載: blog.csdn.net/qq_41405475/article/details/111472594