レッドブルブランチpart01の基本データをクロールするだけです
このチュートリアルでは、requests、re、pandasの3つのモジュールを使用して、クロールを完了します。
モジュールをインポートします。
import requests
import re
import pandas
获取URL:
url = requests.get('http://www.redbull.com.cn/about/branch')
コード:
import requests
import re
import pandas
url = requests.get('http://www.redbull.com.cn/about/branch')
# 打印是否能获取URL请求
# print(url.text)
# 公司名称
title_list = re.findall('<h2>(.*?)</h2>',url.text)
# print(title_list)
# 公司地址
addr_list = re.findall("<p class='mapIco'>(.*?)</p>",url.text)
# print(addr_list)
# 公司邮箱
email_list = re.findall("<p class='mailIco'>(.*?)</p>",url.text)
# print(email_list)
# 公司电话
phone_list = re.findall("<p class='telIco'>(.*?)</p>",url.text)
# print(phone_list)
data_dict={
"公司名称":title_list,
"公司地址":addr_list,
"公司邮箱":email_list,
"公司电话":phone_list
}
df = pandas.DataFrame(data_dict)
df.to_excel(r'company.xlsx')
関係者を見ていただきありがとうございます、私たちは後で更新し続けます!!!