使用python爬取网站源代码

import requests ###爬虫模块,获取网页文本
def gettext(url):
    r = requests.get(url,timeout=30)
    r.encoding = 'apparent_encoding'
    return r.text
### 把 'https://space.bilibili.com/435068643' 改成需要爬取的网站网址
###  '这是一个文件名.txt' 即为输出的txt文件的文件名

url = 'https://space.bilibili.com/435068643'
name = '这是一个文件名.txt'

print(gettext(url),file=open(name,'x',encoding='utf-8'))

猜你喜欢

转载自blog.csdn.net/Infinity_07/article/details/113982562