在python3中使用bs4模块爬取电影名称

在这里插入图片描述

root@VM-0-7-ubuntu:~/python/zeropython3/15# cat pa_https.py 
from bs4 import BeautifulSoup
import requests
  
url = 'https://www.80s.tw'

def pa(url):
	response = requests.get(url)
	#print (response.text)
	soup = BeautifulSoup(response.text,'lxml')
	#print (soup.prettify())
	#如果网页中格式混乱,可以使用此方法输出为标准的html格式
	for divv in soup.find_all('div',class_='left noborder clearfix block1'):
		#print (divv)
		for biaoti in divv.find_all('h3'):
			print (biaoti.string.strip())
	#先找到想要匹配的块,再具体匹配符合条件的内容。
   
pa(url)
-----------------------------------------------------------------------
root@VM-0-7-ubuntu:~/python/zeropython3/15# python3 pa_https.py 
一条狗的回家路
乌里:外科手术式打击
此房是我造
骡子/毒行侠
辩护人
狂野生活
大黄蜂
冒牌上尉
蓝色生死恋
皇家酒店谋杀案
生化危机6:终章[未删减版]
徒手攀岩
永生之地
检察方的罪人
高潮
碰撞 第一季
国务卿夫人[第五季]
未来全明星
联邦调查局
海豹突击队 第二季
新圣女魔咒
互怼特工
大热门
附身
触及真心
欢乐喜剧人第五季
歌手2019
声临其境 第二季
国家宝藏 第二季
明星大侦探[第四季]
吐槽大会(2018)
风味人间
奇葩说1-5季
中餐厅第二季
极限挑战 第四季
少年歌行
雪鹰领主
五等分的新娘
雄兵连之诸天降临
盾之勇者成名录
队长小翼/新足球小将
强风吹拂
武动乾坤动画版第一季
多罗罗
灵能百分百 第二季
发布了48 篇原创文章 · 获赞 22 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/lhh134/article/details/88744701