学习爬虫（一） - 代码天地

学习爬虫（一）

其他 2018-06-15 22:07:50 阅读次数: 5

学习爬虫：

1、安装Python（anaconda)

2、安装库

pip install requests

3、简单访问网页

import requests #导入requests库
r = requests.get('http://www.lining0806.com') #像目标url地址发送get请求，返回一个response对象
print(r.text) #r.text是http response的网页HTML

4、获取文章标题

 1 # -*- coding: utf-8 -*-
 2 """
 3 Spyder Editor
 4 
 5 This is a temporary script file.
 6 """
 7 
 8 import requests
 9 from bs4 import BeautifulSoup
10 
11 url = 'http://www.lining0806.com'
12 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'} 
13 r = requests.get(url, headers=headers)
14 all_title = BeautifulSoup(r.text, 'lxml').find('div', class_='content').find_all('a',attrs={"target": "_blank"})
15 Alltitle = []
16 for title in all_title:
17     title_temp = title.get('title')
18     print(title_temp)
19     if (title_temp ==None):
20         continue
21     else:
22         Alltitle.append(title_temp)
23 print (Alltitle)

目前只有找到使用循环获取a标签下的title内容。以后有更好的方法时再更新

猜你喜欢

转载自www.cnblogs.com/Crazy-sun/p/9189048.html

Python爬虫学习（一）

网络爬虫学习（一）

学习爬虫（一）

python 爬虫学习（一）

爬虫学习（一）

Python爬虫学习一

《爬虫学习》（一）

# 爬虫快速学习（一）

爬虫学习总结一

python爬虫学习(一)

爬虫学习笔记（一）初识爬虫

python爬虫学习笔记(一)-爬虫介绍

爬虫学习记录（一）————Request库爬虫

Python爬虫学习（一）——爬虫基础

WebCollector爬虫学习记录（一）

python学习之爬虫一

Python网络爬虫学习（一）

爬虫框架Scrapy学习（一）

Python爬虫学习笔记一

爬虫Scrapy框架学习（一）

爬虫学习笔记整理一

Scrapy爬虫框架学习一

Python爬虫学习笔记（一）

python爬虫学习笔记（一）

Python爬虫开发学习（一）

Python学习-网络爬虫(一)

Python爬虫图片学习(一)

java 爬虫学习笔记一使用爬虫框架 WebMagic

Python爬虫学习：一些关于爬虫的知识的充电

python网络爬虫学习笔记之一爬虫基础入门

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

tensorflow 笔记：二（北大）

fork函数详解

unity单利模板

mac下的特殊键位指引（转自apple）

c语言入门-注释

Python--多任务[线程，进程，协程]

深度对抗学习在图像分割和超分辨率中的应用

【转】【Maven】Project configuration is not up-to-date with pom.xml错误解决方法

基本数据类型与常量池

部署自己的Intell项目的经历

每日归档

更多

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)