爬取网页数据python - 代码天地

爬取网页数据python

其他 2018-09-09 08:52:32 阅读次数: 0

一个网页数据的爬取
效果图如下
这里写图片描述

代码如下：

import csv, requests
from bs4 import BeautifulSoup
url = 'https://www.chunyuyisheng.com/pc/article/22127/'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
name = []
SimilarName=[]
qq=[]
Description=[]
all=[]
for x in soup.find_all('p'):
    c=x.get_text()
    qq.append(c)
    u1 =c.split('：')
a=12
name.append(qq[4][2:])
while a<70:
    name.append(qq[a][2:])
    a=a+7
name[-1]=name[-1][1:]
print(name)
b=14
SimilarName.append(qq[6][3:])
while b<71:
    SimilarName.append(qq[b][3:])
    b=b+7
print(SimilarName)
c=16
Description.append(qq[8])
while c<73:
    Description.append(qq[c])
    c=c+7
print(Description)
i=0
x=()
Description1=[]
Source=[]
Mean=[]
for z in Description:
    u2 = z.split('。')[1]
    Description1.append(u2)
for zz in Description:
    u3 = zz.split('，')[0]
    Source.append(u3)
for zzz in Description:
    u4 = zzz.split('，', 1)[1]
    u5 = u4.split('。')[0]
    Mean.append(u5)
while i<10:
    x=([name[i]]+[Source[i]]+[Mean[i]]+[Description1[i]])
    i=i+1
    print(x)
    all.append(x)
with open('E:\\textn.csv', 'w+',newline="") as f:
    writer = csv.writer(f)
    writer.writerow(['名字','起源',"含义",'描述'])
    for row in all:
        writer.writerow(row)

大家可以自己尝试修改。

猜你喜欢

转载自blog.csdn.net/qq_40594554/article/details/82229262

Python爬取网页数据

爬取网页数据python

python初学-爬取网页数据

使用 Python 爬取网页数据

python爬取网页数据方法

Python 简单爬取网页数据

Python-爬取HTML网页数据

python之爬取网页数据总结（一）

python：Requests+正则爬取网页数据

python 爬取网页数据并进行保存

Python之requests爬取网页数据案例。

如何用python爬取网页数据,python爬取网页详细教程

正则爬取网页数据(二)

正则爬取网页数据(三)

java网页数据爬取

如何快速爬取网页数据

jsoup爬取网页数据

Scrapy爬取网页数据

Java爬取网页数据

爬取网页数据基础

使用XPath爬取网页数据

python爬取网页的方法总结,python爬虫获取网页数据

爬网页数据

Python 爬虫爬取多页数据

python爬虫教程：实例讲解Python爬取网页数据

Python 爬取网页数据（以基金净值数据为例子）

Python3.5-爬虫实战-爬取网页数据并且导入excel

Python3~Scrapy框架爬取网页数据到MySql~pipelines.py

Python3+Selenium爬取动态网页数据

你以为Python爬虫只能爬取网页数据吗？APP也是可以的呢！

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)