GPT4.0写爬虫，连bug都没有 - 代码天地

GPT4.0写爬虫，连bug都没有

企业开发 2023-05-17 04:47:46 阅读次数: 0

灵感来源

看到很多大佬在发这个，打开一看是个小光子，付费课程，所以我觉得写一个简单的免费教程。

在这里插入图片描述

简单示例

我们用一个简单的来介绍，比如爬取这位博主:

https://blog.csdn.net/AOAIYI/article/details/130659496

在这里插入图片描述

定义目标

下面我用自己的4.0镜像来做尝试：GPT4.0 ,如下进行提问：
在这里插入图片描述
这样第一次问，当然是抓取不对的。GPT实际上不具备爬取功能，但是我要给他赋予爬虫技能，接下来就是给他更详细的星系。

灌输详细内容

手动打开检查，把重要的HTML部分灌输给GPT4:
在这里插入图片描述
返回大致如下，可以看到代码中让我自己粘贴进去，这显然不符合正常爬虫操作。

在这里插入图片描述

继续追加提问

让它直接添加获取这部分源码：
在这里插入图片描述
然后复制下面的完整代码即可：

import requests
from bs4 import BeautifulSoup

url = 'https://blog.csdn.net/AOAIYI/article/details/130659496'
headers = {
    
    
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

response = requests.get(url, headers=headers)
html = response.text

soup = BeautifulSoup(html, 'html.parser')

title = soup.find('h1', class_='title-article').text.strip()
read_count = soup.find('span', class_='read-count').text.strip()
collection_count = soup.find('span', class_='get-collection').text.strip()

print(f'标题：{
    
    title},阅读数：{
    
    read_count},收藏数：{
    
    collection_count}')

输出如下：

标题：机器学习：基于Kmeans聚类算法对银行客户进行分类,阅读数：1065,收藏数：64

更多玩法

解锁更多玩法，自行研究，这里我只是刚好抽空测试一下效果，后续有空继续写测试文。

猜你喜欢

转载自blog.csdn.net/weixin_46211269/article/details/130689902

GPT4.0写爬虫，连bug都没有

不懂进制转换，我连B站追番的权利都没有

性能调优经验不足，连做外包的资格都没有了？

不会吧，你连这些职场高光时刻都没有？！

未来，不会JetPack的Android开发连面试机会都没有

连流量染色都没有，你说要搞微服务？

其实什么都没有

博弈（啥都没有

VB,VBS,ASP都没有反余弦函数,解决方法:自己写

京东员工被裁后哀叹：优化后连面试的机会都没有，每月还要还贷款

前端面试，如果连前端基础都没有掌握，那还能面试成功吗？

都2021年了，还不会JetPack的Android开发以后连面试机会都没有！

字节给我狠狠上了一课：危机来的时候你连准备时间都没有！

解决了两天都没有处理bug(js再IE下通过class获取元素值)

GDOI2018油都没有记

以前的帐号被锁，好久都没有结果

009篇：好人从来都没有市场

神气的Android Studio -Pligins什么都没有

99%的程序都没有考虑的网络异常

测试贴，啥都没有，不用看

面试官：个人博客都没有？

mac搜索文件什么都没有，是为什么

有没有不写代码的项目经理，别给我说一个都没有

连大学毕业证都没有，25岁了，现在转行做运维可以吗

Java知识点太多掌握不了？那是因为你连一个完整的知识体系都没有。

python面向对象入门必读，读懂这篇文章，就读懂了什么是面向对象-你会连对象都没有！

面试软件测试工程师居然连项目经验都没有！这个说不过去吧

AS新建工程没有src 和res各种文件夹都没有

java中的URLConnection和HttpURLConnection有什么区别（因为我自己搜到别人写的区别看下来都没有什么区别）

为什么你投了那么多份简历都没有回应？手把手教你写简历

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)