Python学习日志（八） - 代码天地

Python学习日志（八）

其他 2020-02-08 17:48:01 阅读次数: 0

今天学习的是爬虫和自动化办公相结合的案例：爬取豆瓣读书网站上的信息并按类别存储到excel表格当中。
今天学习的新的知识点并不多，大多都是前面学习的知识点的综合使用。
其中关于数据分别存储到表格里的语句如下：
book_array = str(book_desc).strip().split("/");
#针对于数据不完整：不进行录入：
if len(book_array)<4:
book_array = [’’, ‘’, ‘’, ‘’];
pass
# 价格
book_jg =str(book_array[-1]).strip();
# 出版时间
book_time = str(book_array[-2]).strip();
# 出版社
book_add = str(book_array[-3]).strip();
# 作者或翻译
book_author = “”;
book_len = len(book_array); # 5-3 = 2
for i in range(0,book_len-3):
book_author+=book_array[i]+"/"
pass
# “abc/”
len_01 = len(book_author);
book_author = book_author[0:len_01-1];
即采用了数组的方式分别保存数据。
以实际案列为例，在爬取豆瓣图书中书籍评分这一栏信息中并保存到excel时，会报错，之后检查时发现，这是因为在爬虫tag类别下的图书缺少书籍评分信息，从而导致爬虫无法爬取到这一信息。
最后的解决方案如下：
book_rating_nums = tag_dl.dd.find(“span”,attrs={“class”:“rating_nums”}).string;

除此之外，下午通过百度的AI百度云利用百度的人工智能了解了文字识别的应用，通过百度的一个官方的学习文档，就可以很轻松地使用百度开发的人工智能进行文字识别、图片识别等等的内容，此处略去不谈。

发布了21 篇原创文章 · 获赞 1 · 访问量 1572

私信关注

猜你喜欢

转载自blog.csdn.net/qq_33566628/article/details/88537007

Python学习日志（八）

学习日志(八)：PCA

Python自动化学习笔记（八）——接口开发、发送网络请求、发送邮件、写日志

Python 学习笔记（八）

python学习记录（八）

python学习（八）

Python学习之旅（八）

python学习日记（八）

Python学习笔记八

Python学习（八）：函数

python 学习笔记八

Python学习笔记（八）

python基础学习（八）

python学习记录八

学习python（八）——函数

python爬虫学习(八)

Python 全栈开发八日志模块

第八天学习日志

学习日志第八日

学习springBoot（八，AOP处理请求日志）

第八周学习日志

python基础学习日志

Python学习日志-8

Python学习日志-7

Python学习日志-5

Python学习日志-4

Python学习日志-3

Python学习日志-2

Python学习日志-1

Python学习日志-6

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)