云数据库RDS与爬虫结合的试用 - 代码天地

云数据库RDS与爬虫结合的试用

其他 2020-03-08 15:13:46 阅读次数: 0

这个云数据库RDS是送的，为了了解一下这个RDS的用户，也为了在主机上做一个自动存数据的爬虫，今天开始试用这个RDS。
还是一步一步摸着石头过河。

登录数据库RDS

首先从控制台登录
进入实例 - mysql 8.0的，20g
内外网白名单设置

先把内网加白名单，按照旁边的帮助我先加了0.0.0.0/0试试，这个默认是内网的主机
外网先点了申请外网地址，然后等一会儿就下来了。
内外网都有网址了。凭着这两个网址，理论上，内外网都可以访问。
在这里插入图片描述

创建账号，并登录查看

在这里插入图片描述

下了一个mysql客户端试试，连上了，开始建表，我还是不太习惯在命令行中操作。
下的这个客户端还可以。
现在本地python里面连接试试，这需要先装pymysql

pip install pymysql
在这里插入图片描述

爬虫代码开始编写，这次主要尝试把易车网的车型信息爬下来
url的规律是http://car.bitauto.com/tree_chexing/+type+"_"+id
不过type和id是品牌信息里的，之前爬过一次。
导入模块信息

import pymysql
import requests as rq
import re
import bs4
import json

数据库连接，还是很简单的
内网填内网地址，外网就填外网，在管控台那里有。
从数据库中读取刚填好的信息，篇幅有限，到此为止
爬虫主要用的是requests， BeautifulSoup还在不断练习中。

#从数据库中获取brand信息存到数据字典里
dict_car_brand={}
if bl_get_dict_car_brand is False:
    try:
        # 执行SQL语句
        cursor = db.cursor()
        sql="SELECT id,type,name,url FROM car_brand"
        cursor.execute(sql)
        # 获取所有记录列表
        results = cursor.fetchall()
        for row in results:
            int_id = row[0]
            str_type = row[1]
            str_name = row[2]
            str_url = row[3]
            # 加入字典
            dict_car_brand[str(int_id)]={"type":str_type,"name":str_name,"url":str_url}
        bl_get_dict_car_brand=True
    except:
        print ("Error: unable to fetch data")
    finally:
        cursor.close()
#print(dict_car_brand)

zeng31403

发布了14 篇原创文章 · 获赞 6 · 访问量 1358

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43662503/article/details/104369523

云数据库RDS与爬虫结合的试用

什么是云数据库RDS

云原生数据库-Amazon RDS

云数据库RDS是什么？云数据库RDS有什么优势？

天翼云RDS试用系列之一受理申请RDS，基本配置、数据库权限、开发禁忌及原理说明

公网访问阿里云RDS云数据库

阿里云RDS数据库从库搭建

云数据库 RDS 版 > 技术运维问题

云数据库RDS MYSQL 查看SQL日志

Python 备份阿里云RDS数据库优化版

如何使用阿里云RDS myslq数据库

云数据库RDS规格族配置详解

解析天翼云RDS数据库只读实例

云数据库RDS 2019扬帆启航

云数据库RDS存储能力进化解析！

如何使用阿里云RDS数据库

阿里云RDS的mysql数据库连接

阿里云RDS(MySQL)数据库恢复

本地MySQL数据库迁移到阿里云RDS

迁移阿里云RDS数据库至ECS

如何使用云数据库RDS版

云图说｜云数据库RDS跨区域备份

阿里云数据库RDS MySQL Serverless测评

MSSQL · 最佳实践 · RDS SDK实现数据库迁移上阿里云RDS SQL Server

阿里云RDS云数据库恢复到本地mysql数据库

rds数据库实例

Python 大数据库备份阿里云RDS数据库分表导出压缩

阿里云rds数据库导出到windows本地数据库中

阿里云RDS数据库与自建数据库做主从同步

阿里云数据库(RDS)是什么,与传统数据库有什么区别？

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)