爬学校就业指导网站和学校有合作的企业————第一次用爬虫

其他 2018-07-03 16:19:02 阅读次数: 0

　　已经将数据库操作注释掉了

 1 from urllib.request import urlopen;
 2 from urllib.error import HTTPError;
 3 from bs4 import BeautifulSoup;
 4 import pymysql;
 5 
 6 num = 1480;
 7 #conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mysql',charset='utf8');
 8 #cur = conn.cursor();
 9 #cur.execute("USE hfutxjh");
10 while num < 2000:
11     url = "http://gdjy.hfut.edu.cn/products/" + str(num) + ".html";
12     num = num + 1;
13     try:
14         html = urlopen(url);
15     except HTTPError as e:
16         print(num - 1);
17         print(e);
18         continue;
19     else:
20         if html is None:
21             print(num - 1);
22             print("URL is not found");
23         else:
24             bsObj = BeautifulSoup(html.read());
25             str1=str(num-1);
26             print(str1);
27             str2=bsObj.h3.get_text();
28             print(str2);
29             #cur.execute("INSERT INTO h3(id,h3text) VALUES('"+str1+"','"+str2+"')");
30             #print(cur.fetchone());
31 
32 #cur.close();
33 #conn.close();

猜你喜欢

转载自www.cnblogs.com/uasier/p/9259066.html

爬学校就业指导网站和学校有合作的企业————第一次用爬虫

参加第一次学校新生赛

第一次参加学校的ACM比赛所学及感想

运用HTML+CSS写学校网页（静态）第一次

从理论到实践--记录第一次离开学校正式实习

我用java玩爬虫之第一次爬CSDN就是这么简单！

第一次团队合作

第一次用python写爬虫

第一次用joomla做网站的心得

第一次使用爬虫

记第一次爬虫

第一次爬虫实例

第一次爬虫与测试

第一次接触爬虫

一次对学校AVCON系统的渗透

记学校的一次抢课

团队合作第一次会议有感

python爬虫入门（一）-----环境配置——第一次爬数据

第一次用ant

第一次用博客

第一次用kafka

第一次用mybatis

第一次用CSDN

第一次用博

第一次用

echarts第一次用

第一次用Qt

关于第一次小组合作的总结

机房合作第一次验收验收

Java就业指导

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)