golang爬虫串行版本 - 代码天地

golang爬虫串行版本

其他 2020-03-28 11:07:32 阅读次数: 0

package main

import (
	"fmt"
	"io"
	"net/http"
	"os"
	"strconv"
)


func main() {
	//爬取一个网页并保存在文件中
	var start,end int
	fmt.Println("请输入要爬取的起始页(>=1)")
	fmt.Scan(&start)
	fmt.Println("请输入要爬取的起始页(>=start)")
	fmt.Scan(&end)
	fmt.Println("开始爬取")
	//写一个函数爬取网页
	scapy(start,end)
}



func scapy(start int, end int) {
	fmt.Printf("正在爬取第%d页到%d页\n",start,end)
	for i:=start;i<=end ;i++  {
		url:= "http://tieba.baidu.com/f?kw=%E9%87%8D%E5%BA%86%E5%A4%A7%E5%AD%A6&ie=utf-8&pn="+strconv.Itoa((i-1)*50)
		resp,err:= http.Get(url)
		errprint("http get err",err)

		defer resp.Body.Close()

		f,err2:=os.Create("第"+strconv.Itoa(i)+"个网页.html")
		errprint("os create err",err2)
		//读取文件
		buff := make([]byte,4096)
		for{
			n,err:=resp.Body.Read(buff)
			errprint("resp body err",err)
			if n == 0{
				fmt.Printf("网页%d导出完成\n",i)
				break
			}
			//写出到文件
			f.Write(buff[:n])
		}
	}

}

func errprint(s string, e error) {
	if e!=nil&&e!=io.EOF{
		fmt.Println(s,e)
		return
	}
}

发布了74 篇原创文章 · 获赞 2 · 访问量 6471

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42067668/article/details/103531590

golang爬虫串行版本

golang实现单任务版本爬虫功能

golang 爬虫

golang爬虫

基于golang的爬虫实战

Golang福利爬虫

golang简单爬虫示例

golang版并发爬虫

利用Golang写爬虫！

Golang - 爬虫案例实践

纯golang爬虫实战

Golang的首个爬虫程序

Golang的首个爬虫程序

Golang 爬虫02

golang并发版的爬虫

golang爬虫案例

golang中的爬虫

golang并发版本的tcp

Golang 多版本管理

【Golang】Golang语言初级爬虫实战

Golang - 爬虫案例实践 Golang - 爬虫案例实践

Golang 的类Scrapy爬虫实现

使用Golang实现网页爬虫

纯golang爬虫实战(三）

纯golang爬虫实战(二）

Golang 爬虫框架 Goquery的使用

Golang 爬虫系列一 goquery

Golang 语言 1.10.2 版本发布

termui golang 版本的终端dashboard

Linux下升级golang的版本

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)