纯golang爬虫实战(三） - 代码天地

纯golang爬虫实战(三）

其他 2020-01-23 17:50:52 阅读次数: 0

网站上有9000多张照片要下载:

//一开始参考https://www.jb51.net/article/153275.htm用reader和writer进行io.Copy,但经常是抓取100多个网页后就崩溃了，

//原因似乎是输入输出流影响或并发数量影响，代码执行快，输出流写硬盘慢。

//后来参考https://www.cnblogs.com/smartrui/p/12110576.html，改为ioutil.WriteFile直接写文件,还不行

//因为一共才9000多张照片，原来的程序每次下载前400张就崩溃了，应该是并发访问太多，网站受不了。

//于是狠心在主程序中每300个协程时延时2秒，终于成功下载完毕。但总感觉不那么优雅。
代码如下：

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
    "sync"
    "time"
)

var wg sync.WaitGroup

//保存图片
func savepic(id int) {
    defer wg.Add(-1)
    idstr := fmt.Sprintf("%08d", id)
    url := "http://192.168.13.1:8080/temp/Usr" + idstr + ".tmp"
    resp, err := http.Get(url)
    defer resp.Body.Close()
    if err != nil {
        fmt.Println(err)
    }
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        fmt.Println(err)
    }
    _ = ioutil.WriteFile("pic/"+idstr+".jpg", body, 0755)

}

func main() {
    for id := 2; id < 9202; id++ {
        wg.Add(1)
        go savepic(id)
        if (id % 300) == 0 {
            time.Sleep(time.Duration(2000) * time.Millisecond)
        }
    }
    wg.Wait()
}

猜你喜欢

转载自www.cnblogs.com/pu369/p/12230828.html

纯golang爬虫实战(三）

纯golang爬虫实战

纯golang爬虫实战(二）

纯golang爬虫实战－（五－小结篇）

纯golang爬虫实战－（七）－使用mime/multipart传输附件

基于golang的爬虫实战

【Golang】Golang语言初级爬虫实战

golang 爬虫

golang爬虫

路飞学城爬虫实战笔记（三）

爬虫实战之三--mysql安装

爬虫——三个小实战

Python 爬虫实战汽车某家(三) 车型

爬虫实战三、Scrapy爬虫部署工具Scrapyd服务搭建

【GoLang】《GORM实战》第三篇：关联与预加载

Golang流媒体实战之三：转推和录制

golang（三）

Golang福利爬虫

golang简单爬虫示例

golang版并发爬虫

利用Golang写爬虫！

Golang - 爬虫案例实践

Golang的首个爬虫程序

Golang的首个爬虫程序

Golang 爬虫02

golang并发版的爬虫

golang爬虫串行版本

golang爬虫案例

golang中的爬虫

实战爬虫

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)