ScrapeKit 和 Swift 编写程序 - 代码天地

ScrapeKit 和 Swift 编写程序

企业开发 2023-10-27 17:45:53 阅读次数: 0

以下是一个使用 ScrapeKit 和 Swift 编写的爬虫程序，用于爬取图片。同时，我们使用了proxy 这段代码来获取代理。

import ScrapeKit

class PeopleImageCrawler: NSObject, ScrapeKit.Crawler {
    let url: URL
    let proxyUrl: URL

    init(url: URL, proxyUrl: URL) {
        self.url = url
        self.proxyUrl = proxyUrl
    }

    func crawl() -> [String: Any] {
        var images = [String]()
        
        let html = try? String(contentsOf: url, encoding: .utf8)
        let doc = try? HTML(html: html, encoding: .utf8)
        
        if let imgElems = doc?.css("img") {
            for imgElem in imgElems {
                if let imgUrl = imgElem.attr("data-src") {
                    images.append(imgUrl)
                }
            }
        }
        
        return ["images": images]
    }
}

let targetUrl = URL(string: "https://www.people.com.cn")!
let proxyUrl = URL(string: "https://www.duoip.cn/get_proxy")!

let crawler = PeopleImageCrawler(url: targetUrl, proxyUrl: proxyUrl)
let result = crawler.crawl()

print(result)

这个程序首先导入 ScrapeKit 库，然后定义一个名为 PeopleImageCrawler 的类，继承自 ScrapeKit.Crawler。我们为其提供一个初始化方法，用于传入目标 URL 和代理 URL。在 crawl 方法中，我们使用 ScrapeKit 库解析 HTML 文档，并查找所有的 <img> 标签。如果找到，我们会将图片的 data-src 属性值添加到 images 数组中。最后，我们将 images 数组作为字典的一个键值对返回。

在主函数中，我们创建了一个 targetUrl 和一个 proxyUrl，然后实例化了一个 PeopleImageCrawler 类的对象。接着，我们调用 crawler.crawl() 方法来开始爬取，并将结果打印出来。

猜你喜欢

转载自blog.csdn.net/weixin_73725158/article/details/133981306

ScrapeKit 和 Swift 编写程序

python java 和 C++编写程序的比较

59、ADC的工作原理和编写程序

编写程序测试线程的sleep()方法和interrupt()方法

编写程序-用continue和不用continue的区别

编写程序计算圆的面积和周长

Boost.Beast和C++编写程序

9.1 Binder系统_C程序示例_框架分析和编写程序

编写程序-特别费脑和逻辑思维的程序

c语言编写程序“输入任意一个年份和月份，打印当月日历。”

编写程序从cin读取一组数，输出其和

编写程序，找出矩阵中最大的和最小的项和它们的位置

编写程序，求出100-200之间所有素数的和

编写程序，观察线程中加锁和不加锁的区别（互斥锁）

编写程序-如何使用FOR进行双重循环和三重循环

【IT运维】go编写程序充当prometheus告警触发端和接收端

在Windows下编写swift程序

编写程序

编写程序过程

03 编写程序

编写程序流程

Activiti——编写程序

openstack swift 文档（八）：Java Storlet 编写和部署指导

iOS 13 采用 Swift 编写更多的系统 APP 和组件

习题1.23 编写程序，读入几个具有相同ISBN 的交易，输出所有读入交易的和。

编写程序，使用嵌套if选择结构，根据出行的月份和选择的舱位输出实际的机票价格。

(计算圓柱体的体积）编写程序，读入圆柱体的半径和高，并使用下列公式计算圆柱的体积

编写程序-不相同的三位数和四位数

编写程序，利用元组作为函数的返回值，求系列类型中的最大值、最小值和元素个数，并编写测试代码。python实现

使用Swift编写脚本

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)