【易语言】易语言制作-bt天堂ok资源采集器(网络爬虫)

.版本 2
.支持库 spec

.程序集 程序集1

.子程序 _启动子程序, 整数型, , 本子程序在程序启动后最先执行
.局部变量 i, 整数型
.局部变量 源代码, 文本型
.局部变量 详细页地址, 文本型
.局部变量 目的地址, 文本型, , "0"
.局部变量 标题, 文本型
.局部变量 j, 整数型
.局部变量 导演, 文本型
.局部变量 主要演员, 文本型
.局部变量 类型, 文本型
.局部变量 地区, 文本型
.局部变量 剧情介绍, 文本型
.局部变量 播放链接, 文本型, , "0"
.局部变量 播放链接汇总, 文本型
.局部变量 k, 整数型
.局部变量 封面地址, 文本型
.局部变量 返回信息, 文本型
.局部变量 总页数, 整数型
.局部变量 当前页, 文本型

总页数 = 431
' 标准输出 (1, “开始页数:”)
' 当前页 = 标准输入 ()
' i = 到整数 (当前页)
.计次循环首 (总页数, i)
    写到文件 (取运行目录 () + “/confuig.ini”, 到字节集 (“当前页:” + 到文本 (i)))
    源代码 = 网页_访问S (“http://www.okzy.me/?m=vod-index-pg-” + 到文本 (i) + “.html”, 0, , , )

    文本_取中间_批量 (源代码, #目的地址1, #目的地址2, 目的地址, , , )

    .计次循环首 (取数组成员数 (目的地址), j)

        详细页地址 = 网页_访问S (“http://www.okzy.me” + 目的地址 [j], 0, , , )
        ' 调试输出 (详细页地址)
        标题 = 文本_取出中间文本 (详细页地址, #标题1, #标题2, , )

        导演 = 文本_取出中间文本 (详细页地址, #导演1, #导演2, , )

        主要演员 = 文本_取出中间文本 (详细页地址, #主演1, #主演2, )

        类型 = 文本_取出中间文本 (详细页地址, #类型1, #类型2, )

        地区 = 文本_取出中间文本 (详细页地址, #地区1, #地区2, )

        剧情介绍 = 文本_取出中间文本 (详细页地址, #剧情介绍1, #剧情介绍2, )

        ' 播放链接 = 文本_取出中间文本 (详细页地址, #影片地址1, #影片地址2, )

        封面地址 = 文本_取出中间文本 (详细页地址, #封面1, #封面2, )


        调试输出 (文本_取出中间文本 (详细页地址, #KuyunBox1, #KuyumBox2, ))
        文本_取中间_批量 (文本_取出中间文本 (详细页地址, #KuyunBox1, #KuyumBox2, ), #影片地址1, #影片地址2, 播放链接, )

        播放链接汇总 = “”
        .计次循环首 (取数组成员数 (播放链接), k)


            播放链接汇总 = 播放链接汇总 + “<a href=” + 播放链接 [k] + “>” + 播放链接 [k] + “</a> <br />”

            ' 调试输出 (“名称:” + 标题 + “链接:” + 播放链接 [k])
        .计次循环尾 ()

        



        标准输出 (1, #换行符 + “电影名称:” + 标题 + #换行符 + “导演:” + 导演 + #换行符 + “主要演员:” + 主要演员 + #换行符 + “类型:” + 类型 + “地区:” + 地区 + #换行符 + “剧情介绍:” + 封面地址 + #换行符  + #换行符)




        调试输出 (标题)
        调试输出 (导演)
        调试输出 (主要演员)
        调试输出 (类型)
        调试输出 (地区)
        调试输出 (剧情介绍)
        调试输出 (封面地址)
        调试输出 (播放链接汇总)
        i = i + 1
    .计次循环尾 ()


.计次循环尾 ()
返回 (0)  ' 可以根据您的需要返回任意数值

 

猜你喜欢

转载自blog.csdn.net/u011182346/article/details/83213449