Python爬虫解析库之xpath解析库详解

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102320900 xpath解析库详解 简单说明 XPath的选择功能十分强大,它提供了非常简洁明了的路径选择表达式。XPath相对于正则表达式显得更加简洁明了,对于网页的节点来说,它可以定义id、class或其他属性。而且节点之间还有层次关系,在网页中可以通过XPath来定位一
分类: 其他 发布时间: 10-26 22:55 阅读次数: 0

数据分析之numpy学习

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102414231 numpy的安装 pip3 install numpy numpy的ndarray对象 NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。 ndarray 对象是用于存放同类型元
分类: 其他 发布时间: 10-26 22:55 阅读次数: 0

数据分析之pandas学习

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102488466 pandas的安装 pip3 install pandas pandas简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的 pandas 纳入了大量库和一些标准的数
分类: 其他 发布时间: 10-26 22:54 阅读次数: 0

数据分析之matplotlib详解

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102509441 matplotlib介绍 Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用,如 PyQt 和 wxPython matplotlib安装 pip3 in
分类: 其他 发布时间: 10-26 22:54 阅读次数: 0

机器学习之基本概念

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102526812 数据挖掘 数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式
分类: 其他 发布时间: 10-26 22:54 阅读次数: 0

python必备小技巧

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102612945 检验一个列表中的所有元素是否一样 使用[1:]和[:-1]来比较给定列表的所有元素 def all_equal(lst): return lst[1:] == lst[:-1] all_equal([1, 2, 3, 4, 5, 6]) # False
分类: 其他 发布时间: 10-26 22:54 阅读次数: 0

23个python爬虫开源项目代码

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102615054 WechatSogou – 微信公众号爬虫 基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典 github地址: https://github.com/Chyroc/WechatSogou DouB
分类: 其他 发布时间: 10-26 22:53 阅读次数: 0

线性回归以及非线性回归

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102527952 一元线性回归 只含有一个自变量,对应的方程是一条直线 代价函数(损失函数) 这个代价函数也称为平方误差代价函数 思想:对于训练样本(x, y)来说,选择θ0,θ1 使h(x) 接近y 选择合适的(θ0, θ1)使得代价函数最小 每一个不同θ1的对应一条直线,我们
分类: 其他 发布时间: 10-26 22:53 阅读次数: 0

使用python计算身份证号码(time模块和datetime模块)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_44205272/article/details/102730263 本文章需要的使用到time模块,故先从time模块和datetime模块讲起. python之time模块 需要注意的是在time模块中的大多数函数是调用了所在平台C library的同名函数, 所以要特别注意有些函数是平台相关的,可能会在不同的平台有不同的效果
分类: 其他 发布时间: 10-26 22:53 阅读次数: 0

【CSP-S2019模拟】09.24比赛总结

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101289820 心态崩了,-PZM、LYL两年前就AC了前两题???那天的我做B组还没有AK??? 比赛思路 传送门 T1(序列操作):一下子就想到了贪心,将最大的几个减一,然后想到记录元素个数,但是这样子要线段树平移???或者直接排序的顺序建一个线段树,但是操作的区间不一定连
分类: 其他 发布时间: 10-26 22:53 阅读次数: 0

【LCT维护MST】JZOJ5433. 【NOIP2017提高A组集训10.28】图

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101291366 Description 有一个n个点A+B条边的无向连通图,有一变量x,每条边的权值都是一个关于x的简单多项式,其中有A条边的权值是k+x,另外B条边的权值是k-x,如果只保留权值形如k+x的边,那么这个图仍是一个连通图,如果只保留权值形如k-x的边,这个图也依
分类: 其他 发布时间: 10-26 22:52 阅读次数: 0

【CSP-S2019模拟】09.25比赛总结

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101451601 T1的出题人祝您身体健康 比赛思路 传送门 T1(化学):刚开始看到“烷烃”就懵逼了,一看六页的题面以为是毒瘤的题答题,仔细读懂后原来是模拟题,十几种特判实际上是码农题,只用找重链等简单操作,我读题意读了40+min,总共打了2.5小时(意志坚定),获得了80分
分类: 其他 发布时间: 10-26 22:52 阅读次数: 0

JZOJ6368. 【NOIP2019模拟2019.9.25】质树(tree)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101454052 Description 大神 wyp 手里有棵二叉树,每个点有一个点权。大神 wyp 的这棵树是质树,因为 随便找两个不同的点 u, v,只要 u 是 v 的祖先,都满足 u 和 v 的点权互质。 现在你通过偷看了解到了大神 wyp 这棵树的中序遍历的点权值,你
分类: 其他 发布时间: 10-26 22:51 阅读次数: 0

【CSP-S2019模拟】09.28

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101683270 又是自闭的一天,NOIP模拟(×) GDOI模拟(√) 比赛思路 传送门 T1 (卷积):刚开始被吓到了,以为真的是一个卷积,但是随即一想,NOIP怎么可能有卷积呢?肯定是某种神奇的转移和优化。。。2h过去了。最后半个小时的时候突然想到,这可以直接FWT卷积啊!
分类: 其他 发布时间: 10-26 22:51 阅读次数: 0

JZOJ6371. 【NOIP2019模拟2019.9.28】基础图论练习题

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/101723555 先打题解(思路)再打代码,因为这题实在挺难打。 Decription 给定一个无向图,并且有q次操作,每一次加上或删去一条边。 在操作前以及每一个操作后询问无向图中桥的个数。 n<=2e5,q<=4e5 Solution 由于删除操作不好做,所以我们考虑只有加入
分类: 其他 发布时间: 10-26 22:51 阅读次数: 0

【CSP-S2019模拟】10.04比赛总结

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_43649416/article/details/102176421 国庆假期回来的自闭赛 比赛思路 传送门 T1:计数题??结论题??脑子不好放弃思考,打表。。。然而并没有找出规律。 T2:简单的线段树…样例过不去??????? T3:没有时间看了。。。T2刚得我人没了。 赛后消化 T1:有一万种推法,而且也十分简单易懂。。。我
分类: 其他 发布时间: 10-26 22:51 阅读次数: 0

欧拉反演?

大意是:求证 \[\sum_{d|n} \varphi(d)=n\] 定理①: \[\sum_{z|mn}\varphi(z)=\sum_{x|m}\varphi(x)\sum_{y|m}\varphi(y)(\gcd(m,n)=1)\] 有\(\sum\)在里面不太好看,设\(m\)的所有因数为: \(a_1,a_2...a_k\), \(n\)的所有因数为: \(b_1,b_2...b_l\) 乘起来后易得: \[\sum\limits_{i=1}^k\sum\limits_{j=1}^l
分类: 其他 发布时间: 10-26 22:50 阅读次数: 0

「CF1051F」The Shortest Statement

传送门 Luogu 解题思路 注意到 \(m - n \le 20\) ,所以这其实是一个树上问题,非树边至多只有21条,那么我们就可以暴力地对每一个非树边所连接的点求一次单源最短路,然后每次询问时,先访问两点的树上距离,再尝试用非树边更新答案,取最小值输出即可。 细节注意事项 最短路不要写挂就好 参考代码 #include <algorithm> #include <iostream> #include <cstring> #include <cstdlib> #include <cstdi
分类: 其他 发布时间: 10-26 22:50 阅读次数: 0

博弈论学习笔记

NIM游戏 阶梯NIM SG函数 反NIM
分类: 其他 发布时间: 10-26 22:50 阅读次数: 0

「CF1042F」Leaf Sets

传送门 Luogu 解题思路 比较显然的一种做法: 我们把一个点的子树高度抠出来并排序记为 \(L_i\),找到最大的 \(i\) 使得 \(L_{i-1}+L_i\le K\)。 于是我们把前 \(i\) 个对应的子树中的叶子合并为一个集合,之后的单独为一个集合,从非叶子跑一遍 \(\text{DFS}\) 就可以了,最后输出答案即可。 细节注意事项 咕咕咕 参考代码 #include <algorithm> #include <iostream> #include <cstring> #i
分类: 其他 发布时间: 10-26 22:50 阅读次数: 0