Web项目之网络爬虫

一、爬虫基础篇   Python网络爬虫(认识爬虫)   Python网络爬虫(http和https协议)   Python网络爬虫(基于urllib库的get请求页面)   Python网络爬虫(requests模块应用1)
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

初探html-16 表单

HTML 表单和输入 HTML 表单用于收集不同类型的用户输入。 在线实例 <!DOCTYPE html> <html> <head>  <meta charset="utf-8">  <title>菜鸟教程(runoob.com)</title>  </head> <body> <form action=""> First name: <input type="text" name="firstname"><br> Last name: <input type="tex
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

linux常用命令简介

本次重点介绍系统的启动与常用的linux命令的基本使用 一、计算机性能: 2、学习命令的原因:尽量减少与计算机的交互 3.系统的启动 4、Linux命令的基本格式 Command [选项] [参数] [] : 中括号代表,可有可无;指定实现命令的某个特定功能; <> : 代码命令执行的对象;如果没有加 <> 代表不能省略; 短选项可以合并,而长整列选项不能合并 5.文件系统 储存设备必须安装文件系统;格式化操作就是在安装文件系统 Windows下常见的文件系统格式:NTFS、FAT32 文件系
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

GCC linker

http://www.scoberlin.de/content/media/http/informatik/gcc_docs/ld_3.html https://ftp.gnu.org/old-gnu/Manuals/ld-2.9.1/html_mono/ld.html#TOC6 ld -X--discard-locals   Delete all temporary local symbols. For most targets, this is all local symbols whos
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

分布式主键 SNOWFLAKE (雪花算法)

SNOWFLAKE 雪花算法是由Twitter公布的分布式主键生成算法,它能够保证不同进程主键的不重复性,以及相同进程主键的有序性。 在同一个进程中,它首先是通过时间位保证不重复,如果时间相同则是通过序列位保证。 同时由于时间位是单调递增的,且各个服务器如果大体做了时间同步,那么生成的主键在分布式环境可以认为是总体有序的,这就保证了对索引字段的插入的高效性。例如MySQL的Innodb存储引擎的主键。 使用雪花算法生成的主键,二进制表示形式包含4部分,从高位到低位分表为:1bit符号位、41b
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

动态中位数(对顶堆)

依次读入一个整数序列,每当已经读入的整数个数为奇数时,输出已读入的整数构成的序列的中位数。 输入格式 第一行输入一个整数PP,代表后面数据集的个数,接下来若干行输入各个数据集。 每个数据集的第一行首先输入一个代表数据集的编号的整数。 然后输入一个整数MM,代表数据集中包含数据的个数,MM一定为奇数,数据之间用空格隔开。 数据集的剩余行由数据集的数据构成,每行包含10个数据,最后一行数据量可能少于10个,数据之间用空格隔开。 输出格式 对于每个数据集,第一行输出两个整数,分别代表数据集的编号以及
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

STL入门大全(待编辑)

前言:这个暑假才接触STL,仿佛开启了新世界的大门(如同学完结构体排序一般的快乐\(≧▽≦)/),终于彻底领悟了大佬们说的“STL大法好”(虽然我真的很菜www现在只学会了一点点...)这篇blog主要是总结一下一些简单用法,是怕我在要用时忘记又要去搜很麻烦,有哪里写的不对了请戳我~(如果你是大佬请跳过www这一篇是蒟蒻用来入门滴qwq) 备注:本篇blog参考了https://www.cnblogs.com/skyfsm/p/6934246.html,https://blog.csdn.ne
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

jpa的分页

List<BrandE> brandEList = new ArrayList<>(); Sort sort = new Sort(Sort.Direction.DESC, "id"); Pageable pageable = PageRequest.of(pageNum - 1, pageSize, sort); Page<BrandE> brandPage; if (StringUtils.isNotEmpty(keyWord)) { brandPage = brandReposi
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

强连通图,Tarjan——HDU-1269

题目链接 题目含义 判断一个图是不是强连通图,即任意两点存在双向通道 题目分析 用Tarjan可以算出这个图中的强连通图有多少个,如果不是1那当然输出No 而如果是1,只能说明有一个强连通子图而不能说明这个图是强连通图,就需要在当dfn[x]==low[x]时,找到这个强连通图所有的点,将他们全部指向x,最后再类似并查集,确定这个图所有点在不在这个强连通图里 题目代码 #include<iostream> #include<stdio.h> #include<string.h> usin
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

Python02 语法

第三天 Python语法 代码缩进 代码块:区分代码的作用域 缩进:Python中使用4个空格或者一个TAB键进行缩进 实例: if 12 < 16: print("12的值比16小!") print("我早就知道了") 注释: 不会被程序执行,是为了提高代码阅读体验给编写代码的人看的 单行注释: 使用#号开头,# 号后面的内容都会被程序忽略执行 单行注释实例: # 这是一段注释内容,程序不会执行,我只是想告诉其他编写/阅读代码的人,下面的代码是向屏幕打印输出 hello pr
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

一个C++的ElasticSearch Client

ElasticSearch官方是没有提供C++的client的;因此决定自己写一个,命名为ESClient https://github.com/ATinyAnt/ESClient(手下留星 star) 优势是简单易用: * 封装大幅度减少了直接写DSL的机会,避免了一些非逻辑错误 * 只需要包含头文件 request.h即可以使用 * 复杂的语句,可支持用原生(Raw)Json嵌套 目前ESClient只支持常用的搜索短语,暂不支持插入、更新、删除和响应处理;原因是我们做ElasticSea
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

牛客多校第五场 A digits 2 签到

题意: 给定一个n,输出一个数,要求这个数所有位之和整除n,并且这个数也整除n,并且位数不许多于1e4 题解: 把这个数n输出n遍。 #include<iostream> using namespace std; int main(){ int t; scanf("%d",&t); while(t--){ int q; scanf("%d",&q); for(int i=1;i<=q;i++)printf(
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

可达性统计

题目链接 题意:给定一张N个点M条边的有向无环图,分别统计从每个点出发能够到达的点的数量。N,M<=30000。 思路:先拓扑排序,这样肯定拓扑序前面的肯定在拓扑序后面的点的前面。然后用状态压缩,用bitset转化成二进制,一顿从后往前按位或,有多少1就代表有多少个能达到的点的数量。 #include<cstdio> #include<cstring> #include<algorithm> #include<bitset> #include<cmath> #include<queu
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

我爱Java系列之---【作为组长的git直接上手教程,初始化工程】

1.在github或码云上创建远程仓库 2.在本地找到一个文件夹,右键选择Git Bush Here, 输入:git clone 仓库地址,克隆远程仓库到本地磁盘 把准备好的初始工程拷到这个目录下,不要有target和.idea文件 记得一定不要忘了把.gitignore文件复制到工程目录下,下面这个是个样本 .idea/workspace.xml *.iml /**/*.iml /*/target/ target .idea/dataSources.local.xml
分类: 其他 发布时间: 08-01 20:51 阅读次数: 0

如何做擦能防止网站被劫持

  为什么自己的访问行为和隐私数据突然会被“偷走”?为什么域名没输错,结果却跑到了一个钓鱼网站上?用户数据泄露、流量劫持、页面篡改等安全事件频发怎么办?这是因为你的域名被劫持了,所以导致网站跳转。那么域名被劫之后该如做呢,如何才能防止域名被劫?  先要学会检查问题,在运营时用IIS7网站监控是完全可以提早发现网站有没有被劫持的,一旦第一时间发现了,去补救就方便多了。  如何预防域名劫持?  1、为
分类: 企业开发 发布时间: 08-01 20:50 阅读次数: 0

[leetcode] 935 Knight Dialer 骑士拨号器

目录 题目:935. Knight Dialer 骑士拨号器 问题描述 思路1 算法实现 思路2 算法实现 题目:935. Knight Dialer 骑士拨号器 问题描述 国际象棋中的骑士可以按下图所示进行移动: 这一次,我们将 “骑士” 放在电话拨号盘的任意数字键(如上图所示)上,接下来,骑士将会跳 N-1 步。每一步必须是从一个数字键跳到另一个数字键。 每当它落在一个键上(包括骑士的初始位置),都会拨出键所对应的数字,总共按下 N 位数字。 你能用这种方式拨出多少个不同的号码? 因为答案
分类: 其他 发布时间: 08-01 20:34 阅读次数: 0

用函数模拟简单的购物车(Python)

""" 购物车功能: a.引导用户输入金额 b.给用户展示所有的商品 c.引导用户输入需要进行的操作【添加 删除 结算购物车 退出】 d.引导用户选择商品 e.引导用户输入需要购买的商品数量 f.添加到购物车【容器】 g.整个循环的操作,循环的次数不确定 """ def add(): print(super_market) # 超市商品列表 print(price_list) #商品价格表
分类: 其他 发布时间: 08-01 20:34 阅读次数: 0

系统启动与命令基本介绍

1.系统的启动 (1)电源 (2)BIOS芯片   1)加电自检。检查硬件设备是否正常          2)启动系统。选择系统启动           ①系统所在位置的读取顺序问题(BIOS):硬盘、网络(PXE) U盘、CD/DVD。            ②需要将硬盘中的系统文件,加载到内存中,让CPU读取,并运行。 注:MBR分区(BootLoader)BootLoader有两种;即LILO(适合嵌入式小型系统加载)、grub(常用),分为第一阶段、1.5阶段、第二阶段。   到此,我
分类: 其他 发布时间: 08-01 20:34 阅读次数: 0

学习markdown总结

%%% %%%
分类: 其他 发布时间: 08-01 20:34 阅读次数: 0

8.1考试解题报告

\(\text{T1:}\) 题面:戳这里 \(Solution:\) 先跑两次 \(DP\),预处理出两个东西: \(f1[i]\) 表示以第 \(i\) 个元素结尾的最大子段和(正序推) \(f2[i]\) 表示以第 \(i\) 个元素开头的最大子段和(逆序推) 然后考虑枚举一个下标 \(i\),用于确定绝对选不到的那 \(k\) 个元素。 然后我们就需要知道在当前枚举的这个区域左边的 \(\max(f1[i])\) 以及右边的 \(\max(f2[i])\)。 这个可以开两个 \(\te
分类: 其他 发布时间: 08-01 20:34 阅读次数: 0