MongoDB插入优化

速度问题 最近工作中遇到这么一个问题,全站抓取时采用分布式:爬虫A与爬虫B,爬虫A给爬虫B喂饼,爬虫B由于各种原因运行的比较慢,达不到预期效果,所以必须对爬虫B进行优化。 提升Scrapy运行速度有很多方法,国外有大佬说过 Speed up web scraper Here's a collection of things to try: use latest scrapy version (if not using already) check if non-standard middlew
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

min_25筛

min_25筛 用来干啥? 考虑一个积性函数\(F(x)\),用来快速计算前缀和\[\sum_{i=1}^nF(i)\] 当然,这个积性函数要满足\(F(x),x\in Prime\)可以用多项式表示 同时,\(F(x^k),x\in Prime\)要能够快速计算答案 需要预处理的东西 先不考虑求前缀和的问题,考虑一个积性函数\(F(x)\) 求解\[\sum_{i=1}^n[i\in Prime]F(i)\] 直接求我也会懵逼的,还是找一个函数来算算,假设\(F(x)=x^k\) 那么,求解
分类: 其他 发布时间: 06-14 22:12 阅读次数: 1

Could not apply the stored configuration for monitors

sudo rm -f ~/.config/monitors.xml 重启
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

Python 拷贝

一、数字字符串拷贝 # 字符串,数字 a1 = 123123 a2 = 123123 #此时 id(a1) = id(a2) #对于数字或字符串来说,无论深浅拷贝内存id都不变。 #其它,列表,字典,元祖。 n1 = {"k1":"wo","k2":"hao","k3":[1,2,3]} n2 = n1 #此时n1 = n2 二、浅拷贝。 n3 = copy.copy(n1) #此时的拷贝只拷贝第一层,但是数字和字符串永远是用的原地址的。 #此时id(n1) != id(n3) #id(n1[
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

静态页面清除浏览器缓存

  在做官网开发中出现静态页之后,即使发布了新的版本之后,还是会读取浏览器缓存,导致页面不是最新页面。   解决措施:   1、meta方法:   <meta htpp-equiv="pragma" content="no-cache">   <meta http-equiv="cache-control" content="no-cache,must-revalidate">   <meta http-equiv="expires" control="0">   2、JQUERY 浏览器清除
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

UVA1316 Supermarket

题目描述 有一个商店有许多批货,每一批货又有N(0<=N<= 10^4104 )个商品,同时每一样商品都有收益 P_iPi ,和过期时间 D_iDi (1<= Pi,DiPi,Di <= 10^4104 ),一旦超过了过期时间,商品就不能再卖。 你要做的就是求出每批货最多能得到多少收益。 输入输出格式 输入格式 多组数据,每组先给出一个整数N,表示这批货的商品个数。 然后有N对数,每对数有两个用空格隔开的正整数 P_i,D_iPi,Di ,表示第i个商品的收益和过期时间。相邻两对数之间用空格隔
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

【LOJ6053】简单的函数(min_25筛)

题面 LOJ 题解 戳这里 #include<iostream> #include<cstdio> #include<cstdlib> #include<cstring> #include<cmath> #include<algorithm> using namespace std; #define ll long long #define MAX 222222 #define MOD 1000000007 ll n,Sqr,w[MAX]; ll pri[MAX],id1[MAX],id2[M
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

Spark2.0 shuffle service

Spark 的shuffle 服务是spark的核心,本文介绍了非ExternalShuffleClient的方式,看BlockService的整个架构。ShuffleClient是整个框架的基础,有init方法和fetchBlock两个方法。 /** Provides an interface for reading shuffle files, either from an Executor or external service. */ public abstract class S
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

三年前父亲节的作品——三月三

点此播放《三月三》 介绍: 2015年献给父亲节的作品。 重新编曲和业余的演唱,给大家带来点不一样的味道! 歌词 独白:当父亲把一张破旧的塑料纸铺在地上,用毛笔在上面画出一个老鹰的轮廓时,我怎么也不会想到,这张不起眼的塑料纸,日后会翱翔天空,飞的那么高…… 又是一年三月三 风筝飞满天 牵着我的思念和梦幻 走回到童年 记得那年三月三 一夜难合眼 望着墙角糊好的风筝 不觉亮了天 叫醒村里的小伙伴 一同到村边 怀抱画着小鸟的风筝 人人笑开颜 抓把泥土试试风 放开长长的线 风筝带着天真的笑声 和白云去
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

Python自动化四--json模块使用,集合操作,函数

内容: json模块 集合操作 函数 一,json模块 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数: json.dump(): 对数据进行编码。 json.load(): 对数据进行解码。 json格式存储--小例子 import json stu_info = { 'laowang':{ 'cars':['B
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

装箱和拆箱的性能损耗以及没有装箱和拆箱的性能损耗

List<int> listint = new List<int>(); DateTime start = DateTime.Now; for (int i = 0; i < 10000000; i++) { listint.Add(i); } DateTime stop = DateTime.Now; Con
分类: 其他 发布时间: 06-14 22:12 阅读次数: 1

windows开启telnet服务

1.打开控制面板 2.选择 程序标签 3.选择启用或关闭Windows功能 4.勾选Telnet客户端 5.cmd中运行telnet检验结果
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

python全栈开发06 零基础之第六天(is,id,编码,小数据池)

零基础之第六天(is,id,编码,小数据池) id(变量):返回一个内存地址 k1 is k2 :判断他们的内存地址是否一致 k1 == k2:判断他们的值是否一致 小数据池: -5 -> 256 str :同样的字符串 str * int :他们的长度不超过20,内存就是一致的 他们的内存地址都是一致的 编码 传输的过程中使用UTF-8或GBK编码 内存中:我们程序运行的过程中,编码是unicode 在程序中,字符串可以编码成bytes类型的数据 编码 encode() 语法: 变量名.en
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

行级触发器

for each row表示创建行级触发器,如果省略表示创建语句级触发器 行级触发器的作用在于DML语句执行时,影响多少条记录,触发器就执行多少次 语句级触发器的作用在于不管DML语句执行时影响多少条记录,触发器只执行一次 行级触发器语法: create or replace trigger 触发器名 before/after 动作 on 作用范围(表) for each row :new 新添加的一条记录或者更新的一条记录 :old刚删除的那条记录或更新前的一条记录 -- 触发器 +
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

SQL DML 数据操纵语句

前言 DML(Data Manipulation Language)语句:数据操纵语句,用于添加、删除、更新和查询数据库记录,并检查数据完整性。常用的语句关键字主要包括 insert、delete、update 和 select 等。
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

Go之GOPATH与工作空间

来自: GOPATH与工作空间 GOPOATH 设置 go 命令依赖一个重要的环境变量:$GOPATH 在类 Unix 环境下大概这样设置: exprt GOPATH=/home/apple/mygo 为了方便,应该新建一个文件夹,并且上一行加入到.bashrc 或者.zshrc 或者自己的 sh 的配置文件中。 GOPATH 允许有多个目录,当有多个目录时,请注意分隔符,多个目录的时候 Linux 系统是冒号,当有多个 GOPATH 时,默认会将 go get 的内容放在第一个目录下。 以上
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

SQL DCL 数据控制语句

前言 DCL(Data Control Language)语句:数据控制语句,用于控制不同数据段直接的许可和访问级别的语句。这些语句定义了数据库、表、字段、用户的访问权限和安全级别。主要的语句关键字包括 grant、revoke 等。
分类: 其他 发布时间: 06-14 22:12 阅读次数: 1

修改电脑自动休眠时间win10

https://jingyan.baidu.com/article/adc81513a481cdf723bf73e6.html
分类: 其他 发布时间: 06-14 22:12 阅读次数: 1

Python学习笔记:初

一、Print()格式: print('hello word') 或 print("hello word") print('hello word\n'*8) 结果: 二、缩进: Tab不等于四个空格 缩进级别一致(官方建议四个空格) 三、变量命名: 具有描述性:Student_number(良好习惯) 支持中文命名,但不推荐 不能以数字开头 变量名只能数字字母组成,不可一是空格或特殊字符(#?<,./$%^#等) 保留字符不用做变量:print=5(不可) Python不分常量,
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3

设计模式之装饰器设计模式

Java的IO流使用了一种装饰器设计模式。它将IO流分成底层节点流和上层处理流,其中节点流用于和底层的物流存储结点直接关联——不同的物流节点获取该结点流的方式可能存在一定差异,但程序可以把不同的物理节点流包装成统一的处理流,总而允许程序使用统一的输入、输出代码来读取不同的物流存储结点的资源。 简单来说,装饰器模式就是将某个类重新装扮一下,使它比原来更漂亮或功能更强大,但是这个类袁蓓的使用者不会感受到装饰前和装饰后的区别,所以装饰器模式要做到对装饰类的使用者透明。 在由InputStream、O
分类: 其他 发布时间: 06-14 22:12 阅读次数: 3