爬取酷狗音乐排行榜单
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yhj198927/article/details/88828517
import time
import requests
from bs4 import BeautifulSoup
from pymongo import MongoClient
client=MongoClient()
songs=client.kugou_db.songs
header={
'User-Agen
Python使用bs4爬取数据时乱码问题
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yhj198927/article/details/88875552 使用requests和beautifulsoup模块爬取网页数据时,有时会出现乱码情况,如下所示: 需要爬去的网页的编码格式为: Pyhton代码如下所示:
import requests
from bs4 import BeautifulSoup
def get_content(url):
content_da
Pyhton破解滑动验证码
极验滑动验证码 以上图片是最典型的要属于极验滑动认证了,极验官网:http://www.geetest.com/。 现在极验验证码已经更新到了 3.0 版本,截至 2017 年 7 月全球已有十六万家企业正在使用极验,每天服务响应超过四亿次,广泛应用于直播视频、金融服务、电子商务、游戏娱乐、政府企业等各大类型网站 对于这类验证,如果我们直接模拟表单请求,繁琐的认证参数与认证流程会让你蛋碎一地,我们可以用selenium驱动浏览器来解决这个问题,大致分为以下几个步骤 1、输入用户名,密码 2、点
Python学习之109道面试题(下)
51、正则匹配,匹配日期2018-03-20 1 2 3 4 5 6 import re url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462' result=re.findall(r'dateRange=(.*?)&',u
ASP.NET中服务器控件的生命周期
服务器控件的生命周期是创建服务器控件最重要的概念。作为开发人员,必须对服务器控件生命周期深刻理解。当然,这不是一朝一夕就可以做到的。对于学习控件开发技术的初学者,可以不必掌握得非常详细深入,只需对服务器控件的生命周期中的不同阶段有一个大致的了解即可。 初始化(oninit) 加载视图状态 处理回发数据(回发是浏览器又一次请求服务器) 加载 发送回发更改通知 处理回发事件 预呈现 保存状态 呈现 处置(释放资源) 卸载(unload) 当Web服务器接收到一个HTTP请求(request),会返
WinForm如何调用Web Service
今天看了李天平关于WinForm调用Web Service的代码,我自己模仿做一个代码基本都是复制粘贴的,结果不好使。郁闷的是,又碰到那个该死的GET调用Web Service,我想肯定又是Web.config需要配置,结果WinForm没有这个配置文件,奇怪,为什么人家的就好使,我写的就不好使呢。 上网搜吧,唉,找个两个多小时,基本都是和我一样的代码,互相转载。根本没人提代码好不好使,也没人提正确的用法。就在我要放弃的时候,终于发现原来是在 Web Service的Web.config里配置
C#二十三种设计模式
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yhj198927/article/details/89196268 创建型: 1. 单例模式(Singleton Pattern) 2. 抽象工厂(Abstract Factory) 3. 建造者模式(Builder) 4. 工厂方法模式(Factory Method) 5. 原型模式(Prototype) 结构型: 6. 适配器模式(Adapter Pattern) 7. 桥接模式(Bridg
JavaScript将输入的数值转换为人民币大写
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yhj198927/article/details/89354089
function convertCurrency(currencyDigits) {
var MAXIMUM_NUMBER = 99999999999.99; //最大值
// 定义转移字符
var CN_ZERO = "零";
C#将输入的数字转换为人民币大写
/// <summary>
/// 数字转换为大写人民币表示
/// </summary>
/// <param name="strMoney"></param>
public string MoneyToChinese(string strCurrentDigit)
{
// 1. 字符串切分
string integral = ""; // 整数部分
string dec = "";
poj3177(Redundant Path)
蓝书P183 #include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int N=5005;
const int M=10005;
int first[N],dfn[N]={0},low[N],co[N],col=0,num=0;
struct node{
int v,next,from; //from表示无向边的另一条边的编号(可以以2为首边编号,则第n条无向边存储在下标为n*2,n*2+1
模型融合(集成)方法
FROM : https://blog.csdn.net/sinat_29819401/article/details/71191219 本文是《KAGGLE ENSEMBLING GUIDE》一文的阅读笔记,忽略了一些不感兴趣的内容,原文请阅:https://mlwave.com/kaggle-ensembling-guide/ 模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果
sklearn_Feature selection(特征选择)
From: http://sklearn.apachecn.org/cn/0.19.0/modules/feature_selection.html#feature-selection https://www.jianshu.com/p/b3056d10a20f 目录 1.13. 特征选择 1.13.1. 移除低方差特征 1.13.2. 单变量特征选择 1.13.3. 递归式特征消除 1.13.4. 使用 SelectFromModel 选取特征 1.13.4.1. 基于 L1 范数的特征选取
Python 浅拷贝与深拷贝
以下实例是使用 copy 模块的 copy.copy( 浅拷贝 )和(copy.deepcopy ): 实例
#!/usr/bin/python
# -*-coding:utf-8 -*-
import copy
a = [1,2,3,4,['a','b']]#原始对象
b =a#赋值,传对象的引用
c = copy.copy(a)#对象拷贝,浅拷贝
d = copy.deepcopy(a)#对象拷贝,深拷贝
a.append(5)#修改对象a
a[4].append('c'
机器学习_随机数据生成
FROM: https://www.cnblogs.com/pinard/p/6047802.html 在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。下面对scikit-learn和numpy生成数据样本的方法做一个总结。 完整代码参见gith
DBSCAN可视化展示网站推荐
一个参数可调的DBSCAN聚类算法的可视化展示网站 https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/ 是一个国外的大佬写的 先选择数据集的类型 比如选择 Smiley Face 左下角可以调节领域半径以及领域密度阈值。 橙红色的圆圈方便我们根据数据集选择恰当的参数。 hh
与matplotlib的斗争之路
一. 读取文件画图篇 1. 怎么批量读csv文件(pandas方法)并画图
import os
import matplotlib.pyplot as plt
import pandas as pd
# 根目录
root_dir = r"D:/xxx/xxx"
# 依次读取根目录下的每一个文件
i = 0
for file in os.listdir(root_dir):
i += 1
# 只读取csv文件
if file.split('.')[-1] == 'CSV':
numpy陌生但常用的函数小结
目录 返回最小/最大值的下标 输出排序后的下标 返回中位数 返回累加值 返回相邻位上做n次差后的值 返回非零元素的索引值数组 返回非零元素的个数 将超出的部分强置为边界 返回最小/最大值的下标 # axis=0 在每一列中找 axis=1 在每一行中寻找 np.argmin(a, axis=None) np.argmax(a, axis=None) example:
>>> a = np.arange(6).reshape(2,3)
>>> a
array([[0, 1, 2],
如何实现VMware下Ubuntu和Windows之间的复制粘贴
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/GISLN/article/details/54983157 如何实现VMware下Ubuntu和Windows之间的复制粘贴 解决办法非常简单,只需要在虚拟机上安装一下VMware Tools即可。 第一步,打开虚拟机(我使用的虚拟机是ubuntu-16.04-desktop-amd64) 第二步,点击菜单栏中的虚拟机->安装VMware Tools。这一步要注意的是,如果你之前安装过,这个选项
今日推荐
周排行