【机器学习】特征预处理

学习目标了解数值型数据、类别型数据特点应用MinMaxScaler实现对特征数据进行归一化应用StandardScaler实现对特征数据进行标准化1、什么是特征预处理特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程可以通过上面那张图来理解1.1 包含内容数值型数据的无量纲化:归一化标准化1.2 特征预处理APIsklearn.preprocessing为什么我们要进行归一化/标准化?特征的单位或者大小相差较大,或者某特征的
分类: 其他 发布时间: 10-08 23:47 阅读次数: 0

【机器学习】特征降维-主成分分析

主成分分析目标应用PCA实现特征的降维应用:用户与物品类别之间主成分分析什么是主成分分析(PCA)定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量作用:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。应用:回归分析或者聚类分析当中那么更好的理解这个过程呢?我们来看一张图APIsklearn.decomposition.PCA(n_components=None)将数据分解为较低维数空间n_components:小数:
分类: 其他 发布时间: 10-08 23:47 阅读次数: 0

【机器学习】特征降维-特征选择

特征选择什么是特征选择定义: 数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。方法:Filter(过滤式):主要探究特征本身特点、特征与特征和目标值之间关联方差选择法:低方差特征过滤相关系数Embedded (嵌入式):算法自动选择特征(特征与目标值之间的关联)决策树:信息熵、信息增益正则化:L1、L2深度学习:卷积等Wrapper (包裹式)模块sklearn.feature_selection过滤式低方差特征过滤
分类: 其他 发布时间: 10-08 23:47 阅读次数: 0

【机器学习】机器学习概述

简单的一句话:让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好,这就是机器学习。机器学习是实现人工智能的一种途径,它和数据挖掘有一定的相似性,也是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够白动地从数据中“学习”规律,并利用规律对未知数据进行预测。因为学习算法涉及了大量的统计学理论,与统计推断联系尤为紧密,所以也被称为统计学习方法。机
分类: 其他 发布时间: 10-08 23:46 阅读次数: 0

Mac触控板设置

我觉得用着还行留个记录,今天刚重装系统~_~
分类: 其他 发布时间: 10-08 23:46 阅读次数: 0

如何更改 Mac 文件的默认打开方式

方法 1. 更改某一个文件的默认打开方式第一步:右键单击该文件。第二步:按下 Option 键,你会看到「打开方式」选项变成了「始终以此方式打开」。第三步:选择「始终以此方式打开」列表内的某一个应用程序。那么该文件应该在你刚刚选择的应用程序(本例为 Typora)内打开,并且,该文件以后也会默认以这个应用程序打开。注:它仅适用于你所选择的这一个文件,并不适用于其他文件,包括同一类型的文件。方法 2. 更改同类型文件的默认打开方式第一步:右键单击该文件,然后选择「显示简介」选项。第二步:找到
分类: 其他 发布时间: 10-08 23:45 阅读次数: 0

我的图床设置PicGo

使用七牛云和PicGo搭建图床我目前用的Github
分类: 其他 发布时间: 10-08 23:45 阅读次数: 0

【机器学习】分类算法-sklearn转换器和估计器

目标知道sklearn的转换器和估计器流程转换器想一下之前做的特征工程的步骤?实例化 (实例化的是一个转换器类(Transformer))调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)把特征工程的接口称之为转换器,其中转换器调用有这么几种形式fit_transformfittransform这几个方法之间的区别是什么呢?看以下代码就清楚了In [1]: from sklearn.preprocessing import Standa
分类: 其他 发布时间: 10-08 23:45 阅读次数: 0

【机器学习】分类算法-K-近邻算法

目标说明K-近邻算法的距离公式说明K-近邻算法的超参数K值以及取值问题说明K-近邻算法的优缺点应用KNeighborsClassifier实现分类了解分类算法的评估标准准确率应用:Facebook签到位置预测K-近邻算法(KNN)定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,即由你的“邻居”来推断出你的类别来源:KNN算法最早是由Cover和Hart提出的一种分类算法距离公式两个样
分类: 其他 发布时间: 10-08 23:45 阅读次数: 0

【机器学习】K-近邻算法-模型选择与调优

前言在KNN算法中,k值的选择对我们最终的预测结果有着很大的影响那么有没有好的方法能够帮助我们选择好的k值呢?模型选择与调优目标说明交叉验证过程说明参数搜索过程应用GirdSearchCV实现算法参数的调优应用Facebook 签到位置预测调优什么是交叉验证(cross validation)定义将拿到的训练数据,分为训练和验证集,以下图为例:将数据分成4份,其中一份作为验证集,然后经过4次(组)的测试,每次都更换不同的验证集,即得到4组模型的结果,取平均值作为最终结
分类: 其他 发布时间: 10-08 23:44 阅读次数: 0

机器学习-sk-learn-Facebook数据集预测签到位置

sk-learn Facebook数据集预测签到位置本次比赛的目的是预测一个人将要签到的地方。 为了本次比赛,Facebook创建了一个虚拟世界,其中包括10公里*10公里共100平方公里的约10万个地方。对于给定的坐标集,我们的任务将根据用户的位置,准确性和时间戳等预测用户下一次的签到位置。 数据被制作成类似于来自移动设备的位置数据。特征值:“x”, “y”, “accuracy”, “day”, “hour”, “weekday”目标值: place_id本实例使用Facebook上统计的数据
分类: 其他 发布时间: 10-08 23:44 阅读次数: 0

解决oh my zsh Insecure completion-dependent directories detected

安装oh my zsh 的命令sh -c "$(wget https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh -O -)"--2021-09-01 15:44:32-- https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh正在解析主机 raw.githubusercontent.c
分类: 其他 发布时间: 10-08 23:43 阅读次数: 0

“package XXX is not in GOROOT“ when building a Go project2021-09-06

解决方案https://stackoverflow.com/questions/61845013/package-xxx-is-not-in-goroot-when-building-a-go-projectYou may have GO111MODULE set “on”, which will be on the go mod. Turning off the GO111MODULE may resolve this problem.go env -w GO111MODULE=off...
分类: 其他 发布时间: 10-08 23:43 阅读次数: 0

Mac Go 国内加速镜像

Go 国内加速镜像# 启用 Go Modules 功能go env -w GO111MODULE=on# 配置 GOPROXY 环境变量,以下三选一# 1. 七牛 CDNgo env -w GOPROXY=https://goproxy.cn,direct# 2. 阿里云go env -w GOPROXY=https://mirrors.aliyun.com/goproxy/,direct# 3. 官方go env -w GOPROXY=https://goproxy.io,d
分类: 其他 发布时间: 10-08 23:43 阅读次数: 0

【磨合】关于VS code报错 gopls requires a module at the root of your workspace

设置中搜索:goplssettings.json设置里面添加如下: "gopls": { "experimentalWorkspaceModule": true }
分类: 其他 发布时间: 10-08 23:43 阅读次数: 0

beego之context新老版本使用

在不同版本中对应的ctx的类型和package有所不同。在老版本中是通过引入beego包就可以直接使用beego.Context获取的到。比如:import "github.com/astaxie/beego"func checkAccount(ctx *beego.Context) bool {}在新版本中只能新引入另外一个包来获取:import "github.com/astaxie/beego/context"func checkAccount(ctx *context.Context
分类: 其他 发布时间: 10-08 23:42 阅读次数: 0

Golang判断元素是否存在数组中

func IsContain(items []string, item string) bool { for _, eachItem := range items { if eachItem == item { return true } } return false}
分类: 其他 发布时间: 10-08 23:42 阅读次数: 0

Go语言GO111MODULE设置

GO111MODULE是 go modules 功能的开关,关于go modules本文不详述,这个涉及到go的一种很重要的管理机制,后面会有专门的文章来分析,我们可以简单的理解为,在没有go modules机制时,go工程中对于第三方功能包的管理非常复杂,也非常专业,这就导致程序员在进行开发的时候,对于第三方功能包的管理很不方便,所以才有了go modules机制。这个机制的开关是通过GO111MODULE环境变量来配置的。GO111MODULE=off无模块支持,go命令行将不会支持module功能
分类: 其他 发布时间: 10-08 23:41 阅读次数: 0

Go语言参数校验(go-playground / validator)

基本使用Go语言没有像Java一样的注解快速进行参数的校验,但可以通过struct tag(结构体标签)进行序列化。常用的如:type User struct { ID string `json:"id"` Name string `json:"name"` Age string `json:"age"`} 但需要更复杂的校验,这时需要用一些专业的库来完成。go-playground / validator作为一款优秀的Go语言校验库,基于标记为结构体和单个字段实现值验证。使用简单、快捷。添
分类: 其他 发布时间: 10-08 23:41 阅读次数: 0

如何使用curl命令发送json格式请求体的post请求

如何使用curl命令发送json格式请求体的post请求直接上完整的命令:curl 'http://localhost:8080/cnd_inke/qc/v2/inke' \-H "Content-Type:application/json" \-H 'Authorization:bearer' \-X POST \-d '{"Id":"12330245","visitTimes":1,"docType":"散文","docId":"36e5854f5f0e4f80b7ccc6c52c06324
分类: 其他 发布时间: 10-08 23:40 阅读次数: 0