数据挖掘课R语言知识小结

  • 数据挖掘课R语言知识小结
课程设计报告+PPT  答辩:6.25号


library(tidyverse)
# 判断x与x_unscale是否相等,精确度为0.1
near(x,x_unscale,tol = 0.1)

# 反scale
利用scale()函数,参数center=  scale()计算得到的 -center/scale
         参数scale=   scale()计算得到的 1/scale


# boxplot.stats():可以看到画出箱线图的具体的数据值 
# 长度为5的向量,包含下层晶须的极值、上四分位数、中值、下四分位数和上晶须的极值。
# fivenum():最小值、最大值、上四分位数、中值、下四分位数
# 两端取值不一样,即最小值、最大值的取值不一样

$`status`:反单引号
# 列名奇奇怪怪的时候,可以用反单引号`` 包含起来用

查准率和查全率:
    面积最大的点


标准价格的标准化距离:
    分子取中位数,即防止受异常值的影响

向量化运算:
    向量取值:V[1:10]  (把get操作应用于向量V的不同元素)
    向量赋值:V[1:10] <- seq(1,10)  (把set操作应用于一个序列与向量V的对应元素)
    apply系列:lapply(V, mean)  (跟python的map函数类似,是向量化最直接的表达形式)
    矩阵运算:A + B;A %*% B  (矩阵的基本运算也是向量化的典型形式)


留出法:
    70%:训练集
    30%:测试集

评估方法:
    k-折交叉检验



猜你喜欢

转载自blog.csdn.net/mr_muli/article/details/80797131