R言語学習特記事項:文字は大文字と小文字が区別されます
- R言語オブジェクト:R言語の6種類のベクター、配列、リスト、マトリクス係数、データブロックであるデータオブジェクトタイプを、記憶され、次は11示すであろう
- (整数または小数であってもよい)、文字(キャラクタ)の値(数値)、整数(整数)、化合物(錯体)、ロジック(論理):5つの基本的なオブジェクトのタイプ
- Rオブジェクト属性:オブジェクトの名前(名)、オブジェクトの大きさ(マトリクスアレイ)(薄暗い)、オブジェクトの種類(クラス)、オブジェクトの長さ(長さ)
- R言語の割り当て:C言語とJava言語の割り当てとは異なり、R言語の割り当ては、R言語変数が直接割り当てを使用して、宣言する必要はありません
割当てシンボルと「< - 」または「=」を示し推奨「< - 」など。
X <-1
X:[1]#1角括弧xの最初の要素です。
- ベクトル(ベクトル)
- 簡単な説明:ベクトルメモリは、数値、文字、または論理データ・タイプの一次元アレイである、ベクターは、統合オブジェクト・タイプを含むことができ
- 機能概要:データ型に依存するパラメータ値によって指定されたベクトルの要素を作成するタイプ(モード)と長さ(長さ):数値(数値関数ベクトル(モード=「論理」、長さ= 0L)は、2つのパラメータを有します())のベクトル要素の値は0であり、論理型(論理())であり、文字(キャラクタ())FALSEでありされています ""
- ベクトルの作成:
X <-C( "A"、 "B"、 "C")
> X
[1] "A" "B" "C"
> Y <-C(1,2,3,4,5)
> Y
[ 1] 1 2 3 4 5
> Z <-c(1:8)
> Z
[1] 1 2 3 4 5 6 7 8
- マトリクス(行列)
- 行列は、特性ベクトルガーベイの簡単な説明です
- 作成した行列:行列を移入するには、2つの行列のパラメータ、行と列の最小値、空白のコンテンツを作成するには、列にある、薄暗い機能は、行列がどのように多くの行を見ることが良いですどのように多くの列をすることができ
X < -マトリックス(。。nrow 3 =、=のNcoI 4)が
特異的に(X)#表示情報行列を説明する属性
同じ行列である必要があり、統一型素子の一種に変換され、以下のように、マトリックスは、コンテンツの異なるタイプのマトリックスに格納されている一次元アレイである。注:
> X <-C(、2,3、TRUE、FALSE)
> X
[1] 5 2 3 0 1
- アレイ(配列)
- 簡単な説明:Rは、多次元配列であるマトリックスとの間の差と多次元配列が配列であることができるが、唯一の一次元マトリックス
- 配列を作成します。
> x<-array(1:24,dim=c(4,6))
> x
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1 5 9 13 17 21
[2,] 2 6 10 14 18 22
[3,] 3 7 11 15 19 23
[4,] 4 8 12 16 20 24
> k<-array(1:24,dim=c(2,3,4)) #创建一个2行3列的思维数组,dim=c(2,3,4) 参数4代表的是数组的维度
>
> k
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
- 列表(list)
- 简要描述:列表是一个包含不同的类型的内容数据集,一个列表中可以存放很多不同类型的数据
- 创建列表:list
l<-list(a,2,TRUE,-2i) > l [[1]] [1] 5 [[2]] [1] 2 [[3]] [1] TRUE [[4]] [1] 0-2i
- 命名列表内容
l2<-list(a=1,b=2,c=3)
> l2
$a
[1] 1
$b
[1] 2
$c
[1] 3
- 因子(Factor)
- 简要描述:factor 因子是用来处理分类数据有序和无序的数据,可以把因子理解成整数向量,因子优于整数向量,在因子中使用levels=...来设置基线水平
- 创建因子 :
> x<-factor(c("female","male","male","female","male")) > x [1] female male male female male Levels: female male > y<-factor(c("female","male","male","female","male"),levels=c("male","female")) > y [1] female male male female male Levels: male female #Levels表示因子的水平,因子的水平可以手动设置 unclass(x) #去掉因子的属性来看因子内容 table(x) #计算因子中的词频
- 数据框(data.frame())
- 简要描述:R数据框是用于存储表格数据,存储列表,和矩阵关系密切,可以把它当作长度相同的列表
- 数据库小规则:数据框中每个元素代表一列数据、数据框中每个元素的长度代表行数、数据框中元素类型可以不同
- 创建数据框:
> df<-data.frame() > df data frame with 0 columns and 0 rows > class(df) [1] "data.frame"
- 日期(Date)
x<-Sys.date:获取当前系统的日期
x2<-"2015-10-01" #声明字符型日期
x3<-"2017-10-01"
x2<-as.Date("2015-10-01")
x3<-as.Date("2017-10-01") #将字符型的日期转换为日期类型
weekdays(x) #获取日期是周几
months(x) #当前日期是哪月
quarters(x) #当前日期属于这一年的哪个季度
julian(x) #表示距离1970-01-01日期到现在过去了多少天18123
#时间运算,日期运算可以转换为整数
> x2
[1] "2015-10-01"
> x3
[1] "2017-10-01"
> x3-x2
Time difference of 731 days
>as.numeric(x3-x2) #将结果转换成数值类型
[1] 731
#两个日期做减法会得到一个字符型的结果,在处理数据时通常需要把它作相应的转换
- 时间(Time)
- 简要描述:时间类型有POSIXct和POSIXlt
- 字符—>时间转换:
as.Date() #字符转日期
as.POSIXct() as.POSIXlt() strptime() #字符转时间
# 例如:
x1<-"Jan 1,2019 02:18"
strptime(x1,"%B %d,%Y %H:%M")
- 缺失值(NA/NaN)
- 简要描述:缺失值的处理在数据分析中是很常见的一种,在数据预处理之前必须要处理数据的缺失值
- R中的缺失值:NA/NaN :其中NaN属于NA,而NA不属于NaN :NaN一般只用于表示数字的缺失值
- NA有类型属性:整数NA和字符NA
- 检测缺失值的方法:is.na() / is.nan()
- 实例:
> x<-c(5,NA,6,NA,NA)
> y<-c(5,NaN,6,NaN,NaN)
>
> is.na(x)
[1] FALSE TRUE FALSE TRUE TRUE
> is.na(y)
[1] FALSE TRUE FALSE TRUE TRUE
> is.nan(x)
[1] FALSE FALSE FALSE FALSE FALSE
> is.nan(y)
[1] FALSE TRUE FALSE TRUE TRUE
#说明:is.na()表示的两个结果相同说明NaN属于NA