R言語の数学関数や統計関数と確率関数

数学関数
ほとんどのアプリケーションスカラーにおける数学関数(個別値)が
それぞれ個々の値に作用するこれらの関数は、数値ベクトル、行列、データブロックに適用される、
一般的な数学関数の
関数説明
ABS(x)の絶対値
SQRT(x)の平方根の
天井(X)が最小の整数以上のx(切り上げ)
X(丸いダウン)よりも大きくない最大整数フロア(x)が
X 0の方向に沿ったTRUNC(x)が整数セクション
ラウンド(X、桁= N)回の小数点以下の指定された数にxは
指定された有効桁数、有意性に対するX有意性(X、桁= N)回(3.475、桁= 2 ) 3.4の値を返します
COS(X)、SIN(X )、黄褐色(x)の余弦、正弦、正接
ACOS(x)は、ASIN(X )、ATAN(x)の逆余弦、アークサイン、アークタンジェント
COSH(X)、SINH(X ) 、TANH(x)は双曲線余弦、双曲線正弦、双曲線正接
ACOSH(X)、ASINH(X )、ATANH(x)の逆双曲線正弦、双曲線正接逆逆双曲線余弦、
ログ(X、ベース= n)はXベースのnの対数取り込むため
のexp(x)の指数関数を

第二に、統計関数
の多くの機能は、最終結果に影響を与えることができ、オプションのパラメータを持っています。
そのパラメータの最小および最大数指定されたパーセンテージ、他の欠損値を拒否するかna.rmを廃棄するトリム平均(x)関数。
統計関数の
機能説明
平均(x)の平均
中央値(x)の中央値
SD(x)の標準偏差
VAR(x)の分散
怒っ(x)の絶対中央
分位数を求めている分位数(X、ちゃったごめんなさい)。xが数値ベクトル量分位数、[0,1]の間で確率からなる数値ベクトルちゃったごめんなさいの値であることが要求される
範囲(X)を探している範囲、最大値と最小リターンベクター、例えば、X <-C(1,2,3,4)、範囲( X)は、 C(1,4)を返し
SUM(X)合計
差分(X、ラグ= n)の差動遅延は、いくつかの指定されたヒステリシスを遅らせます。既定。1 = LAGの
最小分間(x)の
最大値を選択する最大値(x)は
スケール(X、中心= TRUE、スケール= TRUE) カラム(中心(TRUE))の中心によってデータオブジェクトxまたは正規化センター= TRUE 、スケール= TRUE)

x <- c(1,2,3,4,5,6,7,8)
#利用统计函数求平均值和标准差
mean(x)
sd(x)
#不利用函数求平均值和修正标准差
n <- length(x)
n
meanx <- sum(x)/n

css <- sum((x-meanx)^2)
sdx <- sqrt(css/(n-1))
#数据的标准化
#默认情况下,函数scale()对矩阵或数据框的指定进行均值为0,标准差为1的标准化
newdata <- scale(mydata)
#对数据进行任意均值和标准差的标准化
#对数据进行均值为M标准差为SD的标准化
newdata <- scale(mydata)*SD + M
#对指定列进行标准化
#将列myvar进行均值为M标准差为SD的标准化
newdata <- transform(mydata,myvar=scale(myvar)*SD +M)

第三に、確率関数
確率関数は、通常、既知の特性を有するシミュレートされたデータを生成するために使用され、統計的確率関数値ユーザー作成計算される
Rの形で確率関数を、
[dpqr] distribution_abbreviation()
[]は、それが意味している表します特定の態様の分布
D =密度関数(密度)
P =分布関数(分布関数)
Q =分位関数(ファンクション分位)
R&LT =乱数(ランダム変動)を生成する
確率関数を一般的として使用される
分布略称
ベータ分布ベータ
二項binom
コーシー分布コーシー
(非中央)カイ二乗分布CHISQ
指数分布EXP
F F分布
ガンマガンマ分布
幾何分布のgeom
スーパー超幾何分布
、対数正規分布すぎるlnorm
ロジスティック分布ロジ
分布multinomの多くの
負の二項nbinomの
陽性状態分布ノルム
ポアソン分布は、ランドマーク
ウィルコクソン符号付き順位分布signrankの
T分布
一様分布UNIF
ワイブル分布ワイブルを
ウィルコクソン順位和分布ウィルコックス

#例子正太分布有关函数
#在区间[-3,3]上绘制标准正太曲线
#pretty()生成-3到3的30个等差值组成的向量
x <- pretty(c(-3,3),30)
y <- dnorm(x)
plot(x,y,type="l",
     xlab="Normal Deviate",
     ylab = "Density",
     yaxs="i")

#求位于z=1.96左侧的标准正太曲线下方面积是多少?
pnorm(1.96)
#求均值为500,标准差为100的正态分布的0.9分位点值为多少
qnorm(0.9,mean=500,sd=100)
#生成50个均值为50,标准差为10的正太随机数
#第一个参数是生成的随机数的个数,第二个参数为正太分布的均值,第三个参数为正太分布的标准差
rnorm(50,50,10)

3.2、設定ランダムシード
の各パラメータも乱数生成同じ場合、得られた乱数が異なっています。
それぞれがランダムシードの乱数が異なる生成するからです。
私たちは同じような状況のパラメータで同じ乱数を生成したいときは、操作が完了するために同じランダムシードを指定することができます
例:

#函数runif()用来生成0到1区间上服从均匀分布的伪随机数
runif(5)
#同样函数和参数生成的随机数也不同
runif(5)
#设定随机种子生成相同的随机数
set.seed(1234)
runif(5)
#注意每次生成随机数时都需要重新设定随机种子这样才能生成相同的随机数
#也就是说设定的随机种子是一次性的只对最近的随机数使用。之后还需要重新设定相同的随机种子
set.seed(1234)
runif(5)

3.3、平均ベクトルおよび共分散行列所与価を生成することは、あまりにも配信データで
生成するMASSパッケージmurnorm()関数を用いて、
N個の得られた試料の大きさであり、平均は、平均ベクトルであり、シグマは分散である-共分散行列(又は相関行列)
mvrnorm(N、平均、シグマ)

library(MASS)
#options()为环境设置函数,options(digits=3),设定R的整数表示能力为3位
options(digits=3)
set.seed(1234)
mean <- c(230.7,146.7,3.6)
sigma <- matrix(c(15360.8,6721.2,-47.1,
                  6721.2,4700.9,-16.5,
                  -47.1,-16.5,0.3),nrow=3,ncol=3)
mydata <- mvrnorm(50,mean,sigma)
mydata <- as.data.frame(mydata)

head(mydata,n=10)
公開された39元の記事 ウォン称賛11 ビュー10000 +

おすすめ

転載: blog.csdn.net/weixin_42712867/article/details/95575158