機能基本構造 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
入力データ型
ベクター:
合計、平均、標準偏差、範囲、中央値、並べ替え、順序
マトリックスまたはデータ フレーム:
cバインド、rバインド
数値行列:
ヒートマップ
例: 回帰分析 lm()
state <- as.data.frame(state.x77[, c("殺人","人口", "文盲", "収入", "霜")])
フィット <- lm(殺人 ~)
オプションパラメータ
1. 入力制御部
2. 出力制御部
3. 調整部
共通オプション
ファイル: ファイル
data: 通常、データフレームを入力する必要があります。
x: 単一のオブジェクト (通常はベクトル、行列、リスト) を表します。
x と y: 関数には 2 つの入力変数が必要です
x、y、z: 関数には 3 つの入力変数が必要です
formula: 公式
na.rm: 欠損値を削除する
調整パラメータ
共通パラメータ
カラーオプションであり、明らかに色を制御するために使用されます
選択は選択に関連しています
フォントはフォントに関連しています
font.axis は軸のフォントです
lty は回線タイプです
lwd は線幅です
メソッドはソフトウェアアルゴリズムです
カスタム関数 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
関数名
関数コマンドは関数に関連しており、文字と数字の組み合わせを使用できますが、文字で始める必要があります。
関数宣言
myfun <- function(オプションパラメータ){
関数本体
}
共通機能 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
数学的統計学
確率関数
d 確率密度関数
p分布関数
q 分布関数の逆関数
r は同じ分布から乱数を生成します
関数の前に追加します。
その他の確率分布関数
他の
set.seed(233) #ランダムシードを設定します
runif(num) # 0 ~ 1 の間の num 数値をランダムに生成します
runif(num, min=1, max = 100) # 1 から 100 までの乱数をランダムに生成します
記述統計
記述統計とは、集計データの表作成と分類、グラフィックスと計算を使用してデータの特性を記述するアクティビティを指します。記述統計分析は、調査母集団のすべての変数の関連データを統計的に記述することであり、主にデータ頻度分析、中心傾向分析、分散度分析、分布およびいくつかの基本的な統計グラフィックスが含まれます。
summary() # データセット、最小値、最大値、四分位、数値変数の平均などの詳細な統計を実行します。
Fivenum() #基本的な 5 つの統計を返します
Hmisic::disscribe()
pastecs::state.desc()
psych::disscribe() #trim は極端な値を削除できます
psych::disscribe.by() #グループ化に応じて計算可能
ggregate() #指定されたグループ化情報を使用してデータを計算します
doBy::summaryby() #複数のグループの複数の統計値を計算
頻度統計
周波数(Frequency)、「回数」とも呼ばれます。変数値の中で、ある特徴を表す数値(フラグ値)が出現する回数を指します。グループごとに順番に配置された周波数は周波数系列を形成します。これは、マーカー値全体に対するマーカー値の各グループの役割の強さを示すために使用されます。
分割() #グループ化
Cut() #連続データの分割
table() #頻度統計
prop.table() # 周波数値を計算する
xtabs() #さまざまなニーズに応じてさまざまな数式を記述します
margin.table() #限界頻度、行または列のみで処理
addmargins() #周縁和を度数表に加算します
例えば
with(データ = 関節炎(テーブル(治療、改善)))
xtabs(~治療 + 改善、データ = 関節炎)