MA308:統計計算とソフトウェア


MA308:統計計算とソフトウェアの
割り当て3(2019年12月24日- 2020年1月2日)
?3.1 HSAUR3パッケージから「weightgain」データセットについて、データは、4つの異なるに与えたラットの体重でゲインを勉強するexperiメントから発生します食事は、で区別
タンパク質(低・高)の量とタンパク質(牛肉と穀物)のソースで。テン
ラットは4つの処理及びグラムの体重増加のそれぞれに無作為に割り付けされている
記録します。関心の質問は、ダイエットは体重増加にどのような影響を与えるかです。
()を生成するgplotsパッケージ内plotmeans()関数を使用して、グループ手段とスタン?DARD偏差を計算することにより、データの主要な特徴を要約
基手段とその信頼区間の相互作用プロット。
両方のプロットを生成するHHパッケージの(b)の使用interaction2wt()関数
を任意の順序の任意の要因設計の主効果と双方向の対話を。
ソースと型の間の相互作用が存在するかどうかを説明してください。
(c)は、相互作用ととせずに双方向要因ANOVA分析を実行し
、対応する結果を説明し、それぞれの用語。
(d)に我々のデータは、我々が実装したときに満足させる必要があると仮定何ですか
一方向ANOVAを?今、私たちは一方向ANOVAは、の違いを調べるために使用する場合
、タンパク質の異なるソース間weightgainを、これらの仮定が満たされますか?
(e)は双方向の要因ANOVA分析の順列テストバージョン行って
weightgainのを〜ソース* lmPermパッケージとタイプ、結果を比較します
3.1(c)のよう。
HSAUR3パッケージから「惑星」のデータセットについては、3.2
()惑星への完全な結合および平均連結階層的クラスタリングを適用し
たデータ。K平均(K = 3)で結果をクラスタリングして結果を比較する
講義ノート。
2
(b)は惑星データの三次元のドロップライン散布構築
点が適切なクラスター標識で標識されているが、K平均(K = 3)の方法は、
クラスタリングのために使用することができます。
(c)は、二成分正常に基づくパラメトリックモデルに合うようにRの関数を書く
惑星データにおけるエキセン変数の混合モデル。(ヒント:を参照してください。
第6章「混合分布推定」セクション)
実際、(d)は、混合物の推定のためのパッケージmclustオファーハイレベルの機能
モデルを、エキセン変数の正規混合モデルを推定するMclustを適用
惑星データです。3.2(c)において、その結果との比較。
(e)の最初の2つの主成分と主要コンポーネントのCO?efficients見つける、惑星データに主成分分析を実装し
、各惑星のためのスコア。
(F)の最初の2つの主成分にクラスタリングK平均(K = 3)を適用
惑星データ。元に基づくものとクラスタリング結果の比較
3.2で述べたデータ()。
3.3 ISLRの可能パッケージから「デフォルト」のデータセットのために、我々は、デフォルトを予測する方法を検討
代做MA308作业、代写Pythonの程序语言作业
バランスと収入の任意の値。特に、我々は今推定値を計算する
所得の標準誤差のためとにロジスティック回帰係数のバランスをとる
ための標準的な式を用いて、(1)ブートストラップを使用して、そして(2)2つの異なる方法
)(GLM標準誤差を計算します関数。ランダムに設定することを忘れないでください
、あなたの分析を開始する前に種子を。
()要約()とGLM()関数を使用して、推定標準判断
複数の所得とのバランスに関連した係数の誤差
の両方プレディクタを使用ロジスティック回帰モデル。
井戸などの入力としてデフォルトのデータセットを取る(B)関数を記述し、boot.fn()、
観察の指標、及びそのための係数の推定値として出力する
多重ロジスティック回帰モデルにおける収入とのバランスを。
(C)を推定するためにあなたのboot.fn()関数と一緒にブート()関数を使用して
収入とのバランスのためにロジスティック回帰係数の標準誤差を。
3
(d)の推定標準誤差のコメントはGLM()関数を使用して取得
し、あなたのブートストラップ機能を使用して。
ISLRの可能パッケージから「デフォルト」のデータセットについては3.4、我々はのためのデフォルトを予測する方法を検討
バランスと収入の任意の値。
()訓練セット(70%)と検証セット(30%)にサンプルセットを分割。フィット
のみ使用して複数のロジスティック回帰モデル(デフォルト〜バランス+収入)
トレーニング観測。各個々のデフォルトの状態の予測を得る
ことのデフォルトの事後確率を計算することによって、検証セットで
個々に、および後部場合、デフォルトカテゴリに個体を分類する
確率が0.5よりも大きいです。あるバリデーションセット誤差、計算
誤って分類された検証セットの観測の割合を。
[10点]
(B)デフォルトクラシックデシジョンツリーおよび条件推論ツリーを適用し
たデータセット。交差検証エラープロットするplotcp()関数を使用して、
複雑さのパラメータを、最も適切な木のサイズを選択してください。
(c)はランダムフォレストのためのアルゴリズムは例をサンプリングし、必要書き留め
決定木を大量に作成するための変数。ランダムフォレスト実装
伝統的な決定木に基づくalgorighmと条件推論木を
それぞれ。検証を分類するために構築されたランダムフォレストモデルを使用し
たサンプルをし、二つのモデルの予測精度を比較します。
(d)は、デフォルトのデータセットにサポートベクターマシン分類器を取り付けます。tune.svm()を使用し
、よりにつながる可能性があり、ガンマとコストの組み合わせを選択する機能を
有効なモデルを。感度、特異度、陽性予測力の比較
とSVMの負の予測力、ランダムフォレストおよびロジスティック回帰
分類器を。

プロ、とても信頼できるので。必要に応じて、追加 QQ 99515681 または マイクロチャネル: codehelpを

おすすめ

転載: www.cnblogs.com/memory4/p/12134594.html