1.R言語はコンパイル言語またはインタプリタ言語でありますか?
インタプリタ言語
2.基本的な機能R言語の説明。
Rは、完全な言語データの処理で計算し、グラフィックス・ソフトウェア・システムは、次の機能を含みます。
(1)データ記憶及び処理機能、及びデータの読み出しが豊富なストレージ容量を、データが豊富な機能を処理します。
(2)配列演算ツール
(3)完全で一貫性の統計解析ツール
(4)優れた統計的マッピング関数
3.R言語は、多くの場合、どのような分野で使用されますか?
人工知能、統計分析、応用数学、計量経済学、財務分析、財務分析、バイオインフォマティクス、データの可視化とデータマイニング。
分類と予測アルゴリズム一般的に使用される言語4.R何?
サンプルの中で最も類似したK(近隣最寄りの特徴空間)の最も特徴空間でのサンプルはクラスに属している場合(1)K-最近傍は、サンプルもこのカテゴリーに分類されます。
分類に依存する(2)決定木、知らに従って訓練の予測ツリーは、分類、将来を予測します。
(3)サポートベクターマシンは、二つのカテゴリーにデータセット内の今後のデータに対して二分のアプローチです。
データ分析、モデリング、予測データのためのRパッケージを使用する方法の5.説明。
アプリケーションの要件予測の実装を完了するために> - ロードデータセット - >データセットのデータ解析 - >無効なデータを処理する - >予測モデルの構築 - >モデルの評価と選択 - >実際の需要予測
6.サンプルがグループ化されたデータの「クラスタリング」と「分類」を使用する方法。
「クラスタリング」と「カテゴリは」未来のデータを予測することができ、データを、指定したプロモーションの説明では歴史的な記録から自動的に導出することができます。違いは、ある「分類」アルゴリズムは、分類器コンストラクタ学習サンプル、およびカテゴリの特徴ベクトルに加えて、サンプル・データ・セット内の各サンプルが、また、必要なカテゴリタグをとります。マークされていない「クラスタリング」のサンプルは、クラスタリングアルゴリズムによって自動的に決定する必要があります。
7.SparkRデータフレームの役割は何ですか?
(1)これは、データ科学者は、大規模なデータセットを分析することができ、ジョブはRシェルの相互作用によりSparkR上で実行されています。
データソースの(2)非常に広い範囲は、複数種類のデータを処理することができます。
(3)高いスケーラビリティ、容易TBの治療および水平レベル・データ・サーバ用に拡張することができます。
(4)は、自動的にインテリジェントな決定の開発までの計算速度のために最適化オプティマイザ照会します。
RDD API(5)支持体は、コンピューティング、分散およびデータ解析を効率的に大規模なデータセットによってもたらされる課題に対処することができます。
8. DESCRIPTION関係SparkRと機械学習。
SparkRは、機械学習のためのサポートを提供し、モデル線形一般ような機械学習アルゴリズムの様々な達成することができ、故障時の生存回帰モデル、ナイーブベイズモデル、K-手段モデルを加速しました。