ビッグデータの原則とアプリケーションの最終的な答え

1.データ生成方法の変換は、主に3つの段階を経ています。次のうち、これらの3つの段階に属さないものはどれですか。

A.
データフローステージ

B.
運用システムの段階

C.
ユーザーオリジナルコンテンツステージ

D.
知覚されるシステム段階

2単一選択(2点)
情報技術の第3波の発生は、次の技術のどれの普及であるか

A.モノの
インターネット、クラウドコンピューティング、ビッグデータ

B.
CPU

C.
パソコン

D.
インターネット

3つの単一選択(2ポイント)
1TB =()MB

A.
2 ^ 20(注:2の20乗)

B.
1024

C.
1000

D.
2 ^ 10(注:2の10乗)

4単一選択(2ポイント)
Hadoopの2つのコアは

A.
HDFS; HBase

B.
MapReduce; HBase

C.
GFS; MapReduce

D.
HDFS; MapReduce

5単一選択(2ポイント)
HDFSデフォルトのブロックサイズは

A.
32KB

B.
8KB

C.
64MB

D.
16KB


データの保存と読み取りを担当する分散ファイルシステムHDFSの6つの単一選択(2ポイント)

A.
データノード

B.
名前ノード

C.
マスターノード

D.2
番目の名前ノード

7単一選択(2ポイント)
現在のディレクトリにあるローカルファイルfile.txtを分散ファイルシステムHDFSの「/ path」ディレクトリにアップロードするためのシェルコマンドは次のとおりです。

A.
hdfs fs -put file.txt / path

B.
hdfs dfs -put file.txt / path

C.
hadoop dfs -put / path file.txt

D.
hdfs dfs -put / path file.txt

8単一選択(2ポイント)
HDFSルートディレクトリに/ testフォルダーを作成します。/testフォルダーにはフォルダーdirも含まれます。正しいシェルコマンドは次のとおりです。

A.
hadoop dfs -mkdir / test / dir

B.
hadoop fs -mkdir -p / test / dir

C.
hdfs fs -mkdir -p / test / dir

D.
hdfs dfs * mkdir -p / test / dir

9単一選択(2ポイント)
HBaseに関する次の説明のうち正しいものはどれですか?

A.
HBaseは、信頼性が高く高性能なグラフデータベースであるGoogleBigTableのオープンソース実装です。

B.
データベースにレコードを挿入する場合、HBaseは、リレーショナルデータベースと同様に、レコード全体を「行」単位でデータベースに毎回挿入します。

C.
HBaseデータベーステーブルは、テーブルの任意の列をインデックスとして設定できます

D.
HBaseのは、NoSQLのデータベースです

10単一選択(2ポイント)
テーブルの学生がHBaseに格納されていることを知って、レコード{id:2015001、name:Mary、{score:math}:88}をテーブルに挿入し、そのIDを行キーとして使用します、その中で、数学に88ポイントを挿入する場合、正しいコマンドは次のとおりです。

A.
プット 'student'、 'score:math'、 '88'

B.
put'student '、' 2015001 '、' score:math '、' 88 '

C.
put'student '、' 2015001 '、' 88 '

D.
put'student '、' 2015001 '、' math '、' 88 '

11単一選択(2ポイント)
NoSQLデータベースの3つの理論的基礎は含まれていません

A.

B.
CAP

C.結果
整合性

D.
ベース

12単一選択(2ポイント)
単語頻度統計用のMapReduceプログラムを設計する場合、テキスト行「hello bigdata hello hadoop」の場合、結果はマップ関数の処理後に直接出力される必要があります(結合およびマージ操作は発生しません)。

A.
<“ hello”、2>、<“ bigdata”、1>和<“ hadoop”、1>

B.
<“ hello”、<1,1 >>、<“ bigdata”、1>和<“ hadoop”、1>

C.
<“ hello”、1,1>、<“ bigdata”、1>和<“ hadoop”、1>

D.
<“ hello”、1>、<“ hello”、1>、<“ bigdata”、1>和<“ hadoop”、1>

13単一選択(2ポイント)
PATH環境変数が構成されていると仮定すると、hadoopを開始するコマンドは次のとおりです。

A.
start-hadoop.sh

B.
start-hdfs.sh

C.
start-fs.sh

D.
start-dfs.sh

14単一選択(2点)
次の記述は間違っています

A.
HDFSHAは単一障害点の問題を解決できます

B.
HDFSフェデレーションにより、HDFSネーミングサービスの水平方向の拡張が可能になります

C.2
番目の名前ノードは単一障害点の問題を解決できません

D.
2番目の名前ノードはホットバックアップですが、HDFSHAはホットバックアップではありません

15単一選択(2ポイント)
RDD操作には変換(変換)とアクション(アクション)の2つのタイプがあり、次のRDD操作はアクション(アクション)タイプに属します。

A.
マップ

B.
参加する

C.
groupBy

D.
収集する

16単一選択(2ポイント)
Hiveに関する次の説明のうち正しいものはどれですか?

A.
ハイブは、インデックスをサポートしていません。

B.
ハイブは、バッチインポートをサポートしています

C.
ハイブのスケーラビリティが低い

D.
ハイブは、頻繁にデータ更新をサポートしています

17複数選択(3点)
ビッグデータの特徴は次のとおりです。

A.
多種多様なデータ
B.
低い値の密度
C.
速い処理速度
D.
大量のデータ

18複数の選択肢(3点)
バッチコンピューティングに適し次のフレームワークは何ですか

A.
MapReduce

B.
プレゲル

C.
ストーム

D.
スパーク

19複数の選択肢(3ポイント)
ストリームコンピューティングに適し次のフレームワークは何ですか?

A.の
スパークストリーミング

B.
ドレメル

C.
プレゲル

D.
ストーム


次のフレームワークのどれがグラフ計算に適しているか20の複数の選択肢(3ポイント)

A.
ハマ

B.
GraphX

C.
プレゲル

D.
インパラ

21複数の選択肢(3ポイント)
技術アーキテクチャの観点から、モノのインターネットはどのレイヤーに分割できますか?

A.
ネットワーク層
B.
アプリケーション層
C.
処理層
D.
知覚層

22複数の選択肢(3ポイント)
HBaseがセル(セル)内の特定のバージョンのデータを一意に決定するために必要な属性

A.
列修飾子
B.
行キー
C.
タイムスタンプ
D.
列ファミリー

23の複数の選択肢(3ポイント)
NoSQLデータベースの典型的なタイプは次のとおりです。

A.
キー値データベース
B.
列ファミリーデータベース
C.
ドキュメントデータベース
D.
グラフデータベース

24の複数の選択肢(3ポイント)
CAPは意味します

A.
持久性

B.
一貫性
C.
可用性
D.
パーティションの許容範囲


3種類のクラウドコンピューティングが主に含む25の複数の選択肢(3ポイント)

A.
SaaS
B.
PaaS

C.
CaaS

D.
IaaS

26の複数の選択肢(3ポイント)
ストリームコンピューティングの次のアプリケーションはですか?

A.
ショッピングサイトでの広告の推奨

B.
過去1年間の買い物記録に基づいてユーザーの購買力を判断する

C.
データウェアハウスデータバッチ分析

D.
リアルタイムの交通ルートの推奨

27複数の選択肢(3点)
グラフの計算に関する次の説明のうち、正しいものはどれですか。

A.
従来のグラフコンピューティングフレームワークは通常、より良いメモリアクセスの局所性を示します

B.
複数の頂点の操作要求が競合する場合、Pregelはローカル順序付けとハンドラーを使用して競合を解決し
ます
。C。PregelはBSPモデルに基づく並列グラフ処理システムです
。D
。各スーパーステップで、各頂点は最大値を比較します。受信したメッセージの値と、それ自体の状態がどのような変更を加えたかを判別するための独自の値。

28の複数の選択肢(3ポイント)
次のうちどれがグラフコンピューティングフレームワークPregelのアプリケーションですか

A.
PageRank

B.
単一ソースの最短パス
C.
バイナリマッチング
D.
ストリーミングデータ処理

29の複数の選択肢(3ポイント)
Sparkの特性について正しい説明はですか?

A.の
DAGに基づいてスパークのタスクスケジューリングおよび実行機構は、HadoopのMapReduceのの反復実行機構よりも優れている。
B.の
スパークのコンピューティングモデルは、MapReduceのに属しているが、プログラミングモデルは、HadoopのMapReduceのより柔軟である
。C.
Scalaはスパークの主プログラミングあります言語、ただしSparkプログラミング言語としてJava、Python、およびRもサポートします。D。Sparkはメモリ内計算を提供します

これにより、中間結果をメモリに配置できるため、反復操作がより効率的になります。

30以上の選択肢(3点)
BASEの基本的な意味は

A.
基本的に利用可能
B.
ソフト状態

C.
継続性

D.結果
整合性

31判断(2ポイント)
Hadoopは、Apache Software Foundationの下にあるオープンソースの分散コンピューティングプラットフォームです。Java言語に基づいて開発されており、優れたクロスプラットフォーム機能を備えています。

A.エラー

B.正しい
32の判断(2ポイント)
HDFS分散ファイルシステムはGoogleファイルシステムGFSのオープンソース実装であり、HadoopMapReduceもGoogleMapReduceのオープンソース実装です。

A.正解

B.エラー
33の判断(2ポイント)
分散ファイルシステムHDFSでは、ネームノードがHDFSのメタデータの管理を担当し、これらのメタデータはディスクに保存されます。

A.正解

B.エラー
34判定(2点)
HDFSは多数の小さなファイルを効率的に保存できます。

A.正解

B.エラー
35の判断(2ポイント)
FsImageは、ファイルシステムツリーと、ファイルツリー内のすべてのファイルおよびフォルダーのメタデータを維持するために使用されます。

A.正解

B.エラー
36判定(2点)
セカンダリNameNode(Secondary NameNode)は、HDFSアーキテクチャのコンポーネントであり、HDFSメタデータ情報のバックアップをネームノードに保存し、ネームノードの再起動時間を短縮するために使用されます。

A.正解

B.エラー
37の判断(2ポイント)
HDFSはマスタースレーブ(マスター/スレーブ)アーキテクチャモデルを採用しています。HDFSクラスターには、名前ノードと複数のデータノードが含まれます。

A.正解

B.エラー
38の判断(2ポイント)
NoSQLデータベースは柔軟なデータベースモデルと優れたスケーラビリティを備えています。同時に、すべてのNoSQLデータベースはトランザクションのACID4特性をサポートしています。

A.正解

B.間違った
39の判断(2点)
従来のリレーショナルデータベースとNoSQLデータベースにはそれぞれの長所があり、一方が他方を完全に置き換えることは問題ありません。長期的には、異なるアプリケーションの違いに対応するために両方が共存します。 。化需要。

A.正解

B.エラー
40の判断(2ポイント)
MongoDBはC ++言語で記述されたグラフデータベースであり、そのデータ型はJSONオブジェクトに似ています。

A.正解

B.エラー
41の判断(2ポイント)
Hadoopの2つのコアはHDFSとMapReduceです。HDFSはデータの保存に使用され、MapReduceはデータの処理に使用されます。

A.正解

B.エラー
42の判断(2ポイント)
協調フィルタリングは、最も初期の最もよく知られている推奨アルゴリズムであり、ユーザーベースの協調フィルタリングとアイテムベースの協調フィルタリングに分けることができます。

A.正解

B.エラー
43の判断(2ポイント)
Hiveはリアルタイムの対話型SQLクエリに適しており、Impalaは長期のバッチクエリ分析に適しています。

A.正解

B.エラー

この答えはインターネットから来ています。

おすすめ

転載: blog.csdn.net/langezuibang/article/details/106229121