データ分析[CDA第二章:データの収集とインポート]

I.概要

  データは、我々が分析作業に先立って行われなければならないデータの性質や特徴を研究現象の具体的な説明のデータを収集することです。データの格納形式は、構造化データ、非構造化および半構造化データに分割してもよいです。

  1.データ構造

    データまたは統一フォーマットとして表すことができ、単にデータベースです。

  2.非構造化データ

    その上のデータや統一された構造の表現、ビデオの形のように、オーディオ、画像、ドキュメント、および使用することはできません。

  3.半構造化データ

    メール、HTML、レポート作成、リソースライブラリを含みます。

二.SQL言語とMySQL

  データベースには、名前が示す、データウェアハウスを格納することです。厳密に言えば、データベース中の長期保存は、コンピュータ、大量のデータの整理コレクションを共有することが可能です。特定の組織のデータ・モデルに応じて、データベース内のデータは、記載及び保管が小さい冗長性、より高いデータ独立性と容易な拡張性を有し、様々なユーザで共有することができます。、永久的なデータベースのデータストレージを話す前に、三つの基本的な特徴を整理し、共有しました。

  1.SQLの言語

    SQL [構造化照会言語]、つまり、構造化照会言語は、リレーショナル・データベースの標準言語です。SQLは、ボイスやチェンバレンによって1974年に提案し、プロトタイプシステムR.を開発し、IBMのデータベース管理システムに実装されました 1987年に国際標準として。SQL収集データのクエリ[データクエリー]、データ操作[データ操作] DML、データ定義[データ定義] DDLおよびデータ管理[データコントロール] DCL -in-1、言語スタイルの制服、およびデータベースのライフサイクルのすべての活動を完了でき。

継続するには。

おすすめ

転載: www.cnblogs.com/yszd/p/11618238.html