CSVデータをロードするために(F)を学習pgloader

設定パラメータのロードについてCOMANDファイルを使用しています

コマンドファイル参照形式

LOADのCSV
   FROM 'GeoLiteCity-Blocks.csv' WITH ENCODINGのISO - 646 - 私たち
        HAVING FIELDSを
           startIpNum、endIpNum、LOCID
   INTO のpostgresql://ユーザー@ localhostの:54393 / DBNAME
        TARGETのgeolite。ブロック
        TARGETのCOLUMNS
           iprange ip4r 使用(iprange startIpNum endIpNum)
           LOCID
   WITH TRUNCATE、
        スキップヘッダー= 、2
        フィールドオプションで囲ん「"」、
        フィールドエスケープバックスラッシュ- クオート、
        フィールド終端は「\ t」の
    SETのwork_mem '32 MB ' のmaintenance_work_mem '64 MB';

CSVソースガイド:FROM

エンコーディングオプションの受け入れ、そこからデータをロードするファイル名を指定して
ファイル名は引用符に単一可能に、次の特殊値のいずれかになります。

  • データコマンドの開始と終了の間でコマンドの構文解析の最後にインラインデータは、空白行の任意の数を受け入れます
  • 標準入力、標準入力からデータを読みます
  • マッチするファイル名
    試合は前の規則を遵守しなければなりません
 
[ ALL FILENAMES | [ FIRST] FILENAME]
マッチング正規表現
[ 、IN DIRECTORY '...']

フィールドガイド

また、サポートしているフィールドのオプションのコンマ区切りリストは、オプションでCSVデータファイルの名前、何を記述するために期待されているオプションFROM HAVING FIELDS
各フィールド名は名前だけで、それはフィールドの特定の読者を続けることができますオプションの名前は、角括弧内に、各フィールドのリーダーの
オプションは、カンマで区切られたサポートしています。

  • で終了
  • 時間形式は
    サポートされる形式
 
- YYYY、YYY、YY のための年の一部
- MM のための数値月の一部
- DD のための数値日の一部
- HH、HH12、HH24 のための時間の一部
- 午前、AM、 M。、A. M.
- 午後、PM、P。M。、P. M.
- MI のための分の一部
- SS のための秒の部分
- MS のためのミリ秒の部分(4 桁)
- 米国のためのマイクロ秒の部分(6 桁)
- 未解析の句読点の兆候:- 。* #の@のT /スペース
 

簡単なデモ

コラム- 名[ 日付形式'YYYY-MM-DD HH24-MI-SS.US']
  • 場合はnull
    このオプションが一つのキーワードボックスかもしれパラメータ、または二重引用符で囲まれた文字列を受け付けます
  • 両方の空白をトリム、左の空白をトリム、右の空白をトリム
    このオプションは、ブランクデータの両側からのリードデータの構築を可能に

CSV形式の読み込みオプション

  • 切り捨てられ
    たデータをロードする前に、最初に実行TRUNCATE
  • インデックスをドロップ
    しますが、ターゲット表のインデックスを削除するために、データをコピーする前に、その後、データのロードが完了した後でcreate index
  • トリガーを無効にする
    このオプションは最初のデータロード前に実行無効pgloaderされるとALTER TABLE … DISABLE TRIGGER ALL、データ
    のロードを実行した後に終了しましたALTER TABLE … ENABLE TRIGGER ALL
  • ヘッダスキップ
    pgloader入力ファイルの先頭にスキップする行数を示す値を
  • CSVは、ヘッダ
    フィールド名のリストとしてタイトルを読んだ後、最初の行はスキップされます
  • 引用符で囲まれていないブランクトリム
    、CSVファイルの引用符で囲まれていない値を読み取るをセパレータと値との間のギャップを削除
  • 引用符で囲まれていない空白を維持する
    セパレータとブランク値との間で、引用符で囲まれていない値を読み取るには
  • 必要に応じてで囲まれたフィールドを
    引数として単一の文字は、単一引用符で発見されます
  • 囲まれていないフィールド
    はデフォルトでは、pgloaderは閉じられた文字として二重引用符を使用します。CSVファイルを使用している場合は通常の文字の予想通り、それは、フィールドと二重引用符が含まれていない
    、これらの値を受け入れるように選択フィールドがCSVパーサには含まれていない使用します
  • フィールドがでエスケープ
    (下記参照)特別な基準値またはダブルバックスラッシュで任意の値、またはオプションのフィールドサポートにより終了します。それ自体がフィールド区切り文字をエスケープデータフィールドに見つかった場合、
    この値はエスケープ・フィールド区切り文字を識別するために使用されます。デフォルトでは、二重引用符です。
  • CSV形式のエスケープモード
    特別な基準値(デフォルト値)またはそれに続く値、およびのみCSVパーサフィールドセパレータまたはエスケープ文字以下の値(CSVデータを含むことができ
  • 終了フィールド
    、パラメータとして単一の文字は、単一引用符で発見され、印刷可能な文字自体として与えられることができる、特別な値tはタブ文字を表し、又はその後0Xは16進値であり、
    ASCII文字を読み取りますコード。CSVデータを読み込み、文字フィールド区切り文字
  • 終了行
    パラメータとして単一の文字は、単一引用符で発見され、印刷可能な文字自体として与えられることができる、特別な値tはタブ文字を表し、又はその後0Xは16進値であり、
    ASCII文字を読み取りますコード。文字は、CSVデータの読み出し時に回線状態の終わりを識別するために使用されます

説明

CSV負荷制御オプションはまだたくさんあるだけでなく、より柔軟

参考資料

https://pgloader.readthedocs.io/en/latest/ref/csv.html

おすすめ

転載: www.cnblogs.com/rongfengliang/p/11019259.html