Python
どのように接続して動作するようAws
にPB
レベルのクラウドデータウェアハウスRedshift
I.はじめに
アマゾン赤方偏移は、効率的に湖のすべてのデータウェアハウスやデータを簡単に、経済的に分析することができ、高速でスケーラブルなデータウェアハウスです。
高性能ディスクに機械学習を使用して、赤方偏移、超並列クエリ実行と柱状ストレージは、他のデータ・ウェアハウスのパフォーマンスよりも10倍高速を提供することができます。
あなたは、セットアップと数分で新しいデータウェアハウスを展開し、赤方偏移のデータ・ウェアハウスのPBレベルのデータとAmazon S3のデータ湖の上に構築されたEBレベルのデータに対してクエリを実行することができます。
第二に、接続 RedShift
本明細書で使用される場合、それがされているpostgres
理由を駆動:redshift
データウェアハウスはさaws
に基づいて、postgres
デリバティブ商品の二次開発。
注意:使用するには、この必要性orator
ライブラリは、次のコマンドを実行することができますpip3 install orator
インストールしてください。
from orator import DatabaseManager
config = {
'postgres': {
'driver': 'postgres',
'host': 'xxxxxx-cluster.xxxxx.xxxx.redshift.amazonaws.com',
'port': '5439',
'database': 'db_name',
'user': 'root',
'password': 'root',
'prefix': '',
'log_queries': true
}
}
db = DatabaseManager(config)
第三に、基本的な操作
これは、あなたが公式の文書を表示することができ、より高度な操作を学びたい、基本的なCRUD操作が導入されていますポータル
# 查询
row = db.table('users').first()
# 新增
db.table('users').insert({
'email': '[email protected]',
'votes': 0
})
# 更新
db.table('users').where('id', 1).update({'votes': 1})
# 删除
db.table('users').where('age', '<', 25).delete()
第四に、関連文書
V.の概要
のでaws
、公式には提供するだけでJDBC Drvier
、私たちは検索のインターネット接続がRedShift
あるPython driver
が、比較的使いやすい見つけていませんDrvier
。チャンスは一回でAws
公式ドキュメント学んだRedShift
に基づいてpostgres
デリバティブ商品の二次開発、私たちはしてみてくださいpostgres driver
結果は本当にアップ接続します、。これが動作することができpostgres
またはmysql
その運転しますRedShift
。