sparkSQLでのパーティションバイとグループバイの違いと使用

1.パーティション別とグループ別の違いと接続

1)group byはグループ化関数で、partition byは分析関数です(その後sum()のような集約関数)。

2)実行順序では、上記のキーワードの後に​​パーティションバイが適用されます。実際には、選択が実行された後、取得された結果セットに対してパーティションが実行され、一般的なSQLキーワードの優先順位(from> where> group by)を使用してgroup by >持っている>注文する)

3)group byと比較して、partition byはすべてのデータ保持に基づいて一部のフィールドのみをソートでき、group by はグループ化に参加するフィールドと集計関数の結果のみを保持します

 

おすすめ

転載: www.cnblogs.com/yyy-blog/p/12711701.html