スパークチュートリアル(19)述語プッシュダウンの-sparkSQLパフォーマンスの最適化

データベース内の述語の形で、層を解析するSQL文の一部であるフィルタを表し、SQL言語で、

 

それは今、データベースレベルをフィルタリングする場所、一般的なデータベースのインデックスが存在するであろうが発生した場合sparkSQLでは、効率が低すぎません

sparkSQLが大きく、特に、結合の効率を改善するために、効率を改善するために、データの量を減らすだけフィルタリングされたデータを読み出します

 

図の一般的な手順。

 

おすすめ

転載: www.cnblogs.com/yanshw/p/11984061.html