Impala がクエリを実行すると、列の型は String ですが、エラーは Double になります (列の型: STRING、Parquet スキーマ: オプションの double ZXS)

ここに画像の説明を挿入します
解決策 1:
クエリ時にこの一時的な環境設定を追加し、スキーマ情報
set PARQUET_FALLBACK_SCHEMA_RESOLUTION=name;を確認します。

解決策 2:
Parquet フィールドの順序に基づいて Hive テーブルを再構築します。

問題の原因:
Hive は、Parquet の列とスキーマがテーブル作成順序と同じ順序であるかどうかを自動的に照合しますが、Impala はデフォルトで順序に基づいてのみ照合し、フィールド名と照合しないため、データ型が不整合になります。 。

おすすめ

転載: blog.csdn.net/m0_49447718/article/details/120080688