Проблемы, возникающие при записи импала

Impala первоначальный контакт с большим количеством вещей , не очень ясно, шага на несколько углублений , записанных на
1. Проблемы: память происходит переполнение , когда таблица присоединиться
решением: осуществившие две таблицы вычислить статистику, потому что импали на операционном столе не будет статистический анализ структуры сразу таблица и столбцы (эта операция , потому что будут некоторое потребление), используя статистику вычислительной будут обновлять эту информацию и сохранить ее в MetaStore, будут использовать эту информацию для оптимизации стратегии запросы к сокращению потребления , когда Impala связаны таблицам запроса.
Ссылка https://docs.cloudera.com/documentation/enterprise/5-9-x/topics/impala_compute_stats.html

2. Вопрос: У нас есть сервисный интерфейс для выполнения импала SQL, как обеспечить синхронизацию данных после выполнения каждого узла impalad (если вы не создали кластер синхронизации библиотеки DLL, узлы кластера не синхронизированные данные)
Решение: В соответствии с официальным мышлением, мы SQL затем создать пробел после выполнения временной таблицы, созданная DLL , кластер синхронизации верно, то понижается временная таблица, настроить кластер синхронизация длл ложно, то данные кластера синхронизируются, и лучшая производительность.
Ссылка https://docs.cloudera.com/documentation/enterprise/5-15-x/topics/impala.html

3. Вопрос: очень медленно таблицы происходит присоединиться
Обход: Считать количество широковещательных присоединиться, если левое соединение будет транслировать правой таблицы (широковещательный сумму , эквивалентную нужного размера таблицы , умноженному на число табличных данных , оставленных в машине), чтобы рассмотреть хороший SQL целесообразно оптимизация или очистить правильный размер таблицы уменьшается ненужной таблица данных

рекомендация

отblog.51cto.com/13665344/2446072