Impala vs Docker : comment optimiser les performances d'Impala dans un environnement conteneurisé

Auteur : Zen et l'art de la programmation informatique

En tant que technologie émergente dans le domaine du cloud computing, la technologie des conteneurs est de plus en plus favorisée par tous les horizons. L'émergence de la technologie des conteneurs facilite le déploiement, l'extension et la gestion des logiciels d'application ; étant donné que le conteneur isole l'environnement d'exploitation du programme d'application, il utilise davantage les ressources ; il facilite également le traitement parallèle multitâche et améliore le traitement global du système capacité. Par rapport aux méthodes traditionnelles de machines virtuelles, la technologie des conteneurs présente les avantages suivants :

  1. La technologie des conteneurs offre des modes de travail plus flexibles. Non seulement les ressources peuvent être allouées à la demande, mais l'utilisation des ressources peut également être ajustée de manière dynamique et les applications peuvent être contrôlées via des contraintes de ressources ;
  2. Une façon plus pratique de se déployer. Le mode de déploiement basé sur des conteneurs permet aux applications d'être rapidement déployées, migrées et mises à l'échelle de manière élastique sans dépendre de l'infrastructure sous-jacente ;
  3. Les travaux d'exploitation et de maintenance sont simplifiés. Les applications conteneurisées n'ont pas besoin de se soucier de la plate-forme sous-jacente et de la configuration matérielle, mais doivent seulement prêter attention à l'application elle-même, sans tenir compte des divers problèmes de compatibilité ;
  4. Amélioration de l'indépendance des applications. Les services du conteneur peuvent s'exécuter indépendamment les uns des autres et chaque service a sa propre limite de ressources indépendante, de sorte que l'utilisation des ressources peut être améliorée tout en garantissant la disponibilité ;

En raison de la large application de la technologie des conteneurs, de plus en plus d'entreprises, d'organisations et d'entreprises choisissent de l'utiliser comme l'une de leurs infrastructures, y compris les célèbres fournisseurs de cloud public tels que Microsoft Azure, Amazon Web Services et Google Cloud Platform. Avec la popularisation de la technologie des conteneurs, de plus en plus d'entreprises déploient des applications basées sur des conteneurs dans des environnements de production, tels que Hadoop, Spark, Impala, ElasticSearch, Redis et d'autres composants de Big Data open source. Bien que les applications basées sur des conteneurs offrent une flexibilité, une fiabilité et une évolutivité élevées, car elles sont généralement déployées sur des serveurs physiques de manière autonome, il existe certains goulots d'étranglement au moment de l'exécution. Par exemple, démarrage lent de Hadoop YARN ResourceManager, temps de réponse long des requêtes Impala, etc. Afin de résoudre ces goulots d'étranglement de performances, de nombreuses entreprises étudient comment optimiser les performances dans les cadres informatiques distribués basés sur des conteneurs.

En général &

おすすめ

転載: blog.csdn.net/universsky2015/article/details/131799056