Explosion de puissance de calcul, agencement mondial, l'IA générative de la technologie cloud d'Amazon innove constamment pour répondre aux besoins des entreprises

Aujourd'hui, l'IA générative a été utilisée dans les quatre domaines de la production créative (comme l'écriture, la programmation, la conception), l'amélioration fonctionnelle (comme la rédaction de résumé, la recherche), l'expérience interactive (Q&A, chat) et l'aide à la décision (toutes sortes d'assistants ).Montre un potentiel incroyable.

Lors de l'Amazon Cloud Technology China Summit 2023, Chen Xiaojian, directeur général du département produit d'Amazon Cloud Technology Greater China, a également présenté deux types de cas pratiques, nous montrant comment cela peut aider les entreprises à résoudre des problèmes lorsqu'elles innovent dans le contexte de l'ère générative d'aujourd'hui. IA. , Ressources de calcul et problèmes de globalisation rencontrés.

2f6c485bfd8746c69bca712cacbb5c39.png

 

En raison de l'explosion de la technologie d'IA générative, la demande globale de puissance de calcul dans l'industrie a explosé, ce qui a entraîné trois défis majeurs : la pénurie de ressources de puissance de calcul elles-mêmes, la confusion de l'offre flexible de ressources de calcul et le seuil et la complexité de l'exploitation et de la maintenance du cloud ne sont pas suffisantes Faible.

Tout d'abord, Amazon Cloud Technology a lancé diverses puces auto-développées, telles qu'Amazon Nitro, une puce spécifique au cloud computing qui peut réduire la charge sur le CPU, Amazon Graviton, une puce de processeur à usage général basée sur l'architecture ARM, et Amazon Inferentia et Amazon Traininum, qui sont spécialement développés pour la formation et le raisonnement en apprentissage automatique.Une série de puces pour aider les entreprises à atteindre un rapport performances/prix ultra-élevé.

Prenant l'exemple de la voiture de course F1, les organisateurs ont utilisé la puce Amazon Graviton 3E de la technologie cloud d'Amazon pour la simulation aérodynamique, et ont pu développer une nouvelle génération de voitures de course à une vitesse 70 % plus rapide qu'auparavant, et ont réduit la perte de pression. des voitures de course de 50% à 15%. Cela signifie que les propriétaires de voitures peuvent plus facilement dépasser pendant la conduite, apportant des combats d'arène plus excitants aux fans de voitures.

Deuxièmement, Amazon Cloud Technology utilise une variété de stockage de réseau informatique riche (peut être sélectionné à la demande ou vous aide directement à évaluer intelligemment) et un portefeuille de produits (plus de 600 instances informatiques différentes) pour aider les utilisateurs à faire face aux demandes soudaines de puissance de calcul et à obtenir une grande flexibilité. de ressources informatiques.

Prenons l'exemple de Weta Digital Cloud Studio, qui a remporté 6 Oscars pour les meilleurs effets spéciaux et dont les travaux incluent « Avatar », « Le Seigneur des anneaux » et « L'ascension de la planète des singes ». Grâce à une série de services tels que des ressources informatiques d'infrastructure, une pile de production cloud et une pile d'apprentissage automatique fournies par Amazon Cloud Technology, le studio a réalisé « Avatar 2 » sur le cloud avec 3,3 milliards d'heures de rendu en seulement 8 mois. production; contrairement à "Avatar 1", "Il a fallu 14 mois complets pour voir la première image."

Enfin, Amazon Cloud Technology utilise également la technologie Serverless pour simplifier l'exploitation et la gestion de la maintenance du cloud, aidant les sociétés de jeux à se concentrer sur le développement du jeu "Marvel Snap" lui-même sans se soucier des mises à niveau et de l'expansion du système lorsque le nombre de visites augmente considérablement. Chen Xiaojian a annoncé qu'après le lancement du jeu, il n'y avait pas eu d'événement d'erreur back-end, ce qui est sans précédent dans l'industrie du jeu.

Outre les ressources de puissance de calcul, de nombreuses entreprises ont également trois exigences majeures dans le cadre de la tendance générale actuelle à la mondialisation : réaliser une gestion unifiée de toutes les entreprises sur le cloud et garantir une fiabilité élevée et une faible latence ; le processus de construction d'un réseau doit être rapide et efficace ; Les lois et réglementations locales exigent que l'entreprise aille à l'étranger sans heurts.

Prenant OPPO comme exemple, leur activité de téléphonie mobile est répartie dans le monde entier, et il existe des centaines de VPC sur le cloud et des ressources locales qui doivent être connectées, ce qui est un test de la difficulté de la mise en réseau mondiale. En s'appuyant sur le service Amazon Cloud WAN de la technologie cloud d'Amazon, un réseau mondial peut être rapidement construit en quelques minutes. Il peut non seulement maintenir le fonctionnement indépendant des activités mondiales d'OPPO, la conformité et l'autonomie régionales, mais également effectuer une gestion unifiée.

Deuxièmement, pour le Nasdaq, un marché d'échange de capitaux avec des exigences de fiabilité et de latence de réseau très élevées, Amazon Cloud Technology l'a aidé à construire la première zone locale privée de l'histoire de l'industrie du marché des capitaux avec le service Amazon Outposts, et a atteint un bord retardé ultra-faible. capacités informatiques.

Enfin, Pax, fournisseur mondial de terminaux de paiement électronique, s'appuie également sur une série de services tels qu'Amazon CloudHSM et Amazon Security Hub d'Amazon Cloud Technology pour répondre aux normes de service de sécurité fournies par plusieurs fournisseurs, assurer la sécurité des paiements des utilisateurs et raccourcir les délais de paiement. cycle de livraison 40%, et le coût est réduit de 20%, réalisant l'expansion sans heurt des affaires internationales.

Les cas de coopération réussis ci-dessus illustrent bien l'efficacité de la technologie cloud d'Amazon pour aider les entreprises à se débarrasser des contraintes d'infrastructure et à se concentrer sur l'innovation.

 

Adhérer à "construire une base pour la base"

En fait, pour cette vague d'IA générative, dès avril, Amazon Cloud Technology a montré sa position au public : chacun roulera lui-même le grand modèle, et nous construirons la base pour la base.

Aujourd'hui, les discours des deux dirigeants lors de l'Amazon Cloud Technology China Summit ont une fois de plus délivré le même message : fournir un support de base et un support de base pour le développement d'applications d'IA génératives pour le public.

bbec2bfc408e4e66a59ade26df7a4ccb.png

 

Comment comprendre la notion de "base" ?

Amazon Bedrock, une plate-forme entièrement gérée qui peut obtenir rapidement les capacités de modèle de base les plus avancées au monde, est la base ; une infrastructure haute performance pour la formation et l'exécution de vos propres modèles, telles que les instances Amazon EC2 Inf1 prises en charge par les puces Amazon Inferentia et Amazon EC2 Trn1 pris en charge par les instances Amazon Trainium et les instances Amazon EC2 P5 prises en charge par le GPU Nvidia H100 Tensor Core constituent la base ; Amazon SageMaker, qui crée, forme et déploie vos propres modèles à partir de zéro, constitue la base ; Amazon SageMaker Jumpstart prend en charge le déploiement en un clic et le réglage fin de plus de 150 modèles open source populaires , mais aussi la base ; ce sont tous des outils de base qui servent nos grands modèles et le développement d'applications génératives d'IA. Les ressources utilisées par plus d'entreprises, d'organisations et d'individus peuvent être atteintes.

Amazon Cloud Technology a plus de 25 ans d'expérience en IA, et plus de 100 000 clients utilisent les services d'IA et d'apprentissage automatique d'Amazon Cloud Technology pour aider leurs entreprises.

 

Dans ce torrent, grâce à l'existence de services de base tels qu'Amazon Cloud Technology, chaque entreprise et chacun a la possibilité d'obtenir, d'utiliser et de profiter des avantages apportés par les nouvelles technologies. Personne ne sera activement laissé pour compte dans cette transformation, la répartition inégale finira par s'améliorer et l'avenir qui se profile deviendra extrêmement clair.

 

Guess you like

Origin blog.csdn.net/m0_66395609/article/details/131570668