OpenAI lance officiellement GPT-4

OpenAI vient d'annoncer le lancement officiel de GPT-4. GPT-4 est l'abréviation de Generative Pre-trained Transformer 4, c'est-à-dire le modèle de transformation générative pré-formé 4.

L'annonce indique que GPT-4 est un modèle de langage multimodal à grande échelle (prenant en charge l'entrée et la sortie d'images et de texte sous forme de texte) et la dernière étape importante dans les efforts d'OpenAI pour étendre l'apprentissage en profondeur. Bien que GPT-4 soit pire que les humains pour faire face à de nombreux scénarios du monde réel, il a montré des niveaux comparables à ceux des humains dans divers critères qui reflètent les capacités professionnelles et académiques.

Par exemple, GPT-4 a réussi l'examen du barreau simulé avec des scores dans les 10 % des meilleurs candidats ; en revanche, GPT-3,5 a obtenu des scores dans les 10 % inférieurs. OpenAI indique qu'il a fallu 6 mois pour régler de manière itérative GPT-4 en utilisant des procédures de test contradictoires et les leçons tirées de ChatGPT, ce qui a donné les meilleurs résultats jamais obtenus en termes de réalisme et de contrôlabilité (bien que loin d'être parfaits).

Exemple d'utilisation

OpenAI a démontré la fonction "multimodale" unique de GPT-4 avec un mème.

Question de l'utilisateur : Expliquez en quoi consiste la blague dans l'image ci-dessous et décrivez chaque partie de l'image.

GPT-4:

L'image montre un paquet pour un adaptateur "Lightning Cable" avec trois panneaux.

Panneau 1 : Un smartphone avec un connecteur VGA (un grand connecteur bleu à 15 broches généralement utilisé pour les écrans d'ordinateur) branché sur son port de charge.

Panneau 2 : Le paquet de l'adaptateur « Lightning Cable » avec une image d'un connecteur VGA dessus.

Panneau 3 : gros plan du connecteur VGA avec un petit connecteur Lightning (utilisé pour charger les iPhones et autres appareils Apple) à l'extrémité.

L'humour de cette image vient de l'absurdité de brancher un grand connecteur VGA obsolète dans un petit port de chargement de smartphone moderne.

La traduction est la suivante :

L'image montre l'emballage d'un adaptateur "Lightning Cable", qui se compose de trois parties au total.

Panneau 1 : Un smartphone avec un connecteur VGA branché sur son port de charge (le gros connecteur bleu à 15 broches, généralement utilisé pour les écrans d'ordinateur).

Panneau 2 : Il y a une image du connecteur VGA sur l'emballage de l'adaptateur « Lightning Cable ».

Panneau 3 : gros plan du connecteur VGA, terminé par un petit connecteur Lightning (utilisé pour charger les iPhones et autres appareils Apple).

C'est là que la blague entre en jeu : Démontrer l'absurdité de brancher un gros connecteur VGA obsolète dans un petit port de chargement de smartphone moderne.

L'exemple ci-dessus semble simple, OpenAI montre ensuite une utilisation avancée - lisez l'article. En termes simples, il s'agit de fournir à GPT-4 le fichier au format image du document, de le laisser lire et de résumer les points principaux. L'effet est le suivant :

Laissez même GPT-4 répondre directement à la question correspondant au numéro de question sur l'image :


Limites de GPT-4

Bien que puissant, GPT-4 présente des limites similaires aux modèles GPT antérieurs en ce sens qu'il génère des résultats irréalistes. Ce n'est donc pas encore entièrement fiable (il peut "halluciner" des faits et avoir des erreurs d'inférence).

Bien que cela reste un problème, le GPT-4 réduit considérablement les "hallucinations" par rapport aux modèles précédents (qui eux-mêmes se sont améliorés à chaque itération). Lors d'évaluations d'authenticité contradictoires internes, le GPT-4 obtient un score de 40 % supérieur au dernier GPT-3.5 :

 


Comparaison avec GPT 3.5

Selon les rapports, pour les conversations quotidiennes, la différence entre GPT-3.5 et GPT-4 peut être subtile. Mais lorsque la complexité des tâches atteint un seuil suffisant, des différences apparaissent : GPT-4 est plus fiable, plus créatif et capable de gérer des instructions plus précises que GPT-3.5.

Pour comprendre la différence entre les deux modèles, OpenAI a été testé à travers divers benchmarks, y compris des examens blancs conçus à l'origine pour les humains. Comme le montre la figure ci-dessous, la plupart des résultats du GPT-4 sont meilleurs que ceux du GPT-3.

GPT-4 a également obtenu des notes presque complètes dans un certain nombre d'éléments de test :

  • Examen de demi-finale USABO 2020 (Olympiade de biologie des États-Unis)
  • GRE Parlant

OpenAI utilise également des références traditionnelles pour les modèles d'apprentissage automatique pour évaluer GPT-4. Les résultats montrent que GPT-4 a largement dépassé les modèles de langage à grande échelle existants, ainsi que la plupart des modèles de pointe (SOTA, état de l'art). Les données de référence sont les suivantes :

Dans le benchmark MMLU (un ensemble de données de référence comprenant des questions à choix multiples de 57 disciplines, y compris les STEM, les sciences humaines, les sciences sociales, etc., qui est utilisé pour tester la connaissance du monde et la capacité de résolution de problèmes de LLM), la précision du traitement GPT-4 chinois Il est d'environ 80%, ce qui est meilleur que les performances en anglais d'autres LLM, telles que GPT-3.5, Chinchilla et PALM.


Méthode d'essai

  1. Les abonnés ChatGPT Plus sont parmi les premiers à adopter, et ils obtiendront un accès GPT-4 limité à l'utilisation sur chat.openai.com.
  2. Appelez l'API, visitez  https://openai.com/waitlist/gpt-4  pour entrer dans la liste d'attente

おすすめ

転載: www.oschina.net/news/232609/gpt-4