Grand modèle mathématique, MathGPT se met en ligne et démarre la bêta publique !

 Partage de données 

Grand modèle mathématique : MathGPT, source : Cœur de la machine

TAL a lancé MathGPT, un modèle à grande échelle de 100 milliards de dollars dans le domaine des mathématiques, pour faire du bon travail dans le travail de base des mathématiques à l'ère de l'IA.

Le marché national des modèles à grande échelle a inauguré un nouvel « acteur », il s'agit cette fois d'un modèle à grande échelle dédié aux mathématiques.

Le 24 août, le cœur de la machine a appris que lors de la diffusion en direct de l'événement du 20e anniversaire de TAL, le CTO Tian Mi a annoncé que MathGPT, un modèle à grande échelle de 100 milliards de niveaux dans le domaine mathématique développé par TAL, avait démarré en interne. essai. Désormais, les utilisateurs peuvent demander une expérience d'essai gratuite via le site officiel ( www.mathgpt.com ) pour créer un compte.

En mai de cette année, TAL a annoncé qu'elle développait un grand modèle mathématique auto-développé, nommé MathGPT. MathGPT est un modèle à grande échelle dans le domaine vertical des mathématiques avec des algorithmes de résolution de problèmes et de cours comme noyau pour les passionnés de mathématiques et les instituts de recherche scientifique du monde entier. Il s'agit également du premier modèle à grande échelle spécialement construit pour les mathématiques en Chine.

Il est également très simple à utiliser. Lorsque les utilisateurs utilisent MathGPT, ils peuvent télécharger des questions mathématiques sous forme de texte ou d'images, puis obtenir des commentaires sur les réponses sous forme de dialogue. Ils peuvent également utiliser le bouton « question aléatoire » pour générer de manière aléatoire des questions mathématiques et donner des réponses par le système.

9bf362f70c8ece702f7dca4cfdea964c.png

Actuellement, MathGPT prend en charge les expériences PC et mobiles dans les versions chinoise et anglaise.

Compétences de pointe en résolution de problèmes mathématiques

MathGPT rassemble les années d'accumulation de données d'éducation, d'enseignement et de recherche de TAL, en se concentrant sur le domaine des mathématiques. Le cadre de formation, de raisonnement et de déploiement de centaines de milliards de grands modèles confère au modèle de puissantes capacités. Grâce à des données éducatives de haute qualité, une formation continue multitâche et un réglage fin supervisé tel que le calcul du sujet, l'explication et les questions-réponses sont réalisés, montrant d'excellentes performances. De plus, grâce à l’alignement des retours humains, la qualité globale du modèle sera encore améliorée. MathGPT présente des avantages évidents en termes de précision de résolution de problèmes, de stabilité et d'expérience utilisateur.

Il est entendu que la capacité de calcul mathématique de MathGPT a couvert des problèmes de mathématiques à l'école primaire, au collège et au lycée. Cependant, les interactions questions-réponses autres que mathématiques ne sont pas encore ouvertes.

e16f01b67f72d683545a8e0d80090bee.png

Rapport technique MathGPT

Quel est l'effet spécifique ? Parmi les résultats des tests de six collections publiques d'évaluation des mathématiques, dont CEval-Math, AGIEval-Math, APE5K, CMMLU-Math, Gaokao Mathematics et Math401, MathGPT a obtenu les scores les plus élevés dans plusieurs tests. Dans le même temps, MathGPT a également obtenu de bons résultats sur l'ensemble de tests généraux des collèges et lycées de C-Eval.

8d6d1ccb092c088ec7235f4df162658b.png

Liste C-Eval de MathGPT des matières du premier et du deuxième cycles du secondaire

De plus, en termes de stabilité de résolution de problèmes et de convivialité d'explication, MathGPT organise une formation de modèle basée sur un grand nombre de données de processus de résolution de problèmes d'enseignants célèbres, et les étapes de résolution de problèmes du modèle sont professionnelles et claires.

Prenons comme exemple une question de séquence. La réponse donnée par MathGPT comprend trois parties : « analyse », « explication détaillée » et « finition », qui est plus détaillée que l'explication approximative du grand modèle général. Parmi eux, « l'analyse » fournit des idées de résolution de problèmes et des méthodes de réflexion sur le sujet, aidant les utilisateurs à mieux comprendre le sujet ; cliquez pour demander, aidez les utilisateurs à examiner et à réfléchir sur l'intention de la question et à tirer des conclusions à partir d'une instance.

9af1ea962e6a4920d4f8186e98097088.png

Pour les utilisateurs, rechercher des problèmes mathématiques ne consiste pas seulement à obtenir les réponses eux-mêmes, mais également à comprendre les principes de résolution de problèmes et la logique de pensée qui sous-tend les réponses. Par rapport à d'autres grands modèles à usage général, MathGPT peut résoudre des problèmes avec une plus grande précision, et peut également analyser les réponses plus clairement et les expliquer plus clairement, et mieux répondre aux besoins fondamentaux des utilisateurs qui souhaitent utiliser des produits d'IA pour résoudre des problèmes mathématiques.

Parallèlement à la publication de MathGPT, TAL a également mis à jour un ensemble d'évaluation de tâches mathématiques représentative et stimulante que les experts mondiaux en intelligence artificielle et les passionnés de mathématiques peuvent expérimenter et évaluer. TAL espère faire jouer à MathGPT un rôle plus important dans le domaine de l'enseignement des mathématiques et est disposé à partager avec l'industrie l'expérience et les méthodes de développement de centaines de milliards de grands modèles basés sur un contenu à grande échelle et de haute qualité, et à progresser. en collaboration avec l'industrie.

L'accumulation d'IA de TAL

Poussées par la vague de l'IA, de nombreuses entreprises technologiques ont annoncé cette année le lancement de produits de grands modèles de langage à usage général, mais TAL a choisi une autre direction, non basée sur le réglage fin et l'appel d'interface des grands modèles de langage existants, et ne faisant pas grands modèles de langage à usage général, mais recherche et développement approfondis de grands modèles dans le domaine vertical des mathématiques, et s'engage à créer des solutions mathématiques indépendantes, stables, durables et de haute qualité.

Le modèle général à grande échelle « met l'accent sur la littérature plutôt que sur la théorie », mais il présente des lacunes évidentes dans la résolution, l'explication, les questions et réponses et la recommandation des problèmes mathématiques. À un autre niveau, sur la voie de l’intelligence artificielle générale, la capacité de raisonnement mathématique est très importante, et de nombreuses grandes entreprises à travers le monde mènent des recherches dans ce domaine.

"Talk Future a 20 ans d'accumulation de données mathématiques et commerciales, et a accumulé une grande quantité de données éducatives et la capacité de produire en continu des données éducatives, il a donc choisi de faire cette chose difficile mais correcte. " Tian Mi a déclaré que Talent Future J'espère utiliser Avec mes années d'accumulation en mathématiques et en IA, je ferai du bon travail dans le travail de base des mathématiques à l'ère des grands modèles d'IA.

En fait, dès 2017, TAL a créé le laboratoire d'intelligence artificielle AI Lab. Grâce au soutien de la plateforme d'innovation ouverte Smart Education AI, le laboratoire TAL AI a remporté 16 championnats et 6 finalistes dans diverses compétitions de conférences universitaires de premier plan et a publié près de 100 articles universitaires de haut niveau dans des revues et conférences internationales.

En 2019, le ministère de la Science et de la Technologie a annoncé qu'en s'appuyant sur TAL pour construire une plate-forme nationale d'innovation ouverte en IA de nouvelle génération pour l'éducation intelligente, TAL est devenu le premier et le seul membre de « l'équipe nationale » d'IA dans le secteur de l'éducation. , et compte des années de recherche approfondie dans le domaine de l’IA. Au fil des années, TAL a construit une plate-forme nationale d'innovation technologique pour l'éducation avec des capacités d'algorithmes d'intelligence artificielle orientées vers l'éducation, des solutions d'application, des systèmes logiciels et matériels de base, ainsi que des services open source et ouverts axés sur les besoins majeurs du secteur de l'éducation.

TAL participe également activement à la promotion de la construction d'un système de normes de modèles à grande échelle. En tant qu'unité centrale, elle a successivement participé aux normes nationales des séries de modèles à grande échelle organisées par le Groupe général national de normalisation de l'intelligence artificielle et le "Technologie de modèle de pré-formation à grande échelle et évaluation des applications" dirigée par l'Académie chinoise des technologies de l'information et des communications. Série de normes de groupe "Méthodes" et préparation de la série de normes "Modèle général d'éducation" dirigée par la technologie d'informatisation de l'éducation Comité des normes du ministère de l'Éducation et Comité technique national de normalisation des technologies de l'information.

Récemment, TAL a joué un rôle de premier plan dans l'élaboration de normes de groupe pour les grands modèles éducatifs en collaboration avec l'Académie chinoise des technologies de l'information et des communications, l'Université de Fudan, iFLYTEK, Baidu et d'autres institutions de recherche scientifique, universités et entreprises de pointe, couvrant de manière exhaustive les scénarios, effets d'application et fiabilité du service.Évaluer les capacités des grands modèles éducatifs et fournir des références et des conseils pour l'application de grands modèles éducatifs.

Utiliser l’IA pour parvenir à un enseignement individualisé à grande échelle

Avec l’essor des grands modèles linguistiques, la manière d’utiliser la technologie de l’IA au service de tous les horizons est au centre de l’attention sociale. Le secteur de l'éducation est l'un des premiers secteurs à commencer à définir le domaine de l'IA, et les changements que l'IA peut apporter à l'écologie de l'éducation ont toujours attiré l'attention.

" L'IA offre l'opportunité de redéfinir le secteur de l'éducation, et la technologie des modèles à grande échelle permet de réaliser un enseignement individualisé à grande échelle. " Tian Mi a présenté que TAL explore l'apprentissage personnalisé depuis 20 ans, des petites classes hors ligne à l'apprentissage en ligne. Des grandes classes aux classes d'IA, la forme évolue constamment, mais le contenu pédagogique est toujours fixe, l'interaction entre étudiants et enseignants est moindre et la granularité ne peut atteindre qu'au niveau du sujet.

Tian Mi estime que l'essence des grands modèles est un moyen plus efficace d'apprendre des connaissances à partir des données et de les appliquer. Grâce aux capacités de l'IA, la nouvelle méthode d'apprentissage « auto-apprentissage des étudiants + réponses aux questions par l'IA » est devenue largement possible. Le seuil et le coût pour les apprenants d'obtenir un contenu pédagogique de haute qualité sont réduits, et le degré de personnalisation et de raffinement du contenu pédagogique obtenu continue d'augmenter. Il peut réaliser un enseignement de l'IA et un tutorat questions-réponses pour des milliers de personnes, et chaque étudiant peut obtenir le contenu d'apprentissage le plus approprié pour eux.

Sur la base de MathGPT, TAL continuera d'explorer les méthodes d'apprentissage dans un environnement d'IA pour mieux servir les apprenants et les amateurs de mathématiques du monde entier, partager son expérience avec l'industrie en temps opportun et contribuer à des changements positifs dans la technologie éducative grâce à la technologie de l'IA.

Avec le bon déroulement du test interne, la capacité de résolution de problèmes de MathGPT continuera de s'améliorer et les applications au niveau des produits basées sur MathGPT seront également accélérées et seront publiées dans un avenir proche.

862aef20de4f0022036475f5ef155c70.png

Apprentissage des produits secs, genre trois fois

Acho que você gosta

Origin blog.csdn.net/Datawhale/article/details/132517728
Recomendado
Clasificación