¡Modelo matemático grande, MathGPT se conecta y comienza la versión beta pública!

 ballena de datoscompartir 

Modelo matemático grande: MathGPT, fuente: Heart of the Machine

TAL lanzó MathGPT, un modelo a gran escala de 100 mil millones de niveles en el campo de las matemáticas, para hacer un buen trabajo en el trabajo básico de las matemáticas en la era de la IA.

El mercado nacional de modelos a gran escala ha dado paso a un nuevo "jugador", esta vez es un modelo a gran escala dedicado a las matemáticas.

El 24 de agosto, el corazón de la máquina se enteró de que en el evento transmitido en vivo del vigésimo aniversario de TAL, el CTO Tian Mi anunció que MathGPT, un modelo a gran escala de 100 mil millones de niveles en el campo de las matemáticas desarrollado por TAL, inició internamente pruebas. A partir de ahora, los usuarios pueden solicitar una experiencia de prueba gratuita a través del sitio web oficial ( www.mathgpt.com ) para registrar una cuenta.

En mayo de este año, TAL anunció que está desarrollando un gran modelo matemático de desarrollo propio, llamado MathGPT. MathGPT es un modelo a gran escala en el campo vertical de las matemáticas con algoritmos de lectura y resolución de problemas como núcleo para los entusiastas de las matemáticas y las instituciones de investigación científica de todo el mundo. También es el primer modelo a gran escala construido especialmente para las matemáticas en China.

También es muy sencillo de utilizar. Cuando los usuarios usan MathGPT, pueden cargar preguntas de matemáticas en texto o imágenes, y luego pueden obtener comentarios de respuestas al estilo de un diálogo. También pueden usar el botón "pregunta aleatoria" para generar preguntas de matemáticas de forma aleatoria y dar respuestas por parte del sistema.

9bf362f70c8ece702f7dca4cfdea964c.png

Actualmente, MathGPT admite experiencias para PC y dispositivos móviles en versiones en chino e inglés.

Habilidades líderes en resolución de problemas matemáticos.

MathGPT reúne los años de educación, enseñanza e investigación de acumulación de datos de TAL, centrándose en el campo de las matemáticas. El marco de entrenamiento, razonamiento e implementación de cientos de miles de millones de modelos grandes dota al modelo de poderosas capacidades. A través de datos educativos de alta calidad, se realiza capacitación continua multitarea y ajustes supervisados, como cálculo de temas, explicaciones y preguntas y respuestas, lo que muestra un rendimiento excelente. Además, con la ayuda de la alineación de la retroalimentación humana, se mejorará aún más la calidad integral del modelo. MathGPT tiene ventajas obvias en la precisión, la estabilidad y la experiencia del usuario en la resolución de problemas.

Se entiende que la capacidad de cálculo matemático de MathGPT ha cubierto problemas matemáticos en la escuela primaria, secundaria y preparatoria. Sin embargo, las interacciones de preguntas y respuestas distintas de las matemáticas aún no están abiertas.

e16f01b67f72d683545a8e0d80090bee.png

Informe técnico de MathGPT

¿Cuál es el efecto específico? Entre los resultados de las pruebas de seis colecciones públicas de evaluaciones de matemáticas, incluidas CEval-Math, AGIEval-Math, APE5K, CMMLU-Math, Gaokao Mathematics y Math401, MathGPT logró las puntuaciones más altas en múltiples pruebas. Al mismo tiempo, MathGPT también obtuvo buenos resultados en el conjunto de pruebas generales de las escuelas intermedias y secundarias de C-Eval.

8d6d1ccb092c088ec7235f4df162658b.png

Lista C-Eval de MathGPT de materias de secundaria y preparatoria

Además, en términos de estabilidad en la resolución de problemas y facilidad de explicación, MathGPT lleva a cabo una capacitación modelo basada en una gran cantidad de datos del proceso de resolución de problemas de maestros famosos, y los pasos de resolución de problemas del modelo son profesionales y claros.

Tomemos como ejemplo una pregunta de secuencia: la respuesta dada por MathGPT incluye tres partes: "análisis", "explicación detallada" y "finalización", que es más detallada que la explicación aproximada del modelo grande general. Entre ellos, "análisis" proporciona ideas para la resolución de problemas y métodos de pensamiento del tema, ayudando a los usuarios a comprender mejor el tema; hacer clic para solicitar, ayudar a los usuarios a revisar y reflexionar sobre la intención de la pregunta y sacar inferencias de un caso.

9af1ea962e6a4920d4f8186e98097088.png

Para los usuarios, investigar problemas matemáticos no se trata sólo de obtener las respuestas ellos mismos, sino también de los principios de resolución de problemas y la lógica de pensamiento detrás de las respuestas. En comparación con otros modelos grandes de propósito general, MathGPT puede resolver problemas con mayor precisión y también puede analizar las respuestas con mayor claridad y explicarlas con mayor claridad, y satisfacer mejor las necesidades básicas de los usuarios de utilizar productos de inteligencia artificial para resolver problemas matemáticos.

Al mismo tiempo que se lanzó MathGPT, TAL también actualizó un conjunto de evaluación de tareas matemáticas representativo y desafiante para que los expertos globales en inteligencia artificial y entusiastas de las matemáticas puedan experimentar y evaluar. TAL espera que MathGPT desempeñe un papel más importante en el campo de la educación matemática y está dispuesto a compartir con la industria la experiencia y los métodos para desarrollar cientos de miles de millones de modelos grandes basados ​​​​en contenido de alta calidad a gran escala, y progresar. junto con la industria.

La acumulación de IA de TAL

Impulsadas por la ola de IA, muchas empresas de tecnología han anunciado el lanzamiento de productos de modelos de lenguaje grandes de propósito general este año, pero TAL ha elegido otra dirección, no basada en el ajuste fino y la llamada de interfaz de los modelos de lenguaje grandes existentes, y no en hacer Modelos de lenguaje grande de propósito general, pero investiga y desarrolla en profundidad modelos grandes en el campo vertical de las matemáticas, y se compromete a crear soluciones matemáticas independientes, estables, sostenibles y de alta calidad.

El modelo general a gran escala "enfatiza la literatura sobre la teoría", pero existen deficiencias obvias en la resolución, explicación, preguntas y respuestas y recomendación de problemas matemáticos. En otro nivel, en el camino hacia la inteligencia artificial general, la capacidad de razonamiento matemático es muy importante y muchas grandes empresas de todo el mundo están investigando en esta área.

"Talk Future tiene 20 años de acumulación en datos matemáticos y negocios, y ha acumulado una gran cantidad de datos educativos y la capacidad de producir datos educativos continuamente, por lo que elige hacer esto difícil pero correcto", dijo Tian Mi, Talent Future Espero utilizar Con mis años de acumulación en matemáticas e IA, haré un buen trabajo en el trabajo básico de las matemáticas en la era de los grandes modelos de IA.

De hecho, ya en 2017, TAL estableció el laboratorio de inteligencia artificial AI. Con el apoyo de la plataforma de innovación abierta de IA de educación inteligente, el laboratorio TAL AI ha ganado 16 campeonatos y 6 finalistas en varias competiciones de conferencias académicas importantes, y ha publicado casi 100 artículos académicos de alto nivel en revistas y conferencias internacionales.

En 2019, el Ministerio de Ciencia y Tecnología anunció que, al confiar en TAL para construir una plataforma nacional de innovación abierta de IA de próxima generación para la educación inteligente, TAL se ha convertido en el primer y único miembro del "equipo nacional" de IA en la industria de la educación. y tiene años de investigación en profundidad en el campo de la IA. A lo largo de los años, TAL ha construido una plataforma nacional de innovación en tecnología educativa con capacidades de algoritmos de inteligencia artificial orientadas a la educación, soluciones de aplicaciones, sistemas básicos de software y hardware, y servicios abiertos y de código abierto impulsados ​​por las principales necesidades de la industria educativa.

TAL también participa activamente en la promoción de la construcción de un sistema estándar modelo a gran escala y, como unidad central, ha participado sucesivamente en los estándares nacionales de series de modelos a gran escala organizados por el Grupo General Nacional de Normalización de Inteligencia Artificial y en la "Evaluación de aplicaciones y tecnología de modelos previos a la capacitación a gran escala" dirigida por la Academia China de Tecnología de la Información y las Comunicaciones. Serie de estándares grupales de métodos y la preparación de la serie de estándares "Modelo general de educación" dirigida por la Tecnología de Informatización Educativa. Comité de Normas del Ministerio de Educación y Comité Técnico Nacional de Normalización de Tecnologías de la Información.

Recientemente, TAL está asumiendo el papel de liderazgo en la compilación de estándares grupales para modelos educativos grandes junto con la Academia China de Tecnología de la Información y las Comunicaciones, la Universidad de Fudan, iFLYTEK, Baidu y otras instituciones de investigación científica, universidades y empresas líderes en la industria, cubriendo escenarios de manera integral. efectos de la aplicación y confiabilidad del servicio Evaluar las capacidades de grandes modelos educativos y proporcionar referencias y orientación para la aplicación de grandes modelos educativos.

Uso de la IA para lograr una enseñanza individualizada a gran escala

Con el surgimiento de grandes modelos lingüísticos, el foco de atención social es cómo utilizar la tecnología de inteligencia artificial para servir a todos los ámbitos de la vida. La industria de la educación es una de las primeras industrias en comenzar a diseñar el campo de la IA, y los cambios que la IA puede traer a la ecología de la educación siempre han llamado la atención.

"La IA brinda la oportunidad de redefinir la industria de la educación, y la tecnología de modelos a gran escala hace posible realizar una enseñanza individualizada a gran escala". Tian Mi presentó que TAL ha estado explorando el aprendizaje personalizado durante 20 años, desde clases pequeñas fuera de línea hasta el aprendizaje en línea. Desde clases grandes hasta clases de IA, la forma evoluciona constantemente, pero el contenido de la enseñanza siempre es fijo, la interacción entre estudiantes y profesores es menor y la granularidad solo puede alcanzar el nivel del tema.

Tian Mi cree que la esencia de los modelos grandes es una forma más eficiente de aprender conocimientos a partir de datos y aplicarlos. Con la bendición de las capacidades de la IA, el nuevo método de aprendizaje de "autoestudio de los estudiantes + respuesta de la IA a preguntas" se ha vuelto ampliamente posible. El umbral y el costo para los estudiantes para obtener contenido didáctico de alta calidad se reducen, y el grado de personalización y refinamiento del contenido didáctico obtenido continúa aumentando. Puede realizar la enseñanza de IA y la tutoría de preguntas y respuestas para miles de personas, y cada estudiante puede obtener el contenido de aprendizaje más adecuado para ellos.

Basado en MathGPT, TAL continuará explorando métodos de aprendizaje en un entorno de IA para servir mejor a los estudiantes y amantes de las matemáticas de todo el mundo, compartir su experiencia con la industria de manera oportuna y contribuir a cambios positivos en la tecnología educativa a través de la tecnología de IA.

Con el buen progreso de la prueba interna, la capacidad de resolución de problemas de MathGPT seguirá mejorando y las aplicaciones a nivel de producto basadas en MathGPT también se están acelerando y se lanzarán en un futuro próximo.

862aef20de4f0022036475f5ef155c70.png

Aprendizaje de productos secos, como tres veces

Supongo que te gusta

Origin blog.csdn.net/Datawhale/article/details/132517728
Recomendado
Clasificación