El primer modelo grande biomédico disponible comercialmente en el mundo BioMedGPT-10B de código abierto

Mizuki Molecule y el Instituto de Investigación de la Industria Inteligente (AIR, por sus siglas en inglés) de la Universidad de Tsinghua anunciaron el código abierto del primer modelo BioMedGPT-10B de 10 000 millones de parámetros biomédicos multimodal disponible comercialmente en el mundo , que se puede utilizar para mejorar la eficiencia de todos los aspectos de la investigación de fármacos y desarrollo, incluida la evaluación de proyectos de nuevos medicamentos, diseño y optimización de medicamentos, diseño de ensayos clínicos, expansión de indicaciones, etc.

Además, la capacidad de respuesta a preguntas del modelo en el campo de la biomedicina es comparable a la de los expertos humanos, y ha llegado a SOTA en tareas de respuesta a preguntas de lenguaje natural, molecular y intermodal de proteínas, y ha superado con éxito el Examen de calificación de médicos de EE. UU. .

Dirección de código abierto:

BioMedGPT es un nuevo marco de comprensión semántica multimodal que utiliza el modelo de lenguaje grande previamente entrenado en el campo biomédico: BioMedGPT-LM como puente para conectar el lenguaje natural, el lenguaje de codificación biológica y el lenguaje químico molecular.

Arquitectura BioMedGPT::

BioMedGPT-LM ajusta con precisión el modelo de lenguaje a gran escala de uso general basado en la arquitectura GPT mediante el uso completo de datos biomédicos masivos para lograr un mejor rendimiento en el campo biomédico.

Como puente de conexión, BioMedGPT-LM puede conectar códigos de varias modalidades biológicas, incluidos datos moleculares, de proteínas, células y expresión génica, y también puede integrar la experiencia incorporada en gráficos de conocimiento, documentos, resultados de experimentos numéricos y otros formatos. A través de la integración de módulos de fusión de funciones multimodales, se pueden integrar diferentes lenguajes de codificación biológica modales, lenguajes moleculares químicos y lenguajes naturales en el mismo espacio de funciones.

Al mismo tiempo, Mizuki Molecule y AIR crearon conjuntamente el código abierto del primer modelo de lenguaje Llama 2 comercial gratuito del mundo, BioMedGPT-LM-7B, dedicado a la biomedicina . "AIR-Zhiyuan Health Computing Joint Research Center" cooperó para abrir el modelo básico del fármaco de molécula pequeña DrugFM. El modelo básico de biomedicina de código abierto está orientado a la investigación científica y está disponible comercialmente, lo que proporciona una gran base de modelos para la investigación y aplicación biomédicas.

Supongo que te gusta

Origin www.oschina.net/news/254294
Recomendado
Clasificación