¡ChatLaw, código abierto!

Preste atención a "GitHubDaily" en la cuenta pública

¡Configúralo como una "estrella" y te llevará a GitHub todos los días!

be40bb5dfd2f7e9dc7e7c58c9d37b089.png

En el período reciente, la popularidad general de la IA ha disminuido, pero el ritmo de exploración de la tecnología de IA en varias industrias no se ha detenido.

Cuando ChatGPT se lanzó por primera vez, muchas personas en la industria creían que el profesionalismo y el rigor de la IA podrían ser una buena opción para ser utilizado como un consultor inteligente para algunas industrias específicas.

La industria legal, entre ellas, se mencionó por primera vez como una de las industrias con mayor probabilidad de ser interrumpida por la IA.

Sin embargo, después de que muchas personas lo probaron, descubrieron que todavía hay muchos problemas por resolver en la aplicación de la IA en la industria legal.

El más grave de ellos es que cuando la IA responde realmente a las preguntas, a menudo se produce una alucinación (ilusión) y luego proporciona algunas respuestas inventadas.

Para escenarios de aplicación legal que requieren varios soportes de datos rigurosos y argumentos razonables y suficientes, ya sea GPT-3.5 o GPT-4, todavía hay muchos problemas por resolver.

Hace unos días, un amigo del equipo de la Universidad de Pekín me encontró y me dijo que habían abierto un gran modelo de lenguaje centrado en la industria legal en GitHub: ChatLaw .

Después de varias pruebas de evaluación, se encuentra que su efecto real en la industria legal es mejor que el de los grandes modelos existentes.

Hoy, me gustaría presentarles este proyecto solemnemente.

ChatLaw es un gran modelo legal entrenado en base a varias disposiciones legales chinas, casos reales y disposiciones judiciales. Con la ayuda de IA, puede realizar escenarios como la redacción de contratos legales, la introducción de casos, la explicación de cláusulas y la consulta judicial.

8fe08d0f024c5baf6f3cca0a8bf60a65.png

  • GitHub: https://github.com/PKU-YuanGroup/ChatLaw

  • Uso en línea: https://chatlaw.cloud/lawchat/

Los desarrolladores pueden usar este gran modelo para crear rápidamente asesores legales personales y abogados inteligentes exclusivos para ayudarlo a resolver mejor las diversas disputas legales que encuentre en su trabajo diario.

El modelo tiene principalmente 3 series (ChatLaw-13B, ChatLaw-33B, ChatLaw-Text2Vec), que son adecuadas para muchos escenarios diferentes.

De acuerdo con la magnitud de los parámetros, ChatLaw se puede dividir en versiones 13B y 33B, ambas versiones de demostración académica, que corresponden a 13 mil millones y 33 mil millones de parámetros de entrenamiento, respectivamente.

ChatLaw-13B está entrenado en base al modelo Ziya-LLaMA-13B-v1 de Jiang Ziya, y los datos chinos son relativamente ricos, por lo que funciona mejor en la escena del diálogo chino, pero la desventaja es que los parámetros de entrenamiento son insuficientes y, a veces, algunos problemas legales más complicados, las respuestas fueron de baja calidad.

ChatLaw-33B está entrenado en base a otro modelo chino, Anima-33B. Debido a los parámetros más grandes, la capacidad de razonamiento lógico ha aumentado significativamente. Sin embargo, todavía hay muy pocos corpus en chino, por lo que ocasionalmente aparecen algunos datos en inglés al responder.

Para la mayoría de los usuarios, los escenarios más interactivos del modelo legal giran principalmente en torno a la consulta legal.

Para permitir que la IA comprenda y responda mejor a las preguntas legales planteadas por los usuarios, el equipo de la Universidad de Pekín utilizó un conjunto de datos de 930 000 juicios reales y entrenó un modelo de comparación de similitudes basado en BERT: ChatLaw-Text2Vec, lo que permite que la inteligencia artificial haga coincidir automáticamente dudas de los usuarios y disposiciones legales.

El usuario preguntó: "¿Qué debo hacer si no se paga el préstamo?"

AI respondió: "Ley de Contratos (15 de marzo de 1999): Artículo 206 El prestatario deberá reembolsar el préstamo dentro del plazo acordado. Si no hay acuerdo sobre el plazo del préstamo o el acuerdo no es claro, se aplicarán las disposiciones del Artículo 61 de se observará esta Ley. Si todavía no está claro, el prestatario puede devolverlo en cualquier momento, el prestamista puede instar al prestatario a que lo devuelva en un plazo razonable”.

Los resultados muestran que la similitud entre el contenido del texto de la respuesta de la IA y los datos de entrenamiento se calcula en 0,9960. De esta forma, el problema de la "ilusión" en el modelo de lenguaje grande se puede reducir en gran medida y se puede mejorar la calidad de la respuesta.

En la sesión de evaluación y prueba del modelo, el equipo de ChatLaw también hizo algo especial.

Introdujeron el mecanismo ELO de League of Legends, resolvieron un total de 2,000 preguntas basadas en las preguntas del examen judicial de los últimos diez años, dejaron que el modelo de IA jugara la competencia de calificación del modelo, y anotaron, y finalmente encontraron que la puntuación final y la tasa de victorias de ChatLaw son todas altas. Bastante bien.

14fa85056ff7ac024b70a6c1e701548e.png

En el futuro, si el modelo de lenguaje grande va a ser realmente utilizable, mejorar el razonamiento lógico y reducir las ilusiones del modelo son dos cuestiones fundamentales que deben resolverse con urgencia. Esta es también la principal dirección de investigación del equipo de ChatLaw en el próximo paso.

En los próximos meses, los desarrolladores mejorarán los parámetros del modelo y optimizarán la base de datos de vectores, para que la investigación sobre estos dos temas tenga un gran avance. Puede esperar y ver.

Dado que AIGC es bastante popular este año, también hemos establecido una comunidad de IA para explorar más perspectivas y aplicaciones en el campo de la inteligencia artificial.

Si desea obtener más información sobre tecnologías y aplicaciones prácticas de IA, así como nuevos desarrollos en ChatGPT, puede hacer clic en el enlace a continuación para unirse a nuestra comunidad para más discusiones.

Entrada a la comunidad: Comunidad ChatGPT, ¡lanzada oficialmente!

¿No quieres perderte el empuje del artículo? ¡Haga clic en la tarjeta de cuenta oficial a continuación para agregar una estrella a la cuenta oficial de GitHubDaily!

3e500124400b9d9ba75c1fc324402f60.png

Supongo que te gusta

Origin blog.csdn.net/sinat_33224091/article/details/131587748
Recomendado
Clasificación