북경대학교는 중국의 대형 법률모델인 ChatLaw를 공식 출시하고 오픈소스로 만들었습니다.

"Kechuangban Daily" 보고서에 따르면 북경대학교 팀은 최근 대중에게 대중적인 법률 서비스를 제공하는 것을 목표로 하는 ChatLaw라는 중국 법률 모델을 출시했습니다. 이 모델은 문서 수신 및 음성 입력을 지원하며, 법률 문서 생성, 법률 자문 제공, 사용자에게 적절한 법률 지원 서비스 추천 등이 가능합니다.

 

이 프로젝트를 개발하기 위해 북경대학교 심천 대학원의 Tuzhan Intelligence AIGC 공동 연구소는 범용 초대형 모델을 기반으로 하며 법률 분야의 대량의 구조화된 텍스트 데이터를 교육에 사용합니다.

팀이 ChatLaw-13B, ChatLaw-33B 및 ChatLaw-TextVec의 세 가지 모델도 오픈 소스로 제공했다는 점은 언급할 가치가 있습니다.

ChatLaw 프로젝트의 출시는 광범위한 관심과 인정을 받았습니다. 현재 이 프로젝트는 GitHub에 1,000개가 넘는 별을 보유하고 있으며 법률 기술 분야에서 인기와 잠재적 영향력을 보여줍니다.

물론 북경대학교 역시 대규모 법률 코퍼스 교육을 통해 대형 법률 모델인 변호사-라마(Lawyer-Lama)를 오픈소스화했으며, 중국 법률지식 시스템을 체계적으로 학습하여 해당 모델이 중국 법률지식을 익히고 이를 중국 법률 실무에 적용할 수 있도록 했다. .

 

위 사진 왼쪽의 BELLE(Be Everything's Large Language model Engine) 모델과 비교하여 "중국의 법적 결혼 연령"을 물으면 LLaMA 변호사가 변호사의 답변에 더 가까운 정답을 준 것을 알 수 있습니다. . 게다가 위 사진의 질문 B처럼 필요한 법적 조항이 갖춰져도 BELLE은 정답을 줄 수 없는 반면, LLaMA 변호사는 이 질문에 이유를 들어 전문적으로 잘 답변해 주었습니다.

실제로 BELLE의 답변에서도 이러한 대형 모델을 전문 수직 분야에 직접 적용하면 종종 많은 문제가 발생한다는 것을 알 수 있습니다. 저자 팀은 대형 모델을 법률의 특별한 요구 사항에 잘 적용할 수 있다고 믿습니다. 필드에는 다음 세 가지 조건이 충족되어야 합니다.

1. 모호함을 피한 정확한 표현: 법률분야에서는 단지 단어 하나를 바꾸는 것만으로도 법률관계 구축에 있어 정반대의 결과를 가져오는 경우가 많습니다. 중국어로는 법적 의미와 동일하지만 계약법상 효력은 상당히 다릅니다.

2. 법률용어의 이해와 구별: 법률에는 독특하고 구체적인 용어가 많고, 법인의 개념 등 법률 분야에서만 나타나는 용어가 많으며, 법률 분야에서는 다른 의미를 가질 수 있는 용어가 더 많습니다. 분야와 생활분야, 같은 의미로 모델도 구별되어야 한다.

3. 실태를 이해할 수 있어야 한다. 법률용어 및 법률분석에 대한 기본적인 이해와 체계적 이해뿐만 아니라, 실생활의 문제를 정확하게 이해하는 능력, 즉 모델이 갖춰야 할 역량은 다음과 같다. 특정 문제를 해결하기 위해 법이론을 적용하는 능력 핵심 역량.

위의 이론을 바탕으로 저자팀은 오픈소스 LLaMA 모델을 기반으로 다음과 같은 단계를 통해 법률 분야의 대형 모델 적용을 해결할 것으로 기대하고 있다.

1. 법률 관련 지식 주입: 법률 조항, 사법 해석, 국가 법률 문서 등 법률 분야의 수많은 원본을 수집하여 새로운 데이터를 사용하여 원본 모델을 지속적으로 학습시킵니다.

2. 분야별 기술 습득: 좋은 법률 대형 모델은 개념 해석, 사례 분석, 법률 상담 등 법률 분야에서 공통적으로 발생하는 문제를 해결할 수 있어야 하므로 저자는 실제 업무 사례 세트를 수집하고 ChatGPT를 사용하여 해당 답변 생성 모델이 법적 영역의 특정 작업을 해결할 수 있도록 감독된 미세 조정을 수행합니다.

3. 정보 검색으로 환각 완화: 대형 모델에서 기계 환각 문제를 완화하기 위해 저자는 정보 검색 모듈도 도입했습니다. 각 답변을 생성하기 전에 먼저 사용자의 쿼리와 컨텍스트를 사용하여 관련 법률 조항을 검색한 다음 이러한 법적 조항을 기반으로 해당 대응을 생성합니다.

 

저자팀은 Lawyer LLaMA 구축을 성공적으로 완료했으며, Lawyer LLaMA의 전반적인 운영 과정을 그림에 나타내었습니다.

 

 

논문에 제시된 효과를 직접 살펴보자면, 동등한 비교를 위해 다양한 각도에서 보면 변호사-라마가 확실히 훨씬 낫다.

자세한 코드와 설치 단계는 댓글란에 있으니 직접 골라보시고 많은 지원 부탁드립니다.

Supongo que te gusta

Origin blog.csdn.net/xyk2000114/article/details/131551522
Recomendado
Clasificación