3개월 만에 79개의 기본 대형 모델이 탄생했는데, 기업이 대형 모델을 선택할 때 주의해야 할 점은?

ChatGPT가 탄생한 이래로 온갖 대형 모델들이 끝없이 등장했고 경쟁은 점점 더 치열해졌습니다.

대기업의 진입으로 신생 기업에 의심의 여지없이 차원 축소 타격을 입힐 것이며, 신생 기업은 언제든지 무너져 미완성 프로젝트로 이어질 수 있습니다.

저도 대형 모델 분야의 최신 동향에 주목해 왔지만, 매일 엄청난 양의 정보가 쏟아져 들어오는 상황에서 저만의 독자적인 사고 틀을 갖고 그것을 유지하는 것이 매우 중요하다고 생각해서 여기까지 왔습니다. 또한 최근 정보를 입력하고 모든 사람과 생각을 공유하십시오.

사실 To C 시장에 비해 To B 시장에 더 주목하는 이유는 대형 모델들이 점차 심해권에 진입하면서 다양한 산업으로의 침투가 불가피한 추세가 되었기 때문입니다.

미래의 모든 기업은 대형 모델에 크게 의존할 것이며, 모든 제품은 대형 모델을 기반으로 개발될 것입니다. 대형 모델이 장기적으로 비즈니스 세계에 실질적인 영향을 미칠 수 있는 방법은 무엇입니까? 이것이 우리가 다음 단계에서 더 주목해야 할 초점입니다.

1. "AI 대형모델 기술역량평가 보고서" 해석

현재 대표적인 국내 대형 모델로는 Wenxin(Baidu), M6(Ali), Pangu(Huawei), ChatGLM(Zhipu Technology), Xinghuo(iflytek), Ririxin(Shangtang) 등이 있습니다.

세계 최고의 IT 시장 조사 및 컨설팅 회사인 IDC는 최근 "AI 대규모 모델 기술 역량 평가 보고서, 2023"을 발표했습니다. 이번 조사에는 중국 시장의 주류 제조업체 14개사가 참여했습니다. IDC는 9개의 대규모 모델 기술 제조업체를 선정했습니다. 핵심 연구를 위해 사용자 인터뷰 및 연구를 통해 사용자가 관심을 갖는 기술 능력, 제품 기능 및 생태 서비스 측면에서 종합 평가를 수행했습니다.

이 보고서에 주목하는 이유는 다음과 같습니다.

  1. 현 국제 정세로 볼 때 중국에는 바이두에서 구글로, 알리바바 클라우드에서 AWS로 비유할 수 있는 대규모 모델이 중국에 한두 개 정도 있을 것 같다. 대규모 모델.
  2. IDC는 산업 인지도가 높은 국제 권위 있는 컨설팅 기관이므로 이 보고서의 권위가 있습니다.
  3. 이 보고서는 기술적 관점에서 대형 모델을 평가할 뿐만 아니라 알고리즘 기능, 산업 범위 및 생태 협력과 같은 지표를 다룹니다. 나는 항상 기술이 닫힌 문 뒤에서 개발될 수 없다고 믿었습니다.높은 수준과 낮은 수준은 종종 비현실적임을 의미합니다.결국 기술은 비즈니스와 사회에 도움이 되어야 합니다.

IDC가 대규모 모델을 평가하는 방법을 자세히 살펴보겠습니다.

  1. IDC는 큰 모델을 서비스 생태, 제품 기술 및 산업 응용이라는 세 가지 계층으로 나눕니다.
  2. 각 계층의 능력을 평가하고 주요 지표는 알고리즘 모델, 일반 능력, 혁신 능력, 플랫폼 능력, 보안 및 설명 가능성, 대형 모델의 응용 산업, 지원 서비스 및 대형 모델 생태 등(구체적으로 36개 벌금 포함) - 세분화된 평가 기준), 각 지표는 1점에서 5점까지 5단계로 점수가 높을수록 제조사의 대형 모형 기술력이 강함을 의미하며, 최종 평가 결과는 레이더 차트를 통해 표시됩니다.
  3. 대형 모델 선택에서 IDC는 핵심 연구를 위해 중국 시장에서 Alibaba, Baidu, 4Paradigm, HKUST Xunfei, Lanzhou Technology, Yuncong Technology, Zhipu AI, China Telecom Zhike 및 Zhongke Wenge 등 9개 대형 모델 기술 제조업체를 선정했습니다. 또한 IDC는 360, 미니맥스, 화웨이, 센스타임, 텐센트 등 대형 모델도 관찰했다.

추신: IDC는 또한 더 많은 기술 제조업체를 대상으로 평가를 계속 업데이트할 것이라고 밝혔습니다.

2. Wenxin 모델의 우수한 성능은 주목할 가치가 있습니다.

이번 평가에서 Baidu의 Wenxin 대형 모델이 매우 좋은 성능을 보여 눈길을 끌었습니다.

구체적인 성능은 다음과 같습니다.

7개 핵심 지표 만점(5점): 알고리즘 모델, 일반 능력, 혁신 능력, 플랫폼 능력, 생태 협력, 산업 범위, 에너지 산업;

국내 유일 만점 3점(5점): 알고리즘 모델, 산업 커버리지, 에너지 산업;

보안 설명 가능성, 서비스 능력, 금융 산업, 산업 산업 및 의료 산업의 5개 지표에 대해 4점.

다음 두 그림은 Wenxin 대형 모델과 다른 국내 모델 간의 수평 비교와 각 지표에서 Wenxin 대형 모델 자체의 점수입니다.

여기서는 "알고리즘 모델"과 "산업 커버리지"의 두 가지 지표에 대해 설명하고자 합니다.

제품의 기술 능력 중에서 '알고리즘 모델' 차원이 가장 중요하고, 대형 모델 능력의 핵심 요소이며, 대형 모델의 적용 효과를 결정하는 근원이다. 알고리즘 모델 기술의 돌파구와 일반적인 효과 우위를 지닌 대규모 모델 기반의 실현을 통해서만 더 넓은 산업 범위를 지원할 수 있고, 각계각층이 기술 혁신으로 인한 배당금을 충분히 향유할 수 있으며, 높은 문턱의 딜레마를 해결할 수 있습니다. AI 구현.

응용 기능 측면에서 산업 적용 범위의 폭은 대규모 모델 제조업체에게 가장 중요한 지표입니다. "산업 커버리지"는 기업 수준의 고객 수와 상륙 산업의 수를 통해 산업 구현에서 대형 모델의 강점을 반영하며 대형 모델의 일반적인 주도 효과와 산업 결합 능력을 종합적으로 나타냅니다.

"알고리즘 모델"과 "산업 커버리지"의 두 가지 핵심 지표는 고유한 상관 관계가 있습니다.산업 커버리지의 폭은 알고리즘 모델의 일반적인 리더십을 집중적으로 표현하며, 또한 지속적인 개선을 위해 지속적으로 긍정적인 피드백을 제공할 것입니다. 지속적인 반복 개선을 위한 플라이휠을 형성하는 알고리즘 모델 기능.

Wenxin 대형 모델은 알고리즘 모델 차원에서 유일한 만점을 얻었으며, 이는 대형 모델의 핵심 기술에서 Baidu의 선점자 이점을 반영합니다. Baidu는 2019년부터 사전 교육 모델의 연구 개발에 깊이 관여했으며 지식이 강화된 Wenxin 시리즈 모델을 연속적으로 출시했습니다. Wenxin Large Model의 최신 버전 3.5는 기본 모델 업그레이드, 미세 조정 기술 혁신, 지식 향상, 논리적 추론 향상 등을 달성했습니다. 새 버전은 효과, 기능 및 성능을 종합적으로 개선했습니다.

또한 이 평가 보고서 외에도 다른 공개 평가에서는 Wenxin Big Model 3.5가 지원하는 Wenxinyiyan 중국어 능력이 우수하여 GPT-4를 능가하고 평가에서 종합 능력이 ChatGPT를 능가하여 다른 대형 모델보다 훨씬 앞선 것으로 나타났습니다.

SuperCLUE의 최신 평가 목록에서 Wenxinyiyan은 GPT3.5turbo 및 GLM130B를 능가했습니다.

3. 기업용 대형 모델 선택 방법

"AI 대규모 모델 기술 능력 평가 보고서"의 결과를 기반으로 대규모 모델 선택에 대한 생각을 촉발했습니다. 위에서 언급했듯이 미래의 모든 기업은 대규모 모델에 크게 의존할 것입니다.

그렇다면 상용 모델을 선택해야 할까요 아니면 오픈 소스 모델을 선택해야 할까요? 대형 공장이나 신생 기업과 협력을 선택해야 할까요? 피할 수 없는 문제가 되었습니다.

내 결론부터 시작하겠습니다. 주요 제조업체의 상용 모델을 선택하는 것이 최선의 선택입니다. 이유는 다음과 같습니다.

1. 시간은 가장 소중한 자원이다

스타트업 기업이든 일정한 규모의 기업이든 오늘날 점점 더 치열해지는 시장에서 발전을 모색하는 데 가장 중요한 자원은 무엇일까요? 시간입니다. 이것은 시간과의 게임입니다.

당신은 오픈 소스 모델이 GPT-3의 기능에서 GPT-3.5로 진화하기를 기다리고 있는 반면, 당신의 경쟁사는 GPT-4 기능이 있는 상용 모델을 직접 출시하여 제품 기능이나 사용자 경험 측면에서 당신을 직접 압도하고 있습니다. 따라서 이러한 관점에서 대형 상용 모델을 선택하는 것이 선점자 이점을 얻을 수 있는 유일한 옵션입니다.

2. To B 대형 모델의 경우 업계 경험이 매개 변수보다 훨씬 중요합니다.

앞서 언급한 바와 같이 폐쇄적인 매개변수와 규모에 집중하는 것은 무의미하며 To B 시나리오의 경우 축적된 업계 경험이 결정적인 역할을 하는 경우가 많습니다.

지금까지 수집한 정보를 바탕으로 Baidu는 이미 이 분야에서 선도적인 위치에 있으며 지난 몇 달 동안 Baidu Smart Cloud는 화학, 제조, 에너지 및 자동차 부문에서 자주 새로운 움직임을 보였습니다. 예를 들어, 7월 초 BMW Brilliance는 Baidu와 전략적 협력을 발표했으며, 양 당사자는 유리한 자원을 공유하고 AI 기술과 자동차 제조 산업의 글로벌 장면의 통합 및 혁신을 탐색할 것이라고 말했습니다. 지난달 Sinopec과 Baidu는 산업용 인공 지능 인프라 구축, 디지털 전환 및 업그레이드, 대형 모델과 같은 신기술 혁신을 포함한 6개 주요 영역에서 협력하기 위한 전략적 협력 계약을 체결했습니다. 전력 산업에서 지난 5월 Baidu는 China Southern Power Grid와 양해각서를 체결했으며, 양 당사자는 AI와 전력 파견의 통합과 혁신을 공동으로 추진할 예정입니다.

이것은 또한 모든 측면에서 Baidu의 Wenxin 모델이 선점자 우위를 기반으로 의심할 여지없이 선두를 차지했음을 의미합니다.

Supongo que te gusta

Origin blog.csdn.net/qq_35190492/article/details/131916255
Recomendado
Clasificación