머리말
2024 중관촌 포럼 연례회의 및 하드 기술 투자 및 개발 포럼이 최근 중관촌 국제혁신센터에서 열렸습니다. 전 세계 180명의 투자자, 금융가, 기업가, 업계 전문가 및 관련 정부 지도자들이 "자본 세계화와 해외 기술", "하드 기술 투자의 확립과 실패", "하드 기술의 새로운 글로벌 실천"에 초점을 두고, 심도 있는 교류와 토론을 진행하였습니다.

베이징시 인민정부 부비서장 한경(Han Geng)은 연설에서 새로운 시대의 여정에서 새로운 생산력의 핵심 요소인 하드과학과 기술의 혁신과 발전이 필수 불가결한 요소가 되었다고 말했습니다. 중국 현대화 추진의 중요한 힘이다. 베이징의 유니콘 기업 수는 항상 전국 1위를 차지하고 있으며, 그 중 하드 기술 유니콘 기업이 60% 이상을 차지합니다. 미래를 대비하여 베이징은 6개 주요 과학 기술 분야에 20개 세분화 산업을 배치하고 400억 달러에 달하는 과학 기술 혁신 기금을 조성했습니다. 이 기금은 인공 지능, 로봇 공학, 의료 건강과 같은 전략적 신흥 산업에 중점을 둘 것입니다. .

한경(Han Geng) 베이징시 인민정부 부비서기
Alluxio는 전 세계적으로 많은 주목을 받고 있는 차세대 AI 데이터 플랫폼으로, 수석 설계자인 Fu Zhengjia 박사가 포럼에 초대되어 "New"라는 주제로 TED 쇼에서 2023~2024년 뛰어난 혁신 리더들을 만났습니다. Global Practices of Hard Technology'에는 Zhipu AI 사장 Wang Shaolan, Pathfinder Group 사장 He Huajie, Oriental Space 공동 창립자 겸 공동 CEO Bu Xiangwei, Origin Quantum CMO Zhao Yongjie 및 Zhong Haizheng이 포함되어 있습니다. Zhijing Technology의 창립자는 다양한 회사의 최신 하드 코어 기술과 기술을 공유했습니다.
Alluxio는 "차세대 AI 데이터 플랫폼" 이라는 주제를 공유합니다.
Alluxio의 수석 건축가 Fu Zhengjia 박사
AI와 데이터 관리 문제의 가속화된 진화
AI는 현재 빠르게 진화하고 있으며 다양한 산업의 수직적, 수평적 분야에서 폭넓은 주목을 받고 있습니다. 미국의 투자자이자 미래학자인 레이 커즈웰(Ray Kurzwell)은 “인공지능은 2029년에 인간 지능 수준에 도달하고, 2045년에는 스마트 기술과 인류 문명이 만들어내는 생물학적 기계지능의 역량이 10억배 확장될 것”이라고 예측했다. NVIDIA CEO Jen-Hsun Huang은 글로벌 데이터 센터 구조 조정에 대한 수요가 급증하고 있다고 믿습니다. 이러한 10년 간의 기존 데이터 센터 재활용 및 활용은 결국 가속화된 컴퓨팅의 전환 여정으로 이어질 것입니다. 많은 기업이 모델을 훈련하고 실제 비즈니스에 적용하여 생산 효율성을 향상하고 더 큰 가치를 창출함으로써 비즈니스 역량을 강화하기 위해 AI를 준비하기 시작했거나 사용하고 있습니다.
동시에 ChatGPT에서 시작되는 차세대 AI로 인해 모델 구조가 점점 더 복잡해지고 관련 매개 변수 수가 점점 더 많아지고 컴퓨팅 성능 요구 사항도 점점 더 증가하고 있습니다. 분명한. 따라서 일반적으로 AI 발전의 가장 중요한 3대 핵심은 컴퓨팅 파워, 알고리즘, 데이터라고 생각하고 있지만, AI 인프라 구축의 중요성을 모두가 간과하는 경우가 많다. , AI의 세 가지 핵심 측면은 훌륭한 핵심 능력이 있어야만 더 잘 활용될 수 있습니다.
기업은 또한 AI 인프라를 구축할 때 다음과 같은 일련의 과제에 직면합니다.
현재 국내 기업은 일반적으로 GPU 부족, 높은 가격 및 낮은 활용률 문제에 직면해 있습니다. 그러나 GPU 문제가 완화되더라도 GPU 컴퓨팅 데이터를 어떻게 더 잘 관리하고 제공할 것인가 하는 또 다른 문제가 따릅니다. , GPU에서 요구하는 데이터 액세스 효율성을 달성하는 방법(데이터 IO에 병목 현상이 발생하면 GPU 활용도가 부족해지고 훈련을 수행하기 전에 데이터가 GPU에 로드될 때까지 기다려야 함)
알고리즘과 비즈니스 리더는 더 빠른 모델 구축 주기와 반복 속도를 요구하는 경우가 많습니다. 또한 지능형 운전 및 무인 차량을 위한 데이터 수집과 다양한 산업 분야의 데이터 수집 및 주석과 같은 데이터에서 매우 명확한 성장 추세를 볼 수 있습니다. 기업은 증가하는 데이터 규모에 대비해야 합니다.
규모의 성장에는 두 가지 차원이 있는데, 한편으로는 전체 데이터 양의 증가입니다. 예를 들어, 특히 대규모 언어 모델 외에도 몇 억 개의 사진이 있습니까? 또한 멀티모달, 텍스트 기반 사진, 텍스트 기반 동영상 등 다양한 모델을 학습하려면 데이터 준비가 필요하므로 데이터의 양은 계속 증가할 것입니다.
반면에 데이터 자체의 크기는 점점 커지고 있습니다. 몇 년 전에는 얼굴 인식 사진이 100KB 또는 200KB에 불과하다고 보았습니다. 그러나 지금은 동영상 사진, 4K 고화질 사진, 사진 등을 볼 수 있습니다. 1MB, 4MB, 8MB는 데이터 자체가 지속적으로 늘어나기 때문에 이 두 차원을 곱하면 전체 데이터의 크기가 제곱 수준으로 늘어납니다.
따라서 훈련 효과를 높이기 위해서는 전체 훈련 플랫폼에 대해 더 나은 데이터 저장 및 데이터 I/O 솔루션이 필요합니다.
알룩시오 솔루션
시장에는 요구 사항을 어느 정도 충족할 수 있지만 많은 문제가 발생할 수 있는 솔루션이 있습니다. 특히 상업용 스토리지와 같이 원래 슈퍼컴퓨팅 센터를 겨냥한 일부 솔루션은 매우 비싸지만 설계되지 않았습니다. 현재의 문제를 해결합니다. 일반적인 AI 시나리오가 직면한 과제를 위해 설계되었습니다.
따라서 Alluxio는 고성능 분산 데이터 액세스 플랫폼을 사용하여 전체 AI에서 데이터 플랫폼 및 데이터 I/O가 직면한 문제를 더 잘 해결하기를 희망합니다. Alluxio는 Pytorch, TensorFlow, Ray 및 데이터 스토리지와 같은 컴퓨팅 프레임워크(훈련 플랫폼 프레임워크) 사이에 있으며 느린 스토리지 및 컴퓨팅 성능 프레임워크를 조정하고 조정할 수 있습니다.
Alluxio를 통해 GPU 및 CPU 컴퓨팅 파워와 같은 데이터를 컴퓨팅 노드에 더 가깝게 가져올 수 있으며, 데이터를 핫 데이터와 콜드 데이터를 신속하고 자동으로 분리하여 GPU 트레이닝 작업을 통해 데이터를 빠르게 획득할 수 있습니다. 동시에 Alluxio는 다양한 유형의 기본 데이터 소스를 결합하여 저렴한 콜드 스토리지와 Alluxio 핫 캐시로 구성된 비용 효율적이고 ROI가 높은 전체 솔루션을 형성할 수 있습니다.
이 솔루션이 주로 해결하는 첫 번째 시나리오는 기업이 상대적으로 민감하기 때문에 클라우드에 배치할 수 없는 자체 데이터를 보유하는 동시에 로컬 컴퓨팅 성능이 부족하여 필요한 경우입니다. 다른 데이터 센터에서 GPU를 빌리려면 현재 기업에는 유연한 GPU 배포를 지원하고 데이터를 유연하게 활용할 수 있는 솔루션이 필요하며 Alluxio는 이러한 시나리오에 매우 잘 대처할 수 있습니다.
두 번째 시나리오는 모델 훈련이 완료된 후 모델을 자주 업데이트해야 하는 추론 클러스터가 많아 추론 배포 프로세스에서 I/O 병목 현상이 발생할 수 있다는 것입니다. 이 경우 Alluxio는 추론 배포 중에 발생하는 문제를 매우 효율적으로 해결할 수 있습니다.
Alluxio가 가져오는 가치
전반적으로, 차세대 AI 훈련 플랫폼에서 Alluxio는 전체 훈련 프로세스에 대한 가속 서비스를 제공할 수 있을 뿐만 아니라 훈련된 모델이 추론 클러스터에 배포될 때 더 나은 추론 및 배포를 제공할 수 있습니다. 솔루션은 매우 고가의 하드웨어를 추가로 구입하는 것에 비해 빠르게 배포하고 사용할 수 있으며, 기업은 표준 저가형 하드웨어만 사용하면 진정한 비용 절감 및 효율성 향상을 달성할 수 있습니다.
테스트 검증을 통해 훈련 작업이 Alluxio 없이는 85분이 걸리지만 Alluxio를 사용하면 17분밖에 걸리지 않으며, DataLoader가 전체 훈련 시간의 10%를 차지한다는 사실을 직관적으로 알 수 있습니다. 이를 통해 얻을 수 있는 가치는 기업이 많은 돈을 들여 구입하는 GPU의 활용률을 원래 17%에서 93%로 높일 수 있다는 점입니다. 이는 기업의 인프라를 크게 향상시킬 뿐만 아니라 ROI, 최종 사업 출시를 가속화합니다.
현재 Alluxio는 전 세계 다양한 산업 분야의 기업과 기관에서 널리 채택되고 있습니다. 우리는 모든 사람과 협력하여 AI의 발전을 가속화하고 기업에 보다 효율적으로 투자 수익을 가져올 수 있기를 기대합니다.
✦
[더 많은 정보를 얻으려면 어시스턴트를 추가하세요]
✦

✦
【최근 인기】
✦
✦
【바오뎬 시장】
✦




이 기사는 WeChat 공개 계정인 Alluxio(Alluxio_China)에서 공유되었습니다.
침해가 있는 경우 [email protected]에 연락하여 삭제를 요청하세요. 이 글은 " OSC 소스 생성 계획
" 에 참여하고 있습니다 . 이 글을 읽고 계신 여러분의 많은 참여와 공유 부탁드립니다.