PPIO Wang Wenyu와의 대화: 추론 발발 직전, GPU 개발 관점에서 본 AIGC 시대의 도래

편집자 주

혁신적인 추론 애플리케이션의 출현과 함께 GPU는 강력한 컴퓨팅 도구로서 디지털 세계의 변화를 주도하고 있습니다. 뛰어난 고성능 컴퓨팅 성능과 병렬 처리 기능은 AIGC 기술 개발을 강력하게 지원하고 오디오 및 비디오 콘텐츠의 혁신과 발전을 촉진합니다.

오늘 PPIO의 Wang Wenyu 선생님을 인터뷰에 초대하게 된 것을 영광으로 생각합니다. 그는 상하이 역에서 인상 깊었던 질문인 “국내 AIGC와 해외 AIGC의 개발 격차는 얼마나 됩니까?”를 시작으로 GPU 및 AIGC 오디오 및 비디오 콘텐츠 제작에 대한 독특한 관찰과 통찰력을 공유할 예정입니다. 이 분야의 향후 발전 방향.

문자/왕원위

기획 편집/리메이한

면접 대상

왕웬유

PPIO Pai Ouyun의 공동 창립자 겸 CTO

연쇄 창업가이자 PPTV의 전 수석 설계자이자 공동 창립자입니다. 대학생 시절인 2004년 기숙사에서 PPTV를 시작해 핵심 코드 대부분을 혼자서 완성해 P2P, CDN, 스트리밍 미디어 등 핵심 기술을 주도했으며, 2018년에는 PPIO 클라우드를 창업해 분산컴퓨팅, 스토리지 등을 개발했다. 및 네트워크 서비스 엣지 클라우드 플랫폼은 낮은 대기 시간, 넓은 대역폭 및 높은 비용 성능을 달성합니다.

1.LiveVideoStack: 안녕하세요, Wang Wenyu 선생님, 다시 인터뷰에 참여하도록 초대하게 되어 매우 기쁩니다. 상하이 스테이션에서 [AIGC 및 콘텐츠 제작]이라는 주제로 참여하여 멋진 연설을 하게 되었는데, 참여해 보신 소감이 어떠셨나요? 특히 인상 깊었던 청중의 하이라이트나 질문이 있었나요?

Wang Wenyu : 지난 행사에서 제가 연설한 후 많은 친구들이 질문을 해서 매우 인기가 있었고, 우리 컨퍼런스에 참석한 청중들이 매우 열정적이라는 것을 느꼈습니다. 상하이 방송국에서 공유한 내용은 "AIGC 오디오 및 비디오 도구 분석과 미래 혁신 기회에 대한 생각"이라는 주제로 AIGC와 오디오 및 비디오의 관계를 주로 분석했으며 글로벌 관점에서 잘 공유했습니다. 잘 알려진 외국 오디오 및 비디오 애플리케이션 또는 앱과 그 뒤에 있는 최첨단 기술 (자세한 내용은 "AIGC 오디오 및 비디오 도구 분석 및 미래 혁신 기회에 대한 생각" 참조 )

그 당시에는 모두가 AI와 AIGC라는 주제에 많은 관심을 기울였지만, 많은 친구들은 해외 오디오 및 비디오 산업의 발전과 일부 최첨단 기술 동향에 익숙하지 않았습니다. 최근에는 상황이 달라져 사람들의 관심이 높아지면서 바이트, 메이투 등 국내 유수의 기업들이 관련 제품을 축적하기 시작했다.

인터넷의 사진

상하이역에서 가장 인상 깊었던 주제 중 하나는 국내외 AIGC의 개발 격차가 얼마나 되는가였습니다.

현재 관점에서 보면 국내 AIGC와 해외 AIGC의 격차는 여전히 상대적으로 크다. 본질적으로 업계의 많은 논문이 국내 학교 및 기관에서 제안되었지만 Transformer, Diffusion, VideoDiffusion, NeRF 및 기타 모델과 같은 일부 혁신적인 기술 및 응용 프로그램은 해외에서 들어오는 경우가 많습니다. 이러한 혁신적인 기술은 모두 해외에서 출시됩니다. 기업, 기관, 한자 서명은 보이지 않습니다. 국내 학교와 기관은 최적화와 보완을 더 잘하지만 실제 하드 코어 기반 기술로는 충분하지 않습니다.

산업혁신의 관점에서 볼 때, 외국의 AIGC 애플리케이션과 앱은 비가 내린 뒤 버섯처럼 솟아오르고 있으며, 그 중 다수는 소수 또는 십여 명 이상의 소규모 기업에서 제작되고 있으며 이는 중국보다 훨씬 활발합니다. 물론 잘 알려진 이유로 인해 중국은 상대적으로 그다지 활발하지 않습니다.

인터넷의 사진

그런 점에서 국내 개발자들에게 제가 조언하는 것은 해외 제품 제작을 고려해보고, 해외 제품의 핵심 로직을 검증한 뒤 국내에서 카피하라는 것입니다. 또한 개발자에게 중국에서 웹과 앱을 게시할 때 법률 준수와 데이터 보안에 주의를 기울여야 한다는 점을 상기시켜 드립니다.

물론, 국내외 AIGC의 발전격차도 고정되어 있지 않다고 생각하며, 인공지능 기술개발, 인재육성, 정책지원 등 국내 환경의 변화에 ​​따라 국내 산업 발전과 기업가 정신의 환경도 점점 더 중요해질 거예요.

2. LiveVideoStack: 기술 환경의 변화에 ​​매우 관심이 많으신 것으로 알고 있는데, 심천에서 연설 주제로 GPU를 선택하게 된 계기가 무엇인지 알려주실 수 있나요? 이 주제에 관해 공유하고 싶은 특별한 통찰력이 있습니까?

Wang Wenyu : GPU에 대해 이야기하는 이유는 무엇입니까? 4월과 달라진 점은 점점 더 혁신적인 추론 앱과 시나리오가 구현됐다는 점이다. 훈련이 첫 번째 단계에 도달하면 추론은 필연적으로 폭발하게 되는데, 심지어 우리는 추론 폭발의 초기 단계에 있다고 생각합니다.

추론 애플리케이션이 폭발적으로 증가함에 따라 미래의 애플리케이션은 추론에 대한 비용 요구 사항이 점점 더 높아질 것이라고 생각합니다. 추론 제품을 개발하려면 CDN이 이전에 이러한 비용 절감 프로세스를 경험한 것처럼 비용을 현재 비용의 1/10 또는 심지어 1/100까지 줄여야 합니다. 게다가 추론이 발달하면 필연적으로 대규모 GPU 수요가 발생하게 된다. 이때 좋은 GPU를 선택하는 방법, GPU를 잘 활용하는 방법, GPU의 일부 특성을 최적화하여 추론 비용에 영향을 미치는 방법에 대해 논의할 가치가 있는 주제입니다.

인터넷의 사진

이와 관련하여 특별한 통찰력이 있다면 물론 그렇습니다. 하지만 여기서 주의할 점이 있는데, 저의 연설 "AIGC의 초석으로서의 컴퓨팅 파워 철학 - GPU의 과거, 현재, 미래"가 11월 25일 오후 2시에 센토사 호텔 제이드 홀 3에서 열릴 예정입니다. 심천(A) 심천역 컨퍼런스에서 공유할 예정이니 관심 있으신 분들은 현장에 오셔서 함께 소통해 보시기 바랍니다.

3. 오늘날 디지털 세계에서 GPU가 어떤 핵심 역할을 한다고 생각하시나요? 메타버스, AIGC 및 기타 분야의 홍보에 기여하는 것은 무엇입니까? 실제 사례나 적용 시나리오를 공유해 주실 수 있나요?

Wang Wenyu : GPU는 물, 전기, 가스, 석탄과 마찬가지로 오늘날 디지털화 과정의 핵심 생산 소재라고 할 수 있다고 생각합니다. GPU는 메타버스, 인공지능, 대규모 언어 모델, AIGC 개발에 필요한 인프라 중 하나가 되었습니다. 저는 작년 LVS 컨퍼런스에서 PPIO 라는 주제를 공유한 적이 있습니다 . 메타버스의 인프라 구축과 클라우드 게임의 실천과 사고를 탐구하는 것입니다. 메타버스 개발에서 스트리밍 방법을 이야기할 때, 스트리밍은 GPU가 매우 중심적인 역할을 하는 클라우드에서 GPU에 의해 수행되어야 한다는 점은 이미 추론되었습니다. 또한 GPU 컴퓨팅은 모든 AI의 초석이기도 하며, AIGC의 개발은 기본적으로 GPU가 제공하는 컴퓨팅 성능을 기반으로 합니다. 이는 엔비디아가 수조 달러의 시장 가치를 지닌 기업이 될 수 있는 이유이기도 하며, 그 시장 가치는 기본적으로 인텔, AMD, 퀄컴 3대 칩 대기업의 합보다 큽니다.

인터넷의 사진

4.LiveVideoStack: GPU 개발의 핵심 순간과 기술적 혁신은 무엇이라고 생각하시나요?

Wang Wenyu : GPU 기술은 거의 30년 동안 발전해 왔으며 그래픽, 행렬 계산, 인코딩 및 디코딩을 포함하여 소프트웨어 및 하드웨어 측면에서 다양한 혁신이 있었습니다. 이야기할 주제가 많습니다. 이번 강연에서는 GPU의 기원과 역사, GPU 하드웨어 기술의 반복, 3D 렌더링부터 신경망, LLM, AIGC까지 세 가지 타임라인(과거, 현재, 미래)을 요약하여 말씀드리겠습니다. 애플리케이션, GPU의 주요 아키텍처, 매개변수 및 컴퓨팅 성능에 대한 엔지니어링 최적화 고려 사항 등이 포함됩니다. 누구나 와서 우리를 볼 수 있습니다!

5.LiveVideoStack: 신흥 분야인 GPU 클라우드 기술은 글로벌 GPU 산업에 매우 중요합니다. GPU 클라우드의 발전이 어떤 변화를 가져올 것이라고 생각하시나요? 기존 CPU 클라우드와 비교하여 GPU 클라우드의 독특한 특징은 무엇입니까?

Wang Wenyu : GPU 클라우드 사용량의 급속한 증가는 추세일 수밖에 없으며, 향후 5년 안에 GPU 클라우드 사용량, 규모, 예산이 기본 클라우드 컴퓨팅보다 훨씬 커질 것으로 예상합니다. 그러나 GPU 클라우드는 다른 특성을 가지고 있어 기존 클라우드 컴퓨팅만큼 표준화되지 않고 더 이질적입니다(머신 모델과 카드 유형의 다양한 조합 포함). GPU는 매우 비싸며 시나리오에 따라 GPU에 대한 요구 사항과 선택이 다르며 훈련과 추론도 매우 다릅니다. 그래서 내 생각에는 미래에는 각계각층의 모든 요구를 최고의 가성비로 해결할 수 있는 특정 GPU가 없을 것이며, 각 수요 유형에 맞는 최적의 모델 솔루션이 있을 수 있을 것입니다.

인터넷의 사진

게다가, 최근 NVIDIA와 초크홀드에 대한 금지 조치는 모든 사람들 사이에서 열띤 토론을 불러일으켰습니다. 나는 이 문제에 장단점이 있다고 생각한다.

나는 이러한 병목 현상이 단기적으로는 해롭지만 장기적으로는 우리나라 발전에 매우 유익하다고 굳게 믿습니다. 단기적으로는 어느 정도 불만을 겪을 수 있지만, 다음 단계에서는 국가가 국내 GPU를 지원하기 위해 신에너지 자동차 산업 체인을 지원하기 위해 했던 것과 동일한 강도를 사용할 것으로 예측합니다. 5~10년 안에 칩 스턱 문제를 완전히 해결할 수 있을 것이라고 믿습니다. 목이 막혔을 때 대처 방법에 대해서는 회의에서 더 많은 의견을 나누겠습니다.

인터넷의 사진

6.LiveVideoStack: 이러한 기능이 PPIO 기술팀에 어떤 도전과 기회를 가져올 수 있습니까?

Wang Wenyu : 중국 최고의 독립 엣지 클라우드 서비스 제공업체인 PPIO는 고객에게 30개 이상의 성, 1,000개 이상의 카운티, 도시 및 지역에서 짧은 대기 시간, 고대역폭 및 대규모 데이터 분산 처리 요구 사항을 충족하는 엣지 클라우드 컴퓨팅 서비스를 제공합니다. 전국 지역 및 솔루션을 제공합니다. GPU 클라우드 개발 측면에서 PPIO의 장점은 분산성과 이기종 특성이라고 생각합니다. 이 모델은 추론 분야의 많은 시나리오에 힘을 실어줄 수 있습니다. 왜냐하면 이질적인 능력 자체가 GPU와 기술 센터에 좋은 보완책을 가져올 수 있기 때문입니다.

7. LiveVideoStack: 답변해주신 Wang Wenyu 선생님께 감사드립니다! 마무리하기 전에 독점 LiveVideoStackCon 콘텐츠에 대한 스포일러를 알려주실 수 있나요?

왕원위 : 독점 콘텐츠 스포일러는 없습니다. 미팅에서 만나요!

인터뷰를 수락하고 AIGC 오디오 및 비디오 콘텐츠의 관점에서 GPU 컴퓨팅 성능과 미래 동향에 대한 통찰력을 공유해 주신 Mr. Wang Wenyu에게 감사드립니다. 인터뷰를 통해 모든 분들이 이 연설 내용의 깊이와 풍부함을 감상하실 수 있다고 믿습니다. 알고리즘 컴퓨팅 성능의 엔지니어링 최적화 및 컨퍼런스의 기타 독점 콘텐츠에 대해 자세히 알아보려면 LiveVideoStack 사용자가 심천 컨퍼런스에 와서 Wang Wenyu 씨와 직접 소통할 수 있습니다.

LiveVideoStackCon 2023 오디오 및 비디오 기술 컨퍼런스 심천역에서 여러분의 참여를 진심으로 초대합니다.

시간 : 2023년 11월 24-25일

위치 : 심천 센토사 호텔(제이드 브랜치)

문의 : 13520771810 (위챗에서도 같은 번호), [email protected]

Alibaba Cloud에 심각한 장애가 발생하여 모든 제품에 영향을 미쳤습니다 (복원되었습니다) 러시아 운영 체제 새로운 UI인 Aurora OS 5.0이 Tumblr에 공개되었습니다 많은 인터넷 회사에서 Hongmeng 프로그래머를 긴급 모집했습니다 .NET 8이 최신 정식 GA입니다 LTS 버전 유닉스 시대 17억 시대 돌입(이미 돌입) 샤오미는 샤오미 벨라가 완전한 오픈 소스이며, 기반 커널은 NuttX 리눅스의 .NET 8이며 독립 크기가 50% 감소했다고 공식 발표했다. FFmpeg 6.1" 헤비사이드(Heaviside)' 출시 마이크로소프트, 새로운 '윈도우 앱' 출시
{{o.이름}}
{{이름}}

Supongo que te gusta

Origin my.oschina.net/u/3521704/blog/10143400
Recomendado
Clasificación