MMLM의 Gemini: "Gemini 소개: 가장 크고 가장 유능한 AI 모델" 번역 및 해석

MMLM의 Gemini: "Gemini 소개: 가장 크고 가장 유능한 AI 모델" 번역 및 해석

소개: 2023년 12월 6일 Google은 대규모 다중 모드 모델 Gemini를 출시하여 Google 언어 모델 개발이 새로운 단계에 이르렀음을 나타냅니다. -modal 및 일반 기능은 대부분의 현재 주류 대형 모델보다 훨씬 뛰어납니다. 이는 현재 Google의 가장 크고 강력한 인공 지능 모델입니다. 처음부터 다중 모드로 구축된 Gemini는 텍스트, 이미지, 오디오, 비디오 및 코드를 포함한 다양한 유형의 정보를 요약하고 원활하게 이해, 조작 및 결합할 수 있습니다. 이는 정교한 다중 모드 추론과 고급 인코딩 기능을 갖추고 있음을 의미합니다. Google 제품을 구동하고, 보다 발전된 고객 서비스 상호작용을 제공하고, 콘텐츠 제작 및 마케팅 활동에 사용되며, 자연어, 코드 생성, 경쟁 프로그래밍과 같은 작업을 효과적으로 수행할 수 있습니다.

배경: AI 기술이 지속적으로 발전함에 따라 언어 모델도 지속적으로 발전하고 있지만 기존 모델은 다중 모드 처리 기능 및 일관성에서 단점을 노출했습니다.

고충점 해결: Gemini는 미래 AI 비서의 지식과 역량, 즉 다중 모드, 범용, 신뢰성 및 기타 역량에 직면해야 합니다.

해상 방안:

>>Gemini는 처음부터 Multi-Modality에 중점을 둔 훈련 방법을 채택하여 다양한 입력을 자연스럽게 이해하고 추론할 수 있습니다.

>> Gemini는 여러 언어, 이미지, 지식 평가 벤치마크에서 현재 SOTA를 능가하여 강력한 다중 모드 기능을 나타냅니다.

>> Gemini는 자연어, 코드 생성, 경쟁 프로그래밍과 같은 작업에서도 좋은 성능을 발휘합니다.

>> 세 가지 버전의 Gemini는 다양한 시나리오에 최적화되어 있으며 서버와 장치에서 효율적으로 실행될 수 있습니다.

>> Gemini 시리즈의 개발은 책임과 안전에 중점을 두고 모델 보안을 향상시키기 위해 다양한 메커니즘을 채택했습니다.

>> Gemini는 여러 Google 제품에서 사용될 것이며 API를 통해 개발자에게도 공개될 것입니다.

즉, Gemini는 Google 모델의 다중 모드 기능, 다양성 및 운영 효율성을 크게 개선하고 이와 관련하여 기존 모델의 단점을 해결했으며 AI 비서 개발을 촉진할 것으로 예상됩니다.

목차

"Gemini 소개: 가장 크고 가장 유능한 AI 모델" 번역 및 해석

순다르의 메모

Gemini 소개Gemini를 소개합니다

최첨단 성능

Gemini 기술 보고서에서 자세한 내용을 확인하세요.

Gemini는 텍스트 및 코딩을 포함한 다양한 벤치마크에서 최첨단 성능을 능가합니다.. Gemini는 텍스트 및 코딩을 포함한 다양한 벤치마크에서 최첨단 성능을 능가합니다.

Gemini는 다양한 다중 모드 벤치마크에서 최첨단 성능을 능가합니다.

차세대 기능차세대 기능차세대 기능

Gemini의 기능에 대해 자세히 알아보고 작동 방식을 확인하세요.

정교한 추론 복잡한 추론

Gemini는 새로운 과학적 통찰력을 열어줍니다.

텍스트, 이미지, 오디오 등 이해텍스트, 이미지, 오디오 등 이해

쌍둥이자리는 수학과 물리학의 추론을 설명하고, 쌍둥이자리는 수학과 물리학의 추론에 탁월합니다.

고급 코딩Advanced Coding

Gemini는 코딩 및 경쟁 프로그래밍에 탁월하고 Gemini는 코딩 및 경쟁 프로그래밍에 탁월합니다.

AlphaCode 2 기술 보고서에서 자세한 내용을 확인하세요.

확장 가능하고 효율적입니다. 확장 가능하고 효율적입니다.

더욱 안정적이고 확장 가능하며 효율적입니다. 더욱 안정적이고 확장 가능하며 효율적입니다.

Google 데이터 센터에 있는 Cloud TPU v5p AI 가속기 슈퍼컴퓨터 행 Google 데이터 센터에 있는 Cloud TPU v5p AI 가속기 슈퍼컴퓨터 행

책임과 안전책임과 안전

책임과 안전을 핵심으로 구축책임과 안전을 핵심으로 구축

가용성가용성

Gemini를 전 세계에 제공하기Making Gemini를 전 세계에 제공하기

Google 제품의 Gemini Pro, Google 제품의 Gemini Pro

Gemini를 온라인으로 경험해 보세요

Gemini로 만들기Gemini로 만들기

Gemini Ultra가 곧 출시됩니다. Gemini Ultra가 곧 출시됩니다.

쌍둥이자리 시대: 혁신의 미래를 가능하게 하는 쌍둥이자리 시대: 혁신의 미래를 가능하게 함


"Gemini 소개: 가장 크고 가장 유능한 AI 모델" 번역 및 해석

주소

地址Gemini 소개: Google의 가장 유능한 AI 모델

시간

2023년 12월 6일

작가

순다르 피차이

구글과 알파벳의 CEO

데미스 허사비스

구글 딥마인드(Google DeepMind) CEO 겸 공동 창업자

순다르의 메모

Google과 Alphabet CEO Sundar Pichai의 메모:

모든 기술 변화는 과학적 발견을 발전시키고 인류의 발전을 가속화하며 삶을 개선할 수 있는 기회입니다. 나는 지금 우리가 보고 있는 AI의 전환이 이전의 모바일이나 웹으로의 전환보다 훨씬 더 큰, 우리 생애에서 가장 심오한 전환이 될 것이라고 믿습니다. AI는 일상적인 것부터 특별한 것까지 모든 사람들을 위해 기회를 창출할 수 있는 잠재력을 가지고 있습니다. 이는 혁신과 경제 발전의 새로운 물결을 가져올 것이며 이전에 볼 수 없었던 규모로 지식, 학습, 창의성 및 생산성을 촉진할 것입니다.

AI가 전 세계 모든 사람에게 도움이 되도록 만들 수 있다는 점이 저를 흥분시킵니다.

Google과 Alphabet CEO인 Sundar Pichai의 성명서는 다음과 같습니다.

모든 기술 변화는 과학적 발견을 촉진하고 인류 발전을 가속화하며 삶을 개선할 수 있는 기회입니다. 저는 현재 인공 지능에서 우리가 보고 있는 변화가 이전보다 훨씬우리 생애가장 심오한 변화가 될 것이라고 믿습니다. 모바일 또는 웹으로 전환. 인공지능은 일상에서 특별한 순간까지 전 세계 사람들을 위한 기회를 창출할 수 있는 잠재력을 가지고 있습니다. 이는 새로운혁신과 경제 발전의 물결을 가져오고 전례 없는 규모로 지식, 학습, 창의성 및 생산성을 촉진할 것입니다.

저를 흥분시키는 것은 인공지능을 전 세계 모든 사람에게 도움이 되도록 만들 수 있는 기회라는 것입니다.

AI 우선 기업으로의 여정이 시작된 지 약 8년이 지났지만 발전 속도는 점점 더 빨라지고 있습니다. 이제 수백만 명의 사람들이 우리 제품 전반에 걸쳐 생성 AI를 사용하여 1년 전에도 할 수 없었던 일, 즉 답을 찾는 것부터 더 복잡한 작업까지 수행하고 있습니다. 새로운 도구를 사용하여 공동작업하고 창작하는 방법에 대한 질문입니다. 동시에 개발자들은 우리의 모델과 인프라를 사용하여 새로운 생성 AI 애플리케이션을 구축하고 있으며 전 세계의 스타트업과 기업은 AI 도구를 통해 성장하고 있습니다.

이는 놀라운 추진력이지만, 우리는 가능한 것의 표면을 긁기 시작했을 뿐입니다.

우리는 이 작업에 대담하고 책임감 있게 접근하고 있습니다. 이는 우리가 연구에 야심차게 노력하고 사람과 사회에 막대한 이익을 가져올 수 있는 역량을 추구하는 동시에 AI의 역량이 더욱 강화됨에 따라 안전 장치를 구축하고 정부 및 전문가와 협력하여 위험을 해결하는 것을 의미합니다. 그리고 우리는 AI 원칙에 따라 최고의 도구, 기반 모델 및 인프라에 지속적으로 투자하고 이를 우리 제품과 다른 제품에 제공합니다.

이제 우리는 여러 주요 벤치마크에서 최고의 성능을 발휘하며 가장 유능하고 일반적인 모델인 Gemini를 통해 여정의 다음 단계를 밟고 있습니다. 첫 번째 버전인 Gemini 1.0은 Ultra, Pro, Nano 등 다양한 크기에 최적화되어 있습니다. 이는 Gemini 시대의 첫 번째 모델이자 올해 초 Google DeepMind를 설립했을 때 가졌던 비전의 첫 실현입니다. 이 새로운 모델 시대는 우리가 회사로서 수행해 온 가장 큰 과학 및 엔지니어링 노력 중 하나를 나타냅니다. 저는 앞으로의 일과 Gemini가 전 세계 사람들에게 열어줄 기회에 대해 진심으로 기대하고 있습니다.

– 순다르

AI 우선 기업으로서 우리는거의 8년 동안 탐구해 왔으며 발전 속도는 점점 더 빨라지고 있습니다. 사람들은 이제 우리 제품에서 생성 AI를 사용하여 1년 전에는 할 수 없었던 일, 복잡한 문제에 대한 답변부터 공동 작업을 위한 새로운 도구 사용에 이르기까지 다양한 작업을 수행하고 있습니다. 그리고 창조하세요. 동시에 개발자들은 우리의 모델과 인프라를 활용하여 새로운 생성 AI 애플리케이션을 구축하고 있으며 전 세계의 스타트업과 기업은 AI 도구를 통해 성장하고 있습니다.

이것은 놀라운 동기 부여이지만 우리는 단지 가능성의 표면을 긁기 시작했습니다.

우리는 이를 대담하고 책임감 있게 수행하고 있습니다. 이는 연구에 대한 야망을 갖고 사람과 사회에 막대한 이익을 가져올 수 있는 역량을 추구하는 동시에안전 장치를 구축하고정부 및 전문가와 협력하여 a>인공지능이 더욱 강력해짐에 따라 발생하는 합니다. 우리는 AI 원칙에 따라 최고의 도구, 기본 모델 및 인프라에 지속적으로 투자하고 이를 제품과 그 이상에 도입하고 있습니다. 을 해결위험

이제 우리는 현재까지 가장 강력하고 다재다능한 모델 /span>. 다양한 주요 벤치마크에서 나타났습니다. 첫 번째 버전인 Gemini 1.0은 Ultra, Pro, Nano 등 다양한 크기에 최적화되어 있습니다. 이는 Gemini 시대의 첫 번째 모델이자 올해 초 Google DeepMind를 설립했을 때 가졌던 비전의 첫 실현입니다. 이 뉴에이지 모델은 현재까지 회사의 가장 큰 과학 및 엔지니어링 노력 중 하나를 나타냅니다. 앞으로 다가올 일과 Gemini가 전 세계 사람들에게 열어줄 기회가 정말 기대됩니다최첨단 성능Gemini를 통해 여정의 다음 단계를 밟고 있습니다.

Gemini 소개Gemini를 소개합니다

Gemini 팀을 대표하여 Google DeepMind의 CEO이자 공동 창업자인 Demis Hassabis가 작성했습니다.

많은 연구 동료들과 마찬가지로 AI는 내 인생 연구의 초점이었습니다. 10대 때 컴퓨터 게임용 AI를 프로그래밍한 이래로, 그리고 뇌의 작용을 이해하려고 노력하는 신경과학 연구원으로 수년 동안 저는 항상 우리가 더 똑똑한 기계를 만들 수 있다면 이를 활용해 인류에게 엄청난 혜택을 줄 수 있다고 믿어왔습니다. 방법.

AI를 통해 책임감 있는 세상을 만들겠다는 약속은 Google DeepMind에서 계속해서 우리의 업무를 추진하고 있습니다. 오랫동안 우리는 사람들이 세상을 이해하고 상호 작용하는 방식에서 영감을 받아 차세대 AI 모델을 구축하고 싶었습니다. 스마트한 소프트웨어라기보다는 유용하고 직관적인 것, 즉 전문가 도우미 또는 보조자처럼 느껴지는 AI입니다.

오늘 우리는 지금까지 우리가 만든 것 중 가장 유능하고 일반적인 모델인 Gemini를 소개하면서 이 비전에 한 걸음 더 다가섰습니다.

Google DeepMind의 CEO이자 공동 창립자인 Demis Hassabis가 Gemini 팀을 대신하여 게시했습니다.

인공 지능은 나와 많은 연구 동료들의 평생 연구의 초점이었습니다. 저는 컴퓨터 게임용 인공 지능 프로그램을 작성하던 10대 시절부터 뇌의 작용을 이해하려고 노력하는 신경과학 연구원으로 일하는 동안 내내 우리가 더 똑똑한 기계를 만들 수 있다면, 놀라운 방법으로인류에게 혜택을 주기 위해사용할 수 있습니다.

Google DeepMind에서는 인공 지능을 통해 책임감 있게 세상에 힘을 실어주겠다는 약속을 계속해서 이행하고 있습니다. 오랫동안 우리는사람들이 이해하는 것과 방식에서 영감을 받아새로운 세대의 인공 지능 모델을 구축하고 싶었습니다 세상과 소통하는 것. 이 인공 지능은 똑똑한 소프트웨어라기보다는 유용하고 직관적인 전문 비서나 전문가처럼 느껴집니다.

Gemini는 Google Research의 동료를 포함하여 Google 전체 팀의 대규모 공동 노력의 결과입니다. 처음부터 다중 모드로 구축되었습니다. 즉, 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 정보를 일반화하고 원활하게 이해하고 작동하며 결합할 수 있습니다.

오늘 우리는 지금까지 만든 것 중 가장 강력하고 다재다능한 모델 인 Gemini를 출시하며 그 비전을 향한 또 다른 발걸음을 내디뎠습니다.

Gemini는 Google Research의 동료를 포함하여 Google 팀 전반의 대규모 협업의 결과입니다. 처음부터 구축되었으며다중 모드 기능을 갖추고 있습니다. 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 정보를 원활하게 이해하고 조작하며 결합합니다.

Gemini 소개: 가장 크고 가장 유능한 AI 모델

Gemini는 또한 당사의 가장 유연한 모델이기도 하며 데이터 센터에서 모바일 장치에 이르기까지 모든 장치에서 효율적으로 실행할 수 있습니다. 최첨단 기능은 개발자와 기업 고객이 AI를 구축하고 확장하는 방식을 크게 향상할 것입니다.

우리는 첫 번째 버전인 Gemini 1.0을 세 가지 다른 크기에 맞게 최적화했습니다.

>> Gemini Ultra — our largest and most capable model for highly complex tasks.

>> Gemini Pro — our best model for scaling across a wide range of tasks.

>> Gemini Nano — our most efficient model for on-device tasks.

Gemini:我们最大、最强大的人工智能模型

Gemini也是我们迄今为止最灵活的模型,能够在从数据中心到移动设备的所有设备上高效运行。其最先进的功能将显著增强开发人员和企业客户使用人工智能构建和扩展的方式。

我们已经优化了Gemini 1.0,我们的第一个版本,有三种不同的尺寸:

>>GeminiUltra -用于高度复杂任务的最大最强大的模型。

>> Gemini Pro -在各种任务上扩展的最佳模型。

>> Gemini Nano -在设备上任务中最有效的模型。

State-of-the-art performance最先进的性能

We've been rigorously testing our Gemini models and evaluating their performance on a wide variety of tasks. From natural image, audio and video understanding to mathematical reasoning, Gemini Ultra’s performance exceeds current state-of-the-art results on 30 of the 32 widely-used academic benchmarks used in large language model (LLM) research and development.

With a score of 90.0%, Gemini Ultra is the first model to outperform human experts on MMLU (massive multitask language understanding), which uses a combination of 57 subjects such as math, physics, history, law, medicine and ethics for testing both world knowledge and problem-solving abilities.

Our new benchmark approach to MMLU enables Gemini to use its reasoning capabilities to think more carefully before answering difficult questions, leading to significant improvements over just using its first impression.

我们已经对Gemini模型进行了严格的测试,并在各种任务上评估了它们的性能。从自然图像、音频和视频理解到数学推理,Gemini Ultra的性能在32个广泛使用的大语言模型(LLM)研究和开发中使用的学术基准中有30个超越了当前最先进的结果

在MMLU(大规模多任务语言理解)中,Gemini Ultra以90.0%的得分首次超过人类专家,该任务使用57个主题(如数学、物理学、历史、法律、医学和伦理学)结合测试世界知识和解决问题的能力

我们对MMLU的新基准方法使Gemini能够利用其推理能力在回答困难问题之前更加谨慎思考,从而比仅使用第一印象有显着改善。

Gemini Ultra also achieves a state-of-the-art score of 59.4% on the new MMMU benchmark, which consists of multimodal tasks spanning different domains requiring deliberate reasoning.

With the image benchmarks we tested, Gemini Ultra outperformed previous state-of-the-art models, without assistance from object character recognition (OCR) systems that extract text from images for further processing. These benchmarks highlight Gemini’s native multimodality and indicate early signs of Gemini's more complex reasoning abilities.

Gemini Ultra在新的MMM(多模态多任务)基准测试中也取得了59.4%的最先进得分,该基准测试包括涉及不同领域的多模态任务,需要深思熟虑的推理。

在我们测试的图像基准测试中,Gemini Ultra在没有目标字符识别(OCR)系统的辅助下,超越了以前最先进的模型。这些基准测试突显了Gemini的本机多模态性,并表明Gemini具有更复杂推理能力的早期迹象

See more details in our Gemini technical report.在我们的Gemini技术报告中看到更多细节。

在包括文本和编码在内的一系列基准测试中都超越了最先进的性能Gemini surpasses state-of-the-art performance on a range of benchmarks including text and coding.Gemini

在一系列多模式基准上超越了最先进的性能Gemini surpasses state-of-the-art performance on a range of multimodal benchmarks.

Next-generation capabilities一代能力

Until now, the standard approach to creating multimodal models involved training separate components for different modalities and then stitching them together to roughly mimic some of this functionality. These models can sometimes be good at performing certain tasks, like describing images, but struggle with more conceptual and complex reasoning.

We designed Gemini to be natively multimodal, pre-trained from the start on different modalities. Then we fine-tuned it with additional multimodal data to further refine its effectiveness. This helps Gemini seamlessly understand and reason about all kinds of inputs from the ground up, far better than existing multimodal models — and its capabilities are state of the art in nearly every domain.

到目前为止,创建多模态模型的标准方法包括为不同的模态训练单独的组件,然后将它们拼接在一起,粗略地模仿一些功能。这些模型有时可以很好地执行某些任务,比如描述图像,但在更概念性和复杂的推理方面会遇到困难

我们设计Gemini是天生的多模态,从一开始就在不同的模态上进行了预训练。然后我们用额外的多模态数据对其进行微调,以进一步改进其有效性。这有助于Gemini从一开始就无缝地理解和推理各种输入,比现有的多模态模型要好得多,而且它的能力几乎在每个领域都是最先进的

Learn more about Gemini’s capabilities and see how it works.了解有关Gemini能力的更多信息,并了解其工作原理。

Sophisticated reasoning复杂的推理

Gemini 1.0’s sophisticated multimodal reasoning capabilities can help make sense of complex written and visual information. This makes it uniquely skilled at uncovering knowledge that can be difficult to discern amid vast amounts of data.

Its remarkable ability to extract insights from hundreds of thousands of documents through reading, filtering and understanding information will help deliver new breakthroughs at digital speeds in many fields from science to finance.

Gemini 1.0复杂的多模态推理能力有助于理解复杂的书面和视觉信息。这使得它在发现在大量数据中难以辨别的知识方面具有独特的技能。

它通过阅读、过滤和理解信息,从数十万份文件中提取见解的非凡能力,将有助于在从科学到金融的许多领域以数字速度实现新的突破

Gemini解锁新的科学见解

Understanding text, images, audio and more理解文本,图像,音频和更多

Gemini 1.0 was trained to recognize and understand text, images, audio and more at the same time, so it better understands nuanced information and can answer questions relating to complicated topics. This makes it especially good at explaining reasoning in complex subjects like math and physics.

Gemini1.0经过训练,可以同时识别和理解文本、图像、音频等,因此它能更好地理解细微的信息,并能回答与复杂话题有关的问题。这使得它特别擅长解释数学物理等复杂学科的推理。

Gemini explains reasoning in math and physics,Gemini在数学和物理的推理中表现优异。

Advanced coding先进的编码

Our first version of Gemini can understand, explain and generate high-quality code in the world’s most popular programming languages, like Python, Java, C++, and Go. Its ability to work across languages and reason about complex information makes it one of the leading foundation models for coding in the world.

Gemini Ultra excels in several coding benchmarks, including HumanEval, an important industry-standard for evaluating performance on coding tasks, and Natural2Code, our internal held-out dataset, which uses author-generated sources instead of web-based information.

Gemini can also be used as the engine for more advanced coding systems. Two years ago we presented AlphaCode, the first AI code generation system to reach a competitive level of performance in programming competitions.

Using a specialized version of Gemini, we created a more advanced code generation system, AlphaCode 2, which excels at solving competitive programming problems that go beyond coding to involve complex math and theoretical computer science.

我们的第一个版本Gemini可以理解、解释和生成世界上最流行的编程语言的高质量代码,如Python、Java、c++和Go。它具有跨语言工作和对复杂信息进行推理的能力,使其成为世界上领先的编码基础模型之一。

Gemini Ultra在几个编码基准测试中表现出色,包括HumanEval(一个重要的行业标准,用于评估编码任务的性能)和Natural2Code(我们的内部保留数据集),它使用作者生成的来源而不是基于web的信息。

Gemini也可以用作更先进的编码系统的引擎。两年前,我们推出了AlphaCode,这是第一个在编程比赛中达到竞技水平的人工智能代码生成系统。

使用专门的Gemini版本,我们创建了一个更高级的代码生成系统AlphaCode 2,在解决涉及复杂数学和理论计算机科学的竞争性编程问题方面表现出色。

When evaluated on the same platform as the original AlphaCode, AlphaCode 2 shows massive improvements, solving nearly twice as many problems, and we estimate that it performs better than 85% of competition participants — up from nearly 50% for AlphaCode. When programmers collaborate with AlphaCode 2 by defining certain properties for the code samples to follow, it performs even better.

We’re excited for programmers to increasingly use highly capable AI models as collaborative tools that can help them reason about the problems, propose code designs and assist with implementation — so they can release apps and design better services, faster.

当在与原始AlphaCode相同的平台上进行评估时,AlphaCode 2显示出巨大的改进,解决了几乎两倍的问题,我们估计它的表现优于85%的比赛参与者——较AlphaCode的近50%有所提高。当程序员通过为代码示例定义某些属性与AlphaCode 2协作时,它的性能会更好

我们很高兴程序员越来越多地使用高性能的人工智能模型作为协作工具,帮助他们推理问题、提出代码设计并协助实现——这样他们就可以更快地发布应用程序设计更好的服务

Gemini excels at coding and competitive programmingGemini擅长编码和竞争性编程

See more details in our AlphaCode 2 technical report.详见我们的AlphaCode 2技术报告。

Scalable and efficient可扩展且高效

More reliable, scalable and efficient更可靠,可扩展和高效

We trained Gemini 1.0 at scale on our AI-optimized infrastructure using Google’s in-house designed Tensor Processing Units (TPUs) v4 and v5e. And we designed it to be our most reliable and scalable model to train, and our most efficient to serve.

On TPUs, Gemini runs significantly faster than earlier, smaller and less-capable models. These custom-designed AI accelerators have been at the heart of Google's AI-powered products that serve billions of users like Search, YouTube, Gmail, Google Maps, Google Play and Android. They’ve also enabled companies around the world to train large-scale AI models cost-efficiently.

Today, we’re announcing the most powerful, efficient and scalable TPU system to date, Cloud TPU v5p, designed for training cutting-edge AI models. This next generation TPU will accelerate Gemini’s development and help developers and enterprise customers train large-scale generative AI models faster, allowing new products and capabilities to reach customers sooner.

我们使用谷歌自家设计的Tensor Processing Units(TPUs)v4和v5e在我们的AI优化基础设施上大规模训练Gemini 1.0。我们把它设计成最可靠、最可扩展的培训模式,也是最有效的服务模式。

在TPUs上,Gemini的运行速度明显快于早期、较小和功能较差的机型。这些定制设计的人工智能加速器一直是谷歌人工智能产品的核心,这些服务为数十亿用户提供搜索、YouTube、Gmail、Google Maps、Google Play和Android等服务。它们还使世界各地的公司能够以经济高效的方式训练大规模的AI模型。

今天,我们宣布了迄今为止最强大,最高效和可扩展的TPU系统,Cloud TPU v5p,专为训练尖端的人工智能模型而设计。这款下一代TPU将加速Gemini的开发,并帮助开发人员和企业客户更快地训练大规模生成式人工智能模型,从而使新产品和功能更快地到达客户手中。

A row of Cloud TPU v5p AI accelerator supercomputers in a Google data center.谷歌数据中心的一排Cloud TPU v5p AI加速器超级计算机

Responsibility and safety责任与安全

Built with responsibility and safety at the core以责任和安全为核心构建

At Google, we’re committed to advancing bold and responsible AI in everything we do. Building upon Google’s AI Principles and the robust safety policies across our products, we’re adding new protections to account for Gemini’s multimodal capabilities. At each stage of development, we’re considering potential risks and working to test and mitigate them.

Gemini has the most comprehensive safety evaluations of any Google AI model to date, including for bias and toxicity. We’ve conducted novel research into potential risk areas like cyber-offense, persuasion and autonomy, and have applied Google Research’s best-in-class adversarial testing techniques to help identify critical safety issues in advance of Gemini’s deployment.

To identify blindspots in our internal evaluation approach, we’re working with a diverse group of external experts and partners to stress-test our models across a range of issues.

To diagnose content safety issues during Gemini’s training phases and ensure its output follows our policies, we’re using benchmarks such as Real Toxicity Prompts, a set of 100,000 prompts with varying degrees of toxicity pulled from the web, developed by experts at the Allen Institute for AI. Further details on this work are coming soon.

在谷歌,我们致力于在我们所做的一切中推进大胆而负责任的人工智能。在谷歌的AI原则和我们产品各个领域的健全安全政策的基础上,我们为Gemini的多模态能力增加了新的保护措施。在开发的每个阶段,我们都考虑了潜在的风险,并努力测试和缓解这些风险。

Gemini拥有迄今为止谷歌所有人工智能模型中最全面的安全评估,包括偏见和毒性。我们进行了关于潜在风险领域的新颖研究,如网络攻击、说服和自治,并应用了谷歌研究最佳的对抗测试技术,以帮助在Gemini部署之前预先识别关键的安全问题。

为了在内部评估方法中识别盲点,我们与外部的多样化的专家团队和合作伙伴合作,以在一系列问题上对我们的模型进行压力测试。

在Gemini的训练阶段诊断内容安全问题,并确保其输出符合我们的政策,我们使用了真实毒性提示(Real toxic Prompts)等基准测试,这是一组从网络中提取的具有不同程度毒性的10万个提示,由艾伦人工智能研究所的专家开发。有关此工作的进一步细节即将发布。

To limit harm, we built dedicated safety classifiers to identify, label and sort out content involving violence or negative stereotypes, for example. Combined with robust filters, this layered approach is designed to make Gemini safer and more inclusive for everyone. Additionally, we’re continuing to address known challenges for models such as factuality, grounding, attribution and corroboration.

Responsibility and safety will always be central to the development and deployment of our models. This is a long-term commitment that requires building collaboratively, so we’re partnering with the industry and broader ecosystem on defining best practices and setting safety and security benchmarks through organizations like MLCommons, the Frontier Model Forum and its AI Safety Fund, and our Secure AI Framework (SAIF), which was designed to help mitigate security risks specific to AI systems across the public and private sectors. We’ll continue partnering with researchers, governments and civil society groups around the world as we develop Gemini.

为了减少伤害,我们构建了专用的安全分类器,用于识别、标记和分类涉及暴力或负面刻板印象的内容。结合强大的过滤器,这种分层方法旨在使Gemini更安全、更包容。此外,我们还在继续解决模型的已知挑战,如事实性、基础、归因和协同。

责任和安全将始终是我们模型开发和部署的核心。这是一项长期的承诺,需要协作建设,因此我们正在与行业和更广泛的生态系统合作,共同制定最佳实践,并通过MLCommons、Frontier Model Forum及其AI安全基金以及我们的安全AI框架(SAIF)等组织设定安全和安全标准,该框架旨在帮助缓解公共和私营部门中特定于AI系统的安全风险。在我们开发Gemini的过程中,我们将继续与世界各地的研究人员、政府和公民社会团体合作

Availability可用性

Making Gemini available to the world让Gemini向世界开放

Gemini 1.0 is now rolling out across a range of products and platforms:

Gemini 1.0现在正在逐步在一系列产品和平台上推出:

Gemini Pro in Google products,Gemini Pro在谷歌产品中

We’re bringing Gemini to billions of people through Google products.

Starting today, Bard will use a fine-tuned version of Gemini Pro for more advanced reasoning, planning, understanding and more. This is the biggest upgrade to Bard since it launched. It will be available in English in more than 170 countries and territories, and we plan to expand to different modalities and support new languages and locations in the near future.

We’re also bringing Gemini to Pixel. Pixel 8 Pro is the first smartphone engineered to run Gemini Nano, which is powering new features like Summarize in the Recorder app and rolling out in Smart Reply in Gboard, starting with WhatsApp — with more messaging apps coming next year.

In the coming months, Gemini will be available in more of our products and services like Search, Ads, Chrome and Duet AI.

We’re already starting to experiment with Gemini in Search, where it's making our Search Generative Experience (SGE) faster for users, with a 40% reduction in latency in English in the U.S., alongside improvements in quality.

Gemini专业在谷歌产品

我们通过谷歌产品将Gemini带给了数十亿人。

从今天开始,Bard将使用Gemini Pro的微调版本进行更高级的推理、规划、理解等操作。这是Bard自推出以来的最大升级。它将在超过170个国家和地区提供英文版本,并计划在不久的将来扩展到不同的模态,并支持新的语言和地区。

我们还将Gemini引入Pixel。Pixel 8 Pro是首款运行Gemini Nano的智能手机,它支持一些新功能,比如在Recorder应用程序中进行总结,并在Gboard中推出智能回复功能,从WhatsApp开始,明年还会推出更多的即时通讯应用程序。

在未来几个月内,Gemini将在我们的更多产品和服务中推出,如Search、Ads、Chrome和Duet AI。

我们已经开始在Search中尝试Gemini,它使我们的搜索生成体验(SGE)对用户更加快速,在美国英语中的延迟减少了40%,同时提高了质量。

​​​​​​​在线体验Gemini

产品测试地址https://bard.google.com/

Building with Gemini使用Gemini构建

Starting on December 13, developers and enterprise customers can access Gemini Pro via the Gemini API in Google AI Studio or Google Cloud Vertex AI.

Google AI Studio is a free, web-based developer tool to prototype and launch apps quickly with an API key. When it's time for a fully-managed AI platform, Vertex AI allows customization of Gemini with full data control and benefits from additional Google Cloud features for enterprise security, safety, privacy and data governance and compliance.

Android developers will also be able to build with Gemini Nano, our most efficient model for on-device tasks, via AICore, a new system capability available in Android 14, starting on Pixel 8 Pro devices. Sign up for an early preview of AICore.

从12月13日开始,开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro

Google AI Studio是一款免费的基于web的开发者工具,可以通过API密钥快速创建和发布应用。当一个完全托管的人工智能平台到来时,Vertex AI允许Gemini的定制化,具有完全的数据控制,并受益于额外的谷歌云功能,包括企业安全、隐私、数据治理和合规性。

Android开发者还可以通过AICore (Android 14中的一项新系统功能,从Pixel 8 Pro设备开始),使用Gemini Nano(我们最高效的设备上任务模型)进行构建。注册获得AICore的早期预览版。

Gemini Ultra coming soon,Gemini Ultra即将推出

Gemini Ultra의 경우 현재 신뢰할 수 있는 외부 당사자의 레드팀 구성을 포함하여 광범위한 신뢰 및 안전 검사를 완료하고 있으며, 이를 광범위하게 제공하기 전에 인간 피드백(RLHF)을 통한 미세 조정 및 강화 학습을 사용하여 모델을 더욱 개선하고 있습니다.

이 프로세스의 일환으로, 우리는 내년 초에 개발자와 기업 고객에게 출시하기 전에 초기 실험과 피드백을 위해 선택된 고객, 개발자, 파트너, 안전 및 책임 전문가에게 Gemini Ultra를 제공할 것입니다.

내년 초에는 Gemini Ultra를 시작으로 최고의 모델과 기능에 액세스할 수 있는 새로운 최첨단 AI 경험인 Bard Advanced도 출시할 예정입니다.

Gemini Ultra의 경우 현재 신뢰할 수 있는 외부 그룹의 레드팀 테스트를 포함하여 광범위한 신뢰 및 보안 검사를 실시하고 있으며 광범위한 출시를 앞두고 a>인간 피드백에서 얻은 RLHF(미세 조정 및 강화 학습)를 사용하여 모델을 더욱 개선합니다.

이 프로세스의 일환으로선정고객, 개발자, 파트너, 보안 및 책임 전문가 a>< a i=3>Gemini Ultra초기내년초기 실험에 제공됩니다. 개발자 및 기업 고객을 위한 출시 전 피드백

내년 초에는 Gemini Ultra를 시작으로 새로운 최첨단 인공 지능 경험인Bard Advanced도 출시할 예정입니다. 최고의 모델과 기능에 액세스하세요.

쌍둥이자리 시대: 혁신의 미래를 가능하게 하는 쌍둥이자리 시대: 혁신의 미래를 가능하게 함

이는 AI 개발에 있어서 중요한 이정표이며, Google이 계속해서 빠르게 혁신하고 책임감 있게 모델 기능을 발전시키는 가운데 새로운 시대가 시작되는 것입니다.

우리는 지금까지 Gemini에서 큰 진전을 이루었으며 계획 및 메모리의 발전을 포함하여 향후 버전의 기능을 더욱 확장하고 더 나은 응답을 제공하기 위해 더 많은 정보를 처리하기 위한 컨텍스트 창을 늘리기 위해 열심히 노력하고 있습니다.

우리는 창의성을 향상시키고, 지식을 확장하고, 과학을 발전시키고, 전 세계 수십억 명의 사람들이 살고 일하는 방식을 변화시킬 혁신의 미래인 AI를 통해 책임 있게 힘을 실어주는 세상의 놀라운 가능성에 대해 기대하고 있습니다.

이것은 인공 지능의 발전과 새로운 시대의 시작에 있어 중요한 이정표입니다.Google 우리는 계속해서 빠르게 혁신하고 있습니다. 책임감을 갖고 모델의 기능을 책임감 있게 향상시키세요.

우리는 지금까지 Gemini에서 큰 진전을 이루었습니다. 계획 및 메모리 개선을 포함하여 기능을 더욱 확장하기 위해 노력하고 있습니다. 또한 더 많은 정보를 처리하여 더 나은 응답을 제공하기 위한 컨텍스트 창을 늘립니다. .

우리는 혁신을 통해 창의성을 강화하는 세상, 지식을 확장하는 미래, 과학을 발전시키고 전 세계 수십억 명의 사람들이 살고 일하는 방식을 변화시킵니다.

Guess you like

Origin blog.csdn.net/qq_41185868/article/details/134844464