自从 ChatGPT 横空出世之后，收购了 OpenAI 的微软就一直压着各大科技公司一头，尤其是传统意义的科技巨头谷歌也是难得一见地败下阵来。但最近随着 Google I/O 2023 开发者大会的举办，谷歌终于还是没忍住推出了对标 GPT-4 的 PaLM 2。

PaLM 2 的由来

PaLM 2 的前身是 PaLM（Pretraining and Language Model），这是谷歌于 2019 年推出的一种基于神经网络的语言模型，它的主要任务是通过对大量语言数据的学习，提高自然语言处理的准确性和效率。

PaLM 2 支持 100 多种语言，在常识推理、逻辑运算以及数学能力方面优势明显，此外还能根据不同专业领域的知识信息进行调优（Fine-Tuning），比如基于信息安全信息的 Sec-PaLM 2 可以帮助开发者定位恶意脚本内容并排查安全风险，基于医疗领域专业知识进行调优的 Med-PaLM 2 则是首个在医疗许可测验中表现超过人类专家水平的大模型。

根据模型体量的不同，PaLM 2 又以不同动物为名分为壁虎（Gecko）、水獭（Otter）、野牛（Bison）与独角兽（Unicorn）四大类别，比如 Gecko 所需要的算力和存储空间最小，支持在移动设备上离线运行。

技术原理

PaLM 2 的核心技术是基于 Transformer 模型的语言模型预训练，同时加入了自适应注意力机制和多层感知器等技术手段。自适应注意力机制可以自动识别文本中的重点内容，并将其加以强调，进而提高模型的预测精度。多层感知器则可以通过多层神经网络的组合，实现对输入文本的更加深入的理解和分析。这些技术手段的加入，使得 PaLM 2 的预测能力和泛化能力都有了大幅提升。

PaLM 2 中的自适应注意力机制与传统的注意力机制不同，它可以根据不同的输入数据自动地调整权重。PaLM 2 中加入的多层感知器还可以使模型对输入文本的特征更加深入地理解，从而提高模型的泛化能力。

应用场景

PaLM 2 的多功能性使其能够适应不同行业的各种应用：

Bard：直接对标 ChatGPT 的聊天机器人。该应用程序利用 PaLM 2 的语言生成功能来编写创造性内容，如故事、散文和诗歌。用户可以提供提示，Bard 生成连贯且与上下文相关的内容，展示模型对语法、语义和风格的理解。

Google Workspace ‘Help me’ 系列：对标不久前高调亮相的 Microsoft 365 Copilot。Google 所有 Workspace 套件的生成式 AI 服务也都是围绕提示语（prompt）工作的，通过提示语进一步辅助内容创作、文章配图、邮件摘要、快速回复等需求。
新的谷歌搜索：新的搜索页面由有明显标识的广告、生成式 AI 信息面板以及常规搜索结果排名组成。其中生成式 AI 面板还将提供话题跟踪和对话聊天支持，方便用户像使用 Google Assistant 语音助手的手动输入模式那样使用 Google 搜索。

与 GPT-4 相比

GPT-4 由 OpenAI 开发，是人工智能领域另一个重要的语言模型。尽管 PaLM 2 和 GPT-4 在目标和技术原理上有相似之处，但主要区别在于其基本工程和培训过程的细微差别。

GPT-4 基于“Masked Language Model”概念，该概念在训练过程中省略了输入文本的某些部分，并训练模型来预测缺失的单词。相比之下，PaLM 2 的训练过程同时利用有监督和无监督的学习任务来优化其性能。

虽然 GPT-4 在语言理解和生成方面表现出了令人印象深刻的能力，但 aLM 2 是专门设计的，通过其更精细的预训练过程提供的额外知识基础来满足更多样和更广泛的任务。这使 PaLM 2 成为一个更灵活的超级模型，使其能够在更广泛的应用和行业中使用。

PaLM 2 是谷歌训练已久、相对比较成熟的 AI 大模型，就目前来看已经能够和 GPT-4 掰一掰手腕了，而值得一提的是，近期由两个部门合并而成的 Google DeepMind 目前正在为 Google 训练下一代多模态大模型 Gemini。不知道这会不会成为谷歌又一个核弹级的大杀器？

关注我，跟着我一起学习 AI ，走在时代的前沿。

跟着我学 AI丨PaLM 2：谷歌的大杀器

PaLM 2 的由来

技术原理

应用场景

与 GPT-4 相比

猜你喜欢