我从在 Ubuntu Linux 上的传统 CPU 架构上尝试运行 Llama2 中学到了什么 - 代码天地

我从在 Ubuntu Linux 上的传统 CPU 架构上尝试运行 Llama2 中学到了什么

业界资讯 2023-08-08 20:29:49 阅读次数: 0

在 x86 和仅 CPU 架构上运行 Ruunig LLAMA2
20 世纪 90 年代初，英特尔是 CPU 市场的主导力量，以其可靠的高性能微处理器吸引了科技爱好者和企业。然而，这些技术的价格很高，这使得许多潜在用户（包括我自己）在经济上无法获得该技术。

AMD 通过提供价格实惠的 CPU 打破了这种垄断，这些 CPU 在性能方面可以与英特尔相媲美。通过迎合对“足够好”性能感到满意的“过度服务”市场用户，AMD 充分利用了英特尔无意中留下的市场空白。这一转变成为克莱顿·克里斯滕森颠覆性创新理论的教科书案例。克里斯滕森在他的众多书籍和演讲中经常提到他与英特尔首席执行官安迪·格罗夫的互动。在某种程度上，AMD 的出现促使英特尔推出更便宜的奔腾 CPU 变体，并以赛扬变体进行销售。赛扬虽然仍由英特尔生产，但具有较低的缓存和较慢的时钟速度，专为那些正在寻找足够好的 CPU 来运行计算机的人（包括我自己）而设计。

快进到今天，人工智能 (AI) 领域正在发生类似的转变。Meta 开源其先进的 Llama2 语言模型的动机可能是多种多样的，但其中最重要的是大型语言模型 (LLM) 的民主化，它迎合了服务不足和服务过度的细分市场。

通过免费提供最先进的语言模型，Meta 正在打开以前被认为难以接近的大门。结合量化等技术，显着降低 CPU 资源需求，有时甚至完全消除对 GPU 的需求，Meta 正在为新的、包容性的 AI 生态系统铺平道路。

这一战略举措旨在让人工智能技术普及。直到最近，这种先进模型的使用仍然是为那些有能力买得起的人保留的。现在，借助量化，甚至 CPU 也可以承载这些模型，

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/132127696

我从在 Ubuntu Linux 上的传统 CPU 架构上尝试运行 Llama2 中学到了什么

使用GGML和LangChain在CPU上运行量化的llama2

llama2本地CPU推理运行

MIT：我们在区块链上设计学历证书系统的过程中学到了什么

在Windows或Mac上安装并运行LLAMA2

llama.cpp LLM模型 windows cpu安装部署；运行LLaMA2模型测试

异构边缘上的快速、可移植的 Llama2 推理

我从HTML的meta中学到了什么

使用ExLlamaV2在消费级GPU上运行Llama2 70B

如何优雅地下载huggingface上模型，以llama2模型下载为例

我们从CMMI中学到了什么

谈谈我再这次疫情中学到了什么

我从 Android 官方 App 中学到了什么？

Linux——Ubuntu2-上

使用Llama.cpp在CPU上快速的运行LLM

ubuntu上运行linux项目

我在创业第一年的6个产品中学到了什么

我们从爬取1000亿个网页中学到了什么？

我从55个Swift标准库协议中学到了什么（笔记）

2018年我们从容器中学到了什么

使用Kubernetes三年，我们从中学到了什么？

我从过去八个月的AI公司面试中学到了什么？

跟尤雨溪对话：我从vuejs/core发布中学到了什么？

Ubuntu 16.04上安装Caffe(CPU only)

ubuntu16.04上安装tensorflow( cpu)

在Ubuntu上安装CPU版本的Caffe

在淘宝我学到了什么？

ACM我学到了什么

Mistral 7B 大型语言模型 — 小而强大（比 LLAMA2 13B 更好！）探索 Mistral 7B LLM 独特的架构以及 GGLU(CPU) 和 GPU 版本无与伦比的性能

微服务架构之我们应该从Dubbo中学到什么

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)