苹果将大语言模型部署到设备本地 - 代码天地

苹果将大语言模型部署到设备本地

业界资讯 2023-12-23 17:04:01 阅读次数: 0

苹果研究团队在预印本平台 arxiv 发表论文《LLM in a flash》，介绍了一项全新的闪存技术，让苹果可以在其内存有限的设备上部署大语言模型。

论文地址：https://arxiv.org/pdf/2312.11514.pdf

研究团队表示，他们通过将模型参数存储在闪存 (Flash Memory) 中——也就是储存应用和照片的地方，解决了有效运行大语言模型容量的挑战。与传统用于运行大语言模型的 RAM 相比，闪存在移动设备中容量要大得多。

论文指出，这项技术可以让 AI 模型的运行规模达到 iPhone 可用内存的两倍。在这项技术的加持之下，LLM 的推理速度在 Apple M1 Max CPU 上提高了 4-5 倍，在 GPU 上提高了 20-25 倍。

延伸阅读

猜你喜欢

转载自www.oschina.net/news/272282/apple-wants-ai-to-run-directly-on-its-hardware

苹果将大语言模型部署到设备本地

本地化部署大语言模型 ChatGLM

【ChatGLM-6B】清华开源的消费级显卡大语言模型，本地部署与测试

Langchain-Chatchat大语言模型本地知识库的踩坑、部署、使用

本地部署体验LISA模型（LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA）

将Pytorch模型部署到Android端

一文就懂大语言模型Llama2 7B+中文alpace模型本地部署

GPT大语言模型Alpaca-lora本地化部署实践【大语言模型实践一】 | 京东云技术团队

记录部署ChatGLM大语言模型过程

苹果发布开源多模态大语言模型 Ferret

GPT大语言模型Vicuna本地化部署实践（效果秒杀Alpaca） | 京东云技术团队

卷积神经网络模型部署到移动设备

如何使用TensorFlow mobile部署模型到移动设备

将Spring Boot项目部署到本地Tomcat中

如何将本地项目部署到Github

配置 --- > 将本地项目部署到阿里云上

MLC LLM - 大模型本地部署解决方案

本地部署chatgpt之老虎中文大模型

Llama-2大模型本地部署研究与应用测试

深入解析大型语言模型：从训练到部署大模型

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

将训练好的Tensorflow模型部署到web应用中

如何将pytorch模型部署到安卓

苹果大模型，不藏了

探索将大语言模型用作推荐系统

将n个数按从大到小输出（C语言）

将本地项目部署到本地tomcat服务器中

私有部署类chatGPT大语言模型的几种方案

Meta 推出的 LLaMA 大语言模型部署教程

部署百川大语言模型Baichuan2

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)