文章目录
本机运行DeepSeek R1大模型文章如下:
清华大学新闻与传播学院沈阳团队出品的《DeepSeek:从入门到精通》104页PDF
关注【小康师兄】微信公众号,回复【清华大学DeepSeek:从入门到精通】即可获取下载链接。
前言:一场技术平权的除夕夜革命
今天是除夕,本应围炉守岁、盘点旧年。
但当我打开电脑,DeepSeek的最新动态却如一颗深水炸弹,彻底点燃了内心的澎湃。
这个来自中国AI的破局者,又开源了一个AI模型DeepSeek Janus-Pro。
昨天,我们还在讨论DeepSeek可惜没有多模态,今天它就出现了!
我不禁感叹:DeepSeek春节不放假吗,他们的的研究员和开发者春节不休息的吗?
当然,这不重要,重要的是DeepSeek R1 和 DeepSeek Janus 性能强得离谱,关键是训练成本还低,并且全面开源,遵循 MIT 协议,支持商用。
这意味着啥?中小企业的春天要来了!
DeepSeek R1:中小企业手中的「屠龙刀」
当千亿参数不再是巨头的专利,当训练成本压缩至传统模型的1/10,R1用实力诠释了什么叫「小而美,强而悍」:
- 推理性能爆表:单卡部署即可流畅运行,响应速度堪比人类对话,中小企业无需组建豪华算力团队;
- 行业微调零门槛:从医疗问诊到法律咨询,仅需百元级成本即可定制专属垂直模型,告别「通用模型水土不服」的尴尬;
- 知识边界突破:通过RAGFlow实现动态知识库接入,让模型实时「自我进化」,客户问题库就是你的训练数据集。
这一刻,技术垄断的坚冰正在崩裂。
DeepSeek Janus:重新定义AI的「进化论」
如果说R1是开疆拓土的利刃,Janus则是颠覆认知的「基因编辑器」:
- 多模态核爆级突破:文本、图像、代码三位一体,中小企业用一套模型即可打通营销文案、设计草图、程序开发全链路;
- 成本效益比拉满:训练能耗降低60%,推理速度提升3倍,让「用AI养AI」成为可能;
- 场景化开箱即用:预制电商、教育、金融等20+行业解决方案,创业者无需从零造轮子。
这不是AI的「平替」,而是技术民主化的里程碑。
开源不是口号,是刺向垄断的利剑
当OpenAI用API订阅费筑起护城河,DeepSeek选择将代码仓库彻底开放:
- MIT协议商用自由:无需授权费,不限应用场景,中小企业可基于R1打造自有品牌AI产品;
- 本地部署无后门:数据不出本地服务器,彻底解决隐私合规焦虑;
- 开发者生态共建:全球极客共同优化模型,每一次社区贡献都在降低你的使用成本。
这场开源革命,让「技术霸权」成了旧时代的遗物。
就在OpenAI等巨头紧握闭源生态、筑起技术高墙时。
DeepSeek以一场惊艳的「开源起义」,将顶级大模型R1与Janus全量开源,MIT协议商用零门槛!
这不是简单的技术迭代,而是一场为中小企业量身定制的「入场券」,让技术平权的火种在AI寒冬中熊熊燃烧。
我就想直接问一句: 能否基于DeepSeek低成本AI模型,构建企业内部专属的AGI(通用人工智能)?
中型企业的选择:DeepSeek R1微调和训练
中型企业至少能够支撑得起单次将近600万美元的训练成本。
DeepSeek R1是在2048块英伟达H800 GPU集群上运行55天完成的。这些GPU的使用费用是训练成本的主要部分。
考虑到GPU的租赁或购买成本、维护费用以及运行时的能耗等,这部分费用相对较高。约557.6万美元。
除此之外还需要专业AI算法人才。
所以,就算DeepSeek把价格打下来了,普通中小公司也是望尘莫及。
小型企业的选择1:DeepSeek R1 本地部署
难以训练新的模型,那我们就不训练,直接用现成的DeepSeek R1,然后进行本地部署。
想象一下,你不用再依赖别人的服务器,自己在家或者在公司就能搭建一个属于自己的 “智能小助手”。
这样一来,数据安全更有保障,不用担心信息泄露。而且响应速度也更快,用起来别提多爽了。
就好比你有了一个专属的私人秘书,随时待命,还绝对安全可靠。
下面就给大家讲讲具体的本地部署示例:
软硬件环境准备
- 硬件:一台配置还不错的电脑,内存至少 16GB,要是有 NVIDIA GPU(比如 NVIDIA RTX 2060 及以上)那就更完美了,计算速度能快不少。
- 软件:首先得安装 Python,建议版本在 3.7 及以上,它可是运行部署代码的基础。另外,还得安装
Ollama
,这是一个用于在本地运行大语言模型的轻量级框架,按照官网(https://ollama.com/ )的安装指南一步步来就行。安装好后,在终端输入ollama -v
,能显示版本号就说明安装成功啦。要是想指定模型的下载路径,比如新建个文件夹(如:H:\Ollama.ollama\models),然后在系统变量里新建个叫 OLLAMA_MODELS 的变量,把新建文件夹的路径填进去就好。
部署步骤
- 打开电脑上的终端,输入
ollama run deepseek-r1:1.5b
,这就启动了参数为 15 亿的 DeepSeek R1 模型版本。要是你的电脑性能够强,也可以试试运行更大参数版本的模型,不过可得注意对内存等硬件资源的高要求哦。
部署完成后的测试
等部署好后,咱得测试一下是不是能用。
在终端里按照提示输入一些简单的问题,比如 “今天天气怎么样?” 或者 “给我讲个笑话”,看看 DeepSeek R1 能不能给出合适的回答。
要是能顺利回答,那就说明部署成功啦,你已经拥有一个超厉害的本地智能小助手咯!
DeepSeek R1 结合 RAG
DeepSeek R1 结合 RAG(检索增强生成)技术,能让它的能力更上一层楼。
下面给大家详细讲讲具体示例:
数据准备
假设我们是一家电商企业,有大量的商品介绍文档、用户评价数据。
我们把这些数据整理好,放在一个专门的文件夹里。这些数据就是后续 RAG 系统的 “知识宝库”。
比如商品介绍文档里包含了商品的特性、功能、使用方法等信息,用户评价则反映了实际使用体验和常见问题。
代码实现
-
安装必要库:在命令行中输入
pip install langchain streamlit faiss-cpu huggingface-hub
,安装这些用于构建 RAG 系统的关键库。langchain
是强大的框架,帮我们处理文档、检索等;streamlit
用来搭建交互界面;`faiss-cpu
生成向量嵌入和构建向量数据库;huggingface-hub
方便获取模型和资源。
-
导入库:在 Python 代码里,先导入要用的库。
import streamlit as st
from langchain_community.document_loaders import TextLoader
from langchain_experimental.text_splitter import SemanticChunker
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
- 加载并处理文档:利用TextLoader加载整理好的商品数据文档。
loader = TextLoader('your_data_folder_path')
docs = loader.load()
- 文档分块:用SemanticChunker将文档分成小的语义块,方便后续处理。
text_splitter = SemanticChunker(HuggingFaceEmbeddings())
documents = text_splitter.split_documents(docs)
- 创建向量数据库:生成文档的向量嵌入,并存储到FAISS向量数据库。
embeddings = HuggingFaceEmbeddings()
vector_store = FAISS.from_documents(documents, embeddings)
retriever = vector_store.as_retriever(search_kwargs={
"k": 3})
- 配置 DeepSeek R1:实例化基于 DeepSeek R1 的RetrievalQAChain,并设置提示模板。
llm = Ollama(model="deepseek-r1:1.5b")
prompt = """
1. 仅使用以下上下文。
2. 如果不确定,说“我不知道”。
3. 回答保持简洁。
上下文:{context}
问题:{question}
回答:
"""
- 构建问答函数:把检索和生成过程结合,实现回答用户问题。
def answer_query(question):
context = retriever.retrieve(question)
combined_context = "\n".join(context)
response = llm.generate(prompt.format(context=combined_context, question=question))
return response.strip()
- 搭建 Web 界面:用streamlit创建一个简单界面,方便用户提问。
st.title("电商智能问答系统")
user_question = st.text_input("请输入你的问题:")
if user_question:
answer = answer_query(user_question)
st.write("回答:", answer)
运行测试
在终端运行streamlit run your_script_name.py
,把your_script_name.py
换成实际代码文件名。然后在浏览器打开指定 URL,就能使用这个结合 DeepSeek R1 和 RAG 的电商智能问答系统啦。比如输入 “某款手机的电池续航怎么样?” 系统就会从商品数据里检索相关内容,结合 DeepSeek R1 给出回答。
结语:未来属于敢于破局的人
DeepSeek的火种已点燃整个AI江湖。
这不是终点,而是一个新时代的起点——当技术高墙坍塌,当创新不再被算力绑架。
每一家中小企业的会议室里,都可能诞生下一个颠覆行业的AI奇迹。
记住:技术的终极使命,不是成为少数人的权杖,而是让每个人都能平等地站在未来面前。
这个除夕,DeepSeek给了世界一份最好的新年礼物——而你,准备好接住它了吗?
最后的最后,有需要独立部署和构建个人或企业内部专属AGI的,欢迎联系我,微信:kangweijian。
若觉得文章对你有帮助,随手『点赞』、『收藏』、『关注』,也是对我的支持。