SARENKA 开源项目教程

文章浏览阅读300次,点赞3次,收藏4次。SARENKA 开源项目教程 sarenka OSINT tool - gets data from services like shodan, censys etc. in one app 项目地址: https://gitco...
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

大模型新书丨Large Language Models: A Deep Dive,终于有一本全面且基础的大语言模型LLM入门教程书了(附PDF)

文章浏览阅读78次。不过上个月我翻看了一本24年8月出版的名为 《 Large Language Models: A Deep Dive》 的教程书,内容和书名完美匹配,真的是完美符合新手入门大语言模型(LLM)的需求,不仅全面还足够基础。
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

LLM - R1 强化学习 DRPO 策略优化 DAPO 与 Dr. GRPO 算法 教程

文章浏览阅读887次,点赞8次,收藏27次。在强化学习算法中,DAPO (Decoupled Clip and Dynamic Sampling Policy Optimization),通过解耦裁剪和动态采样策略提升模型的推理能力。Dr. GRPO (GRPO Done Right) 解决 GRPO 优化中的偏差问题,提出的改进方案,通过删除长度归一化项和标准差标准化项,解决 GRPO 可能导致错误响应逐渐变长的问题。_drpo优化
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

numpy报ValueError: Expected 96 from C header, got 88 from PyObject

文章浏览阅读1.1k次。numpy报ValueError: Expected 96 from C header, got 88 from PyObject,解决方案是将numpy版本改为2.0.0之前的任何版本_expected 96 from c header, got 88 from pyobject
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

【更新至2023年】2007-2023年各省环保支出数据(无缺失)

文章浏览阅读192次。【更新至2023年】2007-2023年各省环保支出数据(无缺失)
分类: 业界资讯 发布时间: 04-15 10:12 阅读次数: 0

LLM - 开源强化学习框架 OpenR1 的环境配置与训练参数 教程

文章浏览阅读658次,点赞13次,收藏5次。OpenR1 是一个开源的强化学习框架,复现 DeepSeek-R1 的训练流程,为研究人员和开发者提供了一个完整的推理优化训练工具链。该项目由 Hugging Face 发起,通过开源的方式,详细展示了从知识蒸馏到强化学习,再到多阶段训练的完整过程。OpenR1 包含了用于训练和评估模型以及生成合成数据的脚本,支持 GRPO 训练、监督微调(SFT)等多种训练方法。它还封装了多个开源框架,如 TRL 和 distilabel,方便用户快速上手。_llm 强化学习训练框架
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

2002-2023年各省少年儿童抚养比(人口抽样调查)数据

文章浏览阅读240次,点赞4次,收藏2次。2002-2023年各省少年儿童抚养比(人口抽样调查)数据
分类: 业界资讯 发布时间: 04-15 10:12 阅读次数: 0

python执行pip install -r requirements.txt 安装第三方库报 metadata-generation-failed

文章浏览阅读2.1k次,点赞4次,收藏8次。python执行pip install -r requirements.txt 安装第三方库报 metadata-generation-failed
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

Azure Tips and Tricks 项目使用教程

文章浏览阅读428次,点赞12次,收藏20次。Azure Tips and Tricks 项目使用教程 AzureTipsAndTricks Learn some of our favorite Azure tips and tricks—some long-standing, and new ones that have recently been added t...
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

LLM - 大模型的 参数量/计算量/激活值/KV Cache 的详细分析 教程

文章浏览阅读185次,点赞4次,收藏8次。在大模型中,参数量、计算量、激活值以及 KV Cache 是影响模型性能和资源消耗的关键因素。参数量通常与模型的复杂度成正比。计算量则与模型的前向和反向传播过程密切相关,Transformer 模型的计算量在使用 KV Cache 后会显著减少,因为 KV Cache 可以避免重复计算已经处理过的序列。激活值的显存占用在推理阶段尤为重要,其大小取决于序列长度、批次大小、隐藏层维度等因素,通常会随着批次大小的增加而显著增长。_大模型激活值分析paper
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

解决:由于没有远程桌面授权服务器可以提供许可证,远程会话连接已断开.请跟服务器管理员联系

文章浏览阅读2.7k次,点赞2次,收藏11次。由于没有远程桌面授权服务器可以提供许可证,远程会话连接已断开.请跟服务器管理员联系_由于没有远程桌面授权服务器可以提供许可证,远程会话连接已断开请跟服务器管理员
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

2004-2023年各省化学需氧量排放量数据(无缺失)

文章浏览阅读122次。2004-2023年各省化学需氧量数据(无缺失)
分类: 业界资讯 发布时间: 04-15 10:12 阅读次数: 0

区块链即服务(BaaS):企业区块链应用的便捷解决方案

文章浏览阅读1.4k次,点赞26次,收藏16次。区块链即服务是一种通过云平台提供的服务模式,使得企业和开发者可以便捷地部署、操作和管理区块链网络。BaaS平台为用户提供底层区块链基础设施的托管服务,管理网络的搭建、节点维护、智能合约部署和数据存储等繁琐任务,从而使企业可以专注于应用开发,而不必担心区块链基础设施的复杂性和技术挑战。_区块链即服务
分类: 企业开发 发布时间: 04-15 10:12 阅读次数: 0

FastHX 安装与配置指南

文章浏览阅读747次,点赞6次,收藏13次。FastHX 安装与配置指南 fasthx FastAPI and HTMX, the right way. 项目地址: https://gitcode.com/gh_mirrors/fa/fasthx ...
分类: 企业开发 发布时间: 04-15 10:11 阅读次数: 0

LLM - 推理大语言模型 DeepSeek-R1 论文简读

文章浏览阅读753次,点赞6次,收藏21次。DeepSeek-R1 通过强化学习,显著提升大语言模型推理能力,使用特殊的训练策略,其中 DeepSeek-R1-Zero 完全摒弃有监督微调(SFT),依靠强化学习训练,开创大模型训练中,跳过监督微调的先例。DeepSeek-R1 使用冷启动数据微调,通过多阶段强化学习,进一步优化推理能力。强化学习驱动的训练,不仅降低数据依赖,让模型在训练过程中,自发形成 "回头检查步骤" 的自我反思能力。
分类: 企业开发 发布时间: 04-15 10:11 阅读次数: 0

Mac 调整磁盘分区:调整本地与虚拟机内存分区占比

文章浏览阅读3.7k次。可参考第二条链接的方法,更加直接有效。如果你使用第一种方法分区,注意分区提示:“Unable to resize because file system volume format does not support resizing”-“无法调整大小,因为文件系统卷格式不支持调整大小”虚拟机分区所占的磁盘大小是无法直接进行大小更改的。如果你想要扩大本地分区磁盘大小,注意提示 :disk0s2 is an APFS Physical Store (use "diskutil apfs _disk0s2 is an apfs physical store (use "diskutil apfs resizecontainer" inste
分类: 移动开发 发布时间: 04-15 10:11 阅读次数: 0

2002-2023年各省老年人口抚养比(人口抽样调查)数据

文章浏览阅读236次,点赞8次,收藏5次。2002-2023年各省老年人口抚养比(人口抽样调查)数据
分类: 业界资讯 发布时间: 04-15 10:11 阅读次数: 0

百度网盘秒传链接转存/生成/转换工具使用教程

文章浏览阅读359次,点赞5次,收藏10次。百度网盘秒传链接转存/生成/转换工具使用教程 baidupan-rapidupload 百度网盘秒传链接转存/生成/转换 网页工具 (全平台可用) 项目地址: https://gitcode.com/gh_mirrors/bai/...
分类: 企业开发 发布时间: 04-15 10:11 阅读次数: 0

LLM - 大模型服务中处理 Badcase 的 SOP 教程

文章浏览阅读449次,点赞10次,收藏4次。在大模型服务中,处理 Badcase 是复杂且重要的任务。通过增加前置模块,过滤或处理显而易见的错误,例如敏感词检测、高频问题快速响应等。对于复杂的 Badcase,后处理模块对于模型输出,进行二次过滤或修正,比如模型可能产生的“幻觉”内容,进行过滤。调整 Prompt 也是有效的方法,通过优化输入的提示语,引导模型生成更符合需求的结果。如果 Badcase 的问题较为普遍且影响较大,也考虑对模型进行微调,通过有监督微调(SFT),让模型学习错误案例,提升整体性能。_大模型 sop
分类: 企业开发 发布时间: 04-15 10:11 阅读次数: 0

《使用 Bash 编写的命令行 LLM 接口 ell 安装与配置指南》

文章浏览阅读956次,点赞18次,收藏10次。《使用 Bash 编写的命令行 LLM 接口 ell 安装与配置指南》 ell A command-line interface for LLMs written in Bash. 项目地址: https://gitcode.co...
分类: 企业开发 发布时间: 04-15 10:11 阅读次数: 0