AI时代CIO如何应对GPU匮乏
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 通过采用模型优先的心态、优化利用率和战略性地运用负载平衡,首席信息官可以缓解芯片短缺。 译自How CIOs Can Battle GPU Poverty in the Age of AI,作者 Liam Crilly。 人工智能时代的淘金热已经到来,但对于许多公司来说,鹤嘴锄却处于缺货状态。随着人工智能需求的激增,一种被称为“GPU 匮乏”的现象正在困扰 CIO,其速度超过了建立数据中心以及更重要的是为其提供动力所需的芯片的能
UDEMY 报告:2024 年第一季度哪些 IT 技能需求量最大?
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” Informatica PowerCenter、Microsoft Playwright 和 Oracle Database SQL 位列 Udemy 最受欢迎技术课程榜首。 译自Udemy Report: Which IT Skills Are Most in Demand in Q1 2024?,作者 Megan Crouse。 通过在线学习技术行业课程,可以了解哪些 IT 技能需求量大,以及当今职业发展道路是什么样的。 U
Kubernetes十周年派对
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 在过去 10 年中,Kubernetes 已发展成为现代应用程序部署的支柱,并彻底改变了创新的进程。Kubernetes 是第一个被接受进入… 译自Kubernetes is turning 10! Join the party on June 6th,作者 Posted。 在过去的十年中,Kubernetes已发展成为现代应用程序部署的支柱,并彻底改变了创新的进程。Kubernetes 是第一个被接受进入 CNCF 孵化器的项
精彩回顾 | 「AI 驱动增长,研发数智化升级」分享沙龙成功举办
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” AI 应用元年,人工智能技术将如何助力企业发展新质生产力,构建增长动能? 日前,LigaAI 与深圳市企业联合会、西云数据联合举办了「AI 驱动增长,研发数智化升级」技术专题沙龙。本次活动围绕「AI+」应用实践,邀请到 LigaAI 联合创始人兼 CTO 张思、西云数据高级解决方案架构师王高雄分享生成式 AI 在具体工作及业务场景中的落地经验;到场嘉宾们还就「智能化手段对研发效能的提升及对企业增长的影响」展开了交流与探讨。 活动
LigaAI x 极狐GitLab,共探 AI 时代研发提效新范式
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 近日,LigaAI 和极狐GitLab 宣布合作,双方将一起探索 AI 时代的研发效能新范式,提供 AI 赋能的一站式研发效能解决方案,让 AI 成为中国程序员和企业发展的新质生产力。 软件研发是一个涉及人员多、流程多、系统多的复杂工程,LigaAI 和极狐GitLab 一直在积极探索安全、高效交付的方式。LigaAI 在「AI+研发协作」领域持续创新多年。作为以人工智能技术为核心的新一代智能研发协作平台,LigaAI 通过 A
GreptimeDB v0.6 发布 | 支持 Datanodes 间迁移数据表 Region
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 2024 年新年伊始,Greptime 团队携新年的活力,持续进行紧锣密鼓的版本迭代。继上一次更新后,仅仅三周我们的开源时序数据库就又迎来了一个更加强大、功能丰富的新版本——GreptimeDB v0.6。 接下来我们将介绍 GreptimeDB v0.6 的主要版本改进: v0.6 功能上新 其他亮点更新 Region Migration 在 v0.5 版本中,我们引入了对 Kafka WAL 的支持,使得在多个 Datano
GreptimeAI + Xinference 联合方案:高效部署并监控你的 LLM 应用
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 随着人工智能技术的迅速进步,OpenAI 已经崭露头角,成为该领域的领军者之一。它在多种语言处理任务上表现卓越,包括机器翻译、文本分类和文本生成等方面。随着 OpenAI 的兴起,同时涌现的还有许多其他优质的开源大语言模型,比如 Llama,ChatGLM,Qwen 等等,这些优秀的开源模型也可以帮助团队快速地搭建出一个出色的 LLM 应用。 但面对如此多的选择,如何在减少开发成本的同时,能够统一地使用 OpenAI 的接口?如
记一次 Rust 内存泄漏排查之旅 | 经验总结篇
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 在某次持续压测过程中,我们发现 GreptimeDB 的 Frontend 节点内存即使在请求量平稳的阶段也在持续上涨,直至被 OOM kill。我们判断 Frontend 应该是有内存泄漏了,于是开启了排查内存泄漏之旅。 Heap Profiling 大型项目几乎不可能只通过看代码就能找到内存泄漏的地方。所以我们首先要对程序的内存用量做统计分析。幸运的是,GreptimeDB 使用的 jemalloc 自带 heap prof
用户案例|GreptimeDB 助力贵州某机场智慧能源物联网系统
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 近年来,云计算和物联网技术的飞速发展促使许多传统单位的用电、用能系统向数字化、信息化、智能化的方向迈进,旨在实现全过程的实时智能协同,提高生产效率。而随着电力采集、监测数据功能的不断增强,数据量也在不断增加,这就需要一套更高效的数据库系统来存储、分析数据,进而挖掘更大的价值。 GreptimeDB 作为一款具有分布式、开源、云原生和兼容性强等特点的时序数据库,自开源以来强有力地支撑了能源物联网平台、金融可观测、新能源汽车数据存储
时序数据高基问题揭秘:根因分析与解决之道
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” What is High-Cardinality 基数(Cardinality) 在数学中定义是用来代表集合元素个数的标量,比如对于有限集合 A = {a, b, c} 的基数就是 3,对于无限集合也有一个基数概念,今天主要谈论计算机领域,就不在这里展开。 在数据库的上下文里面,基数并没有严格的定义,但大家对基数的共识也类似可借鉴数学中的定义:用来衡量数据列包含的不同数值的个数多少。比如说一个记录用户的数据表,通常有 UID,
时序数据库入门 | 时序数据库的特点及与传统数据库的区别详解
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 在过去的几年里,物联网(IoT)的日益普及和对实时数据的需求导致时序数据库(TSDB)的采用量大幅增长。根据 DB-Engines 的排名,TSDB 的普及率超过了其他任何类型的数据库,仅次于 Graph DBMS。 作为存储、管理和分析时序数据的重要工具,对时序数据库 (TSDB) 的需求在未来也很可能会持续上升。如果你对此还不太了解,本文将全面地介绍什么是时序数据库,以及为什么需要有针对时序数据的数据库。 什么是时序数据 谈
GreptimeDB v0.7 发布 — 全面支持云原生监控场景
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 就在上周,我们公布了 GreptimeDB 2024 路线图,揭示了今年 GreptimeDB 的几个重大版本计划。随着三月初春的到来,首个适用于生产级别的 GreptimeDB 开源版也在万物复苏的“惊蛰”时节如约而至。v0.7 版本标志着我们向生产就绪版本迈出的重要一步,我们欢迎社区的每一位成员积极参与使用,并提供宝贵的反馈意见。 从 v0.6 到 v0.7,Greptime 团队取得了显著的进步:累计合并了 184 个 C
Sermant在异地多活场景下的实践
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 本文分享自华为云社区《Sermant在异地多活场景下的实践》,作者:华为云开源。 Sermant社区在1.3.0和1.4.0版本相继推出了消息队列禁止消费插件和数据库禁写插件,分别用于解决异地多活场景下的故障切流和保护数据一致性问题。本文将对Sermant在异地多活场景下的实践进行剖析。 一、异地多活 1.1 什么是异地多活 对于一个软件系统,我们希望当系统出现故障时仍然可以正常对外提供服务,软件系统的这种特性称之为高可用, 异
华为云开发者桌面全新发布CodeArts IDE for Python,极致优雅云原生开发体验
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 本文分享自华为云社区《华为云发布CodeArts IDE for Python,极致优雅云原生开发体验》,作者:华为云头条。 近日,华为云正式发布CodeArts IDE for Python,这是一款内置华为自主创新的Python语言服务,提供智能编程、灵活调试能力的可扩展桌面开发工具,为华为云开发者提供卓越Python编码体验。 Python 作为一种编程语言,广泛用于 Web 应用程序、软件开发、数据科学和机器学习 (ML
理论+实践,带你了解分布式训练
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练(Distributed Training)系统来解决海量的计算和内存资源要求问题。 在分布式训练系统环境下需要将一个模型训练任务拆分成多个子任务,并将子任务分发给多个计算设备,从而解决资源瓶颈。但是如何才能利用包括数万计算加速芯片
12 个监控指标确保 API 策略成功
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 原文作者:Andrew Stiefel of F5 原文链接:12 个监控指标确保 API 策略成功 转载来源:NGINX 开源社区 NGINX 唯一中文官方社区 ,尽在 nginx.org.cn 随着公司采用 API 优先的设计实践来构建现代应用,衡量这些 API 的运行性能和价值成为当务之急。构建一个可明确定义 API 指标并将其与关键绩效指标 (KPI) 挂钩的框架是确保 API 策略成功的最重要步骤之一。 通常情况下,K
全面提升 RAG 质量!Zilliz 携手智源集成 Sparse Embedding、Reranker 等多种 BGE 开源模型
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” Zilliz 持续为 AI 应用开发者赋能! 近期,Zilliz 与智源研究院达成合作,将多种 BGE(BAAI General Embedding) 开源模型与开源向量数据库 Milvus 集成。得益于 Milvus 2.4 最新推出的 Sparse Vector(稀疏向量)和 Multi-vector(多向量)支持,开发者获得了多种选择,不仅有业界广泛采用的 Dense Embedding(稠密向量模型),还能使用 BGE
RAG 修炼手册|揭秘 RAG 时代的新向量数据库
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。 不过,有很多朋友对于向量数据库和 RAG 的关系及技术原理并不清楚,本文将带大家深入了解 RAG 时代的新向量数据库。 01. RAG 的广泛应用及其独特优势 一个典型的 RAG 框架可以分为检索器(Retriever)和生成器(Gen
海外市场成 ISV 新掘金地?生成式 AI 如何加速业务创新实践?Zilliz 有话说
开源中国社区团队直播首秀,以分享为名讲述开源中国社区背后的故事” 期望了解 Zilliz 最新动态?想要与 Zilliz 线下探讨 AI 时代向量数据库的全球化布局思考及典型实践? 机会来啦!5 月 10 日,Zilliz 将闪现亚马逊云科技的两场活动现场(苏州、西安),与大家共话行业发展与未来,欢迎报名围观! 01.无界向新 智链全球,亚马逊云科技出海全球化城市巡展暨走进产业带 从“数字化出海”到“出海数字化”,海外市场正在成为 ISV(独立软件开发商)的新掘金地。然而,这一过程也面临产业环
今日推荐
周排行