稀疏矩阵的CSR存储方式 - 代码天地

稀疏矩阵的CSR存储方式

企业开发 2023-06-21 10:10:38 阅读次数: 0

稀疏矩阵是数值计算中普遍存在的一类矩阵，主要特点是绝大部分的矩阵元为零。对于矩阵维度比较小的情况，利用稀疏矩阵特殊性并不能完全发挥优势。然而对于大型矩阵，例如矩阵维度超过10000，那么稀疏矩阵不仅节省存储空间，并且可以让线性代数算法得到极大的加速。比如大部分稀疏矩阵的算法均基于递推方法求解，即主要依赖于矩阵矢量乘法，这样很容易知道利用稀疏性可以优化该类算法的时间复杂度。

稀疏矩阵的存储格式往往依赖具体问题中稀疏矩阵的特征，因此其格式比较多。其中一部分是相对简单而又普遍使用的。例如下面列出的格式，均广泛使用。这篇文章主要介绍每种存储类型实现的基本想法。

CSR(compressed sparse row)

CSR包含三个数组（所有的index从0开始）：

data，用来存储矩阵中的非零元素的值；
indices，第 i 个元素记录了 data[i] 元素的列数；
index pointers, 第 i 个元素记录了前 i - 1 行包含的非零元素的数量。

对于第 i 行而言，该行中非零元素的列索引为 indices[indptr[i]:indptr[i+1]]
根据 indptr[i + 1] - indptr[i]，我就得到了该行中的非零元素个数，如：
- 若 indptr[i] = 3 且 indptr[i+1] = 3 ，则第 i 行没有非零元素
- 若 indptr[i] = 6 且 indptr[i+1] = 8, 则第 i 行有两个非零元素，且列索引为 indices[indptr[i]:indptr[i+1]]
得到了行索引、列索引，相应的数据存放在： data[indptr[i]:indptr[i+1]]

对于矩阵第 0 行
indptr[1] - indptr[0] = 2, 可知第 0 行有 2 个元素。
他们的列索引为 indices[0] = 0, indices[1] = 2。
存放的元素为 data[0] = 8, data[1] = 2。
两个元素对应矩阵中索引分别为 [0, 0], [0, 2]

对于矩阵第 4 行

indptr[5] - indptr[4] = 6 - 3 = 3, 可知第 4 行有 3 个元素。
他们的列索引为 indices[3] = 2, indices[4] = 3, indices[5] = 4。
存放的元素为 data[3] = 7, data[4] = 1, data[5] = 2。
两个元素对应矩阵中索引分别为 [4, 2], [4, 3], [4, 4]

稀疏矩阵其他的存储方式还有很多，后面会慢慢介绍。

猜你喜欢

转载自blog.csdn.net/weixin_45773137/article/details/124828608

稀疏矩阵的CSR存储方式

稀疏矩阵存储方式之CSR\CSC

稀疏矩阵的存储方式

Fortran：用csr存储格式并使用pardiso求解稀疏矩阵

稀疏矩阵的存储方法（DOK、LIL、COO、CSR, CRS）

稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB

Spark中稀疏矩阵的存储方式

scipy:csr_matrix稀疏行矩阵

COO 与 CSR 稀疏矩阵存取格式；

稀疏矩阵的压缩存储

对称矩阵、对角矩阵、稀疏矩阵等特殊矩阵的压缩存储方式

sparse.csr_matrix矩阵的压缩存储

基本运算符优先级存储方式及实现（树的方式，稀疏矩阵的压缩存储）

python稀疏矩阵的存储与表示

稀疏矩阵的存储及乘法实现

数组12——稀疏矩阵的压缩存储2——稀疏矩阵的相加

词频矩阵TfidfVectorizer结果与稀疏矩阵csr_matrix的遍历

词频矩阵TfidfVectorizer结果与稀疏矩阵csr_matrix的遍历

python稀疏矩阵scipy.sparse中的csr_matrix和csc_matrix的详细解析

【算法学习】稀疏矩阵乘法 SpMV 压缩方法 CSR/CRS

数组的存储结构、特殊矩阵和稀疏矩阵的压缩存储

spark 稀疏矩阵存储详细揭秘

稀疏矩阵的三种存储方法

稀疏矩阵的存储和乘法操作

稀疏矩阵的十字链表存储

稀疏矩阵的压缩存储及其操作

对称矩阵，上下三角矩阵，对角矩阵，稀疏矩阵的压缩存储，十字链表三元组方式创建稀疏矩阵阵并进行算术运算

python稀疏矩阵得到每列最大k项的值，对list内为类对象的排序(scipy.sparse.csr.csr_matrix)

稀疏矩阵（稀疏数组）

稀疏矩阵

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)