【C++】如何提高Cache的命中率，示例 - 代码天地

【C++】如何提高Cache的命中率，示例

其他 2018-12-04 13:17:58 阅读次数: 0

参考链接 https://stackoverflow.com/questions/16699247/what-is-a-cache-friendly-code

只是堆积：缓存不友好与缓存友好代码的典型例子是矩阵乘法的“缓存阻塞”。

朴素矩阵乘法看起来像

for(i=0;i<N;i++) {
   for(j=0;j<N;j++) {
      dest[i][j] = 0;
      for( k==;k<N;i++) {
         dest[i][j] += src1[i][k] * src2[k][j];
      }
   }
}

如果N很大，例如，如果N * sizeof(elemType)大于高速缓存大小，那么每次访问都src2[k][j]将是高速缓存未命中。

有许多不同的方法可以为缓存优化它。这是一个非常简单的示例：不是在内部循环中每个缓存行读取一个项目，而是使用所有项目：

int itemsPerCacheLine = CacheLineSize / sizeof(elemType);

for(i=0;i<N;i++) {
   for(j=0;j<N;j += itemsPerCacheLine ) {
      for(jj=0;jj<itemsPerCacheLine; jj+) {
         dest[i][j+jj] = 0;
      }
      for( k==;k<N;i++) {
         for(jj=0;jj<itemsPerCacheLine; jj+) {
            dest[i][j+jj] += src1[i][k] * src2[k][j+jj];
         }
      }
   }
}

如果高速缓存行大小为64字节，并且我们在32位（4字节）浮点数上运行，则每个高速缓存行有16个项目。通过这种简单的转换，缓存未命中的数量减少了大约16倍。

Fancier转换在2D图块上运行，针对多个缓存（L1，L2，TLB）进行优化，等等。

谷歌搜索“缓存阻塞”的一些结果：

http://stumptown.cc.gt.atl.ga.us/cse6230-hpcta-fa11/slides/11a-matmul-goto.pdf

http://software.intel.com/en-us/articles/cache-blocking-techniques

一个优化的缓存阻塞算法的精彩视频动画。

http://www.youtube.com/watch?v=IFWgwGMMrh0

循环平铺非常密切相关：

http://en.wikipedia.org/wiki/Loop_tiling

猜你喜欢

转载自www.cnblogs.com/luoyinjie/p/10063432.html

【C++】如何提高Cache的命中率，示例

如何提高缓存命中率

MySQL缓存命中率概述及如何提高缓存命中率

cache和命中率的问题

查看nginx cache命中率

对缓存的思考——提高命中率

一个矩阵乘积到底经历几次cache失效+矩阵分块到底怎么提高cache命中率！！

如何查看mongodb的索引命中率

分布式缓存 --- Redis 如何提高缓存命中率

Linux性能学习（1.2）：CPU_如何提高CPU缓存命中率

[存储器] 简述影响 Cache 命中率的因素

缓存命中率

Oracle数据库提高命中率及相关优化

L1 Cache, L2 Cache读取命中率与时钟周期计算

redis命中率计算

squid 查看命中率

redis缓存命中率

mysql索引的命中率

使用lua统计nginx cache的缓存命中率（openresty版）

Linux的page cache使用情况/命中率查看和操控

cache命中率对程序运行时间的影响真的很大吗？

[转]memcached提高命中率，memcached server LRU 深入分析

【他山之玉】提高文章命中率的秘诀-马臻

Memcache分布式交叉存储实现nginx访问速度与命中率的提高

架构师日记——规划Varnish的缓存大小和提高命中率

postgresql 查看tablespace命中率

memcache 缓存命中率查看

nginx缓存命中率统计(转)

Oracle 检查命中率的SQL

Oracle调优命中率等

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)