【转】C代码利用CPU L1 cache一秒内算出十亿以内质数的个数 - 代码天地

【转】C代码利用CPU L1 cache一秒内算出十亿以内质数的个数

企业开发 2024-01-08 21:58:22 阅读次数: 0

我去年发表了一篇 Python 代码＋Numpy 库 + Sieve算法实现一秒内计算出一亿以内的质数的个数：

https://blog.csdn.net/Scott0902/article/details/128193368

今天在 GitHub 上找到国外牛人在三年前已经用 C 语言编写出利用 CPU L1 cache 来进行超高速计算的代码。学过计算机原理的你应该知道，CPU一级缓存的读取是最快的。别说一亿了，连十亿以内的质数个数在不到一秒内也能算出来，简直是计算性能的天花板！

源代码文件名：sieve_eratosthenes.c

需要注意的是 segmented_sieve 函数里有一个 printf 语句输出质数，运行时会不停地在屏幕打印质数，所以要把这一行注释掉，否则运行时有排等。

我在 Windows 10 使用 clang 编译成功。

运行时第一步：

必须先输入你的 CPU 的每个线程的 L1 cache 容量，单位是字节。这个数怎么找？方法有很多，Win10 自带的任务管理器有得看，或者使用专业的 CPU-Z、AIDA64 等工具查看也能快速找到。

第二步：输入范围，以十亿为例，就是 1 后面加九个零。

我试着第一步输入 131072，也就是 128KB，第二步输入十亿，计算耗时：1.434 秒。

我再试调整第一步输入值，发现 L1 cache 输入值越大，计算耗时越长，输入值越小，计算越快。

输入值为 4096 时，计算耗时最短：只有 0.816 秒，计算质数个数的结果都一样，快得令人惊掉下巴！

代码我就不贴上来了，感兴趣的朋友请移步到牛人的 GitHub 项目地址：https://github.com/TotallyNotChase/cFastSieve

猜你喜欢

转载自blog.csdn.net/Scott0902/article/details/134662294

【转】C代码利用CPU L1 cache一秒内算出十亿以内质数的个数

CPU缓存会分为一级缓存L1、L2、L3

L1 Cache architecture in ARM

为什么CPU缓存会分为一级缓存L1、L2、L3？有什么意义？

L1与L2正则(转)

L1,L2正则化代码

天啦噜！知道硬盘很慢，但没想到比 CPU L1 Cache 慢 10000000 倍

一种利用 Cumulative Penalty 训练 L1 正则 Log-linear 模型的随机梯度下降法

Caputo 分数阶一维问题基于 L1 逼近的快速差分方法(附Matlab代码)

Intel CPU L1,L2,L3 arch

CPU缓存L1,L2和L3是什么？如何工作?

天梯赛L1（c//c++）星炎

(L1) AudioService.VolumeStreamState 代码走读与设计思考

三十七、L1，L2，L3 Cache究竟在哪里

C 两个链表中数据节点的数据域为一个字母，其中L1包含L2，在L1中找出与L2相等的字串，并将其逆置

How L1 and L2 CPU Caches Work, and Why They’re an Essential Part of Modern Chips

L1 Cache, L2 Cache读取命中率与时钟周期计算

Caputo 分数阶一维问题基于 L1 逼近的空间二阶方法(附Matlab代码)

【转】L1正则化和L2正则化的理解

机器学习中L1和L2正则化的一些阐述

机器学习L1和L2范式和归一化

L1、L2正则化；归一化与标准化

一文看懂L1、L2正则化的区别

给定一个单链表 L 的头节点 head ，单链表 L 表示为：L0 → L1 → … → Ln - 1 → Ln请将其重新排列后变为：L0 → Ln → L1 → Ln - 1

机器学习中的范数规则化之（一）L0、L1与L2范数

ARM基础(4)：L1 Cache之I-Cache和D-cache详解

SSD、内存和 L1 Cache 相比速度差多少倍

make menuconfig关闭imx6q开发板的L1 cache/L2 cache

『ACM C++』 PTA 天梯赛练习集L1 | 001-006

『ACM C++』 PTA 天梯赛练习集L1 | 007-0011

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)