CUDA实现高效查找--审核未通过？

其他 2021-11-28 23:05:13 阅读次数: 0

#include <stdio.h>
#include <vector>
#include <iostream>

using namespace std;

void __global__ bisearch(int *d, int *dval, int *pos, const int N);

void __global__ bisearch(int *d, int *dval, int *pos, const int N)
{
    
    

    int tid = blockDim.x * blockIdx.x + threadIdx.x;
    if(tid < N)
    {
    
    
       if(d[tid] == *dval)
       {
    
    *pos = tid;}
    }
}


int main(int argc, char *arcv[])

{
    
    
    if(argc<3)
    {
    
    
        printf("assignment is not enough!");
    }

    int N = atoi(arcv[1]);
    int val = atoi(arcv[2]);

    // host memory
    int hpos = -1;
    int a[N] = {
    
    0,1,2};
    vector<int> vec(a,a+N);
    
    /*  
    for(int i=0; i<N; i++)
    {
        vec.push_back(i);
    }

    cout<< vec[0] <<endl;
    cout<< vec[1] <<endl;
    cout<< vec[2] << endl;
    cout<< val<<endl;
    */

    int *h;
    h = (int *)&vec[0];
    
    // device memory
    int *d;
    cudaMalloc(&d, sizeof(int)*N);
    int *dval;
    cudaMalloc(&dval, sizeof(int));
    int *dpos;
    cudaMalloc(&dpos, sizeof(int));


    // host --> device
    cudaMemcpy( d, h, sizeof(int)*N,cudaMemcpyHostToDevice);
    cudaMemcpy( dval, &val, sizeof(int), cudaMemcpyHostToDevice);
    cudaMemcpy( dpos, &hpos, sizeof(int), cudaMemcpyHostToDevice);

    // threads and blocks

    const int block_size = 128;
    const int grid_size = (N + block_size -1) / block_size;

    bisearch<<<grid_size,block_size>>>(d, dval, dpos, N);

    // cuda to cpu
    cudaMemcpy( &hpos, dpos, sizeof(int), cudaMemcpyDeviceToHost   );
    



    printf("Ans: %d\n", hpos);


    // free memory
    cudaFree(d);
    cudaFree(dval);
    cudaFree(dpos);

    return 0;
    

}

总结

vector不太会用；vector定义需要使用using namespace std；

猜你喜欢

转载自blog.csdn.net/wulele2/article/details/118944799

CUDA实现高效查找--审核未通过？

CSDN - - 待审核或审核未通过 - - 分析

ios 审核未通过相机相册权限问题

京东白条提现审核未通过怎么办

dedeCMS解决问题：“用户资料尚未通过审核，因此空间禁止访问”？

365被黑提取账号异常风控审核一直未通过怎么办

电信营业厅审核未通过？教你如何解决

hdu 5039 未通过

1004尚未通过

小程序审核未通过，涉及平台未开放业务，小程序代码发布内容不符合规则

Mybatis(一)未通过反射接口实现查询操作.通过实现接口

小程序版本审核未通过，需在开发者后台「版本管理—提交审核——小程序订单中心path」设置订单中心页path，请设置后再提交代码审核

两个月前发布的文章，好端端地审核未通过了，不知CSDN在搞什么鬼啊！

未通过——1047 Student List for Course (25)

剑指offer未通过题汇总：

PAT乙级1007（编译未通过）

CodeWars -Good vs Evil（未通过）

如何实现一个高效的Softmax CUDA kernel？

通过分组函数实现高效查询

FlutterGen：通过Codegen实现资源的高效访问

【未通过】LintCode #366 斐波纳契数列

aui-autocomplete [ 二 ] 验证未通过保留输入值

并发测试未通过，自己使用jmeter寻找性能瓶颈

未通过的检查项，必须填写长度大于1的备注。

解决nginx https下 ATS检测未通过的思路

剑指offer——数组中的逆序对（调试未通过）

NOIP生活大爆炸版石头剪刀布(未通过）

留学生论文未通过不能毕业的救急之道

【FOJ】Problem 1065 Alpha Centauri Tennis（WA，未通过）

vue提交表单未通过表单验证，光标移动到第一个校验未通过的地方

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)