博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
cuda by example
阅读量:5252 次
发布时间:2019-06-14

本文共 810 字,大约阅读时间需要 2 分钟。

int offset= x+y*dim
 
x 线程块内的线程索引
y 线程块索引
dim 线程块的维度
 
tid = threadIdx.x+blockIdx.x*blockDim.x

  

计算大于或等于128的最小倍数(127+x)/128
 
kernel<<<(x+127)/128,128>>>(a,b,c)

  

 
规约求和
 
int i= blockDim.x/2;while(i != 0){    if(cacheIndex < i)        cache[cacheIndex] += cache[cacheIndex + i];    __synthreads();    i /= 2;}

  

 
 
const int N = 33*1024const int threadsperblock = 256;const int blockpergrid = imin(32,(N+threadperblock-1)/threadsperblock); kernel<<
>>(a,b,c); __global__ static void kenel(int *a,int *b,int *c){ ... int tid = threadIdx.x+blockIdx.x*blockDim.x; ... while(tid

  

 
if(threadIdx.x % 2){    ...    __synthreads();}

  

这会造成 线程发散
    当某些线程需要执行一条指令,而其他线程不需要执行时,这种情况成为线程发散。
 
__synthreads会当所有的线程都执行后才释放,而有些线程如果不执行,那么kernel函数会无止境的等待。
 

转载于:https://www.cnblogs.com/xing901022/p/3312223.html

你可能感兴趣的文章
在工程中要加入新的错误弹出方法
查看>>
PS 滤镜— — sparkle 效果
查看>>
网站产品设计
查看>>
代理ARP
查看>>
go 学习笔记(4) ---项目结构
查看>>
java中静态代码块的用法 static用法详解
查看>>
Java线程面试题
查看>>
Paper Reading: Relation Networks for Object Detection
查看>>
day22 01 初识面向对象----简单的人狗大战小游戏
查看>>
mybatis源代码分析:深入了解mybatis延迟加载机制
查看>>
Flask三剑客
查看>>
Hibernate-缓存
查看>>
【BZOJ4516】生成魔咒(后缀自动机)
查看>>
提高PHP性能的10条建议
查看>>
svn“Previous operation has not finished; run 'cleanup' if it was interrupted“报错的解决方法...
查看>>
熟用TableView
查看>>
Java大数——a^b + b^a
查看>>
poj 3164 最小树形图(朱刘算法)
查看>>
服务器内存泄露 , 重启后恢复问题解决方案
查看>>
android一些细节问题
查看>>