cuda中使用二维矩阵
一 代码
需要注意的是在cuda中,二维指针的用法和一维的不同,需要增加一个转换的过程
// #include<torch.h>
#include<stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>
template <typename T>
__global__ void my_index_put_kernel(T** src,
int * idx, int row_idx,
T** value,
T** dst, bool accumulate) {
// if(blockIdx.x == idx)
printf("hello kernel = %d\n",blockIdx.x);
printf("test = %d\n",idx[2]);
printf("src = %lf\n",src[0][0]);
// for(int i = 0 ; i < row_idx; i ++)
// {
// printf("value = %f\n",value[blockIdx.x][i]);
// dst[blo
原文地址:https://blog.csdn.net/youzjuer/article/details/142355603
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!