自学内容网 自学内容网

cuda中使用二维矩阵

一 代码

需要注意的是在cuda中,二维指针的用法和一维的不同,需要增加一个转换的过程


// #include<torch.h>
#include<stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>


template <typename T>
__global__ void my_index_put_kernel(T** src,
                            int * idx, int  row_idx,
                           T**  value,
                            T** dst, bool accumulate) {
    // if(blockIdx.x == idx)
    printf("hello kernel = %d\n",blockIdx.x);
    printf("test = %d\n",idx[2]);
    printf("src = %lf\n",src[0][0]);
    // for(int i = 0 ; i < row_idx; i ++)
    // {
    //     printf("value = %f\n",value[blockIdx.x][i]);
    //     dst[blo

原文地址:https://blog.csdn.net/youzjuer/article/details/142355603

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!