我是C,C和OpenCL的新手,并尽力在现在学习.这是一个预先存在的C函数,我试图找出如何使用C或C绑定到OpenCL.
#include <vector> using namespace std; class Test { private: double a; vector<double> b; vector<long> c; vector<vector<double> > d; public: double foo(long x,double y) { // mathematical operations // using x,y,a,b,c,d // and also b.size() // to calculate return value return 0.0; } };
大体上我的问题是如何传递这个函数访问绑定和内核的所有类成员.我知道如何传递标量值,但我不知道的向量值.有可能有一种方式来传递给上述每个成员或内存的指针,以便OpenCL的视图与主机内存同步吗?打破我的问题如下.
>如果将成员b和c传递给可变大小的绑定和内核,我该如何传递?
>如果它是二维的,我如何通过会员d?
>如何从内核中访问这些成员以及在内核的参数中声明哪些类型?将简单地使用数组索引符号,即b [0]可以访问?
>如何在内核函数中调用与b.size()相当的操作,否则我不会将其作为额外的参数传递到绑定到内核中的大小?如果改变会发生什么?
非常感谢.
解决方法
>您必须分配一个OpenCL缓冲区并将您的cpu数据复制到其中. OpenCL缓冲区具有固定的大小,因此如果数据大小发生变化或者使其“足够大”,则必须重新创建它,如果需要更少的内存,则只能使用它的一部分.例如,为b创建缓冲区,同时将其所有数据复制到设备:
cl_mem buffer_b = clCreateBuffer( context,// OpenCL context CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,// Only read access from kernel,// copy data from host sizeof(cl_double) * b.size(),// Buffer size in bytes &b[0],// Pointer to data to copy &errorcode); // Return code
也可以直接映射主机内存(CL_MEM_USE_HOST_PTR),但是在创建缓冲区之后,这对对齐方式和对主机内存的访问会产生一些限制.基本上,当您当前没有映射它时,主机内存可能包含垃圾.
>这取决于第二维中向量的大小是否相等?然后在将它们上传到OpenCL设备时将其平坦化.否则会变得更加复杂.
>在内核中声明缓冲区参数为__global指针.例如,__global double * b将适合于在1中创建的缓冲区.您可以使用内核中的数组符号来访问缓冲区中的各个元素.
>您不能从内核中查询缓冲区大小,因此必须手动传递.这也可以隐含地发生,例如.如果工作项数与b的大小相匹配.
可以访问计算所有数据的内核可能如下所示:
__kernel void foo(long x,double y,double a,__global double* b,int b_size,__global long* c,__global double* d,__global double* result) { // Here be dragons *result = 0.0; }
请注意,您还必须为结果分配内存.如果需要,可能需要传递额外的大小参数.你会调用内核如下:
// Create/fill buffers // ... // Set arguments clSetKernelArg(kernel,sizeof(cl_long),&x); clSetKernelArg(kernel,1,sizeof(cl_double),&y); clSetKernelArg(kernel,2,&a); clSetKernelArg(kernel,3,sizeof(cl_mem),&b_buffer); cl_int b_size = b.size(); clSetKernelArg(kernel,4,sizeof(cl_int),&b_size); clSetKernelArg(kernel,5,&c_buffer); clSetKernelArg(kernel,6,&d_buffer); clSetKernelArg(kernel,7,&result_buffer); // Enqueue kernel clEnqueueNDRangeKernel(queue,kernel,/* ... depends on your domain */); // Read back result cl_double result; clEnqueueReadBuffer(queue,result_buffer,CL_TRUE,&result,NULL,NULL);