我是CUDA编程的新手,我想知道如何将pyCUDA的性能与纯C中实现的程序进行比较.
表现会大致相同吗?有没有我应该注意的瓶颈?
表现会大致相同吗?有没有我应该注意的瓶颈?
编辑:
我显然试图google这个问题,并惊讶地没有找到任何信息.那就是我会有例外,pyCUDA的人们在他们的FAQ中回答了这个问题.
解决方法
如果您正在使用CUDA(无论是直接通过C还是使用pyCUDA),您所做的全部重要数值工作都是在gpu中执行的内核完成的,并以CUDA C(直接由您或间接地以元素方式)内核).因此,您的代码的这些部分的性能应该没有真正的差异.
现在,数组的初始化和任何后期工作分析都将在python(可能是numpy)中完成,如果你使用pyCUDA,而且通常会比编译语言中直接执行的要慢得多(尽管如此,建立您的numpy / scipy,使其直接链接到高性能库,那么这些调用至少会以任一种语言执行相同的方式).但希望您的初始化和最终定稿是您必须做的总工作量的小部分,所以即使在那里存在重大开销,仍然希望对整体运行时不会产生巨大的影响.
事实上,如果事实证明计算的python部分会影响你的应用程序的性能,那么开始在pyCUDA开发你的开发可能仍然是一个很好的开始的方式,因为开发变得更加容易,在直接C中实现Python中太慢的代码,并从python中调用这些代码,从而获得了两个世界中最好的一些.
@H_502_6@ @H_502_6@ 原文链接:https://www.f2er.com/c/114749.html