我正在学习使用Rootbeer,但当我运行它的示例应用程序时,我被卡住了,没有人能回答我的问题:Rootbeer runtime error, how to fix?
所以我下载了Rootbeer的源代码,并查看了代码,这就是CUDAContext.java:119的问题所在
public void setKernel(Kernel kernelTemplate) {
this.kernelTemplate = kernelTemplate;
[ 119 ] this.compiledKernel = (CompiledKernel) kernelTemplate;
}内核和CompiledKernel的定义是:
public interface Kernel
{
public void gpuMethod();
}
public interface CompiledKernel
{
public String getCodeUnix();
public String getCodeWindows();
public int getNullPointerNumber();
public int getOutOfMemoryNumber();
public String getCubin32();
public int getCubin32Size();
public boolean getCubin32Error();
public String getCubin64();
public int getCubin64Size();
public boolean getCubin64Error();
public Serializer getSerializer(Memory memory,Memory memory1);
public boolean isUsingGarbageCollector();
}第119行中的强制转换是否正确?如果是,为什么我会收到这样的错误:
java.lang.ClassCastException: ArrayMult cannot be cast to org.trifort.rootbeer.runtime.CompiledKernel
at org.trifort.rootbeer.runtime.CUDAContext.setKernel(CUDAContext.java:119)如果它没有正确完成,那么正确的转换方式是什么呢?
编辑:以下是示例代码
import java.util.List;
import java.util.ArrayList;
import org.trifort.rootbeer.runtime.Kernel;
import org.trifort.rootbeer.runtime.Rootbeer;
public class ArrayMultApp
{
public ArrayMultApp()
{
int[] array=new int[10];
for (int i=0;i<array.length;++i) array[i]=i;
for (int i=0;i<array.length;++i) Out("start array["+i+"]: "+array[i]);
multArray(array);
for (int i=0;i<array.length;++i) Out("final array["+i+"]: "+array[i]);
}
public void multArray(int[] array)
{
try
{
List<Kernel> jobs=new ArrayList();
for (int i=0;i<array.length;++i) jobs.add(new ArrayMult(array,i));
Rootbeer rootbeer=new Rootbeer();
rootbeer.run(jobs);
}
catch (Exception e) { e.printStackTrace(); }
}
public static void main(String[] args) { ArrayMultApp app=new ArrayMultApp(); }
private static void out(String message) { System.out.print(message); }
private static void Out(String message) { System.out.println(message); }
}
class ArrayMult implements Kernel
{
private int[] m_source;
private int m_index;
public ArrayMult(int[] source,int index)
{
m_source=source;
m_index=index;
}
public void gpuMethod() { m_source[m_index]*=11; }
}发布于 2014-12-15 00:32:11
不,不是。您有两个不同的接口。
public void setKernel(Kernel kernelTemplate) {
this.kernelTemplate = kernelTemplate;
[ 119 ] this.compiledKernel = (CompiledKernel) kernelTemplate;
}在119上,您正在尝试将内核强制转换为CompiledKernel,每个内核都有自己的层次结构。如果为CompiledKernel extends Kernel,那么这将会起作用。
发布于 2014-12-15 01:38:03
我没有G卡,所以我不能测试你的代码。我看了一下源代码。作者在org.trifort.rootbeer.piler.Transform2.java中做到了这一点
public void run(String cls){
OpenCLScene scene = new OpenCLScene();
OpenCLScene.setInstance(scene);
scene.init();
SootClass soot_class1 = Scene.v().getSootClass(cls);
SootMethod method = soot_class1.getMethod("void gpuMethod()");
String uuid = getUuid();
GenerateForKernel generator = new GenerateForKernel(method, uuid);
try {
generator.makeClass();
} catch(Exception ex){
ex.printStackTrace();
OpenCLScene.releaseV();
return;
}
//add an interface to the class
SootClass soot_class = method.getDeclaringClass();
SootClass iface_class = Scene.v().getSootClass("org.trifort.rootbeer.runtime.CompiledKernel");
soot_class.addInterface(iface_class);
System.out.println("added interface CompiledKernel");
OpenCLScene.releaseV();
}我还查看了他的演示代码"examples\sort\src\org\trifort\rootbeer\sort\GPUSort.java".作者确实初始化了Contex,它与您的代码完全不同。我建议你先试试他的代码。我敢打赌,它会调用Transform2.run函数,而您的代码不会调用。
public void sort(){
//should have 192 threads per SM
int size = 2048;
int sizeBy2 = size / 2;
//int numMultiProcessors = 14;
//int blocksPerMultiProcessor = 512;
int numMultiProcessors = 2;
int blocksPerMultiProcessor = 256;
int outerCount = numMultiProcessors*blocksPerMultiProcessor;
int[][] array = new int[outerCount][];
for(int i = 0; i < outerCount; ++i){
array[i] = newArray(size);
}
Rootbeer rootbeer = new Rootbeer();
List<GpuDevice> devices = rootbeer.getDevices();
GpuDevice device0 = devices.get(0);
Context context0 = device0.createContext(4212880);
context0.setCacheConfig(CacheConfig.PREFER_SHARED);
context0.setThreadConfig(sizeBy2, outerCount, outerCount * sizeBy2);
context0.setKernel(new GPUSortKernel(array));
context0.buildState();
......
}发布于 2014-12-15 01:49:47
如果实际对象实现了接口,则只能强制转换为该接口。我不太了解CUDA,但是可能有一种方法可以获取内核,然后返回一个CompiledKernel。简单的强制转换不会做到这一点。
另一方面,如果你是"ArrayMult“类的创建者,那么你可以通过同时实现内核和CompiledKernel来解决这个问题。
https://stackoverflow.com/questions/27471330
复制相似问题