首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在LLVM IR中调用x86 MMX本质

在LLVM IR中调用x86 MMX本质
EN

Stack Overflow用户
提问于 2016-01-07 06:13:51
回答 1查看 831关注 0票数 3

我应该如何在LLVM中调用MMX本质?此代码导致断言失败,因为内部参数的类型不正确。但是,我猜不出正确的类型。最有可能的假设是,像"MMX矢量“这样的东西就行了。但我还没有找到处理这些类型的适当代码片段。

代码语言:javascript
复制
Value* IRGenContext::emitSaturatingSubUI8(Value* lho, Value* rho, const Twine& name)
{
  Type* mmxType = Type::getX86_MMXTy(session_.lctx());
  std::vector<Type*> paramTypes = { mmxType, mmxType };
  std::vector<Value*> paramVals = { 
    irBuilder().CreateCast(llvm::Instruction::CastOps::BitCast, lho, mmxType),
    irBuilder().CreateCast(llvm::Instruction::CastOps::BitCast, rho, mmxType)
  };
  Function* subsIntr = getIntrinsic(llvm::Intrinsic::x86_mmx_psubs_b, paramTypes);
  Value* intrinsicResult = irBuilder().CreateCall(subsIntr, paramVals, name);
  return irBuilder().CreateCast(llvm::Instruction::CastOps::BitCast, intrinsicResult, getUOctaTy());
}

Function* IRGenContext::getIntrinsic(llvm::Intrinsic::ID id, llvm::ArrayRef<llvm::Type*> Tys)
{
  return llvm::Intrinsic::getDeclaration(module_.get(), id, Tys);
}

ir表示如下所示:

它会导致断言错误:

断言失败: DAG.getTargetLoweringInfo().isTypeLegal(PartVT) &&“复制到非法类型!”,文件F:\cpp\llvm-git\llvm\lib\CodeGen\SelectionDAG\SelectionDAGBuilder.cpp,行376

代码语言:javascript
复制
; ModuleID = 'jit_module_560'                                                   
target datalayout = "e-m:w-i64:64-f80:128-n8:16:32:64-S128"                     

define void @jit_fn559(i8* %cookie) {                                           
Block_6010:                                                                     
  %0 = call i64 @_readRegUint(i8* %cookie, i8 2)                                
  %1 = call i64 @_readRegUint(i8* %cookie, i8 3)                                
  %2 = call i64 @_readRegUint(i8* %cookie, i8 4)                                
  br label %Block_6010.split                                                    

Block_6010.split:                                 ; preds = %Block_6010         
  %reg561 = phi i64 [ 0, %Block_6010 ]                                          
  %reg562 = phi i64 [ %0, %Block_6010 ]                                         
  %reg563 = phi i64 [ %1, %Block_6010 ]                                         
  %reg564 = phi i64 [ %2, %Block_6010 ]                                         
  %"#c1010100" = or i64 %reg561, 0                                              
  %"#c1020200" = or i64 %reg562, 0                                              
  %"#c1030300" = or i64 %reg563, 0                                              
  %"#c1040400" = or i64 %reg564, 0                                              
  %3 = bitcast i64 %"#c1020200" to x86_mmx                                      
  %4 = bitcast i64 %"#c1030300" to x86_mmx                                      
  %5 = call x86_mmx @llvm.x86.mmx.psubs.b.x86mmx.x86mmx(x86_mmx %3, x86_mmx %4) 
  %6 = bitcast x86_mmx %5 to i64                                                
  call void @_storeMemUint64(i8* %cookie, i64 %"#c1040400", i64 0, i64 %6)      
  %7 = call i64 @_readSpRegUint(i8* %cookie, i8 4)                              
  call void @_pop(i8* %cookie, i64 %7, i8 0)                                    
  ret void                                                                      
}                                                                               

declare i64 @_readRegUint(i8*, i8)                                              

declare void @_storeRegUint(i8*, i8, i64)                                       

declare x86_mmx @llvm.x86.mmx.psubs.b.x86mmx.x86mmx(x86_mmx, x86_mmx)           

declare void @_storeMemUint64(i8*, i64, i64, i64)                               

declare i64 @_readSpRegUint(i8*, i8)                                            

declare void @_pop(i8*, i64, i8)                                                
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-08 08:56:08

您可以在位于TableGen中的Intrinsics llvm/include/llvm/IR/文件中查找本征文件所需的类型。

来自IntrinsicsX86.td

代码语言:javascript
复制
  3583   def int_x86_mmx_psub_b : GCCBuiltin<"__builtin_ia32_psubb">,
  3584               Intrinsic<[llvm_x86mmx_ty], [llvm_x86mmx_ty, llvm_x86mmx_ty],
  3585                         [IntrNoMem]>;

在您的情况下,您需要x86mmx_ty。作为一种提示,为了得到正确的类型,您可以直接问clang。

编译对内置程序的调用,该调用将产生内部的带gar导值的值:

代码语言:javascript
复制
void foo()
{
  __builtin_ia32_psubb(42, "42"); // we need the error
} 

在以下方面的成果:

代码语言:javascript
复制
test.c:3:24: error: passing 'int' to parameter of incompatible type '__attribute__((__vector_size__(8 * sizeof(char)))) char' (vector of 8 'char' values)
  __builtin_ia32_psubb(42, "42");

因此,这个内在的正确类型是一个vector of 8 char

由于内部没有类型重载,所以不应该调用

代码语言:javascript
复制
Function* subsIntr = getIntrinsic(llvm::Intrinsic::x86_mmx_psubs_b, paramTypes);

使用paramTypes:

代码语言:javascript
复制
Function* subsIntr = getIntrinsic(llvm::Intrinsic::x86_mmx_psubs_b);

对你的目的来说是很好的。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34648471

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档