LLVM项目不区分有符号和无符号整数,如
here所述.在某些情况下,您需要知道某个特定变量是否应该被解释为有符号或无符号,例如,当它是大小扩展时或者用于一个师.我的解决方案是为每个变量保留一个单独的类型信息,描述它是整数还是基数类型.
但是,我想知道,是不是有办法在LLVM中“归属”这种类型?我一直在寻找可以添加到某种类型的某种“用户数据”,但似乎什么都没有.在创建类型时,必须以某种方式发生这种情况,因为在LLVM中只生成一次相同的类型.
因此,我的问题是:
有没有办法跟踪整数变量是否应该在LLVM基础结构中被解释为有符号或无符号,或者是否真的像我一样保留单独的信息?
谢谢
解决方法
首先,您必须确保需要插入额外的类型元数据,因为Clang已经适当地处理了有符号整数运算,例如使用sdiv和srem而不是udev和urem.
此外,可以利用它来实现一些基于IR中变量访问方式的轻量级类型推断.请注意,像add这样的操作不需要signdness信息,因为它基于双补码表示.
否则,我认为最好的方法是修改前端(Clang)以添加一些自定义DWARF调试信息.这是一个可能让你入门的link.
更新:
如果您的目标是直接在LLVM IR上实现静态分析.本文可以提供一个彻底的讨论.
Navas,J.A.,Schachte,P.,Søndergaard,H.,Stuckey,P.J.:
Signedness-agnostic program analysis: Precise integer bounds for low-level code. In: Jhala,R.,Igarashi,A. (eds.) APLAS 2012. LNCS,vol. 7705,pp. 115–130. Springer,Heidelberg (2012)