如果我有一个具有
cache-coherent
non-uniform memory access ( NUMA )的多处理器板,即单独的
“northbridges”与每个处理器的独立RAM,任何编译器都知道如何在不同的内存系统中自动传播数据,以便在本地线程上工作的进程主要检索其数据从与处理器相关联的RAM线程正在运行?
我有一个设置,其中1 GB连接到处理器0,1 GB连接到处理器1等.最多4个处理器.在coherent memory space中,第一个处理器上的RAM的物理内存是地址0到1GB-1.对于第二个处理器,它是1GB到2GB-1,依此类推.
任何编译器,或者特别是malloc都会将特定内核上的进程分配给与该核心相关联的物理RAM的新内存?
解决方法
Linux内核了解NUMA,并将尝试将您的进程页面从内存本地提供给当前cpu(来源:
U. Drepper,“What Every Programmer Should Know About Memory”.)