我试图建立一个基于CentOS的网格集群.所有的机器都有一些类似的结构(有些处理器比其他机器多),我只需要将作业推送到队列然后在可用节点上运行.每个cpu一个工作,其余工作等待.
John T has been exceptionally helpful指向我@L_403_1@接缝是我所假装的(工作将基本上是浴脚本).在接受他的回答之前我还在研究这个问题,但是我要求社区提供一些反馈,因为Gnu Queue网站接缝表明该项目已经死了好几年了.
我也看了Sun Grid Engine,它也像工作的候选人一样,不幸的是甲骨文现在正在杀死这个项目,而Univa还没有发布他们的端口.
我只想从右脚开始,所以我的问题是,你有这种聚类(网格计算)的任何实际经验.你的推荐是什么?
先感谢您.
如果您不需要真正的排队系统,GNU parallel可能足以同时在每个系统上启动作业.如果确实需要真正的调度程序,则可能需要
TORQUE Resource Manager和可选的调度程序,如
Maui.
原文链接:https://www.f2er.com/centos/373782.html你也可以放弃使用CentOS,转而使用像PelicanHPC这样的Live CD.至少那时,配置会更简单(至少它可以做什么).假设你在某个类型的大学里,那里根本没有人做过HPC和/或聚类?没有教师可以在国家实验室或类似工厂与您的项目提供cpu时间吗?
这个问题可能是迁移到Serverfault的候选者.