我们在粗粒度计算集群中有一个由75个Win2k3节点组成的集群.该集群位于大量防火墙之后,位于自己的VLAN中.所有大小和类型的作业都在群集上运行,并且所有运行的可执行文件都是定制的.
(编辑:关于我们的可执行文件的附加说明)作业的持续时间从30秒到7天不等,可能包含一个可执行文件或2000个子作业(持续时间很短).显然,我们正在努力避免在7天的生产工作期间我们的IT计划重新启动的情况.
我们有调度软件,可以容纳粗粒度集群的所有正常任务,我们可以控制哪些机器可以提交,等等.如果WSUS在某种程度上是可编写脚本的(或者客户端可以说明它的关闭可用性),我们可以协调两个系统和帮助.
目前,补丁计划是超级星期二之后的星期日,无论群集上运行的是什么.每次我们想要延迟修补机器以进行长期生产作业时,我们都要求豁免.基本上,虽然我们的团队负责机器,但我们几乎无法控制IT的补丁计划.
>每月修补MS的生产Windows群集的计划是否合理?
> WSUS中是否有软件挂钩我们可以说“请不要重新启动”?
1.Is patching monthly with MS’s schedule sane for a production Windows
cluster?
是的,但群集不应该有任何与补丁相关的停机时间,因为它应该将作业转移到另一个节点 – 我不会同时修补整个群集(这将是疯狂的)
2.Are there software hooks in WSUS where we could say,“please don’t
reboot just yet”?
最终用户无法停止WSUS更新或重新启动,但这听起来像是您的组和IT组之间存在真正的通信问题;但是,您应该能够一次丢失1个节点,而对生产影响很小.