我正在寻找的东西可以:
>获取一组将托管我的服务的Linux机器作为输入,>获取每项服务的实例数量,>自动将服务部署到Linux机器上,>根据某些预定义规则检测并响应故障(重新启动,在备份计算机上安装服务等).
有什么建议?
第4项有点困难 – 你需要一个监控系统(在这里查看,或者询问谷歌.你会收到很多建议),如果你想要自动回复,你的监控系统将不得不提供其他一些系统来接受行动.这不需要太复杂 – 我使用InterMapper实现了类似的功能:当检测到故障时,InterMapper运行一个“命令行通知程序”来指定发生故障的系统.命令行通知程序只是一个shell脚本,它将系统名称作为参数并重新启动它,如果重新启动失败则发送一封电子邮件.