我有一个基于Hadoop的环境.我在此系统中使用Flume,Hue和Cassandra.如今,围绕Docker进行了大肆宣传,因此想了解一下在这种情况下Docker化的优缺点.我认为它应该更具可移植性,但是只需单击几下即可使用Cloudera Manager进行设置.是更快还是为什么值得?有什么优势?
也许应该只对多节点Cassandra集群进行dockerized?
Is it maybe faster or why is worth it?
听起来您已经有了一个Hadoop集群.因此,您必须问自己,重现此环境需要多长时间?您需要多久重现一次这种环境?
如果您不需要重复复制环境并包含可能与主机上其他应用程序冲突的依赖项的方法,那么我还没有找到适合您的用例.
What are advantages?
如果在可能需要混合Java版本的环境中运行Hadoop,则将其作为容器运行可以将依赖项(在这种情况下为Java)与主机系统隔离.在某些情况下,它会为您提供更容易复制的工件,以进行移动和设置.但是Java应用程序已经非常简单,其所有依赖关系都包含在JAR中.
Maybe should be only multi node Cassandra cluster dockerized?
我不认为这是否真正取决于多节点环境.归结为解决的问题.听起来您在部署或再现Hadoop环境方面没有任何痛点,但是我看不到仅仅因为这是一个热门的新事物而需要“ dockerize”某些东西.
当您确实需要轻松地重现Hadoop环境时,可以考虑使用Docker的一些编排和管理工具(Kubernetes,Rancher等),这比在覆盖网络上部署和管理应用程序集群更具吸引力.只是普通的Docker. Docker只是我眼中的工具.当您可以利用其他软件包正在其上构建的一些巧妙的重叠多主机网络,发现和编排时,它真的开始发光起来.