解决方法
我知道这是一个较旧的线程,但在过去一年里有一些发展.将数据仓库与Hadoop进行比较就像将苹果与橙子进行比较.数据仓库是一个概念:干净整合的高质量数据.我不认为数据仓库的需求不会很快消失.另一方面,Hadoop是一项技术.它是一个分布式计算框架来处理大量数据.过去的数据仓库通常建立在关系数据库和数据仓库设备上.然而,在过去几年中,出现了RDBMS的各种限制(面对日益增长的数据量,扩展许可证成本,适合用于查询图形和层次结构以及摄取非结构化数据类型等).同时,Hadoop上的MPP SQL查询引擎已经出现,如Apache Drill,现在可以查询位于Hadoop上的数据.
如果您对所有细节感兴趣,我已经写了一系列关于该主题的帖子. Data Warehousing in the age of big data. The end of an era?