我触及了Teradata.我从未接触过hadoop,但从昨天开始,我正在研究这个问题.通过对两者的描述,它们似乎是可以互换的,但在一些论文中,它被写成它们用于不同的目的.但我发现的一切都是模糊的.我很迷惑.
有谁有经验吗?他们之间有什么严重的区别?
简单示例:我想构建ETL,它将转换数十亿行原始数据并将它们组织成DWH.然后对它们进行一些资源昂贵的分析.为何使用TD?为何选择Hadoop?或者为什么不呢?
解决方法
我认为
this article标题为“MapReduce和并行DBMS:朋友或敌人”在描述每种技术最佳工作的情况方面做得相当不错.简而言之,Hadoop非常适合存储非结构化数据和运行并行转换以“清理”传入数据,其中DBMS擅长快速执行复杂查询.