目前我正在为
MongoDB和
Apache Cassandra的几个项目工作.我也使用Solr很多,我正在处理“大量”的数据(约1-2TB).我听说过
Greenplum和
Vertica是上个星期的第一次,我不太确定,把它们放在脑子里.他们似乎像Dataware House(DWH)解决方案,我还没有真正工作过DWH.而且他们似乎花了很多钱(例如Greenplum的1TB存储的价格为$60k).我目前没有处理小数据的数据,不会这样做,我认为,但像cassandra这样的产品似乎也能够处理这个
Cassandra is the acknowledged Nosql leader when it comes to
comfortably scaling to terabytes or petabytes of data.via 07004
所以我的问题:人们为什么要使用Greenplum& Co吗?与这些其他产品相比,是否有巨大的优势?
谢谢.
解决方法
Cassandra,Greenplum和Vertica都处理大量的数据,但是以非常不同的方式处理.
一些数据库有其优点:
使用cassandra:
tweets.insert(key:user,data:blob); tweets.get(key:user)
使用greenplum:
begin; update account set balance = balance - 10 where account_id = 1; update account set balance = balance + 10 where account_id = 2; commit;
使用Vertica:
select sum(balance) over (partition by region order by account rows unbounded preceding) from transactions;