作者:拍友2702936504 | 来源:互联网 | 2023-05-28 08:09
我无法帮助认为Cassandra可以有效地服务的用例比德鲁伊更好.作为时间序列存储或键值,可以使用Druid编写查询以提取所需的数据.这里的论点更多的是围绕为德鲁伊辩护,而不是卡桑德拉.
除了卡桑德拉的快速写作,还有其他什么吗?Esp给出了德鲁伊的实时聚合/查询能力,它不会超过Cassandra.
对于一个可以回答的更直接的问题 - 德鲁伊没有提供像卡桑德拉那样的特征的超集,并且在使用德鲁伊时不会更好吗?对于所有用例?
1> Nylon Smile..:
对于一个可以回答的更直接的问题 - 德鲁伊没有提供像卡桑德拉那样的特征的超集,并且在使用德鲁伊时不会更好吗?对于所有用例?
完全没有,他们没有可比性.我们在这里谈论两种截然不同的技术.简单的方法是将Cassandra视为分布式存储解决方案,但德鲁伊是一个分布式聚合器(即一个非常棒的开源OLAP工具(:).在我看来,你所指的帖子在某种意义上有点误导它比较了数据挖掘领域的两个项目,这不是cassandra的重点.
德鲁伊根本不擅长点查.它喜欢时间序列,它的分区主要基于基于日期的段(例如,每小时/每月等段,可以根据大小进一步分片).
德鲁伊根据预定义的聚合器预先聚合您的数据 - 这些聚合符是数字(例如,以每日粒度对您网站中点击事件的数量进行求和等).如果想要从字符串存储键查找来说出另一个字符串或确切数字,德鲁伊是他/她可以寻找的最差解决方案.
2> user766353..:
不确定这是一个SO类型的问题,但简单的答案是它是一个用例的问题.简而言之,德鲁伊在为实时摄取的数据提供非常快速的即席查询时会发光.它现在读取一致,并且您不受预先计算的查询限制以获得速度.另一方面,您无法写入它所拥有的数据,您只能覆盖.
Cassandra(从我读过的;没有使用它)更像是一个最终一致的数据存储,它支持写入并且非常适合预计算.它不打算连续摄取数据,同时提供对同一数据的即席查询的实时访问.
事实上,两者可以一起工作,就像planetcassandra.org在"Cassandra作为德鲁伊实时分析引擎的深度存储机制!"中提出的那样..