1、独立组件个数(按进程)
默认情况下是1个;如果需要使用副本机制,需要依赖zookeeper;如果需要监控功能,还得依赖第三方监控系统。
2、单机部署
很好的支持单机运行,并且单机情况下查询入库性能不错(通过其提供的示例数据进行体验)。
3、窗口函数
Clickhouse没有显示的支持窗口函数,根据网上的资料,可以通过arrayEnumerate
,arrayEnumerateDense
,arrayEnumerateUniq
函数间接的实现简单的窗口函数功能。但是用这种方式写查询语句会比较繁琐。参考:
https://blog.csdn.net/vkingnew/article/details/106781788
4、数据自动平衡
(1)分布式表入库时,分布式表会根据sharding_key把数据划分到不同的shard中,这个算是写入时的数据平衡机制;
(2)如果增加新shard,已经入库的数据不会自动均衡到新shard中,必须通过人工命令对数据进行移动。
5、离线处理
MergeTree系列的表引擎中包含几个有特殊功能的引擎:
-
ReplacingMergeTree文章来源:https://www.toymoban.com/news/detail-635903.html
引擎内部在merge时会对具有相同Sorting Key的行进行去重,至于多个重复的行保留哪个是由ReplacingMergeTree的参数决定的,参数指定文章来源地址https://www.toymoban.com/news/detail-635903.html
到了这里,关于Clickhouse调研的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!