流式数据处理,CEP概念,Storm,spark联系和比较
作者:管理员    发布于:2014-12-09 12:01:57    文字:【】【】【

CEP是指复杂事件处理,属于流式数据处理软件,由于流式数据处理的技术核心是CEP,所以流式数据处理软件也称为CEP软件。CEP软件通常也是商业软件,配套专业的商业服务和解决方案。

Storm是分布式流式处理框架,Twitter在收购一个公司的时候得到的,不是Twitter自身原有使用的技术。收购1年内twitter就迅速将storm开源,一方面为了大家能用storm来分析twitter数据,以提高twitter数据的商业价值,另一方面也因storm开源不影响最核心技术和最核心的竞争力。

Storm本身几乎没有流式数据计算的能力,也缺乏商业产品所需的诸多特点。Storm只是给出了一个分布式框架。类似于没有实现的JDBC接口,接口的具体实现需要数据库厂商去实现,storm的功能需要厂商自己实现,通常是互联网公司来实现。在传统领域,例如金融、电信、工业监测领域,拥有类SQL的CEP系统及集群方案仍是首选。

Spark本身是批处理的分布式框架,其中包含了一些流式数据按批处理功能。流式数据处理不是Spark的最主要功能,而是其批量计算向流式数据的延生,适合于可以容许高延迟的地方。

欢迎使用速德贝斯流式计算产品包括集群计算方案。具备图形化建模工具,丰富数据分析功能,细粒度的集群任务监控接口,良好的二次开发支持。http://www.sodbase.com


 
版权所有 Copyright(C)2009-2018 速德贝斯科技有限公司  
keywords:CEP CEP