首页 » OpenStack系统架构设计实战 » OpenStack系统架构设计实战全文在线阅读

《OpenStack系统架构设计实战》9.6 小结

关灯直达底部

Sahara旨在为用户提供大数据即服务能力。其应用场景主要包括:

1)充分利用OpenStack Iaas层的计算能力。

2)在OpenStack上快速配置和部署Hadoop集群的能力。例如,通过对Hadoop版本、集群结构、节点硬件信息等的简单配置,Sahara既能快速部署Hadoop集群,也能支持集群的扩容和减容。

3)提供类似AWS EMR的分析即服务(Analytic-as-a-Service)的数据分析业务。

Sahara提供基本模式和EDP模式。基本模式要求用户自己从底层搭建Hadoop虚拟机,建立集群,技术门槛较高。EDP模式则类似于AWS EMR服务,对底层的Hadoop集群操作和Hadoop业务操作进行了封装,暴露给用户的只有非常简单的接口,从而大大降低了技术门槛。

Sahara、AWS EMR、Serengeti三者比较,各有优劣。Sahara EDP只需提供建立大数据集群所需的要素,并且将云应用的使用与系统运维进行分离,从而提供了比AWS EMR更低的技术门槛。但从大数据整体解决方案能力来看,AWS EMR更胜一筹。Serengeti实现的是“应用虚拟化”,Sahara完成的是“应用云化”,两者有着本质区别。但在如何为搭建在虚拟机环境下的Hadoop集群提高性能和可靠性方面,Serengeti可作为Sahara的参考。