9.1 Sahara概述
9.1.1 Sahara的定位
The Sahara project provides a simple means to provision a data-intensive application cluster(Hadoop or Spark)on top of OpenStack。
这是WiKi百科上关于Sahara的第一句话,由此可见,Sahara的基本定位是基于OpenStack提供简单的Hadoop或Spark集群管理方式。目前,伴随着项目的不断演进,Sahara所涵盖的范畴也有所扩大。
从服务能力看,Sahara已经开始从利用OpenStack的IaaS能力、提供简单的大数据工具集群创建和管理服务,扩展到提供分析即服务(Analytic-as-a-Service)层面的大数据业务应用能力。Sahara v0.3中引入的EDP(Elastic Data Processing)就是一个明确的体现。
从承载业务类型看,Sahara也从单一Hadoop工具范畴,拓展到支持Spark等其他新兴大数据工具。
因此,整体而言,Sahara的定位是成为OpenStack上唯一的BigData-as-a-Service服务模块,整合利用OpenStack自身的各个模块和服务,向用户提供简单、便捷的大数据业务能力。