首页 » OpenStack系统架构设计实战 » OpenStack系统架构设计实战全文在线阅读

《OpenStack系统架构设计实战》9.1.3 Sahara的主要特点

关灯直达底部

1)因契合大数据与云计算融合的发展趋势而备受关注。

云计算和大数据目前都属于IT领域中最受瞩目的方向,二者的结合更是吸引眼球的话题。Sahara作为一个开源的大数据与云计算的融合方案,必然也备受关注。

OpenStack和Hadoop的融合,既最大限度地提高了服务器的资源利用率,又大大降低了大数据处理的准入门槛。可以预见,作为云计算和大数据的桥梁之一,Sahara将会推动OpenStack云平台和Hadoop的整合,逐步进入大数据处理市场,借助云计算平台和大数据处理技术,更快速地把数据转换为商业价值。

2)遵循了OpenStack体系开放灵活、避免重复设计的基本设计思想。

Sahara充分继承了OpenStack体系的“模块化”、“可配置”设计思想,保证了Sahara的使用灵活性与可扩展性。通过开放灵活的架构设计,Sahara大量功能和机制都基于可选择、可配置的模块化插件实现。例如,通过对Engine的配置,Sahara可以支持不同的集群编配机制,既可以使用Sahara自有的direct-engine,也可以使用Heat。利用plug-in机制,Sahara可以方便地支持不同的Hadoop/Spark版本、部署方式和工具(本文暂不考虑Spark等,下同)。

同时,作为在OpenStack上原生开发出来的PaaS层组件,Sahara尽可能地重用了OpenStack自身提供的IaaS层组件及其服务,充分避免重复设计实现相关特性。例如,利用Nova实现虚拟机群的配置启动,利用Heat实现编配服务,集成Ceilometer提供监控能力,在Horinzon中扩展人机界面等。这种设计思想一方面符合开源项目设计中“不重复发明轮子”“站在巨人肩膀上”的原则,另一方面也和AWS EMR的思路相一致。这应该也是Sahara能够快速发展成熟的重要原因之一。

3)提供了简捷的BDaaS解决方案。

尽管Sahara目前尚缺少实际大规模应用的检验,但已经具备了BDaaS基本功能。同时,作为OpenStack中的一个组件,Sahara的安装和应用非常简便。在熟悉OpenStack之后,接受Sahara几乎没有太高的技术门槛。

4)为在OpenStack上的开发应用提供了实例。

在云计算的场景下,如何在云操作系统上开发应用,如何利用操作系统的资源抽象和管理能力为最终的用户服务,一直是比较有挑战的待探索话题。AWS的生态圈在这方面略胜一筹。

Sahara提供了一个整合利用各种云操作系统模块资源(各种云服务)对重要应用(Hadoop)进行云化的实例,这对推动OpenStack,乃至云计算走向实用、迅速落地有着举足轻重的意义。

5)获得了大部分OpenStack关键厂商的支持与推动。

Mirantis、RedHat和Hortonworks三家企业的大力参与,以及Intel、IBM、HP、SUSE等业界大公司的陆续支持和投入,让Sahara的发展不容小觑。

此外,根据社区规则,两个项目之间不能出现所涉及范畴重叠。因此Sahara作为OpenStack社区唯一BDaaS模块的地位不可动摇。

6)Sahara面临着一些挑战。

·Sahara的管理平面性能存在问题,创建和发布集群的等待时间有待测试。

·在复杂管理的成功率方面,目前Sahara中没有看到明确的处理机制,这是一个缺失。

·Sahara搭建的Hadoop在虚拟化环境下的性能有待优化。

·Auto-scaling缺失。目前Sahara要扩展需要人工执行。

·Sahara最大的亮点在EDP,其价值有待进一步挖掘。