Pivotal HD是EMC Greenplum最新的hadoop发行版本,在Apache Hadoop2.0版本基础上,开发了高级数据库服务、数据挖掘分析、自动化配置和部署、统一监控管理、Spring编程框架等诸多功能,同时,Pivotal还将实时计算和分布式流计算能力带入到Hadoop的世界,让Hadoop成为真正的容易使用、性能强大的高级分析系统,是目前业界最强大的企业级Hadoop版本。
Pivotal HD支持海量数据处理,支持结构化,半结构化,以及非结构化的数据,支持实时流式数据分析,构建复杂、高效的数据仓库分析系统。例如银行的历史数据平台、电信行业的信令数据分析系统等。
兼容性 Pivotal HD将Greenplum大规模并行计算数据库产品和Hadoop产品无缝集成。将Greenplum 10余年的开发大规模并行计算数据库平台经验带入到开源大数据平台。Pivotal HD是世界首个Hadoop的完整SQL支持处理大数据平台,能让传统SQL开发人员直接操作大数据,传统的BI数据挖掘工具亦能完全兼容。
高性能 Pivotal HD的动态管道技术能够提供100+倍性能提升,成为业界性能最强的Hadoop发行版。Pivotal HD除了标准的HD组件,Pivotal HD专注于企业级的Hadoop功能开发,包括HAWQ高。
HAWQ:高级数据库服务 高性能查询处理,支持PB级扩展能力Multi-petabyte scalability、、交互式ANSI SQL、可编程式分析、列存储和索引、工作负载管理、Scatter-Gather数据加载、多重分区、第三方工具和开放接口。