数据处理
阿里云计算开放数据处理服务(Open Data Processing Service,ODPS)是飞天平台上的大规模分布式数据处理服务,它以RESTfulAPI 的形式支持基于描述性查询语言SQL 的数据处理,并提供MapReduce的并行计算框架。ODPS 重点面向数据量大(PB 级别)且实时性要求不高的OLAP(On-Line AnalyticalProcessing)应用,适用于海量数据统计、数据建模、数据挖掘、数据商业智能等互联网应用。
计算性能
基于数据驱动的多级流水线并行计算框架,支持Map、Reduce、Join、Union 等多种数据节点处理模式,支持直接使用SQL 语句对海量数据进行离线分析。通过数据分裂将海量数据散布在整个集群内部,数据容量瓶颈问题得以解决。同时,计算压力也被平均分布在集群内部,很好地解决了计算性能问题。
高可用性
系统提供错误监控机制,对于故障采取自动迁移,采用多份备份来确保数据的安全性,系统达到高可用性。
语法兼容
提供与ANSI SQL 高度兼容的语法支持,支持用户复杂的数据分析需求。提供Client 工具、RESTful 开放接口以及Java SDK 来为用户服务,用户可以根据自己的需求选择合适的方式来使用该服务