大数据工具清单

• MongoDB-一种非常流行的、跨平台、面向document的数据库。

• Elasticsearch-专为云计算设计的分布式REST风格的搜索引擎。

• Cassandra-一个开源的分布式数据库管理系统。最初是Facebook设计和开发的,部署在大量商用服务器上来处理大量的数据。高可用,无单点故障。

• Redis-开源的(BSD)内存数据结构存储、内存库、缓存、消息代理。

• Hazelcast-基于Java开发的内存数据网格。

• EHCache-广泛使用的开源Java分布式缓存、J2ee、轻量级容器。

• Hadoop-用java开发的开源分布式大数据框架,用来处理非常大规模数据,hadoop是集群化部署。

• Solr-使用java开发的开源企业级搜索平台。最初归属在Apache Lucene项目中。

• Spark-ASF中最活跃的项目,是一个开源的集群化计算框架。

• Memcached–通用分布式缓存系统。

• Apache Hive-在Hadoop支持类SQL封装,将SQL语句变成mr程序来执行。

• Apache Kafka–高吞吐量、分布式、消息发布-订阅系统,最早是Linkin开发的。

• Akka–Java开发的用来建造高并发,基于jvm弹性消息驱动的应用。

• Hbase-根据Google的BigTable论文开发的开源分布式非关系型数据库。开发语言是Java,用HDFS作为底层存储。

• Neo4j–用Java实现的开源图形数据库。

• CouchBase–面向Document的开源分布式NoSQL数据库,并且针对交互应用做过优化。

• Apache Storm–开源分布式实时计算系统。

• CouchDB–使用json来存储数据的开放源码面向文档的NoSQL数据库。

• Oracle Coherence–内存数据网格解决方案,使企业通过提供快速访问热数据来预测关键任务应用的规模。

• Titan–可扩展的图形数据库,针对集群存储和查询数千亿的图形数据做过优化。

• 亚马逊 DynamoDB – 一个快速、灵活NoSQL数据库,能够应对所有规模应用程序的需求,包括持久化、毫秒级延迟。

• Amazon Kinesis–AWS上的实时数据计算平台。

• Datomic–提供完整事务支持,云计算,分布式的数据库,开发语言用Clojure。

猜你喜欢

转载自tongsh6.iteye.com/blog/2299960