Hadoop绿色版下载-91单机网

简介
教程
其他版本

Hadoop是一个由Apache基金会所开发的分布式数据库，Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理，其核心框架设计为HDFS和MapReduce，HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

Hadoop是什么：

Hadoop是一个由Apache基金会所开发的分布式数据库，Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理

Hadoop功能特性：

高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。

高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。

高效性。Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。

高容错性。Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分配。

低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比，hadoop是开源的，项目的软件成本因此会大大降低。

功能介绍

1、hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem)，简称HDFS。

HDFS有着高容错性(fault-tolerent)的特点，并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(highthroughput)来访问应用程序的数据，适合那些有着超大数据集(largedataset)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streamingaccess)文件系统中的数据。

2、Hadoop还实现了MapReduce分布式计算模型。

MapReduce将应用程序的工作分解成很多小的工作小块(smallblocksofwork)。HDFS为了做到可靠性(reliability)创建了多份数据块(datablocks)的复制(replicas)，并将它们放置在服务器群的计算节点中(computenodes)，MapReduce就可以在它们所在的节点上处理这些数据了。