hdfs
2016-05-15 18:21:27 1 举报
HDFS(Hadoop Distributed File System)是Apache Hadoop项目的核心子项目,是一个高度容错性的系统,设计用于在低成本硬件上部署在大规模节点群中。它提供高吞吐量的数据访问,非常适合大规模数据集应用,并且具有高度的扩展性。HDFS 能有效地存储和管理大数据,支持数据的备份和故障恢复。它将大文件切分成多个块,并将这些块分布在集群中的不同节点上,从而提高了数据的可靠性和处理速度。此外,HDFS 还提供了数据冗余机制,以防止数据丢失。总的来说,HDFS 是大数据处理和分析的理想选择。