hdfs
2016-05-10 21:09:30 1 举报
HDFS(Hadoop Distributed File System)是Apache Hadoop项目的核心子项目,它是一个高度容错性的分布式文件系统,能提供高吞吐量的数据访问能力。HDFS 有以下几个主要特点:首先,它能处理PB级别的数据;其次,它把大文件切分成多个块存储在不同的机器上,每个块的大小默认为64MB或128MB,这样即使部分数据丢失,也不影响整个文件的完整性;再次,HDFS支持并发读写和数据冗余备份,以提高数据的可靠性和读取速度。此外,HDFS还提供了一套简单的文件系统接口,用户可以通过这些接口在集群中创建、删除、移动和重命名文件等操作。