hadoop 中一个大文件在hdfs中是如何存储的

例如，我有一个5GB的大文件，我写到hdfs中，我看权威指南的意思，分成多个数据包，形成一个数据队列，然后依次写入datanode列表。如果有三个datanode,先传给第一个datanode,然后由第一个传给第二个，第二个传给第三个，如果是这样不是每个节点都有5GB的文件了吗？
如果是这样，我一个客户端在读取hdfs的时候，namenode找到一个最优的datanode,那我要读取的文件不是只能在其中一个datanode上去读取了吗，除非文件特别大，超过datanode的存储。那这个分布式的效果如何体现出来呢？有点没有弄懂，请大侠给讲解一下。

举报该文章

hadoop 中一个大文件 在hdfs中是如何存储的

hadoop 中一个大文件在hdfs中是如何存储的