例如,我有一个5GB的大文件,我写到hdfs中,我看权威指南的意思,分成多个数据包,形成一个数据队列,然后依次写入datanode列表。如果有三个datanode,先传给第一个datanode,然后由第一个传给第二个,第二个传给第三个,如果是这样不是每个节点都有5GB的文件了吗?
如果是这样,我一个客户端在读取hdfs的时候,namenode找到一个最优的datanode,那我要读取的文件不是只能在其中一个datanode上去读取了吗,除非文件特别大,超过datanode的存储。那这个分布式的效果如何体现出来呢?有点没有弄懂,请大侠给讲解一下。