如何根据原始流量计算hadoop存储所需容量

如题所述

Hadoop archive 唯一的优势可能就是将众多的小文件打包成一个har 文件了,那这个文件就会按照dfs.block.size 的大小进行分块,因为hdfs为每个块的元数据大小大约为150个字节,如果众多小文件的存在(什么是小文件内,就是小于dfs.block.size 大...
温馨提示:内容为网友见解,仅供参考
无其他回答
相似回答