spark支持parquet hive支持parquet csv存储的大小与实际文件大小一样,若没有压缩,占用容量=实际大小*副本数目 parquet完美实现分区过滤 列修剪 参考:为什么选择parquet orc:先划分行组,然后再划分成一列列再存储
HIVE存储格式ORC、PARQUET对比