作者:书友59418658 | 来源:互联网 | 2023-09-14 20:10
序列化(Serialization)是指把结构化对象转化为字节流。反序列化(Deserialization)是序列化的逆过程。把字节流转为结构化对象。作用:用于实现网络的传输和数据
序列化(Serialization)
是指把结构化对象转化为字节流。
反序列化(Deserialization)
是序列化的逆过程。把字节流转为结构化对象。
作用:
用于实现网络的传输 和 数据的磁盘存储工作
一、需求:
a 1
a 9
b 3
a 7
b 8
b 10
a 5
要求:
第一列按照字典顺序进行排列
第一列相同的时候, 第二列按照升序进行排列,输出到文件。
二、思路:
三、代码实现:
https://download.csdn.net/download/woshilovetg/13735711
四、本机运行
五、运行linux
将sort.txt上传
上传到linux上,在传导hdfs分布式文件系统中
sort.txt
a 1
a 9
b 3
a 7
b 8
b 10
a 5
a 9
执行命令
#/output/sort 必须不存在
#SortMain 主启动类
yarn jar original-day09_mapreduce1-1.0-SNAPSHOT.jar cn.itcast.sort.SortMain /input/sort/sort.txt /output/sort
最终结果
10 比3小,是因为10是字符串,按照第一位取排序