热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Linux命令之md5sum的作用以及使用方法(md5是什么?)

1.背景在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完

1. 背景

   在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。

    md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。

    md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列的。

    在网络传输时,我们校验源文件获得其md5sum,传输完毕后,校验其目标文件,并对比如果源文件和目标文件md5 一致的话,则表示文件传输无异常。否则说明文件在传输过程中未正确传输。


2. 重要的选项

  • -b 以二进制模式读入文件内容
  • -t 以文本模式读入文件内容
  • -c 根据已生成的md5值,对现存文件进行校验
  • --status 校验完成后,不生成错误或正确的提示信息,可以通过命令的返回值来判断。

3. 使用举例

  •     生成文件md5值

md5sum file

1: [root@master lianxi]# md5sum data 2: 0a6de444981b68d6a049053296491e49 data1: [root@master lianxi]# md5sum *2: 0a6de444981b68d6a049053296491e49 data3: 13df384c47dd2638fd923f60c40224c6 data2

     md5sum校验的是文件内容,与文件名无关

  • 以文本模式或二进制模式读入文件并对其进行校验

        -b 以二进制模式读入内容
        -t 以文本模式读入文件内容进行校验
        虽然是不同的读入模式,但是在进行求md5的时候,是一样的,因为是逐位校验的。
        如下文本文件,无论通过哪种模式读取md5都一致。

 

 

1: [root@master lianxi]# file data
2: data: ASCII text
3: [root@master lianxi]# md5sum data
4: 0a6de444981b68d6a049053296491e49 data
5: [root@master lianxi]# md5sum -b data
6: 0a6de444981b68d6a049053296491e49 *data
7: [root@master lianxi]# md5sum -t data
8: 0a6de444981b68d6a049053296491e49 data

 

  • md5值重定向

        将生成md5值重定向到指定的文件,通常文件的扩展名我们会命为.md5

1: [root@master lianxi]# md5sum data > data.md52: [root@master lianxi]# md5sum data3: 0a6de444981b68d6a049053296491e49 data4: [root@master lianxi]# cat data.md55: 0a6de444981b68d6a049053296491e49 data

  • 将多个文件的md5重定向到指定的文件

        每个文件的md5生成为一行

1: [root@master lianxi]# ls2: data data.bak data.md5 d.md53: [root@master lianxi]# md5sum data* > d.md54: [root@master lianxi]# cat d.md55: 0a6de444981b68d6a049053296491e49 data6: 0a6de444981b68d6a049053296491e49 data.bak7: 0bd94658869c53cdcdf35a0f7de93e01 data.md5

  • 重定向追加

        这里新增文件ls,单独求其md5,将其md5追加到文件中

1: [root@master lianxi]# cp /bin/ls .2: [root@master lianxi]# ls3: data data.bak data.md5 d.md5 ls4: [root@master lianxi]# md5sum ls >> d.md55: [root@master lianxi]# cat d.md56: 0a6de444981b68d6a049053296491e49 data 7: 0a6de444981b68d6a049053296491e49 data.bak8: 0bd94658869c53cdcdf35a0f7de93e01 data.md59: c6337b20f3c159544bff5cf622391f9e ls

  •  md5校验

         -c选项来对文件md5进行校验。校验时,根据已生成的md5来进行校验。生成当前文件的md5,并和之前已经生成的md5进行对比,如果一致,则返回OK,否则返回错误信息
         md5sum –c d.md5

1: [root@master lianxi]# md5sum -c d.md52: data: OK3: data.bak: OK4: data.md5: OK 5: ls: OK

        修改文件后,文件md5变化

1: [root@master lianxi]# ls2: data3: [root@master lianxi]# md5sum data4: 2360752c3368ca4f89169f5ecc06e383 data5: [root@master lianxi]# md5sum data > data.md56: [root@master lianxi]# echo "lwg" >> data7: [root@master lianxi]# md5sum data8: 287d237083a42f09785daa46a5fa3afe data9: [root@master lianxi]# md5sum -c data.md510: data: FAILED11: md5sum: WARNING: 1 of 1 computed checksum did NOT match

         --status,不显示校验信息,以命令返回值来判断
         校验一致返回0,不一致返回1

1: [root@master lianxi]# md5sum -c data.md52: data: FAILED3: md5sum: WARNING: 1 of 1 computed checksum did NOT match4: [root@master lianxi]# md5sum -c --status data.md55: [root@master lianxi]# echo $?6: 1

  • 多个文件文件校验和grep连用

        通过grep将正确的信息过滤掉

1: [root@master lianxi]# md5sum -c ../value.md52: acpid: OK3: acpid.1: OK4: anaconda.log: OK5: anaconda.syslog: OK6: anaconda.xlog: OK7: boot.log: OK8: boot.log.1: OK9: ...10: ...11: 省略中间部分12: ...13: ...14: yum.log.2: OK 15: md5sum: WARNING: 1 of 56 computed checksums did NOT match1: [root@master lianxi]# md5sum -c ../value.md5 | grep -v OK2: md5sum: WARNING: 1 of 56 computed checksums did NOT match3: cron.1: FAILED

特殊说明
1)md5sum 是校验文件内容,与文件名是否相同无关

2)md5sum值逐位校验,所以文件越大,校验时间越长。

总结
通过md5sum来校验生成文件校验码,来发现文件传输(网络传输、复制、本地不同设备间的传输)异常造成的文件内容不一致的情况。


工作 实践应用场景:

需要比较2个rc1.tar.gz 包和rc2.tar.gz两个包,变更是不是和开发说的一致

1.获取包,确保包正确无误

   获取包后,验证包的MD5值:md5sum rc*.tar.gz

2. 解压缩到指定目录

    确保对应的目录存在

    tar -zxvf  rc1.tar.gz -C ./test_rc1

     tar -zxvf  rc2.tar.gz -C ./test_rc2

3. 递归生成各文件的的MD5值

    find ./test_rc1 -type f -print0| xargs -0 md5sum >> rc1_md5.txt

    find ./test_rc2 -type f -print0| xargs -0 md5sum >> rc2_md5.txt

4. 比较两文件的MD5值

    diff -c rc1_md5.txt  rc2_md5.txt

     或者用UltraCompare Professional比对结果


推荐阅读
  • 使用 `git stash` 可以将当前未提交的修改保存到一个临时存储区,以便在后续恢复工作目录时使用。例如,在处理中间状态时,可以通过 `git stash` 命令将当前的所有未提交更改推送到一个新的储藏中,从而保持工作目录的整洁。此外,本文还将详细介绍如何解决 `git stash pop` 时可能出现的冲突问题,帮助用户高效地管理代码变更。 ... [详细]
  • MyISAM和InnoDB是MySQL中最为广泛使用的两种存储引擎,每种引擎都有其独特的优势和适用场景。MyISAM引擎以其简单的结构和高效的读取速度著称,适用于以读操作为主、对事务支持要求不高的应用。而InnoDB引擎则以其强大的事务处理能力和行级锁定机制,在需要高并发写操作和数据完整性的场景下表现出色。选择合适的存储引擎应综合考虑业务需求、性能要求和数据一致性等因素。 ... [详细]
  • Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]
  • 本文对比了杜甫《喜晴》的两种英文翻译版本:a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑,b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]
  • javascript分页类支持页码格式
    前端时间因为项目需要,要对一个产品下所有的附属图片进行分页显示,没考虑ajax一张张请求,所以干脆一次性全部把图片out,然 ... [详细]
  • 字节流(InputStream和OutputStream),字节流读写文件,字节流的缓冲区,字节缓冲流
    字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream,所有的输出流都继承子OutputStreamInput ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 本文详细介绍了MySQL数据库的基础语法与核心操作,涵盖从基础概念到具体应用的多个方面。首先,文章从基础知识入手,逐步深入到创建和修改数据表的操作。接着,详细讲解了如何进行数据的插入、更新与删除。在查询部分,不仅介绍了DISTINCT和LIMIT的使用方法,还探讨了排序、过滤和通配符的应用。此外,文章还涵盖了计算字段以及多种函数的使用,包括文本处理、日期和时间处理及数值处理等。通过这些内容,读者可以全面掌握MySQL数据库的核心操作技巧。 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • 您的数据库配置是否安全?DBSAT工具助您一臂之力!
    本文探讨了Oracle提供的免费工具DBSAT,该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告,DBSAT帮助用户识别潜在的安全漏洞,并提供针对性的改进建议,确保数据库系统的稳定性和安全性。 ... [详细]
  • 本文提出了一种基于栈结构的高效四则运算表达式求值方法。该方法能够处理包含加、减、乘、除运算符以及十进制整数和小括号的算术表达式。通过定义和实现栈的基本操作,如入栈、出栈和判空等,算法能够准确地解析并计算输入的表达式,最终输出其计算结果。此方法不仅提高了计算效率,还增强了对复杂表达式的处理能力。 ... [详细]
  • 基于Net Core 3.0与Web API的前后端分离开发:Vue.js在前端的应用
    本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发,并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作,开发环境为Windows 10和Visual Studio 2019,MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装,为开发者提供了一套完整的开发指南。 ... [详细]
  • 本文探讨了利用JavaScript实现集合的对称差集算法的方法。该算法旨在处理多个数组作为输入参数,同时保留每个数组中元素的原始顺序。算法不会移除单个数组内的重复元素,但会删除在不同数组之间出现的重复项。通过这种方式,能够有效地计算出多个数组的对称差集。 ... [详细]
  • 本文介绍了一种算法,用于计算当前日期在本年度的具体周数。该方法由作者王峰提出,通过私有函数 `weekOfYear` 实现,能够准确地确定当前日期在一年中的周位置。此算法在日历计算和时间管理中具有广泛应用,适用于各种编程语言和应用场景。 ... [详细]
  • 本文深入探讨了CGLIB BeanCopier在Bean对象复制中的应用及其优化技巧。相较于Spring的BeanUtils和Apache的BeanUtils,CGLIB BeanCopier在性能上具有显著优势。通过详细分析其内部机制和使用场景,本文提供了多种优化方法,帮助开发者在实际项目中更高效地利用这一工具。此外,文章还讨论了CGLIB BeanCopier在复杂对象结构和大规模数据处理中的表现,为读者提供了实用的参考和建议。 ... [详细]
author-avatar
暖心我在这_若惜
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有