热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python中去除浮点数末尾无意义的零和点

本文详细介绍了在Python中如何有效去除浮点数末尾的无意义零及不必要的点,提供多种实现方法,并深入探讨了浮点数在计算机中的表示方式及其可能带来的精度问题。

方法一:使用条件判断

a = 12.12300 # 结果应为12.123
b = 12.00 # 结果应为12
c = 200.12000 # 结果应为200.12
d = 200.0 # 结果应为200

print('a==>', [str(a), int(a)][int(a) == a])
print('b==>', [str(b), int(b)][int(b) == b])
print('c==>', [str(c), int(c)][int(c) == c])
print('d==>', [str(d), int(d)][int(d) == d])

方法二:利用字符串格式化

for num in [12.12300, 12.00, 200.12000, 200.0]:
    print('{:g}'.format(num))

补充:理解浮点数在 Python 中的表示与陷阱

虽然标题听起来有些夸张,但确实,很多开发者在处理浮点数时遇到了意想不到的问题。让我们通过一个简单的例子来理解这个问题。

>>> 0.1 + 0.2 == 0.3
False

初次见到这个结果,你可能会感到困惑,甚至认为这是 Python 的一个 bug。但实际上,这是由于浮点数在计算机内部的表示方式导致的。

>>> 0.1 + 0.2
0.30000000000000004

为了更好地理解这一现象,我们需要了解浮点数在计算机中的表示方式,特别是它们如何被转换成二进制。

整数的二进制表示

以整数 9 为例,其二进制表示为 1001。这个结果是如何得来的呢?通过将十进制数不断除以 2 并记录每次的余数,可以得到其二进制形式。具体代码如下:

n = 9
while n > 0:
    n, e = divmod(n, 2)
    print(e)

二进制转十进制

十进制数可以通过科学计数法表示,例如 123 = 1*10^2 + 2*10^1 + 3*10^0。同样地,二进制数 1001 可以表示为:

1001 = 1*2^3 + 0*2^2 + 0*2^1 + 1*2^0
= 8 + 0 + 0 + 1
= 9

浮点数的二进制表示

浮点数的二进制表示与整数类似,只是多了一个小数点。例如,二进制数 101.11 对应的十进制数为:

101.11 = 1*2^2 + 0*2^1 + 1*2^0 + 1*2^-1 + 1*2^-2
= 4 + 0 + 1 + 0.5 + 0.25
= 5.75

十进制浮点数转二进制

将十进制浮点数转换为二进制的过程分为两步:整数部分按常规方法转换,小数部分则通过不断乘以 2 并取整数部分,直到小数部分为 0 或达到所需精度。例如,2.25 转换为二进制为 10.01。

0.25 * 2 = 0.5 整数为0,小数为0.5
0.5 * 2 = 1.0 整数为1,小数为0

然而,并非所有浮点数都能如此简单地转换。例如,0.2 的二进制表示为 0.001100110011...,这是一个无限循环的小数。

0.2 * 2 = 0.4 整数为0,小数为0.4
0.4 * 2 = 0.8 整数为0,小数为0.8
0.8 * 2 = 1.6 整数为1,小数为0.6
0.6 * 2 = 1.2 整数为1,小数为0.2
...

这种无限循环导致 0.2 无法在二进制中精确表示,只能取一个近似值。将其转换回十进制,结果为 0.199951171875,接近但不等于 0.2。

浮点数在计算机中的存储

根据 IEEE 754 标准,浮点数在计算机中的存储分为三部分:符号位(s)、指数位(E)和尾数位(M)。例如,1.25 的二进制表示为 1.01 × 2^0,其中 s=0,M=1.01,E=0。

IEEE 754 规定:

  • 对于 32 位浮点数,最高位为符号位,接下来 8 位为指数位,最后 23 位为尾数位。
  • 对于 64 位浮点数,最高位为符号位,接下来 11 位为指数位,最后 52 位为尾数位。
  • 尾数位 M 的第一位总是 1,因此在存储时会省略。
  • 指数位 E 的真实值需要减去一个偏移量,对于 8 位 E,偏移量为 127;对于 11 位 E,偏移量为 1023。

例如,浮点数 0.2 在计算机中的存储方式如下:

import struct

def float_to_bits(f):
    s = struct.pack('>f', f)
    return struct.unpack('>l', s)[0]

print(float_to_bits(0.2))
# 输出: 1045220557
print(bin(float_to_bits(0.2)))
# 输出: 0b111110010011001100110011001101

浮点数 0.2 的实际存储值为 1045220557,对应的二进制表示为 111110010011001100110011001101。转换为 32 位整数后,其二进制表示为:

0 01111100 10011001100110011001101

最高位为 0,表示正数;接下来 8 位 01111100 表示指数位,对应整数 124,减去偏移量 127 后,实际指数值为 -3;最后 23 位表示尾数位,加上省略的 1 后,实际尾数值为 1.10011001100110011001101。因此,0.2 的实际值为:

1.10011001100110011001101 * 2^-3
= 0.00110011001100110011001101
= 1/8 + 1/16 + 1/128 + 1/256 + 1/2048 + 1/4096 + ...
= 0.20000000298023224

这解释了为什么 0.1 + 0.2 不等于 0.3,而是 0.30000000000000004。


推荐阅读
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 本文介绍了在Windows环境下使用pydoc工具的方法,并详细解释了如何通过命令行和浏览器查看Python内置函数的文档。此外,还提供了关于raw_input和open函数的具体用法和功能说明。 ... [详细]
  • 本文深入探讨了 Python 列表切片的基本概念和实际应用,通过具体示例展示了不同切片方式的使用方法及其背后的逻辑。 ... [详细]
  • 基因组浏览器中的Wig格式解析
    本文详细介绍了Wiggle(Wig)格式及其在基因组浏览器中的应用,涵盖variableStep和fixedStep两种主要格式的特点、适用场景及具体使用方法。同时,还提供了关于数据值和自定义参数的补充信息。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 最近团队在部署DLP,作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么,他们都以商业秘密为由避而不谈,不得已只能自己查资料学习,于是有了下面的浅见。身为甲方,虽然不需要开发DLP产品,但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器,只有在懂这个工具的原理之后才能更加灵活地使用这个工具,即使出现意外情况也能快速排错,越接近底层,越接近真相。根据DLP的实际用途,本文将DLP检测分为2部分,泄露关键字检测和近似重复文档检测。 ... [详细]
  • 本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率,使用经典的EK(Edmonds-Karp)和Dinic算法进行求解。 ... [详细]
  • 微软Exchange服务器遭遇2022年版“千年虫”漏洞
    微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞,导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]
  • 本文介绍如何使用 Python 获取文件和图片的创建、修改及拍摄日期。通过多种方法,如 PIL 库的 _getexif() 函数和 os 模块的 getmtime() 和 stat() 方法,详细讲解了这些技术的应用场景和注意事项。 ... [详细]
  • 本文深入探讨了Python中的高阶函数和Lambda表达式的使用方法,结合实际案例解析其应用场景,帮助开发者更好地理解和运用这些强大的工具。 ... [详细]
  • 信用评分卡的Python实现与评估
    本文介绍如何使用Python构建和评估信用评分卡模型,涵盖数据预处理、模型训练及验证指标选择。附带详细代码示例和视频教程链接。 ... [详细]
  • MySQL DateTime 类型数据处理及.0 尾数去除方法
    本文介绍如何在 MySQL 中处理 DateTime 类型的数据,并解决获取数据时出现的.0尾数问题。同时,探讨了不同场景下的解决方案,确保数据格式的一致性和准确性。 ... [详细]
  • 本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本,并进行数据处理和保存。 ... [详细]
  • 本文探讨了 C++ 中普通数组和标准库类型 vector 的初始化方法。普通数组具有固定长度,而 vector 是一种可扩展的容器,允许动态调整大小。文章详细介绍了不同初始化方式及其应用场景,并提供了代码示例以加深理解。 ... [详细]
  • 本实验主要探讨了二叉排序树(BST)的基本操作,包括创建、查找和删除节点。通过具体实例和代码实现,详细介绍了如何使用递归和非递归方法进行关键字查找,并展示了删除特定节点后的树结构变化。 ... [详细]
author-avatar
cocoa_小米多本_148
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有