当前位置: 开发笔记 > 编程语言 > 正文

python哈夫曼树解码_Python哈夫曼树HuffmanTree

作者：遗忘的花心本分尐男人 | 来源：互联网 | 2023-09-18 11:58

今天要讲的是天才哈夫曼的哈夫曼编码，这是树形数据结构的一个典型应用。！！！敲黑板！！࿰

今天要讲的是天才哈夫曼的哈夫曼编码&＃xff0c;这是树形数据结构的一个典型应用。

&＃xff01;&＃xff01;&＃xff01;敲黑板&＃xff01;&＃xff01;&＃xff01;哈夫曼树的构建以及编码方式将是我们的学习重点。

老方式&＃xff0c;代码&＃43;解释&＃xff0c;手把手教你Python完成哈夫曼编码的全过程。、

首先&＃xff0c;我先假设你已经有了二叉树的相关知识&＃xff0c;主要就是概念和遍历方式这些点。如果没有这些知识储备&＃xff0c;可能理解起来会比较困难。

好了&＃xff0c;废话不多说。

哈夫曼树原理

秉着能不写就不写的理念&＃xff0c;关于哈夫曼树的原理及其构建&＃xff0c;还是贴一篇博客吧。

http://www.cnblogs.com/mcgrady/p/3329825.html。(这篇博客关于哈夫曼树及其编码的原理讲的还行&＃xff0c;简洁易懂&＃xff0c;因为哈夫曼树原理本来就挺简单的)。

其大概流程

哈夫曼编码代码

#树节点类构建

classTreeNode(object):def __init__(self, data):

self.val&＃61;data[0]

self.priority&＃61; data[1]

self.leftChild&＃61;None

self.rightChild&＃61;None

self.code&＃61; ""

#创建树节点队列函数

defcreatnodeQ(codes):

q&＃61;[]for code incodes:

q.append(TreeNode(code))returnq#为队列添加节点元素&＃xff0c;并保证优先度从大到小排列

defaddQ(queue, nodeNew):if len(queue) &＃61;&＃61;0:return[nodeNew]for i inrange(len(queue)):if queue[i].priority >&＃61;nodeNew.priority:return queue[:i] &＃43; [nodeNew] &＃43;queue[i:]return queue &＃43;[nodeNew]#节点队列类定义

classnodeQeuen(object):def __init__(self, code):

self.que&＃61;creatnodeQ(code)

self.size&＃61;len(self.que)defaddNode(self,node):

self.que&＃61;addQ(self.que, node)

self.size&＃43;&＃61; 1

defpopNode(self):

self.size-&＃61; 1

returnself.que.pop(0)#各个字符在字符串中出现的次数&＃xff0c;即计算优先度

deffreChar(string):

d&＃61;{}for c instring:if not c ind:

d[c]&＃61; 1

else:

d[c]&＃43;&＃61; 1

return sorted(d.items(),key&＃61;lambda x:x[1])#创建哈夫曼树

defcreatHuffmanTree(nodeQ):while nodeQ.size !&＃61; 1:

node1&＃61;nodeQ.popNode()

node2&＃61;nodeQ.popNode()

r&＃61; TreeNode([None, node1.priority&＃43;node2.priority])

r.leftChild&＃61;node1

r.rightChild&＃61;node2

nodeQ.addNode(r)returnnodeQ.popNode()

codeDic1&＃61;{}

codeDic2&＃61;{}#由哈夫曼树得到哈夫曼编码表

defHuffmanCodeDic(head, x):globalcodeDic, codeListifhead:

HuffmanCodeDic(head.leftChild, x&＃43;&＃39;0&＃39;)

head.code&＃43;&＃61;xifhead.val:

codeDic2[head.code]&＃61;head.val

codeDic1[head.val]&＃61;head.code

HuffmanCodeDic(head.rightChild, x&＃43;&＃39;1&＃39;)#字符串编码

defTransEncode(string):globalcodeDic1

transcode&＃61; ""

for c instring:

transcode&＃43;&＃61;codeDic1[c]returntranscode#字符串解码

defTransDecode(StringCode):globalcodeDic2

code&＃61; ""ans&＃61; ""

for ch inStringCode:

code&＃43;&＃61;chif code incodeDic2:

ans&＃43;&＃61;codeDic2[code]

code&＃61; ""

returnans

# 举例

string&＃61; "AAGGDCCCDDDGFBBBFFGGDDDDGGGEFFDDCCCCDDFGAAA"t&＃61;nodeQeuen(freChar(string))

tree&＃61;creatHuffmanTree(t)

HuffmanCodeDic(tree,&＃39;&＃39;)print(codeDic1,codeDic2)

a&＃61;TransEncode(string)print(a)

aa&＃61;TransDecode(a)print(aa)print(string &＃61;&＃61; aa)

接下来就是一段一段分析代码

1.树结点类的构建&＃xff1a;

共有5个属性&＃xff1a;结点的值&＃xff0c;结点的优先度&＃xff0c;结点的左子结点&＃xff0c;结点的右子结点&＃xff0c;结点值的编码(这个没有什么好说的&＃xff0c;这些属性都是被需要的)

2.创建树结点队列函数&＃xff1a;

对于所有的字母结点&＃xff0c;我们将其组成一个队列&＃xff0c;这里使用list列表来完成队列的功能。将所有树节点够放进列表中&＃xff0c;当然传进来的是按优先度从小到大已排序的元素列表

3.为队列添加节点元素&＃xff0c;并保证优先度从大到小排列&＃xff1a;

当有新生成的结点时&＃xff0c;需将其插入列表&＃xff0c;并放在合适位置&＃xff0c;使队列依然时按优先度从小打到排列的。

4.结点队列类定义&＃xff1a;

创建类初始化时需要传进去的是一个列表&＃xff0c;列表中的每个元素是由字母与优先度组成的元组。元组第一个元素是字母&＃xff0c;第二个元素是优先度(即在文本中出现的次数)

类初始化化时&＃xff0c;调用“创建树结点队列函数”&＃xff0c;队列中的每个元素都是一个树结点。

类中还包含一个队列规模属性以及另外两个操作函数&＃xff1a;添加结点函数和弹出结点函数。

添加结点函数直接调用之前定义的函数即可&＃xff0c;输入的参数为队列和新结点&＃xff0c;并且队列规模加一

弹出第一个元素则直接调用列表的pop(0)函数&＃xff0c;同时队列规模减一

5.计算文本中个字母的优先度&＃xff0c;即出现的次数&＃xff1a;

定义一个字典&＃xff0c;遍历文本中的每一个字母&＃xff0c;若字母不在字典里说明是第一次出现&＃xff0c;则定义该字母为键&＃xff0c;另键值为1&＃xff0c;若在字典里有&＃xff0c;则只需将相应的键值加一。遍历后就得到了每个字母出现的次数。

6.由哈夫曼树得到编码表&＃xff1a;

这里定义了两个全局字典&＃xff0c;用于存放字母编码&＃xff0c;一个字典用于编码&＃xff0c;另一个字典用于解码&＃xff0c;这样程序操作起来比较方便。

这里主要就是遍历&＃xff0c;运用的是二叉树的中序遍历。如果明白中序遍历的化&＃xff0c;就能看懂这里的代码&＃xff0c;每递归到深一层的时候&＃xff0c;就在后面多加一个‘0’(左子树)或‘1’(右子树)。

中序遍历我在

这一段是哈夫曼编码的关键&＃xff0c;也是难点&＃xff0c;希望能够好好理解一下&＃xff0c;也是对递归的一个理解。这一点没问题的话&＃xff0c;我觉得哈夫曼树真的挺简单的&＃xff01;&＃xff01;&＃xff01;

7.字符串编码&＃xff0c;字符串解码&＃xff1a;

这两段我就不详细说了&＃xff0c;应为已经有编码与解码的字典了&＃xff0c;所以对应每一个字母直接在字典里找就好了&＃xff0c;而且字典的寻找速度还是相当快的。

差不多了&＃xff0c;例子就不举了&＃xff0c;确实哈夫曼树比之前的什么八皇后问题还有KMP问题简单多了。

最后向Huffman大神致敬&＃xff0c;祝各位学有所成。

推荐阅读

string
电话号码的字母组合解题思路和代码示例

本文介绍了力扣题目《电话号码的字母组合》的解题思路和代码示例。通过使用哈希表和递归求解的方法，可以将给定的电话号码转换为对应的字母组合。详细的解题思路和代码示例可以帮助读者更好地理解和实现该题目。 ... [详细]

蜡笔小新 2023-12-14 18:50:22
import
Python对Excel文件的读取方法及模块安装

本文介绍了Python对Excel文件的读取方法，包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块，可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式，并给出了相应的代码示例。 ... [详细]

蜡笔小新 2023-12-14 19:49:05
string
SpringBoot uri统一权限管理的实现方法及步骤详解

本文详细介绍了SpringBoot中实现uri统一权限管理的方法，包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性，实现对系统任意接口的权限拦截验证。 ... [详细]

蜡笔小新 2023-12-14 16:11:30
string
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
string
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
string
Mac OS 升级到11.2.2 Eclipse打不开了，报错Failed to create the Java Virtual Machine

本文介绍了在Mac OS升级到11.2.2版本后，使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 12:01:13
string
如何在有序字符序列中插入新字符并保持有序

本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ... [详细]

蜡笔小新 2023-12-14 11:16:33
string
Java String与StringBuffer的区别及其应用场景

本文主要介绍了Java中String和StringBuffer的区别，String是不可变的，而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象，内存使用上要优于String类。因此，在需要频繁对字符串进行修改的情况下，使用StringBuffer更加适合。同时，文章还介绍了String和StringBuffer的应用场景。 ... [详细]

蜡笔小新 2023-12-13 19:21:06
client
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
string
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
string
《数据结构》学习笔记3——串匹配算法性能评估

本文主要讨论串匹配算法的性能评估，包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库，可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n)，通过随机取出长度为m的子串作为模式P，在文本T中进行匹配，统计平均复杂度。对于成功和失败的匹配分别进行测试，分析其平均复杂度。详情请参考相关学习资源。 ... [详细]

蜡笔小新 2023-12-13 16:16:05
int
游标的使用笔记

本文介绍了游标的使用方法，并以一个水果供应商数据库为例进行了说明。首先创建了一个名为fruits的表，包含了水果的id、供应商id、名称和价格等字段。然后使用游标查询了水果的名称和价格，并将结果输出。最后对游标进行了关闭操作。通过本文可以了解到游标在数据库操作中的应用。 ... [详细]

蜡笔小新 2023-12-13 15:24:30
string
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
string
006_Redis的List数据类型

1.List类型是一个链表结构的集合,主要功能有push,pop,获取元素等。List类型是一个双端链表的结构,我们可以通过相关操作进行集合的头部或者尾部添加删除元素,List的设 ... [详细]

蜡笔小新 2023-12-13 09:57:22
string
iOS数据库Sqlite的SQL语句分类和常见约束关键字

本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型，其中DDL语句用于定义、删除和修改数据表，关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外，还介绍了常见的数据库数据类型，包括integer、text和real。 ... [详细]

蜡笔小新 2023-12-12 18:42:03

遗忘的花心本分尐男人

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章