热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Base64编码原理及代码实现

Base64编码原理及代码实现所谓base64编码就是从ASCII码表中选取64个可打印字符(A-Za-z0-9)作为基本字符集对其它字符进行编码转换


Base64 编码原理及代码实现

所谓 base64 编码就是从 ASCII 码表中选取64个可打印字符(A-Za-z0-9+/)作为基本字符集对其它字符进行编码转换。加上作为填充的 “=” 实际上是 65 个字符。


Base64 产生的原因

要想了解 base64 就得先了解下 ASCII 码表, ASCII 码表是由以英语为母语的美国制定。英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的。比如,在法语中,字母上方有注音符号,它就无法用 ASCII 码表示。于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。比如,法语中的é的编码为130(二进制10000010)。这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号。

但是,这里又出现了新的问题。不同的国家有不同的字母,因此,哪怕它们都使用256个符号的编码方式,代表的字母却不一样。比如,130在法语编码中代表了é,在希伯来语编码中却代表了字母Gimel (ג),在俄语编码中又会代表另一个符号。但是不管怎样,所有这些编码方式中,0–127表示的符号是一样的,不一样的只是128–255的这一段。

至于亚洲国家的文字,使用的符号就更多了,汉字就多达10万左右。一个字节只能表示256种符号,肯定是不够的,就必须使用多个字节表达一个符号。比如,简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示 256 * 256 = 65536 个符号。

而在网络上交换数据时,比如说从A地传到B地,往往要经过多个路由设备,由于不同的设备对字符的处理方式有一些不同,这样那些不可见字符就有可能被处理错误,这是不利于传输的。所以就先把数据先做一个 Base64 编码,统统变成可见字符,这样出错的可能性就大降低了。


为什么是 Base64?

为什么是 base64 而不是 base128、base256 呢?其实原因很简单,因为在 ASCII 码表中的可打印字符只有 95 个,所以选取 64 个可打印字符是最为合理的。既然如此,那是不是也有 base32、base16 呢?对,当然可以有。只是目前大多用到的还是 base64 编码。


Base64 编码的理论实现

前面根据 A-Za-z0-9+/ 字符集可以得到一张索引表:


索引对应字符索引对应字符索引对应字符索引对应字符
0A17R34i51z
1B18S35j520
2C19T36k531
3D20U37l542
4E21V38m553
5F22W39n564
6G23X40o575
7H24Y41p586
8I25Z42q597
9J26a43r608
10K27b44s619
11L28c45t62+
12M29d46u63/
13N30e47v
14O31f48w
15P32g49x
16Q33h50y

Base64 具体编码转换步骤如下:

1.将待转换的字符串以每 3 个字节分为一组,1byte = 8bit,每一组正好 24 个二进制位。
2.将上面的 24 个二进制位划分为每 6 位一组,形成 4 组。
3.每组前面加两个 0,形成 8 位一组,即 4 个字节。
4.根据上面 Base64 对照表获取对应的值,形成 Base64 编码。

**举个例子:**下面表格是以字符串 “Man” 作为原始字符串进行 Base64 编码的过程。


文本Man
ASCII7797110
二进制010011010110000101101110
分组00 01001100 01011000 00010100 101110
索引1922546
Base64编码TWFu

那么你可能会问,如果我原始字符串少于 3 个字节怎么办呢?

如果输入原始字符串长度不能被 3 整除的话,我们需要用 “=” 对其 Base64 编码进行填充。为什么需要 “=” 填充呢?因为 Base64 解码是以 4 位字符一划分的,如果你不对其进行填充就会导致解码失败。

当原始字符串的二进制位不是 6 的倍数的时候,我们依然会将其划分为 6 位一组,然后将最后一组用 0 填充至 6 位(在末尾填充)。

**举个例子:**下面是对字符串 “AB” 的编码过程,其编码结果为 “QUI=”。


文本AB
ASCII6566
二进制0100000101000010
分组00 01000000 01010000 001000
索引16208
Base64编码QUI=

注意:中文字符有很多的编码,如 UTF-8、GBK、GB2312 等,不同的编码都会对 Base64 编码产生影响。


源代码

base64.h

/*base64.h*/
#ifndef _BASE64_H
#define _BASE64_H
#include
#include
#include
inline unsigned int BASE64_ENCODE_SIZE(unsigned int len) { // 计算字符串加密后的长度(不包括填充字符 '=')return ceil(len * 8 / 6);
}
unsigned char *base64encode(const unsigned char *str, unsigned int len);
unsigned char *base64decode(const unsigned char *str, unsigned int len);
#endif

base64.c

#include
#include "base64.h"
#define CHARPAD '='
extern inline unsigned int BASE64_ENCODE_SIZE(unsigned int);
/* Base64 编码表 */
static const unsigned char base64_table_encode[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H','I', 'J', 'K', 'L', 'M', 'N', 'O', 'P','Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X','Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f','g', 'h', 'i', 'j', 'k', 'l', 'm', 'n','o', 'p', 'q', 'r', 's', 't', 'u', 'v','w', 'x', 'y', 'z', '0', '1', '2', '3','4', '5', '6', '7', '8', '9', '+', '/',
};
unsigned char *base64encode(const unsigned char *str, unsigned int len)
{int i &#61; 0, j &#61; 0, k &#61; 0;unsigned int encodeSize &#61; BASE64_ENCODE_SIZE(len);unsigned char *result &#61; (unsigned char *) malloc(sizeof(unsigned char) * encodeSize &#43; 4);result[encodeSize] &#61; &#39;\0&#39;; /* 构造字符串 */for(i &#61; 0, j &#61; 0; i > 2) & 0x3f];if (i &#43; 1 >&#61; encodeSize) break;result[i&#43;1] &#61; base64_table_encode[((str[j] & 0x3) <<4) | ((str[j&#43;1] >> 4) & 0xf)];if (i &#43; 2 >&#61; encodeSize) break;result[i&#43;2] &#61; base64_table_encode[((str[j&#43;1] & 0xf) <<2) | ((str[j&#43;2] >> 6) & 0x3)];if (i &#43; 3 >&#61; encodeSize) break;result[i&#43;3] &#61; base64_table_encode[(str[j&#43;2] & 0x3f)];}return result;
}






推荐阅读
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • 本文详细介绍了GetModuleFileName函数的用法,该函数可以用于获取当前模块所在的路径,方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释,帮助读者理解和使用该函数。同时,还提供了相关的API函数声明和说明。 ... [详细]
  • 电话号码的字母组合解题思路和代码示例
    本文介绍了力扣题目《电话号码的字母组合》的解题思路和代码示例。通过使用哈希表和递归求解的方法,可以将给定的电话号码转换为对应的字母组合。详细的解题思路和代码示例可以帮助读者更好地理解和实现该题目。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • SpringBoot uri统一权限管理的实现方法及步骤详解
    本文详细介绍了SpringBoot中实现uri统一权限管理的方法,包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性,实现对系统任意接口的权限拦截验证。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文介绍了深入浅出Linux设备驱动编程的重要性,以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子,展示了模块的编译和加载过程,并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]
  • Java自带的观察者模式及实现方法详解
    本文介绍了Java自带的观察者模式,包括Observer和Observable对象的定义和使用方法。通过添加观察者和设置内部标志位,当被观察者中的事件发生变化时,通知观察者对象并执行相应的操作。实现观察者模式非常简单,只需继承Observable类和实现Observer接口即可。详情请参考Java官方api文档。 ... [详细]
author-avatar
手浪用户2602884673
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有