百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

netty系列之:java中的base64编码器

toyiye 2024-08-22 02:19 5 浏览 0 评论

简介

什么是Base64编码呢?在回答这个问题之前,我们需要了解一下计算机中文件的分类,对于计算机来说文件可以分为两类,一类是文本文件,一类是二进制文件。

对于二进制文件来说,其内容是用二进制来表示的,对于人类是不可立马理解的。如果你尝试用文本编辑器打开二进制文件,可能会看到乱码。这是因为二进制文件的编码方式和文本文件的编码方式是不一样的,所以当文本编辑器尝试将二进制文件翻译成为文本内容的时候,就会出现乱码。

对于文本文件来说,也有很多种编码方式,比如最早的ASCII编码和目前常用的UTF-8和UTF-16等编码方式。即使是文本文件,如果你使用不同的编码方式打开,也可能会看到乱码。

所以不管是文本文件还是二进制文件也好,都需要进行编码格式的统一。也就是说写入的编码是什么样子的,那么数据读取的编码也应该和其匹配。

Base64编码实际上就是将二进制数据编码成为可视化ASCII字符的一种编码方式。

为什么会有这样的要求呢?

我们知道计算机世界的发展不是一蹴而就的,它是一个慢慢成长的过程,对于字符编码来说,最早只支持ASCII编码,后面才扩展到Unicode等。所以对于很多应用来说除了ASCII编码之外的其他编码格式是不支持的,那么如何在这些系统中展示非ASCII code呢?

解决的方式就是进行编码映射,将非ASCII的字符映射成为ASCII的字符。而base64就是这样的一种编码方式。

常见的使用Base64的地方就是在web网页中,有时候我们需要在网页中展示图片,那么可以将图片进行base64编码,然后填充到html中。

还有一种应用就是将文件进行base64编码,然后作为邮件的附件进行发送。

JAVA对base64的支持

既然base64编码这么好用,接下来我们来看一下JAVA中的base64实现。

java中有一个对应的base64实现,叫做java.util.Base64。这个类是Base64的工具类,是JDK在1.8版本引入的。

Base64中提供了三个getEncoder和getDecoder方法,通过获取对应的Encoder和Decoder,然后就可以调用Encoder的encode和decode方法对数据进行编码和解码,非常的方便。

我们先来看一下Base64的基本使用例子:

 // 使用encoder进行编码
 String encodedString = Base64.getEncoder().encodeToString("what is your name baby?".getBytes("utf-8"));
 System.out.println("Base64编码过后的字符串 :" + encodedString);

 // 使用encoder进行解码
 byte[] decodedBytes = Base64.getDecoder().decode(encodedString);

 System.out.println("解码过后的字符串: " + new String(decodedBytes, "utf-8"));

作为一个工具类,JDK中提供的Base64工具类还是很好用的。

这里就不详细讲解它的使用,本篇文章主要分析JDK中Base64是怎么实现的。

JDK中Base64的分类和实现

JDK中Base64类有提供了三个encoder方法,分别是getEncoder,getUrlEncoder和getMimeEncoder:

    public static Encoder getEncoder() {
         return Encoder.RFC4648;
    }

    public static Encoder getUrlEncoder() {
         return Encoder.RFC4648_URLSAFE;
    }

    public static Encoder getMimeEncoder() {
        return Encoder.RFC2045;
    }

同样的,它也提供了三个对应的decoder,分别是getDecoder,getUrlDecoder,getMimeDecoder:

    public static Decoder getDecoder() {
         return Decoder.RFC4648;
    }

    public static Decoder getUrlDecoder() {
         return Decoder.RFC4648_URLSAFE;
    }

    public static Decoder getMimeDecoder() {
         return Decoder.RFC2045;
    }

从代码中可以看出,这三种编码分别对应的是RFC4648,RFC4648_URLSAFE和RFC2045。

这三种都属于base64编码的变体,我们看下他们有什么区别:

编码名称

编码字符

编码字符

编码字符


第62位

第63位

补全符

RFC 2045: Base64 transfer encoding for MIME

+

/

=mandatory

RFC 4648: base64 (standard)

+

/

=optional

RFC 4648: base64url (URL- and filename-safe standard)

-

_

=optional

可以看到base64和Base64url的区别是第62位和第63位的编码字符不一样,而base64 for MIME跟base64的区别是补全符是否是强制的。

另外,对于Basic和base64url来说,不会添加line separator字符,而base64 for MIME在一行超出76字符之后,会添加’\r’ 和 ‘\n’作为line separator。

最后,如果在解码的过程中,发现有不存于Base64映射表中的字符的处理方式也不一样,base64和Base64url会直接拒绝,而base64 for MIME则会忽略。

base64和Base64url的区别可以通过下面两个方法来看出:

        private static final char[] toBase64 = {
            'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
            'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
            'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
            'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
            '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'
        };
        private static final char[] toBase64URL = {
            'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
            'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
            'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
            'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
            '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '-', '_'
        };

而对MIME来说,定义了一个一行的最大字符个数,和换行符:

        private static final int MIMELINEMAX = 76;
        private static final byte[] CRLF = new byte[] {'\r', '\n'};

Base64的高级用法

一般情况下我们用Base64进行编码的对象长度是固定的,我们只需要将输入对象转换成为byte数组即可调用encode或者decode的方法。

但是在某些情况下我们需要对流数据进行转换,这时候就可以用到Base64中提供的两个对Stream进行wrap的方法:

        public OutputStream wrap(OutputStream os) {
            Objects.requireNonNull(os);
            return new EncOutputStream(os, isURL ? toBase64URL : toBase64,
                                       newline, linemax, doPadding);
        }
        public InputStream wrap(InputStream is) {
            Objects.requireNonNull(is);
            return new DecInputStream(is, isURL ? fromBase64URL : fromBase64, isMIME);
        }

这两个方法分别对应于encoder和decoder。

总结

以上就是JDK中对Base64的实现和使用,虽然base64的变种有很多种,但是JDK中的Base64只实现了其中用处最为广泛的3种。大家在使用的时候一定要区分具体是那种Base64的实现方式,以免出现问题。

本文已收录于 http://www.flydean.com/14-1-1-java-base64/

最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!

欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!

相关推荐

# Python 3 # Python 3字典Dictionary(1)

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中,格式如...

Python第八课:数据类型中的字典及其函数与方法

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值...

Python中字典详解(python 中字典)

字典是Python中使用键进行索引的重要数据结构。它们是无序的项序列(键值对),这意味着顺序不被保留。键是不可变的。与列表一样,字典的值可以保存异构数据,即整数、浮点、字符串、NaN、布尔值、列表、数...

Python3.9又更新了:dict内置新功能,正式版十月见面

机器之心报道参与:一鸣、JaminPython3.8的热乎劲还没过去,Python就又双叒叕要更新了。近日,3.9版本的第四个alpha版已经开源。从文档中,我们可以看到官方透露的对dic...

Python3 基本数据类型详解(python三种基本数据类型)

文章来源:加米谷大数据Python中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。在Python中,变量就是变量,它没有类型,我们所说的"类型"是变...

一文掌握Python的字典(python字典用法大全)

字典是Python中最强大、最灵活的内置数据结构之一。它们允许存储键值对,从而实现高效的数据检索、操作和组织。本文深入探讨了字典,涵盖了它们的创建、操作和高级用法,以帮助中级Python开发...

超级完整|Python字典详解(python字典的方法或操作)

一、字典概述01字典的格式Python字典是一种可变容器模型,且可存储任意类型对象,如字符串、数字、元组等其他容器模型。字典的每个键值key=>value对用冒号:分割,每个对之间用逗号,...

Python3.9版本新特性:字典合并操作的详细解读

处于测试阶段的Python3.9版本中有一个新特性:我们在使用Python字典时,将能够编写出更可读、更紧凑的代码啦!Python版本你现在使用哪种版本的Python?3.7分?3.5分?还是2.7...

python 自学,字典3(一些例子)(python字典有哪些基本操作)

例子11;如何批量复制字典里的内容2;如何批量修改字典的内容3;如何批量修改字典里某些指定的内容...

Python3.9中的字典合并和更新,几乎影响了所有Python程序员

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

Python3大字典:《Python3自学速查手册.pdf》限时下载中

最近有人会想了,2022了,想学Python晚不晚,学习python有前途吗?IT行业行业薪资高,发展前景好,是很多求职群里严重的香饽饽,而要进入这个高薪行业,也不是那么轻而易举的,拿信工专业的大学生...

python学习——字典(python字典基本操作)

字典Python的字典数据类型是基于hash散列算法实现的,采用键值对(key:value)的形式,根据key的值计算value的地址,具有非常快的查取和插入速度。但它是无序的,包含的元素个数不限,值...

324页清华教授撰写【Python 3 菜鸟查询手册】火了,小白入门字典

如何入门学习python...

Python3.9中的字典合并和更新,了解一下

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

python3基础之字典(python中字典的基本操作)

字典和列表一样,也是python内置的一种数据结构。字典的结构如下图:列表用中括号[]把元素包起来,而字典是用大括号{}把元素包起来,只不过字典的每一个元素都包含键和值两部分。键和值是一一对应的...

取消回复欢迎 发表评论:

请填写验证码