百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

聊聊Java中String,StringBuilder,StringBuffer那些事

toyiye 2024-08-09 10:37 12 浏览 0 评论

对于这三个,我们首先能知道的就是String是不可变的,StringBuilder和StringBuffer是可变的,那么我们就先说说String,它为什么设计成不可变的以及怎么实现不可变的。

String为什么设计成不可变的?

我们其实能感觉到,字符串其实是我们开发过程中最常用的一种数据结构了,如果依赖于常规的对象创建方式,那么就会出现大量重复字符串值的对象,这会消耗大量空间,从而影响GC效率。

所以如果设计成不可变的情况下,同样一种值的多个对象的引用都会指向一个字符串对象,可以大大的减少堆内存,同时String中缓存了hash值,这也会对使用hash的地方提升很多的性能

同时设计成不可变的情况下,它就是线程安全的,即便在其他线程修改了值,那么也是创建或者引用已存在的对象,而不是修改当前的值。同时它对于安全性也是十分有保障的,一个不可变的内容,我们认为是可信的,如果可以随意的更改它的值,就太不可信了。

String设计如何实现不可变的?

先看一下jdk1.8中的源码

arduino
复制代码
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** The value is used for character storage. */ private final char value[]; /** Cache the hash code for the string */ private int hash; // Default to 0 public String substring(int beginIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } int subLen = value.length - beginIndex; if (subLen < 0) { throw new StringIndexOutOfBoundsException(subLen); } return (beginIndex == 0) ? this : new String(value, beginIndex, subLen); } public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true); } }

从源码中我们可以看到,存储字符串的是用final修饰的char数组,表示这个字符数组不可变,而substring和concat方法返回的其实都是new String()。

扩展

在Java9及以上的版本,存储字符串的结构增加了一种,是byte数组,这其实是做了一层优化。而为什么这么做呢?Java内部使用UTF-16进行编码,也就是说即便一个单个字符可以用一个字节标识,用UTF-16之后也是占用两个字节,这其实是非常浪费时间的,而很多情况下的字符串其实都是可以用LATIN-1(单字节编码方案,可以标识包含ASCLL在内的128个字符)进行编码。所以引入了一种**“Compact String”** 的概念。那么该如何区分什么时候用UTF-16什么时候用LATIN-1呢?

在String的类中定义了一个名为coder 的字段,用来保存字符串是用什么进行编码的,然后根据类型存储到不同的存储结构中,与之相关的indexOf方法就需要这个字段来决定去哪个数组中找到对应字符。

当new String()的时候是做了什么?只是创建了一个对象吗?

Java对象在JVM中存储是有一定结构的,也就是对象模型 ,也包含了两个信息,一个是对象头,存储一些运行时的信息,比如线程,锁标识之类的,另一部分就是元数据,就是一个指向类信息的指针,关于JVM这方便的知识,后面我会单独的进行撰写。

其实不管怎么样,我们new的时候都会在堆上创建一个对象,但是对于字符串确实有一点特殊情况的,这个特殊情况就是常量池中的字符串常量 ,这个字符串其实是类编译阶段就进入到类常量池中的,当类第一次被ClassLoader加载时候,会从类常量池进入到运行时常量池(1.8以后字符串常量池移动到了堆中,为了更好的管理对象,防止内存泄露)。而字符串常量池中存储了字符串的引用与对象,引用存在String Table中,而new String()出来的都是在堆上面的对象实例,它的引用就是引用的字符串常量池中的字符串引用。所以可以看出,如果字符串常量池中没有这个对象,那么就可能创建两个对象,一个是在堆实例中,一个在字符串常量池中,创建一个还是两个对象都是取决于字符串常量池中有没有这个对象。

intern

上面经常在说字符串常量池,对于字符串常量池最通俗的解释就是程序运行时可以知道结果的字符串,比如下面这段代码

java
复制代码
public static void main(String[] args) { String a = "abc"; String b = "def"; String c = "abc"+"def"; }

反编译的结果就是String c="abcdef";当两个常量使用+的时候,就会变成一种常量。而另一种变量相加的方式

java
复制代码
public static void main(String[] args) { String a = "abc"; String b = "def"; String c = a+b; }

反编译的结果就是

java
复制代码
String c = (new StringBuilder()).append(a).append(b).toString();

而这种计算出来的结果值是不会进入到常量池中的,同时,这样的字符串还经常会用到呢,怎么办?所以intern的作用就体现出来了。它的作用就是两个,一个是如果常量池没有这个字符串的话,就将这个值加入到字符串常量池中,第二个就是返回这个常量的引用。

再次扩展-->String是否有长度限制呢?

答案是是有的,而且还不一样,在编译期间的String的最大长度为65535,运行期间的最大长度为int的最大值2^31-1。这里面涉及到了Java虚拟机规范的问题,大致点说就是虚拟机中用一个CONSTANT_Utf8_info的结构表示字符串常量,结构如下: CONSTANT_Utf8_info{ u1 tag; u2 length; u1 bytes[length]; } 其中U2标识2个字节的无符号数,一个字节8位,2个字节就是16位,所以最大值为2^16-1 = 65535。

StringBuilder和StringBuffer都是可变的,且StringBuffer是线程安全的

StringBuilder和StringBuffer都继承了AbstractStringBuilder这里面有两个属性

java
复制代码
char[] value; /** * The count is the number of characters used. */ int count;

并且都没有被final修饰,说明就是可变的,那么看一下他们的append源码

java
复制代码
public AbstractStringBuilder append(StringBuffer sb) { if (sb == null) return appendNull(); int len = sb.length(); ensureCapacityInternal(count + len); sb.getChars(0, len, value, count); count += len; return this; }

其实就是干了2件事扩容和放字符。 StringBuffer中重写了append方法

java
复制代码
@Override public synchronized StringBuffer append(String str) { toStringCache = null; super.append(str); return this; }

都加上了synchronized,说明这是一个线程安全的方法。


原文链接:https://juejin.cn/post/7279052777888497705

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码