当前位置: 开发笔记 > 编程语言 > 正文

ArrayList、Vector、HashMap、HashTable、HashSet的默认初始容量、加载因子、扩容增量、具体区别

作者：zws3504075 | 来源：互联网 | 2023-08-06 12:58

要讨论这些常用的默认初始容量和扩容的原因是：当底层实现涉及到扩容时，容器或重新分配一段更大的连续内存（如果是离散分配则不需要重新分配，离散分配都是插入新元素时动态分配内存），要将容器原来的数据全部复

要讨论这些常用的默认初始容量和扩容的原因是：

当底层实现涉及到扩容时，容器或重新分配一段更大的连续内存（如果是离散分配则不需要重新分配，离散分配都是插入新元素时动态分配内存），要将容器原来的数据全部复制到新的内存上，这无疑使效率大大降低。

加载因子的系数小于等于1，意指即当元素个数超过容量长度*加载因子的系数时，进行扩容。

另外，扩容也是有默认的倍数的，不同的容器扩容情况不同。

List 元素是有序的、可重复的:

ArrayList、Vector默认初始容量为10

Vector：线程安全，但速度慢

　　　　底层数据结构是数组结构

　　　　加载因子为1：即当元素个数超过容量长度时，进行扩容

　　　　扩容增量：原容量的 1倍

　　　　　　如 Vector的容量为10，一次扩容后是容量为20

ArrayList：线程不安全，查询速度快

　　　　底层数据结构是数组结构

　　　　扩容增量：原容量的 0.5倍+1

　　　　　　如 ArrayList的容量为10，一次扩容后是容量为16

Set(集) 元素无序的、不可重复。

HashSet：线程不安全，存取速度快

　　　　　底层实现是一个HashMap（保存数据），实现Set接口

　　　　　默认初始容量为16（为何是16，见下方对HashMap的描述）

　　　　　加载因子为0.75：即当元素个数超过容量长度的0.75倍时，进行扩容

　　　　　扩容增量：原容量的 1 倍

　　　　　　如 HashSet的容量为16，一次扩容后是容量为32

Map是一个双列集合

HashMap：默认初始容量为16,长度始终保持2的n次方

　　　　　（为何是16：16是2^4，可以提高查询效率，另外，32=16<<1 -->至于详细的原因可另行分析，或分析源代码）

　　　　　加载因子为0.75：即当元素个数超过容量长度的0.75倍时，进行扩容

　　　　　扩容增量：原容量的 1 倍

　　　　　　如 HashMap的容量为16，一次扩容后是容量为32

HashTable：默认初始容量为11

　　　　　　线程安全，但是速度慢，不允许key/value为null

　　　　　加载因子为0.75：即当元素个数超过容量长度的0.75倍时，进行扩容

　　　　　扩容增量：2*原数组长度+1

　　　　　　如 HashTable的容量为11，一次扩容后是容量为23

HashTable和HashMap的具体区别:

Hashtable 和 HashMap 做为 Map 的基本特性

两者都实现了Map接口，基本特性相同

- 对同一个Key，只会有一个对应的value值存在

- 如何算是同一个Key？首先，两个key对象的hash值相同，其次，key对象的equals方法返回真

内部数据结构

Hashtable和HashMap的内部数据结构相似

其基本内部数据结构是一个Entry数组 (transient Entry[] table)

- 数组元素为实现Map.Entry接口的类，Hashtable和HashMap各自实现了自己的Entry类。

- Entry包含一个Key-value对，以及一个next指针指向另一个Entry。多个Entry可以组成一个单向链表。

常用操作

数据插入操作： put(key,value)

- 根据Key的hash值计算出该Entry所应存放的位置（数组下标）

- 若该数组元素为空，直接放置Entry到此处

- 若多个不同的Key所计算得到的数组下标相同，新加入的Key-value对（Entry）会被加入到Entry单向链表中。Hashtable和HashMap都是将其插入链表首部.

- 若已经有相同的Key存在于这个链表中，则，新的value值会取代老的value

- 当Map中存放的Entry数量超过其限制（数组长度 * 负荷因子）时，Map将自动重新调整数组大小并重新对Entry进行散列

数据查找：get(key)

- 根据Key的hash值计算出该Entry对所应存放的位置（数组下标）

- 得到该位置的第一个Entry对象，比较key和Entry.key，若hash值相同，并且equals为真，则该Entry是我们要找的Key-value对，否则继续沿next指针构成的单向链表查找

数据移除：remove(key)

- 按照上述数据查找的方式找到key所在的Entry对象，将其移除，并保持Entry单向链表的连通性

Hashtable 和 HashMap 的比较

一般情况下，HashMap能够比Hashtable工作的更好、更快，主要得益于它的散列算法，以及没有同步。应用程序一般在更高的层面上实现了保护机制，而不是依赖于这些底层数据结构的同步，因此，HashMap能够在大多应用中满足需要。推荐使用HashMap，如果需要同步，可以使用同步工具类将其转换成支持同步的HashMap。

Map的效率

Map的效率与Entry数组大小及负荷因子的选取有密切关系。选取适当的数组大小有利于Key-value对的散列分布，并且，如果数组足够大，将有效的减少重新调整数组的次数，提高效率。较小的负荷因子将占用更多的空间，但降低冲突的可能性，从而将加快访问和更新的速度。

另外，Key的hash值本身如果能保证较好的散列性，也有益于提高Map的读写效率。在effective java中，对hash()的重载有好的建议。

辨析

“Hashtable和HashMap的区别主要是前者是同步的，后者是快速失败机制保证不会出现多线程并发错误（Fast-Fail）。”，这是一个被很多文章转载过的概念，但其描述并不准确，容易引起误会。

实质上，Fast-fail与同步保护的是两种不同情况下的并发，两者不能拿来做比较。

Hashtable是同步的，在执行get,put,remove,size,clear等一次性读写操作时，使用了同步机制，避免了多个线程同时读写Hashtable。但同步机制并不能避免在iterator或Enumeration遍历过程中其他线程对Hashtable的put、 remove、clear操作，这些写操作都会被毫无阻拦得成功执行。

快速失败机制主要目的在于使iterator遍历数组的线程能及时发现其他线程对Map的修改（如put、remove、clear等），因此，fast-fail并不能保证所有情况下的多线程并发错误，只能保护iterator遍历过程中的iterator.next()与写并发.

其次，Hashtable的iterator遍历方式也是支持fast-fail的，不能说它没有快速失败机制。写一个简单的例程就可以证明这一点，一个线程做iterator遍历，另一个线程向hashtable中put新的key和value，很容易就会观察到fast-fail 机制报告ConcurrentModificationException

引用：小明快点跑;小明快点跑

推荐阅读

java
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
java
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
copy
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
buffer
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
const
Flutter | Key 的深度解析

在 Flutter 开发过程中，开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说，理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景，并通过实例帮助你更好地掌握这一重要工具。 ... [详细]

蜡笔小新 2024-12-25 08:05:15
java
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
java
GWT PopupPanel onKeyDownPreview 方法详解与实例

本文详细介绍了 GWT 中 PopupPanel 类的 onKeyDownPreview 方法，提供了多个代码示例及应用场景，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:07:27
java
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
java
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
grid
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
java
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
java
深入理解Java泛型：JDK 5的新特性

本文详细介绍了Java泛型的概念及其在JDK 5中的应用，通过具体代码示例解释了泛型的引入、作用和优势。同时，探讨了泛型类、泛型方法和泛型接口的实现，并深入讲解了通配符的使用。 ... [详细]

蜡笔小新 2024-12-26 11:15:56
java
汇编语言等号伪指令解析：探究其陡峭的学习曲线

汇编语言以其独特的特性和复杂的语法结构，一直被认为是编程领域中学习难度较高的语言之一。本文将探讨汇编语言中的等号伪指令及其对初学者带来的挑战，并结合社区反馈分析其学习曲线。 ... [详细]

蜡笔小新 2024-12-26 10:34:21
java
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19
java
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57

zws3504075

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章