Java常用集合基础概念及源码流程分析

Liber-blog 2023-03-28 原文

java集合

学习资源：b站人人都是程序员《看动画学java集合》
b站韩顺平《java集合》感谢二位的开源视频，本博客为个人笔记，如有错误还请包涵
学习方法：推荐观看视频，自己用idea敲一遍然后debug一步步看，最后自己写笔记和画流程图。

前言

目的：为了方便和高效地存储大批量的数据，变量和数组是远远不够的，我们需要能动态扩容的容器来存储。
java的集合
键值对

Collection

分类
Collecion工具类
- 排序方法
- 查找替换
迭代器Iterator
- 所有的集合都实现了迭代器Iterable接口，迭代器是遍历集合的元素，并且返回。
- 实现：1. 先新建迭代器 2. 调用hashnext方法 3. 调用next方法
- 增强型for循环的底层实现也是迭代器

Collection

Set

HashSet,由HashMap实现
1. 无序，存取顺序不一致，其他特点与HashMap一致
2. 区别，HashMap是以key-value存放，而HashSet则是把key当value用，而value则由统一的值代替。
3. 添加元素时，如果在同一个下标处有别的值，则用equals进行比较，如果相同则放弃添加，不同则添加到后面。
4. add方法初次添加，源码及流程分析
5. add方法再次添加流程

LinkedHashMap，继承自HashSet，但是由LinkedHashMap实现及数组+双向链表，因此具有LinkedHashMap的特点
1. 有序，由双向链表维护添加顺序，即存取顺序一致
2. 其他特点与LinkedHashMap相同，key唯一，key可为null
3. 区别：
4. LinkedHashMap数组存放的节点为LinkedEntry，$表示内部类。
TreeSet
1. 无序，存取顺序不一致，其他特点于TreeMap相同
2. 实现了NavigableSet和SortedSet接口，可以使用Comparator的compareTo方法进行排序
3. HashSet，LinkedHashSet，TreeSet的区别：
  
  HashSet，添加查询快性能优于后两者。LinkedHashSet添加修改删除快，有序
  TreeSet只有在需要对元素进行排序时使用

Map

Map的遍历
- 基于EntrySet机制，可以分别拿到所有单独的Key或所有Value，以及k-v。
```
Hashmap map = new HashMap();
Set entrySet = map.entrySet(); 
Collection values = map.values();
Set keySet = map.keySet();
//example
for(Object key : keySet) {
    System.out.println(key);
}
```
- 可以使用增强for/迭代器Iterator来遍历指定的集合（keyset，values，entryset）
HashMap，基于数组与链表（JDK1.7）/链表+红黑树（JDK1.8）实现，初始容量16，增删改查快
1. 无序，key可以为null但只能有一个，并且hash值为0，key不可以重复，value可以重复，以键值对的形式存储，会被封装到HashMap$Node中。元素的下标由数据的hash值&（数组容量-1）得到，因此存放的顺序是无序的。如果有重复的值则会覆盖。
2. Map接口的特点：key-value会以Node类型存放，但是为了方便遍历会创建EntrySet集合，该集合存放的类型为Entry，即 transient Set<Map.Entry<K,V>> entrySet; 然而entrySet中定义的类型是Map.Entry，但实际上存放的仍是Node，因为Node实现了Entry接口，之所以能够存放进EntrySet中是此处是做了向下转型的操作。并且数据只会存放一份在Node中，EntrySet存放的是引用。（先看图再看文字）
3. 哈希冲突，当同一个下标有多个数据时，会以链表的形式存放数据
  - 树（红黑树）化,当链表长度大于8且数组容量大于64时，链表会转化为红黑树（自平衡二叉树），以此提高查询速度，新增数据时需要计算节点的位置
  - 链化，当红黑树中的节点小等于6时，树将转化为链表，因为此时节点数很少，用红黑树查询的速度不比链表快。并且在新增元素的适合，链表不需要计算节点的位置，可以直接插入队尾。
4. 扩容，当元素个数超过临界值时就需要扩容，临界值 = 容量 * 负载因子（默认0.75），扩容后的容量是之前的两倍
LinkedHashMap,继承自HashMap，用双向链表解决了HashMap无序的问题。
- 有序，key唯一，key可为null
- 维护的元素排序顺序：默认维护添加顺序
  - 添加顺序，元素添加和取出的顺序一致，头节点为第一个元素，尾节点为最后一个元素
  - 访问顺序，用get访问某元素，则该元素为尾节点，该元素的next节点为头节点

TreeMap，基于红黑树实现的Map。

无序并会对key排序，key唯一，key不可以为null，因为红黑树是自平衡二叉树，会先比较，而null不能比较，会抛出NullPointerException。

可以自定义的比较器来排序，put流程源码如下图

TreeMap<Object, Object> treeMap = new TreeMap<>(new Comparator<Object>() {
    @Override
    public int compare(Object o1, Object o2) {
    return ((String)o1).length() - ((String)o2).length();
    }
});
 treeMap.put("aa","aa");
 treeMap.put("1213","3");
 treeMap.put("z","aa");

红黑树的特点，在插入时依次先比较，然后再根据规则左右旋。
Hashtable，继承Dictionary<K,V> 实现了Map<K,V>
- 初始化大小是11，负载因子为0.75，扩容按自己的机制来
- Key和Value都不能为null，否则会抛出空指针异常
- 是线程安全的，hashMap是线程不安全的
Properties，继承自Hashtable，实现了Map接口，也是K-V形式
- 通常用于配置文件

List

ArraysList，基于数组实现，默认容量为10，扩容时会先创建一个原始1.5倍的数组，然后再把元素复制过去。特点：
1. 有序，可存重复元素，可存null
2. 查询快，增删慢，适合查询较多的场景
3. 如果使用无参构造器，则初始elementData容量为0，第一次添加时则扩容为10，如需再次扩容，则扩容1.5倍
4. 如果使用指定大小的构造器，则初始elementData为指定大小，扩容仍为1.5倍。
add方法，扩容机制，源码和流程分析
```
public static void main(String[] args) {
        ArrayList<Object> list = new ArrayList<>();

        for (int i = 0; i < 10; i++) {
            list.add(i);
        }
        list.add(11);
        list.add(12);
    }
```
创建ArrayList，循环添加元素，因为初始容量为10，当添加11时会扩容，观察源码执行情况。
1. 先进入int的自动装箱
2. 进入add方法，注意此时的size为0
3. 调用ensureCapacityInternal方法，这里分为了三步计算容量
4. 计算容量，返回minCapacity，初始值为10
5. modCount标记修改次数，在需要考虑线程安全时起作用，if判断当前容量是否进行扩容
6. 调用Grow方法，第一个if保证初次扩容时，容量为10，扩容后返回
7. 添加成功
LinkedList，基于双向链表实现，增加则直接在尾部插入
1. 有序，可存重复元素，可存null
2. 查询慢，增删快，适合增删较多的场景
3. 和ArraysList相比需要记录前后节点，所以内存消耗比ArraysList大
Vector，线程安全的，效率不高，无参构造默认是10，2倍扩容

fail-fast快速失败机制

为了避免多个线程对同一容器并发修改时造成的数据异常。
实现机制：在容器类种定义一个modCount属性，记录容器修改的次数，当容器有添加或删除的操作modCount就++，在迭代的时候比较，如果不相同说明有多个线程同时修改，则抛出ConcurrentModificationException异常。
采用线程安全的容器即可避免并发的问题。

线程不安全线程安全

ArrayList CopyOnWriteArrayList

HashMap ConcurrentHashMap

HashSet CopyOnWriteArraySet
线程安全容器ConcurrentHashMap
- 同步，仅对头节点加锁，因此并发度为数组容量
- 统计元素个数，为了解决线程安全问题，使用CAS（compare and swap）算法，同一时刻只允许一个线程更新个数，其余线程更新失败，失败的线程再循环更新直到成功为止，但这样效率也很低，因此让更新失败的线程先把值累加到数组中。最后的个数由baseCount和CounterCell数组累加
- 多线程协同扩容，每个线程负责一段步长的数据迁移。
- key，value不为null，避免出现不知道是拿出来value为null还是key根本不存在。
- 只针对位置加锁

线程不安全	线程安全
ArrayList	CopyOnWriteArrayList
HashMap	ConcurrentHashMap
HashSet	CopyOnWriteArraySet

有关Java常用集合基础概念及源码流程分析的更多相关文章

ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2
大约一年前，我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞，我可以在一个地方轻松完成，而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
java - 等价于 Java 中的 Ruby Hash - 2
我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么？最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设？关于java-等价于Java中的RubyHash，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/22737685/
java - 从 JRuby 调用 Java 类的问题 - 2
我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java，并成功地将它与另一个Java包一起使用，但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www
java - 我的模型类或其他类中应该有逻辑吗 - 2
我只想对我一直在思考的这个问题有其他意见，例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
UE4 源码阅读：从引擎启动到Receive Begin Play - 2
一、引擎主循环UE版本：4.27一、引擎主循环的位置：Launch.cpp:GuardedMain函数二、、GuardedMain函数执行逻辑：1、EnginePreInit：加载大多数模块int32ErrorLevel=EnginePreInit(CmdLine);PreInit模块加载顺序：模块加载过程：（1）注册模块中定义的UObject，同时为每个类构造一个类默认对象（CDO，记录类的默认状态，作为模板用于子类实例创建）（2）调用模块的StartUpModule方法2、FEngineLoop::Init()1、检查Engine的配置文件找出使用了哪一个GameEngine类（UGame
Observability：从零开始创建 Java 微服务并监控它（二） - 2
这篇文章是继上一篇文章“Observability：从零开始创建Java微服务并监控它（一）”的续篇。在上一篇文章中，我们讲述了如何创建一个Javaweb应用，并使用Filebeat来收集应用所生成的日志。在今天的文章中，我来详述如何收集应用的指标，使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值，然后一切都回到一个请求。这也意味着这些指标可能不准确，你还想提取最小/
【Java 面试合集】HashMap中为什么引入红黑树，而不是AVL树呢 - 2
HashMap中为什么引入红黑树，而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道，在JDK1.8以及之前，针对HashMap有什么不同。JDK1.7的时候，HashMap的底层实现是数组+链表JDK1.8的时候，HashMap的底层实现是数组+链表+红黑树我们要思考一个问题，为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好？？？2.链表上述的截图其实就是链表的结构，我们来看下链表的增删改查的时间复杂度增：因为链表不是线性结构，所以每次添加的时候，只需要移动一个节点，所以可以理解为复杂度是N(1)删：算法时间复杂度跟增保持一致查：既然是非线性结构，所以查询某一个节点的时候
postman接口测试工具-基础使用教程 - 2
1.postman介绍Postman一款非常流行的API调试工具。其实，开发人员用的更多。因为测试人员做接口测试会有更多选择，例如Jmeter、soapUI等。不过，对于开发过程中去调试接口，Postman确实足够的简单方便，而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧，安装过程极其简单，无需任何操作3.使用教程这里以百度为例,工具使用简单，填写URL地址即可发送请求，在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get：请求方法一般是用于数据查询，
postman——集合——执行集合——测试脚本——pm对象简单示例02 - 2
//1.验证返回状态码是否是200pm.test("Statuscodeis200",function(){pm.response.to.have.status(200);});//2.验证返回body内是否含有某个值pm.test("Bodymatchesstring",function(){pm.expect(pm.response.text()).to.include("string_you_want_to_search");});//3.验证某个返回值是否是100pm.test("Yourtestname",function(){varjsonData=pm.response.json

Java常用集合基础概念及源码流程分析

java集合

前 言

Collection

Collection

Set

Map

List

fail-fast快速失败机制

线程安全容器ConcurrentHashMap

有关Java常用集合基础概念及源码流程分析的更多相关文章

随机推荐

前言