C++STL：list（双链表）的底层实现 && 部分源码解析

君辣堡

发布于 2025-12-20 09:41:20

2390

1.list部分源码解析

同样，现在我们是读不懂大部分源码的。还是跳着看，看看部分模块功能，重要的底层变量，不去深究

根据我们看vector源码的理解，list头文件而是其他头文件的封装，重要的是 list.h ，那我们直接打开看看

打开来就看到了一个结构体模板，显然这是节点，定义的是双向链表next，prev ，__list_node 但节点类型为什么是void*？一起往下看

再往下，就是迭代器，看他的迭代器模板参数，有3个参数，究竟是为什么？后面再说，链表迭代器很复杂，暂时跳过。看不懂

再往下看，找到了链表的核心成员，节点 node，类型是 list_node* ,被 typedef为了 link_type,那它到底是什么？我们去看一下它的构造

找到了它的构造函数，构造函数里封装“空初始化函数”，转到定义，发现它是创建哨兵位头节点的，因为next和prev都指向node 那为什么是get_node，不是直接new一段空间？ 因为它的内存都是内存池来的，我们的new是直接在堆空间获取内存。 内存池的空间也是堆空间。区别是 new是动态分配，内存池是预分配，内存池更高效。

往下看发现了create_node 函数，创建节点，其中调用了consturct，construct是用定位new对已有空间显式调用构造完成初始化因为内存池申请的空间是未初始化的内存空间，不是像new，new是开空间加构造。但是内存池申请空间更高效，所以这样。所以用内存池申请，释放空间，就得显式调用它的析构，构造函数，

这一部分是插入和删除，虽然有助于了解底层，不过都涉及迭代器，链表迭代器比较难，那就不去了解了，我们确认链表底层，一步步来实现

2.list 双链表底层实现

基于源码，我们首先来设计一下链表底层：

补充：结构体也是类，需要写构造函数，不然插入新节点会出错（默认构造下，指针是（随机内存地址）野指针，_data是随机值），无法构造新节点。

源码中，节点类型是void* ，不过我们不使用void*，我们按照之前数据结构学的来定义。因为void*设计的不好。后面具体说

2.0 定义结点为什么是结构体模板，不是类模板？

为什么用struct结构体？一个类，如果我们不期望它的成员被访问限定符限定的时候，我们用结构体struct。因为结构体默认public ，也可以用class加public，不过习惯上喜欢定义为sturct，方便。结点作为list的子结构，默认就是要被list访问和使用，因此结点不能设为私有成员 编译器设为公有不怕被其他人随意访问吗？不怕，因为底层都是有层层封装，从外壳层角度，结点底层变量名是不可猜的，因为随机性很强。也没人闲的去翻源码来使用，没有意义。

2.1构造函数

我们就不使用内存池了，太繁琐，没学过。用new：

2.1.1 默认构造的封装——方便其他构造调用

也可以封装一下这个构造，因为链表底层很多构造，那每个涉及构造的函数都得重复一遍创建哨兵位节点的操作，干脆封装起来：

2.1.0 n 个 val 的构造

重载两个，一个int，一个size_t，因为会和迭代器区间构造函数模板冲突

2.2 pusn_back 尾插

思路：尾插需要找到最后一个节点tail，如图，那 tail 就是_head->prev ，然后只需要改变一下节点指向，就完成了

并且这里的尾插不需要考虑为空的情况，因为哨兵位头节点的存在，空也可以直接在哨兵位上正常尾插，十分方便

2.3 迭代器（重要）

2.3.0 vector 和 list 的迭代器比较

这是vector的迭代器，vector底层空间连续，它的指针功能刚好符合迭代器需求，这就是"天赋" ,所以vector的迭代器十分简单，指针就行。 迭代器是行为类似指针的东西，不一定是指针，但可以是指针

这是链表，那链表可以用节点的指针作为迭代器吗？不能。首先，*it得到的是节点，不是节点数据_data ,其次，节点的地址是不连续的，你不能保证下一个节点的地址一定比前面的大，那++it 也实现不了。链表没有vector的"天赋"，那就需要"努力"，怎么努力？

2.3.0迭代器的本质

其实迭代器就是一种封装，只要外层行为像是指针就行，底层可以不是指针，我们可以重载运算符，重载 * ，++ , ->让迭代器像指针 那我们就像源码那样，把迭代器封装成类，自己努力，实现指针行为

2.3.0迭代器的实现

实现const 迭代器后补充：

begin ，end接口返回值是迭代器类型，这种写法是：显式构造迭代器匿名对象，初始化为对应节点指针返回。 也可以是直接返回指针，由迭代器的构造函数，单参数构造函数的隐式类型转换，转换为迭代器类型
封装一个iterator类模板，重载指针相关功能，然后在list中封装为iterator，然后提供相关迭代器接口：begin，end

测试，迭代器功能正常，基础迭代器就完成了

2.3.1迭代器：内存和类型的奥妙

32位下， it1 是4字节， it2 也是4字节，迭代器只是封装了一个Node*指针。甚至他们指向同一个节点，只是因为类型不同（自定义类型），它就调用自定义类型自己的重载函数，导致他们行为完全不同。内存一样，数据一样，只是因为类型不一样，编译的结果就完全不同。

2.3.2迭代器是否需要实现析构？

不需要，节点归链表管，迭代器负责迭代，如果迭代完，把节点析构了，那就麻烦了 节点属于链表，不归迭代器管理。

2.4insert erase 以及复用（迭代器失效）

源码中push_bakc,push_front都是复用insert的，理论上也确实。那我们先实现insert

2.4.1源码节点类型void*的弊端

如图，insert的逻辑不难，就是在pos和pos前一个位置插入一个节点，但是源码的这一句，因为void*要强制转换为link_type类型（list_node*），导致弯弯绕绕的，很麻烦，可读性不高

2.4.2 insert ， erase （处理迭代器失效）

这样就好看多了，把cur位置和prev位置标出来，3个位置节点方向换一下，轻轻松松。

2.4.2 迭代器返回类型详解

返回值：注释的写法是：返回的是迭代器类型，所以显式构造一个匿名对象，初始化为next指针 当前写法：直接返回next指针，通过迭代器的构造，和单参数构造函数的隐式类型转换，转换为迭代器类型
erase 同样也是简简单单，细节是 处理迭代器失效

2.4.3 头插头删，尾插尾删的复用

复用，在insert 和 erase 的基础上，关键在于找对头和尾节点。

2.5size（）

求size，有两种办法，第一种，用范围for循环遍历，计数器记住size数量：

不过，现在还没实现const 迭代器，运行不了。这个方法效率很低，O（N）

第二种方法，新增加一个成员_size ，然后插入删除时对应size++或者size-- ，效率极高，O（1）

2.6析构函数和 clear （仔细看区别）

析构函数：销毁所有节点，包括销毁哨兵位头节点 clear：销毁所有节点，除了哨兵位头节点 析构包含clear

鉴于这个包含关系，我们对clear封装，在析构调用clear

2.7基于迭代器的构造函数

2.7.1initializer_list构造

initializer_list 支持迭代器，范围for ，那initializer_list构造：（记住要先调用empty_init(),得有哨兵位头节点才能谈构造）

2.7.2 迭代器区间构造

2.8 拷贝构造传统，现代

这是拷贝构造函数的传统写法，代码量很少。所以现代写法占不到什么便宜：

现代写法，代码量差不多，

2.9 operator= 赋值运算符重载传统，现代

赋值重载的传统写法

现代写法

2.10 swap

交换底层数据资源就行，不需要深拷贝。

2.11const_iterator cosnt 迭代器

const_iterator 很重要，它要保护迭代器指向的内容（_data）不被修改，但是图中显然能修改*it,而且也没有const_iterator，那现在我们要实现它：

2.11 const 迭代器和普通迭代器的核心差异：T& 和const T&

const_iterator怎么保护迭代器指向内容不被修改？模拟指针行为，那就是让*it 不能被修改：

*it返回类型是T& ，能被修改，只需要改成 const T& ,const 迭代器就完成了，这就是const迭代器和普通迭代器的差异 那么传统方法就是，重新实现一个类模板，把名字改为const_iterator ，然后其他不变，单独把T& 改成 const T&

2.11.1 const 迭代器传统方法

改几个名字，然后其他的全部不变，封装成另一个类 const_iterator ，在list中重命名一下。虽然能解决问题，但是两个迭代器代码重合度很高，太浪费了。看看源码是怎么写的：

2.11.2 const 迭代器利用模板实现——避免冗余

源码在模板参数列表新增了一个参数（左图）：Ref （reference，引用），然后list中重命名改成了两个参数，一个是T&，一个是const T&（右图） 把原本的T& 改成了 Ref ，调用const迭代器，Ref就是const T& ，调用普通迭代器，Ref就是T&，完美地解决了代码重合度高的问题。
前者是自己实现两个类，后者是实现一个双参数类模板，根据模板参数，编译器实例化两个不同的类