自学内容网 自学内容网

【C++进阶】心心念念的红黑树,它来了!

在这里插入图片描述

👦个人主页:@Weraphael
✍🏻作者简介:目前学习C++和算法
✈️专栏:C++航路
🐋 希望大家多多支持,咱一起进步!😁
如果文章对你有帮助的话
欢迎 评论💬 点赞👍🏻 收藏 📂 加关注✨


一、红黑树的概念

  • 红黑树是除AVL-tree之外,另一个被广泛运用的平衡二叉搜索树
  • 红黑树比AVL-tree还牛逼。这是因为AVL-tree需要严格遵守平衡因子不超过1的规则;而红黑树是 通过颜色(红/黑)的限制,来达到最长路径不超过最短路径的2,因此并不是严格的平衡,而是近似平衡

二、红黑树的规则总结

  1. 每个结点不是红色就是黑色。
  2. 根节点必须是黑色的。
  3. 如果一个节点是红色的,那么它的孩子结点必须是黑色的(说明任何路径不可能存在连续的红色结点
  4. 对于每个结点,从根到空结点NIL,黑色结点的数量相等。
  5. 每个空结点NIL都是黑色的。

需要注意的是,在红黑树中,路径是由根结点到空结点。

根据以上规则,一颗红黑树就诞生了

在这里插入图片描述

上图中,红黑树的路径有11条!

三、红黑树的定义

红黑树和AVL-tree都是一个三叉链结构,只是控制平衡的方式不同,红黑树是通过颜色来控制的

#pragma once

#include <utility>
#include <iostream>
using namespace std;

// 颜色
enum Colour
{
RED,
BLACK
};

template <class K, class V>
struct RBTreeNode 
{
pair<K, V> _key;
struct RBTreeNode<K, V>* _left;
struct RBTreeNode<K, V>* _right;
struct RBTreeNode<K, V>* _parent;
Colour _col;

RBTreeNode(const pair<K, V>& kv)
:_key(kv)
,_left(nullptr)
,_right(nullptr)
,_parent(nullptr)
,_col(RED)
{}
};

template <class K, class V>
class RBTree
{
typedef struct RBTreeNode<K, V> Node;

public:
// 默认构造
RBTree()
:_root(nullptr)
{}

private:
Node* _root;
};

为什么要定义parent指针,详细讲解请参考AVL章节:点击跳转

四、新增结点颜色的选择

在红黑树中,新增的默认结点颜色可以选择红色,也可以选择黑色。但是,建议选择红色。

接下来分析为什么选择红色。

  • 如果为新增结点默认为红色,可能违反原则3【如果一个节点是红色的,它的孩子结点必须是黑色的】,那么需要进行适当调整。当然也可能不需要调整。

在这里插入图片描述

  • 如果为新增结点默认为黑色,必然违反原则4【对于每个结点,从根到空结点NIL,黑色结点的数量相等】,并且因为这一条路,影响了其他所有路径,可能需要对现有的红黑树进行更多的旋转和重新着色操作,从而导致更大的改动,增加了调整平衡的复杂度。

在这里插入图片描述

因此,为了尽可能少地改变树的结构,让新结点默认为红色,插入后,不一定调整,但即使调整,也不至于影响全局。

五、插入分析及代码实现

5.1 前言

RB-tree的平衡条件虽然不同于AVL-tree,但同样运用了单旋转和双旋转来调节平衡。

为了方便讨论,可以为某些特殊结点“取别名”。

  • 插入的新结点为cur

  • 新结点的父结点为parent

  • 新结点的祖父结点为(父结点的父亲)grandparent

  • 叔叔结点(父结点的兄弟结点)为uncle

通常情况下,我们会 特别关注叔叔结点。具体来说会有以下三种情况:

5.2 uncle存在且为红

  • cur插在parent的左边时
    在这里插入图片描述

解决方法:变色 + 继续向上更新看是否需要调整

  • 【变色】结点parent(父亲结点一定要为黑色)和uncle变黑,grandparent变红。变色操作是保证每条路径的黑节点个数相同,并且在grandparent这个子树中,暂时解决了出现连续的红结点的情况。
    在这里插入图片描述

  • 【向上调整】:解决整个树可能出现连续红结点情况(三种):

① 如果grandparent没有父亲:将祖父grandparent变黑即可。

在这里插入图片描述

② 如果grandparent有父亲,且父亲是黑色的,那么不用调整。

③ 如果grandparent有父亲,且父亲是红色的,就要向上进行调整,因为不能出现连续的红色结点。具体的情况也就只有3

比如说以下这种:
在这里插入图片描述

此时uncle为红色,并且cur插在parent的右边。虽然插入位置不同,但解决方法还是一样的。

  • cur插在parent的右边时

解决方法:变色 + 继续向上更新看是否需要调整。详细细节可以看看上面的解释说明

在这里插入图片描述

5.3 当uncle不存在

  • uncle不存在于grandparent的右边时

在这里插入图片描述

解决方法:旋转 + 变色

  • 【旋转】:什么旋转是根据cur插入的位置来定的。如果插入在parent的左边,那么就要以grandparent结点进行右单旋;如果插入在parent的右边,就要进行双旋,先左单旋,最后再右单旋。

在这里插入图片描述

  • 【变色】parent变黑,grandparent变红。

在这里插入图片描述

  • uncle不存在于grandparent的左边时

解决方法还是一样:旋转 + 变色。这里就不再重点讲解了,大家看看下图来领会吧 ~

在这里插入图片描述

接下来再基于uncle不存在时,看看 【双旋】 是怎么个事:

  • uncle不存在于grandparent的左边时

在这里插入图片描述

解决方法同样是变色

  • 【双旋】:我们在上面说过,对于uncle不存在于grandparent的左边这种情况,并且cur插入在parent的左侧,那么就要进行双旋。首先先对parent进行右单旋;再对parent进行左单旋。

在这里插入图片描述

  • 【变色】cur变黑,grandparent变红

在这里插入图片描述

当然了,对于对于uncle不存在于grandparent的右边这种情况,并且cur插入在parent的右侧。这种调整的解决方法同样是双旋 + 变色。双旋是先对于parent左旋转,再对grandparent右旋,最后再将cur变黑以及grandparent变红。由于演示的样例过多,这里就不再演示了hh

5.4 uncle存在且为黑

来看看一下这种情况
在这里插入图片描述

首先我们需要处理uncle存在且为红的情况,解决方法很简单:变色 + 继续向上更新

在这里插入图片描述

继续向上更新时,就出现了uncle存在且为黑的情况

在这里插入图片描述

解决方法:旋转 + 变色(parent变黑、grandparents变红)

在这里插入图片描述

我们发现:uncle存在且为黑的情况好像和uncle不存在的解决方法是一模一样的,因此我们可以将其归为一类。

六、对插入操作总结一波

6.1 uncle存在且为红

在这里插入图片描述

解决方式:变色 + 向上调整

【变色】:将parentunlce改为黑,grandparent改为红。

【向上调整】:把grandparent当成cur,继续向上调整。在调整的过程中,如果grandparent是根结点,则直接将其变黑。

6.2 uncle不存在或uncle存在且为黑

在这里插入图片描述

解决方法:旋转 + 变色

注意:什么旋转是根据cur插入的位置来定的。

  • 【单旋转】 如果cur插入在parent的左边,那么就要以grandparent结点进行右单旋
    【变色】 parent变成黑色,grandparent变为红色。
  • 【双旋转】 如果cur插入在parent的右边,就要进行双旋,先左单旋,最后再右单旋。
    【变色】 cur变成黑色(旋转后cur变为根了,根一定为黑),grandparent变为红色。

当然了,以上的情况均是以parent作为grandparent的左孩子分析的,还需要考虑parent作为grandparent的右孩子,其本质是不变。我大致为大家总结了一下:

  1. 不需要旋转的代码都一样。
  2. 旋转部分的代码要注意结点的方向。

6.3 代码实现

bool Insert(const pair<K, V>& key)
{
// 如果一开始根结点为空,直接插入即可
if (_root == NULL)
{
_root = new Node(key); // new会自动调用自定义类型的构造函数
_root->_col = BLACK; // 规则1:根结点_root必须是黑色的
return true;
}

// 如果一开始根结点不为空,就要找到合适的位置插入
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key.first < key.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key.first > key.first)
{
parent = cur;
cur = cur->_left;
}
else // 出现数据冗余,插入失败
{
return false;
}
}
// 当cur走到空,说明已经找到了合适的位置
cur = new Node(key);
cur->_col = RED; // 插入的新结点必须是红色的

if (parent->_key.first < key.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;

// 控制平衡:通过颜色(红/黑)的限制,来达到最长路径不超过最短路径的2倍
while (parent && parent->_col == RED) // 向上调整的条件
{
Node* grandparent = parent->_parent; // 找祖父
// 如果父亲在祖父的左边
if (parent == grandparent->_left)
{
// 那么uncle一定在祖父的右边
Node* uncle = grandparent->_right;

// 情况1:如果uncle存在且为红
if (uncle && uncle->_col == RED)
{
// 解决方法:父亲和叔叔的颜色变黑,祖父变红 + 向上处理

parent->_col = uncle->_col = BLACK;
grandparent->_col = RED;
// 向上处理
cur = grandparent;
parent = cur->_parent;
}

// 情况2:叔叔不存在或叔叔存在且为黑
// 解决方法:旋转 + 变色
else
{
// 1. 插入在parent的左边:单旋 + 变色
if (cur == parent->_left)
{
//     g
//   p
// c

// 右单旋转
RotateRight(grandparent);
// 变色
parent->_col = BLACK;
grandparent->_col = RED;
}
// 2. 插入在parent的右边:双旋 + 变色
else
{
//     g
//   p
//     c

RotateLeft(parent);
RotateRight(grandparent);

cur->_col = BLACK;
grandparent->_col = RED;
}
// 旋转完之后红黑树一定平衡,不需要向上调整
// 因为旋转后,树/子树的根一定是黑色
break;
}
}

else // parent == grandparent->_right
{
// parent在grandparent的右,那么uncle一定在grandparent的左
Node* uncle = grandparent->_left;

// 情况1:如果uncle存在且为红
// 解决方法:父亲和叔叔的颜色变黑,祖父变红 + 向上处理
if (uncle && uncle->_col == RED)
{
// 变色
parent->_col = uncle->_col = BLACK;
grandparent->_col = RED;
// 向上处理
cur = grandparent;
parent = cur->_parent;
}
// 情况2:uncle不存在且uncle为黑
else
{
if (cur == parent->_right)
{
//  g
//     p
//        c
RotateLeft(grandparent);
grandparent->_col = RED;
parent->_col = BLACK;
}
else
{
//  g
//     p
//  c
RotateRight(parent);
RotateLeft(grandparent);
cur->_col = BLACK;
grandparent->_col = RED;
}
break;
}
}
}
// 当循环退出来到此处,有两种情况
// 第一种是break出来的,那么红黑树是百分之百已经调整好的
// 还有一种是向上调整的过程中父亲为空,那么此时根结点可能为空
// 因此我们可以直接进行暴力处理将根结点的颜色变为黑。因为根为黑是必定的!
_root->_col = BLACK; 

return true;
}

七、验证红黑树

注意:不能使用最长路径(高度)不能超过最短路径的2倍来验证,因为你写的程序有可能会破坏红黑树的规则,比如说你写的红黑树可能会出现连续的红色结点,可能会出现最长路径不会超过最短路径的2倍。我们这里使用红黑树的规则来进行检查。

// backnumber - 用于统计黑色结点的数量
// benchmark - 基准值。此变量是为了求出一条路径的黑色结点个数作为基准值
bool CheckColour(Node* root, int blacknums, int benchmark)
{
if (root == nullptr)
{
// 前序遍历走到空就拿backnumber与基准值benchmark比较即可
if (blacknums != benchmark)
{
return false;
}
return true;
}

// 2. 每条路径的黑色结点数量相等
if (root->_col == BLACK) // 遇到黑结点backnumber自增1
{
++blacknums;
}

// 2. 不可能出现连续的红结点
// 检查当前结点的颜色和其父亲结点的颜色即可
if (root->_col == RED && root->_parent && root->_parent->_col == RED)
{
cout << root->_key.first << "连续红色结点" << endl;
return false;
}

// 递归检查左子树和右子树
return CheckColour(root->_left, blacknums, benchmark)
&& CheckColour(root->_right, blacknums, benchmark);
}

bool _IsBalance(Node* root)
{
// 根结点为空也算红黑树
if (root == nullptr)
{
return true;
}
// 1. 每个结点不是红色就是黑色。(这个不需要验证)
// 2. 根节点必须是黑色的。
if (root->_col != BLACK)
{
return false;
}

int benchmark = 0;
Node* cur = _root;
while (cur)
{
if (cur->_col == BLACK)
{
++benchmark;
}
cur = cur->_left;
}

// 3. 颜色的检查
return CheckColour(root, 0, benchmark);
}

八、红黑树与AVL树的比较

红黑树和AVL树都是自平衡的二叉搜索树,它们在维护树的平衡性方面有些不同,因此在不同的应用场景下会有不同的性能表现。

  1. 平衡性:

    • AVL树:AVL树通过保持任意节点的左右子树高度之差不超过1来维护平衡。(严格平衡)
    • 红黑树:红黑树通过保持以五个性质来维护平衡。(近似平衡)
  2. 插入和删除操作:

    • AVL树:AVL树在进行插入和删除操作时,也会通过旋转来调整树的结构并保持平衡。但相比红黑树,AVL树对平衡的要求更加严格,可能需要进行更多的旋转操作。这使得插入和删除操作的时间复杂度略高于红黑树,为O(log n)

    • 红黑树:红黑树在进行插入和删除操作时,只需通过旋转和颜色变换来调整树的结构并保持平衡。这些操作的时间复杂度为O(log n),其中n是树的节点数量。

  3. 查询操作:

    • 红黑树和AVL树在查询操作上具有相同的时间复杂度,都为O(log n)。这是因为它们都是二叉搜索树,具有相似的查找性能。
  4. 存储空间:

    • 红黑树:红黑树通过颜色标记来维护平衡,需要额外存储每个节点的颜色信息,因此在空间上稍微占用更多的内存。
    • AVL树:AVL树不需要额外的信息来维护平衡,因此在空间上相对较小。

综上所述:红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O( l o g 2 N log_2 N log2N),红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言,降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。

九、代码

本篇博客我放到gitte仓库了,感兴趣的小伙伴可以自取:点击跳转

对了,关于红黑树的删除操作大家不用担心,因为在面试中一般只会考察插入操作 ~


原文地址:https://blog.csdn.net/Weraphael/article/details/135003677

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!