KMP算法

🕗 发布于 2024-08-02 02:10 算法 c++ KMP

🌏个人博客主页：心.c

前言：前段时间练习了算法，深入了解了KMP算法思维，今天和大家分享一下如何通过KMP更好地完成字符串对子字符串的查找！

🔥🔥🔥文章专题：KMP

😽感谢大家的点赞👍收藏⭐️评论✍您的一键三连是我更新的动力 💓

如果给你一道这样的算法题（你该如何给更好的处理解决呢？）：

两个字符串 haystack 和 needle ，请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标（下标从 0 开始）。如果 needle 不是 haystack 的一部分，则返回 -1 。

示例 1：
输入：haystack = "sadbutsad", needle = "sad"
输出：0
解释："sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ，所以返回 0 。

当我们看到这种算法题时，我们的第一反应可能是进行两次for循环进行遍历，虽然这样也可以将代码进行提交，但是它的空间复杂度为O(n * m) ，我们的主串很长时，这种for循环就会产生很大的弊端，在运行上花费很多时间，这种for循环不会灵活变通，不太友好，所以这样解决不是一个好的算法思维的解决方法，我们应该通过其他知识来进行更加灵活的求解，下面我将会跟大家分享KMP，一种高效的字符串匹配算法

KMP理论讲解：

内容：

KMP算法是一种高效的字符串匹配算法，用于在一个较长的文本字符串中查找一个较短的模式字符串。KMP 算法的主要优点是它可以在 O(n + m) 的时间内完成搜索，其中 n 是文本字符串的长度，m 是模式字符串的长度。

通过上面KMP算法的适用我们就可以明白，KMP算法是当前解决主字符串中查找子字符串最方便的一种算法思维，所以今天我们通过学习KMP来解决我们写相关类型算法的面临的问题

复杂度：

KMP 算法的时间复杂度为 O(n + m)，空间复杂度为 O(m)。

时间复杂度 (Time Complexity): 描述算法运行所需时间的增长率，通常表示为输入规模（如数组长度、字符串长度等）的函数。它关注的是随着输入规模增长，算法执行时间的增长趋势。
空间复杂度 (Space Complexity): 描述算法运行所需的额外内存空间的增长率，通常也是表示为输入规模的函数。它关注的是随着输入规模增长，额外内存使用的增长趋势。

核心：

在于构建一个next 数组的数据结构。这个表用于记录模式字符串的前缀与其最长相等前后缀的长度。有了这个表，KMP 算法可以避免在匹配过程中重复比较已经比较过的字符，从而提高了效率。

要想创建next数组，首先我们先了解一下关于前缀和后缀的一些概念，因为这里的next数组要记录的是子字符串的前缀与其最长相等前后缀的长度，next数组中记录是的关于子串的前缀的前缀和后缀的最长相等长度

前缀和后缀的概念：

前缀和后缀不加后面的一个字符或者前面的一个字符，也就是上面字符串中的前缀不包括C，后缀不包括A

虽然C没有加入前缀，但是我们在这里默认为0

所以next的数组在这个子字符串中就赋值就为{0，0，1，2，0}

下面我们将通过这组字符串来进行讲解：

（下面这三张照片很抱歉，视频上传不了，所以只能把比较重点的图片拿出来给大家看了，大家不要见怪）

定义一个n,m（提示n的值只会增不会减）
起始n=m=0
如果主串下标n的值等于子串下标m的值 n和m都加一，将下标同时向前移动一位
下图1为n=m=3时刻，因为前面值都相等
下图2为n=m=4时刻，但是主串下标n的值不等于子串下标m的值，所以n和m要发生变化
下图3为n=4,m=2,因为我们判断当主串下标n的值不等于子串下标m的值时，n值不变，然后让m返回m-next[m-1]（只要主串下标n的值不等于子串下标m的值就可以一直这样循环），这样n可以不进行返回，只有m移动，大大减少了不必要的循环遍历（这里的理解非常非常重要）
然后后面的步骤就是和上面的一样直到找到子字符串或者n达到最大值

图一

图二

图三

想必大家看到这里已经对KMP有些理解了，下面我们通过代码进行实践

KMP算法讲解：

next数组的创建：

首先通过子字符串来创建next数组

    // 通过KMP来创建next数组
    vector<int> getNext(const string& needle) {
        vector<int> next;
        next.push_back(0); //数组的第一个值都是0，所以直接进行赋值
        int index = 0;
        int i = 1;

        while (i < needle.length()) {
            if (needle[index] == needle[i]) {
                index++;
                next.push_back(index);
                
                i++;
            } else if (index > 0) {  
                index = next[index - 1]; 
            } else { 
                next.push_back(0);
                i++;
            }
        }

        return next;
    }

遍历数组找到子字符串：

int strStr(const string& haystack, const string& needle) {
        vector<int> next = getNext(needle);
        int hindex = 0;
        int nindex = 0;

        while (hindex < haystack.length() && nindex < needle.length()) {
            if (haystack[hindex] == needle[nindex]) {
                hindex++;
                nindex++;
                if (nindex == needle.length()) {
                    return hindex - nindex; 
                }
            } else if (nindex > 0) {
                nindex = next[nindex - 1];
            } else {
                hindex++;
            }
            
        }

        return -1;  
    }

总代码：

// 通过KMP来创建next数组
    vector<int> getNext(const string& needle) {
        vector<int> next;
        next.push_back(0); 
        int index = 0;
        int i = 1;

        while (i < needle.length()) {
            if (needle[index] == needle[i]) {
                index++;
                next.push_back(index);
                
                i++;
            } else if (index > 0) {  
                index = next[index - 1]; 
            } else { 
                next.push_back(0);
                i++;
            }
        }

        return next;
    }

    int strStr(const string& haystack, const string& needle) {
        vector<int> next = getNext(needle);
        int hindex = 0;
        int nindex = 0;

        while (hindex < haystack.length() && nindex < needle.length()) {
            if (haystack[hindex] == needle[nindex]) {
                hindex++;
                nindex++;
                if (nindex == needle.length()) {
                    return hindex - nindex; 
                }
            } else if (nindex > 0) {
                nindex = next[nindex - 1];
            } else {
                hindex++;
            }
            
        }

        return -1;  
    }

到这里就结束了，不懂的可以给我私信哦

原文地址：https://blog.csdn.net/2301_81253185/article/details/140847776

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：AI问答：理解 HRP / Hospital Resource Planning / 医院资源规划
下一篇：6 postgresql事务与并发控制

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

KMP算法

KMP理论讲解：

内容：

核心：

KMP算法讲解：

next数组的创建：

遍历数组找到子字符串：

总代码：

相关文章