C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现

这篇具有很好参考价值的文章主要介绍了C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

通过我之前那篇KMP算法的讲解,我们可以快速手算KMP算法的next数组,但是之前计算的next数组在一些情况下会有缺陷,比如模式串’aaaab’和主串’aaabaaaab’进行匹配

一.计算根据下列模式串计算出next数组

令模式串指针为j
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现

当第一个元素不匹配时,下一次匹配还是要从模式串的第一个元素与主串匹配,其实我们可以直接写next [1] = 0;,就是当模式串第一个元素就不匹配时next数组对应值直接写0,这样写在我们实现代码时就可以让j = 0时主串和模式串的指针同时往后移动
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现

当第二个元素不匹配时,在匹配失败的元素前面画一条线,然后模式串右移,直到左边没有元素或者左边元素都匹配成功的时候就停下来,从下图可以看到模式串是从第一个元素开始匹配,所以next[1] = 1,这个也可以直接写1,因为在每一个模式串第一个元素不匹配时,next[2]=1

C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
当第三个元素不匹配时,在匹配失败的元素前面画一条线,然后模式串右移,直到左边没有元素或者左边元素都匹配成功的时候就停下来,从下图可以看出next[3]=2
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
右移,下一次模式匹配的是第二个元素,所以next等于2
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
当第四个元素不匹配时,在匹配失败的元素前面画一条线,然后模式串右移,直到左边没有元素或者左边元素都匹配成功的时候就停下来,从下图可以看出next[4]=3
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
当第五个元素不匹配时,在匹配失败的元素前面画一条线,然后模式串右移,直到左边没有元素或者左边元素都匹配成功的时候就停下来,从下图可以看出next[5]=4
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
综上所述,next数组的为[0,1,2,3,4]

二.优化next数组

通过以上我们会发现,当模式串第二个元素不匹配时,我们默认是将模式串右移一位,让模式串第一个元素与之进行比较,然而这里我们可以看到模式串的第一个和第二个元素是同一个,那么就说第一个元素一定与之不匹配,此时我们就可以直接把next[2]设置为0;
原来匹配失败比较位置
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
优化后
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现

其他的也是同样的方式

通过以上我们会发现,当模式串第3个元素不匹配时,我们默认是将模式串右移一位,让模式串第2个元素与之进行比较,然而这里我们可以看到模式串的第2个和第3个元素是同一个,那么就说第2个元素一定与之不匹配,此时我们就可以直接把next[2]设置为0;
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
第四个元素不匹配也是和上面一样让next[4] =0

但是当第五个元素不匹配时,我们只能直到第五个元素一定不是b,但是可能是a,所以我们这里就要模式串的第四个元素与之比较,所以next[5]=4
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现
综上所述,可以得到优化后的next数组等于[0,0,0,0,4]

三.用优化后next的数组代码实现子串的匹配

#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
void get_next(char* s, int* next) {
    int len = strlen(s);
    next[0] = -1;
    int k = -1, j = 0;
    while (j < len - 1) {
        if (k == -1 || s[j] == s[k]) {
            ++j;
            ++k;
            if (s[j] != s[k]) {
                next[j] = k;
            }
            else {
                next[j] = next[k];
            }
        }
        else {
            k = next[k];
        }
    }
}
int kmp(char* s, char* p, int* next) {
    int slen = strlen(s);
    int plen = strlen(p);
    int i = 0, j = 0;
    while (i < slen && j < plen) {
        if (j == -1 || s[i] == p[j]) {
            ++i;
            ++j;
        }
        else {
            j = next[j];
        }
    }
    if (j == plen) {
        return i - j;
    }
    else {
        return -1;
    }
}
int main() {
    char s[] = "aaabaaaab";
    char p[] = "aaaab";
    int next[5];
    get_next(p, next);
    int pos = kmp(s, p, next);
    if (pos != -1) {
        printf("子串在主串的%d元素后\n", pos);
    }
    else {
        printf("匹配失败\n");
    }
    return 0;
}

代码运行:
C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现

总结

通过以上的流程图讲解我们可以清楚的了解到优化KMP算法实际就是通过尽可能的减少子串与子串之间的比较次数从而达到高效的子串匹配,最主要我们要先学会next数组的计算再去了解优化后的next数组,这样才会事半功倍,希望本篇文章可以给大家带来帮助!!!文章来源地址https://www.toymoban.com/news/detail-455249.html

到了这里,关于C语言数据结构+KMP算法next数组优化计算方法+优化后子串匹配代码实现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • KMP算法中的next数组求解

            KMP算法(Knuth-Morris-Pratt) 是一个字符串的匹配算法,其中有一部分算法需要求解next数组来求解 该位置前面字符串的最长相同的真前缀和真后缀长度。          next数组的求解方法为:第一位的next值为0,第二位的next值为1,后面求解每一位的next值时,根据前一位进行

    2024年02月10日
    浏览(14)
  • KMP算法——(手把手算next数组)

    该算法核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数,从而达到快速匹配的目的。 KMP算法与BF算法(暴力算法)区别在于, 主串 的i不会回退,并且 模式串 的j不会每次都回到0位置。 第一个问题:为什么主串的i不需要回退? 看如下两个字符串: a b c d

    2023年04月18日
    浏览(10)
  • 【数据结构与算法】KMP算法

     在C语言的strstr的实现过程中,所涉及的算法较为简单,或者说只是一个简单的思路而已,在字符串过长时,所涉及的算法复杂度过大,那有没有比较简单的算法呢?这里就涉及到了KMP——由三位大佬提出的,下面我们一起来了解吧!  KMP算法是一种改进的字符串匹配算法

    2024年03月26日
    浏览(13)
  • 数据结构--KMP算法

    模板: 例题:acwing--kmp字符串(831. KMP字符串 - AcWing题库) 给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。 模式串 P 在字符串 S 中多次作为子串出现。 求出模式串 P 在字符串 S 中所有出现的位置的起始下标。 输入格式 第一

    2024年02月11日
    浏览(14)
  • 数据结构:KMP算法

         KMP算法是由Knuth、Morris和Pratt三位学者发明的,所以取了三位学者名字的首字母,叫作KMP算法。      KMP主要用于字符串匹配的问题,主要思想是 当出现字符串不匹配时,我们可以知道一部分之前已经匹配过的的文本内容,利用这些信息从而避免从头再开始匹配。    

    2024年02月04日
    浏览(14)
  • 数据结构KMP算法详解

    目录 1. KMP算法是什么? 2. KMP算法的由来 2.1 需要要解决的问题 2.2 一开始想到的方法 2.3 KMP算法诞生了 3.KMP算法的详解 4.KMP算法的实现 5.KMP算法的改进 KMP算法是一种改进的字符串匹配算法,即可以 快速的从主串中找到子串的算法 ,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人

    2024年02月12日
    浏览(28)
  • [数据结构] 串与KMP算法详解

    今天是农历大年初三,祝大家新年快乐! 尽管新旧交替只是一个瞬间,在大家互祝新年快乐的瞬间,在时钟倒计时数到零的瞬间,在烟花在黑色幕布绽放的瞬间,在心底默默许下愿望的瞬间……跨入新的一年,并不意味了一切都会朝着更美好,也没有什么会从天而降,我们赋

    2024年02月19日
    浏览(15)
  • 头歌(C语言)-数据结构与算法-数组(共7关)

    任务描述 本关任务:将十个数进行从大到小的顺序进行排列。 相关知识(略) 编程要求 根据提示,在右侧编辑器 Begin-End 处补充代码。 输入 输入十个整数。 输出 以从大到小的顺序输出这个十个数。 测试说明 样例输入: 1 2 3 4 5 6 7 8 9 10 样例输出: 10 9 8 7 6 5 4 3 2 1 代码:

    2024年02月11日
    浏览(12)
  • 【数据结构】朴素模式匹配 & KMP算法

    🌈 自在飞花轻似梦,无边丝雨细如愁 🌈   🌟 正式开始学习数据结构啦~此专栏作为学习过程中的记录 🌟 子串的定位操作通常称为串的模式匹配,它求的是模式串在主串中的位置,而朴素模式匹配就是一种不断移动主串指针,每一次都和模式串依次进行比较的暴力求解方法

    2024年02月16日
    浏览(15)
  • 数据结构--字符串的KMP算法

    朴素模式匹配算法: 一旦发现当前这个子串中某个字符不匹配,就只能转而匹配下一个子串(从头开始) 但我们可以知道: 不匹配的字符之前,一定是和模式串一致的 color{red}不匹配的字符之前,一定是和模式串一致的 不匹配的字符之前,一定是和模式串一致的 我们可以利用

    2024年02月12日
    浏览(18)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包