【数据结构与算法】深刨Trie树(字典树)

这篇具有很好参考价值的文章主要介绍了【数据结构与算法】深刨Trie树(字典树)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、什么是字典树?

Trie 树,也叫“字典树”。顾名思义,它是一个树形结构。它是一种专门处理字符串匹配的数据结构,用来解决在一组字符串集合中快速查找某个字符串的问题。

Trie 树的本质,就是利用字符串之间的公共前缀,将重复的前缀合并在一起
举个例子,现在我们要存储一些字符串。
【数据结构与算法】深刨Trie树(字典树)

1️⃣ 只要前缀相同的我们就不需要两个节点来存储,但是要注意ABCD和ATCD这两个字符串从B和T就分开了,所以后面的CD就不会存到一起。
2️⃣ 有可能一个字符串是另一个字符串的前缀。所以我们需要一个变量来标志一个字符串的结尾,也能标识有多少个这个字符串。

二、字典树的相关操作

2.1 插入

const int N = 1e6 + 10;
int son[N][26];// 记录下一个节点在第几层
int cnt[N];// 标识字符串结尾
int idx;// 记录下一个要存节点的层数

son数组的作用是记录储存子节点的位置,而26则代表了26个字符,类似于26叉树。
cnt的作用就是标志一个字符串的结尾,顺便记录有多少个该字符串。
idx表示当前要插入的节点(新建节点)。

void insert(const string& s)
{
    int p = 0;// 从根开始找,如果没有说明需要新的根
    for(int i = 0; i < s.size(); i++)
    {
        int u = s[i] - 'a';
        if(!son[p][u])// 没有就创建
        {
            son[p][u] = ++idx;
        }
        p = son[p][u];
    }
    cnt[p]++;
}

用一张图理解一下,假设现在要插入"ac"和"bc":
【数据结构与算法】深刨Trie树(字典树)
这也说明了不管是插入还是查找,第一个字符都是在第0层,所以初始化p = 0

2.2 查找

查找的操作就类似于插入,如果不存在直接返回0即可。

int search(const string& s)
{
    int p = 0;
    for(int i = 0; i < s.size(); i++)
    {
        int u = s[i] - 'a';
        if(!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}

2.3 例题:Trie字符串统计

题目链接

题目描述

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。
    共有 N个操作,所有输入的字符串总长度不超过 1e5,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。接下来 N行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x在集合中出现的次数。
每个结果占一行。

数据范围

1≤N≤2∗1e4

输入样例:

5
I abc
Q abc
Q ab
I ab
Q ab

输出样例:

1
0
1

#include <iostream>
#include <string>

using namespace std;

const int N = 1e6 + 10;
int son[N][26];// 记录下一个节点在第几层
int cnt[N];// 标识字符串结尾
int idx;// 记录下一个要存节点的层数

void insert(const string& s)
{
    int p = 0;// 从根开始找,如果没有说明需要新的根
    for(int i = 0; i < s.size(); i++)
    {
        int u = s[i] - 'a';
        if(!son[p][u])// 没有就创建
        {
            son[p][u] = ++idx;
        }
        p = son[p][u];
    }
    cnt[p]++;
}

int search(const string& s)
{
    int p = 0;
    for(int i = 0; i < s.size(); i++)
    {
        int u = s[i] - 'a';
        if(!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}


int main()
{
    int n;
    cin >> n;
    string s1, s2;
    while(n--)
    {
        cin >> s1 >> s2;
        if(s1 == "I")
        {
            insert(s2);
        }
        else
        {
            cout << search(s2) << endl;
        }
    }
    return 0;
}

三、应用:最大异或对

题目链接

题目描述

在给定的 N个整数 A1,A2……AN中选出两个进行 xor(异或)运算,得到的结果最大是多少?

输入格式

第一行输入一个整数 N。第二行输入 N个整数 A1~AN。

输出格式

输出一个整数表示答案。

数据范围

1≤N≤105, 0≤Ai<231

输入样例:

3
1 2 3

输出样例:

3

思路分析:
首先我们要知道什么时候两个数字异或值最大?
答案是当两个数的二进制位每一位都不相同的时候最大。

我们知道一个数有32个比特位,最高位不用管(符号位),所以我们就要看第0 ~ 30位。
因为比特位有原子性(只有两态),我们可以分两种情况:一种是比特位相同,一种是不同,而为了保证最大,从最高位开始,如果两种情况的话每次尽量往不同的方向走,只有一种情况就没有办法。我们边查找边统计总和,走到最后即可得到异或的值,所以我们边查找就能边统计最大的异或对

#include <iostream>

using namespace std;

const int N = (1e5 + 10) * 31;

int son[N][2], idx;

void insert(int x)
{
    int p = 0;
    for(int i = 30; i >= 0; i--)
    {
        int u = (x >> i) & 1;
        if(!son[p][u]) son[p][u] = ++idx;
        p = son[p][u];
    }
}

int search(int x)
{
    int p = 0, res = 0;
    for(int i = 30; i >= 0; i--)
    {
        int u = (x >> i) & 1;
        // 尽量往不在的那一边走
        // 另一边存在就异或
        if(son[p][!u])
        {
            res = res * 2 + 1;
            p = son[p][!u];
        }
        else
        {
            res = res * 2;
            p = son[p][u];
        }
    }
    return res;
}

int main()
{
    int n;
    cin >> n;
    int res = 0;
    while(n--)
    {
        int x;
        cin >> x;
        insert(x);
        int tmp = search(x);
        res = max(res, tmp);
    }
    cout << res << endl;
    return 0;
}

四、总结

我们上面的题目也可以使用哈希来解决,但是trie树在某些方面它的用途更大,比如说对于某一个单词,我们要询问它的前缀是否出现过。这样hash就不好搞了,而用trie还是很简单。
上面我们使用数组模拟出来的,当然也可以用链式结构:

#define MAX 26
typedef struct trie {
    struct trie* node[MAX];
    int v;
} Trie;

用一道leetcode的例题举例:
题目链接
代码:文章来源地址https://www.toymoban.com/news/detail-416120.html

class Trie {
public:
    vector<Trie*> son;
    bool flag;

    Trie* searchend(string s)
    {
        Trie* node = this;
        for(int i = 0; i < s.size(); i++)
        {
            int u = s[i] - 'a';
            if(!node->son[u])
            {
                return nullptr;
            }
            node = node->son[u];
        }
        return node;
    }

    Trie() 
        : son(26)
        , flag(false)
    {}
    
    void insert(string word) {
        Trie* node = this;
        for(int i = 0; i < word.size(); i++)
        {
            int u = word[i] - 'a';
            if(!node->son[u])
            {
                node->son[u] = new Trie;
            }
            node = node->son[u];
        }
        node->flag = true;
    }
    
    bool search(string word) {
        Trie* node = searchend(word);
        if(node && node->flag)
        {
            return true;
        }
        return false;
    }
    
    bool startsWith(string prefix) {
        Trie* node = searchend(prefix);
        if(node)
        {
            return true;
        }
        return false;
    }
};

/**
 * Your Trie object will be instantiated and called as such:
 * Trie* obj = new Trie();
 * obj->insert(word);
 * bool param_2 = obj->search(word);
 * bool param_3 = obj->startsWith(prefix);
 */


到了这里,关于【数据结构与算法】深刨Trie树(字典树)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 初识Go语言25-数据结构与算法【堆、Trie树、用go中的list与map实现LRU算法、用go语言中的map和堆实现超时缓存】

    初识Go语言25-数据结构与算法【堆、Trie树、用go中的list与map实现LRU算法、用go语言中的map和堆实现超时缓存】

      堆是一棵二叉树。大根堆即任意节点的值都大于等于其子节点。反之为小根堆。   用数组来表示堆,下标为 i 的结点的父结点下标为(i-1)/2,其左右子结点分别为 (2i + 1)、(2i + 2)。 构建堆   每当有元素调整下来时,要对以它为父节点的三角形区域进行调整。 插入元素

    2024年02月12日
    浏览(49)
  • 【高级数据结构】Trie树

    【高级数据结构】Trie树

    高效地存储和查询字符串的数据结构。所以其重点在于:存储、查询两个操作。 示例和图片来自:https://blog.csdn.net/qq_42024195/article/details/88364485 假设有这么几个字符串:b,abc,abd,bcd,abcd,efg,hii。最终存储出来的Trie图如下图所示: 具体是怎么存的呢?对于每一个字符串,

    2024年03月10日
    浏览(10)
  • 【数据结构基础】树 - 前缀树(Trie Tree)

    【数据结构基础】树 - 前缀树(Trie Tree)

    Trie,又称字典树、单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的

    2024年02月07日
    浏览(18)
  • LeetCode、208. 实现 Trie (前缀树)【中等,自定义数据结构】

    LeetCode、208. 实现 Trie (前缀树)【中等,自定义数据结构】

    博主介绍:✌目前全网粉丝2W+,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。 涵盖技术内容:Java后端、算法、分布式微服务、中间件、前端、运维、ROS等。 博主所有博客文件目录索引:博客目录索引(持续更新) 视频平台:

    2024年02月19日
    浏览(12)
  • 数据结构与算法——什么是数据结构

    数据结构与算法——什么是数据结构

    当你决定看这篇文章,就意味着系统学习数据结构的开始。下面我们先来讲什么是数据结构。 数据结构,直白地理解,就是研究数据的存储方式。 我们知道,数据存储只有一个目的,即为了方便后期对数据的再利用,就如同我们使用数组存储  {1,2,3,4,5}  是为了后期取得它们

    2024年02月15日
    浏览(10)
  • 【算法与数据结构】1 算法0基础入门,详解什么是算法?什么是线性查找法?

    【算法与数据结构】1 算法0基础入门,详解什么是算法?什么是线性查找法?

    欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于算法与数据结构体系专栏, 本专栏 是服务于0基础者,一起完成从0到1的跨越 就是 一系列 可以解决问题的 清晰的 可执行的 计算机指令 那么生活中有哪些算法? 问路 :坐公交车到

    2023年04月09日
    浏览(22)
  • 数据结构与算法这么难,为什么我们还要学习?

    提到数据结构与算法,就一定会伴随着诸多所谓的坚持和抱怨。同时,还有两个词总是出现,一个是内功,是对知识的定位,一个是吃透,是对自己

    2024年01月19日
    浏览(15)
  • 【Redis】基础数据结构-字典

    【Redis】基础数据结构-字典

    基本语法 字典是Redis中的一种数据结构,底层使用哈希表实现,一个哈希表中可以存储多个键值对,它的语法如下,其中KEY为键,field和value为值(也是一个键值对): 根据Key和field获取value: 哈希表 数据结构 dictht dictht是哈希表的数据结构定义: table:哈希表数组,数组中的

    2024年02月07日
    浏览(11)
  • 数据结构---字典树(Tire)

    数据结构---字典树(Tire)

    字典树是一种能够快速插入和查询字符串的多叉树结构,节点的编号各不相同,根节点编号为0 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。 核心思想也是通过空间来换取时间上的效率 在一定情况下字典树的效率要比哈希表要高 字典树

    2024年02月21日
    浏览(10)
  • 字典树的数据结构

    字典树的数据结构

    Trie字典树主要用于存储字符串, Trie 的每个 Node 保存一个字符。用链表来描述的话,就是一个字符串就是一个链表。每个Node都保存了它的所有子节点。 例如我们往字典树中插入 see、pain、paint 三个单词,Trie字典树如下所示: 也就是说如果只考虑小写的26个字母,那么Trie字典

    2024年02月12日
    浏览(9)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包