热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

广义后缀自动机在字符串处理中的应用

本文详细探讨了如何使用广义后缀自动机解决MemSQLStart[c]UP2.0竞赛第一轮E题——Threestrings。通过构建和分析后缀自动机,我们能够高效地统计多个字符串中子串出现的频率。

本文旨在深入解析广义后缀自动机(Generalized Suffix Automaton, GSA)在字符串处理问题中的应用,特别是在MemSQL Start[c]UP 2.0竞赛第一轮E题——Three strings中的具体实现。通过本题,我们可以学习到如何利用GSA来高效解决多字符串的子串匹配与计数问题。


问题描述:给定三个字符串,任务是计算每个可能长度的子串在这三个字符串中同时出现的次数,并输出这些计数结果。


#include
#define LL long long
#define fi first
#define se second
#define mk make_pair
#define PII pair
#define PLI pair
#define ull unsigned long long
using namespace std;
const int N = 5e5 + 7;
const int inf = 0x3f3f3f3f;
const LL INF = 0x3f3f3f3f3f3f3f3f;
const int mod = 1e9 + 7;
const double eps = 1e-8;
int n, ans[N], len[3];
char s[3][N];
struct SuffixAutomaton {
int cur, cnt, ch[N<<1][26], id[N<<1], fa[N<<1], dis[N<<1], sz[N<<1], c[N];
int num[3][N<<1];
SuffixAutomaton() : cur(1), cnt(1) {}
void init() {
for(int i = 1; i <= cnt; i++) {
memset(ch[i], 0, sizeof(ch[i]));
sz[i] = c[i] = dis[i] = fa[i] = 0;
}
cur = cnt = 1;
}
int extend(int p, int c) {
cur = ++cnt; dis[cur] = dis[p] + 1;
while(p && !ch[p][c]) ch[p][c] = cur, p = fa[p];
if(!p) fa[cur] = 1;
else {
int q = ch[p][c];
if(dis[q] == dis[p] + 1) fa[cur] = q;
else {
int nt = ++cnt; dis[nt] = dis[p] + 1;
memcpy(ch[nt], ch[q], sizeof(ch[q]));
fa[nt] = fa[q]; fa[q] = fa[cur] = nt;
while(ch[p][c] == q) ch[p][c] = nt, p = fa[p];
}
}
sz[cur] = 1;
return cur;
}
void topo(int n) {
for(int i = 1; i <= cnt; i++) c[dis[i]]++;
for(int i = 1; i <= n; i++) c[i] += c[i-1];
for(int i = cnt; i >= 1; i--) id[c[dis[i]]--] = i;
}
void solve() {
for(int i = 0; i <3; i++) {
scanf("%s", s[i]); len[i] = strlen(s[i]);
for(int j = 0, last = 1; j last = extend(last, s[i][j] - 'a');
}
for(int i = 0; i <3; i++) {
for(int j = 0, p = 1; j p = ch[p][s[i][j] - 'a'];
num[i][p]++;
}
}
topo(max(len[0], max(len[1], len[2])));
for(int i = cnt; i >= 1; i--)
for(int j = 0; j <3; j++)
num[j][fa[id[i]]] += num[j][id[i]];
for(int i = 2; i <= cnt; i++) {
int ret = 1ll * num[0][i] * num[1][i] % mod * num[2][i] % mod;
int mx = dis[i], mn = dis[fa[i]] + 1;
ans[mn] = (ans[mn] + ret) % mod;
ans[mx + 1] = (ans[mx + 1] - ret + mod) % mod;
}
int Len = min(len[0], min(len[1], len[2]));
for(int i = 1; i <= Len; i++) {
ans[i] = (ans[i] + ans[i-1]) % mod;
printf("%d ", ans[i]);
}
puts("");
}
} sam;
int main() {
sam.solve();
return 0;
}


推荐阅读
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 题目描述:给定n个半开区间[a, b),要求使用两个互不重叠的记录器,求最多可以记录多少个区间。解决方案采用贪心算法,通过排序和遍历实现最优解。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 在前两篇文章中,我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象,分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor,即用于描述 Action 方法参数的对象,并详细介绍其工作原理。 ... [详细]
  • PHP 编程疑难解析与知识点汇总
    本文详细解答了 PHP 编程中的常见问题,并提供了丰富的代码示例和解决方案,帮助开发者更好地理解和应用 PHP 知识。 ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • Windows服务与数据库交互问题解析
    本文探讨了在Windows 10(64位)环境下开发的Windows服务,旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行,但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]
  • PyCharm中配置Pylint静态代码分析工具
    本文详细介绍如何在PyCharm中配置和使用Pylint,帮助开发者进行静态代码检查,确保代码符合PEP8规范,提高代码质量。 ... [详细]
  • 本题探讨了一种字符串变换方法,旨在判断两个给定的字符串是否可以通过特定的字母替换和位置交换操作相互转换。核心在于找到这些变换中的不变量,从而确定转换的可能性。 ... [详细]
  • Java 中 Writer flush()方法,示例 ... [详细]
  • 主要用了2个类来实现的,话不多说,直接看运行结果,然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
author-avatar
花落酒未醉
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有