热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

五、数据结构笔记:串[一](定义朴素的模式匹配算法)

串的定义:是由零个或多个字符组成的有限序列,又叫字符串。一般记为s“a1a2a3an(n0),其中,s是字符串的名

串的定义:是由零个或多个字符组成的有限序列,又叫字符串。

 

一般记为 s=“a1a2a3...an"(n>=0),其中,s是字符串的名称,用双引号括起来的字符序列是串的值,注意引号不属于串的内容。ai可以是字母、数字或者其他字符,i是该字符在串中的位置。串中的字符数目n称为串的长度,定义中谈到的有限是指长度n是一个有限的数值。零个字符的串称为空串,它的长度为0,可以直接用两个双引号表示,所谓序列,说明串的相邻字符之间具有前驱和后继的关系。

还有一些概念需要注意:

  • 空格串,是只包含空格的串,注意它与空串的区别,空格串是有内容有长度的,而且枯眼不止一个空格。
  • 子串与主串,串中任意个数的连续字符组成的子序列称为该串的子串,相应地,包含子串的串称为主串。
  • 子串在主串中的位置就是该子串的第一个字符在主串中的位置。

串的比较

两个数字进行比较,2比1大,这完全正确,可是两个字符串如何比较呢?

事实上,串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号。

计算机中的常用字符是用标准的ASCII编码,更准确一点,由8位二进制数表示一个字符,一共可以表示256字符,这些只够以英文为主的语言和特殊符号,但全世界文字千千万万,显然这是不够用的,于是提出了Unicode编码,采用16位的二进制数表示一个字符,一共可以表示6.5万多个,而前256个字符与ASCII完全一致。

如果我们在C语言中比较两个串是否相等,必须是他们串的长度以及他们各个对应位置的字符都相等,才算是相等。

那么当两个字符串不想等时,如何比较他们的大小呢?

给定两个串:s=“a1a2a3...an”,t=“b1b2b3...bm”,当满足以下条件之一时s

  1. n
  2. 存在某个k <&#61; min(m,n)&#xff0c;使得ai&#61;bi&#xff0c;(i从1到k-1)&#xff0c;ak

换句话说&#xff0c;当两个字符串相等&#xff0c;对应位置的字符也都相等&#xff0c;则两个串是相等的。

串的存储结构

1、顺序存储结构

串的顺序存储结构是用一组地址连续的存储单元来存储串中的字符序列的。按照预定义的大小&#xff0c;为每个定义的串变量分配一个固定长度的存储区。一般是用定常数组来定义。

既然是定长数组&#xff0c;就存在一个预定义的最大串长度&#xff0c;一般可以将实际的串长度值保存在数组的0下标位置&#xff0c;有的语言加在数组最后&#xff1a;

 

 

 

上面说的串的顺序存储其实是有问题的&#xff0c;因为字符串的操作&#xff0c;比如两个串的连接&#xff0c;新串的插入等&#xff0c;都有可能造成串长度超过数组长度。

于是对于顺序存储&#xff0c;有一些优化&#xff0c;串值的存储空间可在程序执行过程中动态分配而得。

2、链式存储结构

对于串的链式存储结构&#xff0c;与线性表是相似的&#xff0c;但由于传结构的特殊性&#xff0c;结构中的每个元素数据是一个字符&#xff0c;如果也简单的应用链表存储串值&#xff0c;一个结点对应一个字符&#xff0c;就存在很大的内存浪费。因此一个结点可以存放一个字符&#xff0c;也可以考虑存放多个字符&#xff0c;最后一个结点若是未被占满&#xff0c;可以用井号或其他值将其填满。

 

 

 

总的来说&#xff0c;不如顺序存储灵活&#xff0c;性能也不如顺序存储结构好。

朴素的模式匹配算法

子串的定位操作&#xff0c;通常称作串的模式匹配

通常的模式匹配&#xff0c;是对主串的每一个字符作为子串的开头&#xff0c;与要匹配的字符串进行匹配&#xff0c;不匹配则整体后移一位&#xff0c;直到完全匹配。

其时间复杂度为O(n&#43;m)&#xff0c;n是主串的长度&#xff0c;m是子串的长度。

 

示例&#xff1a;

主串&#xff1a; “goodgoogle”找到   “google” 这个子串的位置

 

后续会有 KMP算法的实现&#xff0c;因为比较复杂&#xff0c;单独拿出一个章节进行讲解。。。。

 

 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


推荐阅读
  • 本文详细介绍了C语言中的指针,包括其基本概念、应用场景以及使用时的优缺点。同时,通过实例解析了指针在内存管理、数组操作、函数调用等方面的具体应用,并探讨了指针的安全性问题。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 本文探讨了如何使用自增和自减运算符遍历二维数组中的元素。通过实例详细解释了指针与二维数组结合使用的正确方法,并解答了常见的错误用法。 ... [详细]
  • 本文介绍了一种基于选择排序思想的高效排序方法——堆排序。通过使用堆数据结构,堆排序能够在每次查找最大元素时显著提高效率。文章详细描述了堆排序的工作原理,并提供了完整的C语言代码实现。 ... [详细]
  • 本文详细介绍了C语言中的基本数据类型,包括整型、浮点型、字符型及其各自的子类型,并探讨了这些类型在不同编译环境下的表现。 ... [详细]
  • 本文详细探讨了KMP算法中next数组的构建及其应用,重点分析了未改良和改良后的next数组在字符串匹配中的作用。通过具体实例和代码实现,帮助读者更好地理解KMP算法的核心原理。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细探讨了C语言中指针的概念,特别是指针在变量和数组中的应用。通过实例讲解,帮助读者更好地掌握指针的使用方法。 ... [详细]
  • 本文探讨了高质量C/C++编程的最佳实践,并详细分析了常见的内存错误及其解决方案。通过深入理解内存管理和故障排除技巧,开发者可以编写更健壮的程序。 ... [详细]
  • 解析SQL查询结果的排序问题及其解决方案
    本文探讨了为什么某些SQL查询返回的数据集未能按预期顺序排列,并提供了详细的解决方案,帮助开发者理解并解决这一常见问题。 ... [详细]
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • 本文介绍如何利用栈数据结构在C++中判断字符串中的括号是否匹配。通过顺序栈和链栈两种方式实现,并详细解释了算法的核心思想和具体实现步骤。 ... [详细]
  • 程序员版情书:王思聪的编程式告白
    当程序员用代码表达爱意,会产生怎样的化学反应?一起来看看这封充满技术感的情书,网友笑称这才是真爱! ... [详细]
author-avatar
用户0a8xoj91q0
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有