热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

五、数据结构笔记:串[一](定义朴素的模式匹配算法)

串的定义:是由零个或多个字符组成的有限序列,又叫字符串。一般记为s“a1a2a3an(n0),其中,s是字符串的名

串的定义:是由零个或多个字符组成的有限序列,又叫字符串。

 

一般记为 s=“a1a2a3...an"(n>=0),其中,s是字符串的名称,用双引号括起来的字符序列是串的值,注意引号不属于串的内容。ai可以是字母、数字或者其他字符,i是该字符在串中的位置。串中的字符数目n称为串的长度,定义中谈到的有限是指长度n是一个有限的数值。零个字符的串称为空串,它的长度为0,可以直接用两个双引号表示,所谓序列,说明串的相邻字符之间具有前驱和后继的关系。

还有一些概念需要注意:

  • 空格串,是只包含空格的串,注意它与空串的区别,空格串是有内容有长度的,而且枯眼不止一个空格。
  • 子串与主串,串中任意个数的连续字符组成的子序列称为该串的子串,相应地,包含子串的串称为主串。
  • 子串在主串中的位置就是该子串的第一个字符在主串中的位置。

串的比较

两个数字进行比较,2比1大,这完全正确,可是两个字符串如何比较呢?

事实上,串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号。

计算机中的常用字符是用标准的ASCII编码,更准确一点,由8位二进制数表示一个字符,一共可以表示256字符,这些只够以英文为主的语言和特殊符号,但全世界文字千千万万,显然这是不够用的,于是提出了Unicode编码,采用16位的二进制数表示一个字符,一共可以表示6.5万多个,而前256个字符与ASCII完全一致。

如果我们在C语言中比较两个串是否相等,必须是他们串的长度以及他们各个对应位置的字符都相等,才算是相等。

那么当两个字符串不想等时,如何比较他们的大小呢?

给定两个串:s=“a1a2a3...an”,t=“b1b2b3...bm”,当满足以下条件之一时s

  1. n
  2. 存在某个k <&#61; min(m,n)&#xff0c;使得ai&#61;bi&#xff0c;(i从1到k-1)&#xff0c;ak

换句话说&#xff0c;当两个字符串相等&#xff0c;对应位置的字符也都相等&#xff0c;则两个串是相等的。

串的存储结构

1、顺序存储结构

串的顺序存储结构是用一组地址连续的存储单元来存储串中的字符序列的。按照预定义的大小&#xff0c;为每个定义的串变量分配一个固定长度的存储区。一般是用定常数组来定义。

既然是定长数组&#xff0c;就存在一个预定义的最大串长度&#xff0c;一般可以将实际的串长度值保存在数组的0下标位置&#xff0c;有的语言加在数组最后&#xff1a;

 

 

 

上面说的串的顺序存储其实是有问题的&#xff0c;因为字符串的操作&#xff0c;比如两个串的连接&#xff0c;新串的插入等&#xff0c;都有可能造成串长度超过数组长度。

于是对于顺序存储&#xff0c;有一些优化&#xff0c;串值的存储空间可在程序执行过程中动态分配而得。

2、链式存储结构

对于串的链式存储结构&#xff0c;与线性表是相似的&#xff0c;但由于传结构的特殊性&#xff0c;结构中的每个元素数据是一个字符&#xff0c;如果也简单的应用链表存储串值&#xff0c;一个结点对应一个字符&#xff0c;就存在很大的内存浪费。因此一个结点可以存放一个字符&#xff0c;也可以考虑存放多个字符&#xff0c;最后一个结点若是未被占满&#xff0c;可以用井号或其他值将其填满。

 

 

 

总的来说&#xff0c;不如顺序存储灵活&#xff0c;性能也不如顺序存储结构好。

朴素的模式匹配算法

子串的定位操作&#xff0c;通常称作串的模式匹配

通常的模式匹配&#xff0c;是对主串的每一个字符作为子串的开头&#xff0c;与要匹配的字符串进行匹配&#xff0c;不匹配则整体后移一位&#xff0c;直到完全匹配。

其时间复杂度为O(n&#43;m)&#xff0c;n是主串的长度&#xff0c;m是子串的长度。

 

示例&#xff1a;

主串&#xff1a; “goodgoogle”找到   “google” 这个子串的位置

 

后续会有 KMP算法的实现&#xff0c;因为比较复杂&#xff0c;单独拿出一个章节进行讲解。。。。

 

 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


推荐阅读
  • 本文详细介绍了C语言中的指针,包括其基本概念、应用场景以及使用时的优缺点。同时,通过实例解析了指针在内存管理、数组操作、函数调用等方面的具体应用,并探讨了指针的安全性问题。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 本文探讨了如何使用自增和自减运算符遍历二维数组中的元素。通过实例详细解释了指针与二维数组结合使用的正确方法,并解答了常见的错误用法。 ... [详细]
  • 本文介绍了一种基于选择排序思想的高效排序方法——堆排序。通过使用堆数据结构,堆排序能够在每次查找最大元素时显著提高效率。文章详细描述了堆排序的工作原理,并提供了完整的C语言代码实现。 ... [详细]
  • 本文详细介绍了C语言中的基本数据类型,包括整型、浮点型、字符型及其各自的子类型,并探讨了这些类型在不同编译环境下的表现。 ... [详细]
  • 本文档汇总了Python编程的基础与高级面试题目,涵盖语言特性、数据结构、算法以及Web开发等多个方面,旨在帮助开发者全面掌握Python核心知识。 ... [详细]
  • 1、字符型常量字符型常量指单个字符,是用一对单引号及其所括起来的字符表示。例如:‘A’、‘a’、‘0’、’$‘等都是字符型常量。C语言的字符使用的就是 ... [详细]
  • 本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 如何在PHPCMS V9中实现多站点功能并配置独立域名与动态URL
    本文介绍如何在PHPCMS V9中创建和管理多个站点,包括配置独立域名、设置动态URL,并确保各子站能够正常运行。我们将详细讲解从新建站点到最终配置路由的每一步骤。 ... [详细]
  • 本文探讨了 C++ 中普通数组和标准库类型 vector 的初始化方法。普通数组具有固定长度,而 vector 是一种可扩展的容器,允许动态调整大小。文章详细介绍了不同初始化方式及其应用场景,并提供了代码示例以加深理解。 ... [详细]
  • 程序员版情书:王思聪的编程式告白
    当程序员用代码表达爱意,会产生怎样的化学反应?一起来看看这封充满技术感的情书,网友笑称这才是真爱! ... [详细]
  • 云屏系统基于嵌入式微系统msOS,旨在解决当前嵌入式彩屏GUI编程中硬件要求高、软件开发复杂、界面效果不佳等问题。该系统通过结合MCU和Android技术,利用Html5+JavaScript实现高效、易用的图形用户界面开发,使嵌入式开发人员能够专注于业务逻辑。 ... [详细]
  • 本文详细解析了Java中throw和throws的关键区别,同时涵盖了JDK的定义、Java虚拟机的关键约定、Java的跨平台性、自动垃圾回收机制、源文件结构、包的概念及作用等多个核心知识点,旨在帮助学生更好地准备Java期末考试。 ... [详细]
  • MATLAB 数据读取与绘图实践
    本文详细介绍了如何使用 MATLAB 进行数据文件的选择、读取及处理,并最终绘制图形。重点在于数据的提取和转换过程。 ... [详细]
author-avatar
用户0a8xoj91q0
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有