热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

串的基础知识

从数据结构角度看,栈和队列是操作受限的线性表,他们的逻辑结构相同。串是重要的非数值处理对象,它是以字符作为数据元素的线性表。串࿱
从数据结构角度看,栈和队列是操作受限的线性表,他们的逻辑结构相同。 
串是重要的非数值处理对象,它是以字符作为数据元素的线性表。 


串:即字符串,是由零个或多个字符组成的有限序列,是数据元素为单个字符的特殊线性表。 


若干术语: 
串长:串中字符个数(n≥0), n=0 时称为空串 。
空白串:由一个或多个空格符组成的串。 
字符位置:字符在串中的序号。 
串相等:串长度相等,且对应位置上字符相等。


子串:串中任意个连续的字符组成的子序列。 
主串:包含子串的串。 
子串的位置:子串的第一个字符在主串中的序号。


串的数据对象约束为某个字符集。
        微机上常用的字符集是标准ASCII码,由 7 位二进制数    表示一个字符,总共可以表示 128 个字符。扩展ASCII      码由 8 位二进制数表示一个字符,总共可以表示 256 个    字符,足够表示英语和一些特殊符号,但无法满足国际需要。  Unicode码由 16 位二进制数表示一个字符,总共可以表示2的16次方个字符,即6万5千多个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。

ADT String {数据对象:D={ ai |ai∈CharacterSet, i=1,2,...,n, n≥0 } 数据关系:R1={ | ai-1, ai ∈D, i=2,...,n }基本操作:} ADT String
  

StrInsert (&S, pos, T)    (插入) 
初始条件:串 S 和 T 均存在,1≤pos≤StrLength(S)+1。
操作结果:在串 S 的第 pos 个字符之前插入串T。 
例如:S = "chater",T = "rac", 则执行 StrInsert (S, 4, T)                得到 S = "character" 

StrDelete (&S, pos, len)    (删除) 
初始条件:串 S 存在,且1≤pos≤StrLength(S)-len+1。
操作结果:从串 S 中删除第 pos 个字符起长度为len的子串。 

StrAssign (&T, chars)    (串赋值) 
初始条件:chars 是字符串常量。 
操作结果:把 chars 赋为 T 的值。

StrCopy (&T, S)    (串复制) 
初始条件:串 S 存在。 
操作结果:由串 S 复制得串 T。

Concat (&T, S1, S2)    (串联接) 
初始条件:串 S1 和 S2 存在。 
操作结果:T 为由串 S1 和串 S2 联接所得的串。
例如: Concat( T, "man", "kind")           求得  T = "mankind"         Concat( T, "kind", "man")           求得  T = "kindman"

StrCompare (S, T)    (串比较) 
初始条件:串 S 和 T 都存在。 
操作结果&#xff1a;若串 S > T, 则返回值>0&#xff1b;若S&#61;T, 则返回值&#61;0&#xff1b;若串 S < T, 则返回值<0. 
例如&#xff1a;StrCompare("data", "state") < 0             StrCompare("compute", "case") > 0

Replace ( S, T, V)    (串置换) 
初始条件&#xff1a;串 S, T 和 V 均已存在&#xff0c;且 T 是非空串。 
操作结果&#xff1a;用 V 替换主串 S 中出现的所有与&#xff08;模式串&#xff09;T 相等的不重叠的子串。 
例如&#xff1a;假设 S &#61; "abcaabcaaabca",  T &#61; "bca"若 V &#61; "x", 则经置换后得到     S &#61; "axaxaax"若 V &#61; "bc", 则经置换后得到      S &#61; "abcabcaabc"

SubString (&Sub, S, pos, len)    (求子串) 
初始条件&#xff1a;串 S 存在&#xff0c;1≤pos≤StrLength(S)    且  0≤len≤StrLength(S)-pos&#43;1。     
操作结果: 以 Sub 返回串 S 中第 pos 个字符起长度为 len 的子串。 
例如&#xff1a;SubString ( sub, "commander", 4, 3)   求得  sub &#61; "man"
SubString( sub, "commander", 1, 9)  求得  sub &#61; "commander" 
SubString( sub, "commander", 9, 1)  求得  sub &#61; "r"

Index ( S, T, pos)    (定位函数) 
初始条件&#xff1a;串 S 和 T 存在&#xff0c;且 T 是非空串&#xff0c; 1≤pos≤StrLength(S)。 
操作结果&#xff1a;若主串 S 中存在和串 T 值相同的子串&#xff0c;则返回它在主串 S 中第 pos个字符起第一次出现的位置;  否则函数值为0。 
假设 S &#61; "abcaabcaaebc",  T &#61; "abc"        Index(S, T, 1) &#61; 1;    Index(S, T, 3) &#61; 5;   Index(S, T, 8) &#61; 0;

串和线性表的区别
串的逻辑结构和线性表极为相似&#xff0c;区别仅在于串的数据对象约束为字符集。
串的基本操作和线性表有很大差别。
        在线性表的基本操作中&#xff0c;大多以“单个元素”作为操作对象&#xff1b;     
        而在串的基本操作中&#xff0c;通常以“串的整体”作为操作对象。 

串的表示和实现

定长顺序存储特点&#xff1a;  
用一组连续的存储单元来存放串&#xff0c;直接使用定长的字符数组来定义&#xff0c;数组的上界预先给出&#xff0c;故称为静态存储分配。 
例如&#xff1a; 
#define Maxstrlen 255    //用户可用的最大串长    
typedef unsigned char SString[ Maxstrlen&#xff0b;1 ] ;       
SString s;   //s是一个可容纳255个字符的顺序串。
注&#xff1a;  一般用SString[0]来存放串长信息&#xff1b; 
C语言约定在串尾加结束符 ‘ \0’&#xff0c;以利操作加速&#xff0c;但不计入串长&#xff1b; 
若字符串超过Maxstrlen 则自动截断&#xff08;因为静态数组存不 进去&#xff09;。 

如果想要存放超长的字符串&#xff0c;静态数组有缺陷&#xff0c;改用动态分配的一维数组----------堆

堆分配存储特点&#xff1a;
仍用一组连续的存储单元来存放串&#xff0c;但存储空间是在程序执行过程中动态分配而得。
思路&#xff1a;利用malloc函数合理预设串长空间。 
特点&#xff1a; 若在操作中串值改变&#xff0c;还可以利用realloc函数按新串长度增加(堆砌)空间。 
约定&#xff1a;所有按堆存储的串&#xff0c;其关键信息放置在&#xff1a;

Typedef struct {     
char *ch;     // 若非空串,按串长分配空间; 否则 ch &#61; NULL     
int length;   //串长度 
}HString 
用“堆”实现串插入操作


Status StrInsert ( HString &S, int pos, HString T ) { //在串S的第pos个字符之前&#xff08;包括尾部&#xff09;插入串T if (pos<1||pos>S.length&#43;1) return ERROR; //pos不合法则告警 if(T.length){ //只要串T不空&#xff0c;就需要重新分配S空间&#xff0c;以便插入T if (!&#xff08;S.ch&#61;(char*)realloc (S.ch, (S.length&#43;T.length)* sizeof(char)) )) exit(OVERFLOW); for ( i&#61;S.length-1; i>&#61;pos-1; --i ) //为插入T而腾出pos之后的位置 S.ch [i&#43;T.length] &#61; S.ch [i]; //从S的pos位置起全部字符均后移 S.ch[pos-1…pos&#43;T.length-2] &#61; T.ch[0…T.length-1]; //插入T&#xff0c;略/0 S.length &#43; &#61; T.length; //刷新S串长度 } return OK;
}//StrInsert

堆分配存储表示

比较字符串是否相同

Int Strcompare ( Hstring S, Hstring T ) { for ( i &#61; 0; i } // StrCompare
清空字符串

Status ClearString ( Hstring &S) { if ( S.ch ) { free(S.ch); S.ch &#61; NULL; } S.length &#61; 0; return OK;
} // ClearString

联接两个串成新串

Status Concat ( HString &T, Hstring S1, Hstring S2 ) { //用T返回由S1和S2联接而成的新串。 if (T.ch) free(T.ch); // 释放旧空间 if ( !(T.ch &#61; (char *) malloc ((S1.length&#43;S2.length) *sizeof (char) ) ) ) exit ( OVERFLOW); T.ch[0 .. S1.length-1] &#61; S1.ch[0 .. S1.length-1]; T.length &#61; S1.length &#43; S2.length ; T.ch [S1.length .. T.length-1] &#61; S2.ch [0 .. S2.length-1]; return OK;
} // Concat

求子串

Status SubString ( Hstring &Sub, Hstring S, int pos, int len ) { //用Sub返回串S的第pos个字符起长度为len的子串。 // 其中,1<&#61;pos<&#61; StrLength (S) 且 0<&#61;len<&#61;StrLength(S)-pos&#43;1。 if ( pos <1 || pos>S.length || len<0 || len>S.length-pos&#43;1) return ERROR; // 参数不合法 if ( Sub.ch) free ( Sub.ch); // 释放旧空间 if (!len) { Sub.ch &#61; NULL; Sub.length &#61; 0; } // 空子串 else {// 完整子串 Sub.ch &#61; ( char *) malloc ( len *sizeof ( char )); Sub.ch[0..len-1] &#61; S.ch [ pos-1.. Pos&#43;len-2] ; Sub.length &#61; len; } return OK;}

块链类型定义&#xff1a;

#define CHUNKSIZE 80 //可由用户定义的块大小 typedef struct Chunk { //首先定义结点类型 char ch [ CHUNKSIZE ]; //结点中的数据域 struct Chunk * next ; //结点中的指针域 }Chunk;typedef struct { //其次定义用链式存储的串类型 Chunk *head; //头指针 Chunk *tail; //尾指针 int curLen; //结点个数 } LString; //串类型只用一次&#xff0c;前面可以不加Lstring

注&#xff1a;
串与线性表的运算有所不同&#xff0c;是以“串的整体”作为操作对象&#xff0c;例如查找某子串&#xff0c;在主串某位置上插入一个子串等。 
这类操作中均涉及到定位问题&#xff0c;称为串的模式匹配。它是串处理系统中最重要的操作之一。     




关于串的模式匹配敬请期待。
申明&#xff1a;备考期末&#xff0c;如果不到之处&#xff0c;敬请指出&#xff0c;感激不尽。






推荐阅读
  • 本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法,通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点,并保持在文档树中。 ... [详细]
  • 本文详细介绍了C语言中链表的两种动态创建方法——头插法和尾插法,包括具体的实现代码和运行示例。通过这些内容,读者可以更好地理解和掌握链表的基本操作。 ... [详细]
  • 本文详细介绍了C语言中的指针,包括其基本概念、应用场景以及使用时的优缺点。同时,通过实例解析了指针在内存管理、数组操作、函数调用等方面的具体应用,并探讨了指针的安全性问题。 ... [详细]
  • 本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法,通过多个实际代码示例展示了其在不同场景下的应用,帮助开发者更好地理解和使用该方法。 ... [详细]
  • 本实验主要探讨了二叉排序树(BST)的基本操作,包括创建、查找和删除节点。通过具体实例和代码实现,详细介绍了如何使用递归和非递归方法进行关键字查找,并展示了删除特定节点后的树结构变化。 ... [详细]
  • 本文详细探讨了VxWorks操作系统中双向链表和环形缓冲区的实现原理及使用方法,通过具体示例代码加深理解。 ... [详细]
  • 本文探讨了在地理信息系统中,如何通过图层数据获取任意两条道路的交叉点坐标及其名称。文中详细介绍了实现方法和相关技术细节。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 本文详细介绍了C语言中的基本数据类型,包括整型、浮点型、字符型及其各自的子类型,并探讨了这些类型在不同编译环境下的表现。 ... [详细]
  • 一个登陆界面
    预览截图html部分123456789101112用户登入1314邮箱名称邮箱为空15密码密码为空16登 ... [详细]
  • 1、字符型常量字符型常量指单个字符,是用一对单引号及其所括起来的字符表示。例如:‘A’、‘a’、‘0’、’$‘等都是字符型常量。C语言的字符使用的就是 ... [详细]
  • MapReduce原理是怎么剖析的
    这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1 ... [详细]
  • sqlserver动态分区方案例子
    sqlserver动态分区方案例子当我们存储的数据量比较大时,比如超过千万,上亿级别时单纯的使用索引可能效果不明显了,此时我们可以考虑采 ... [详细]
  • 第十一章 Python基本数据类型及内置方法
    一、概述数据类型是用来记录事物状态的,而事物的状态是不断变化的(如:一个人年龄的增长(操作int类型),单个人名的修改(操作str类型),学生列表中增加学生(操作list类型)等) ... [详细]
author-avatar
xzh
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有