热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Go的Regexp

https:my.oschina.netkuerantblog199146Golang学习-regexp包------------------------------------

https://my.oschina.net/kuerant/blog/199146 

Golang学习 - regexp 包------------------------------------------------------------// 函数// 判断在 b(s、r)中能否找到 pattern 所匹配的字符串
func Match(pattern string, b []byte) (matched bool, err error)
func MatchString(pattern string, s string) (matched bool, err error)
func MatchReader(pattern string, r io.RuneReader) (matched bool, err error)// 将 s 中的正则表达式元字符转义成普通字符。
func QuoteMeta(s string) string------------------------------// 示例:MatchString、QuoteMeta
func main() {pat := `(((abc.)def.)ghi)`src := `abc-def-ghi abc+def+ghi`fmt.Println(regexp.MatchString(pat, src))// true fmt.Println(regexp.QuoteMeta(pat))// \(\(\(abc\.\)def\.\)ghi\)
}------------------------------------------------------------// Regexp 代表一个编译好的正则表达式,我们这里称之为正则对象。正则对象可以
// 在文本中查找匹配的内容。
//
// Regexp 可以安全的在多个例程中并行使用。
type Regexp struct { ... }------------------------------// 编译// 将正则表达式编译成一个正则对象(使用 PERL 语法)。
// 该正则对象会采用“leftmost-first”模式。选择第一个匹配结果。
// 如果正则表达式语法错误,则返回错误信息。
func Compile(expr string) (*Regexp, error)// 将正则表达式编译成一个正则对象(正则语法限制在 POSIX ERE 范围内)。
// 该正则对象会采用“leftmost-longest”模式。选择最长的匹配结果。
// POSIX 语法不支持 Perl 的语法格式:\d、\D、\s、\S、\w、\W
// 如果正则表达式语法错误,则返回错误信息。
func CompilePOSIX(expr string) (*Regexp, error)// 功能同上,但会在解析失败时 panic
func MustCompile(str string) *Regexp
func MustCompilePOSIX(str string) *Regexp// 让正则表达式在之后的搜索中都采用“leftmost-longest”模式。
func (re *Regexp) Longest()// 返回编译时使用的正则表达式字符串
func (re *Regexp) String() string// 返回正则表达式中分组的数量
func (re *Regexp) NumSubexp() int// 返回正则表达式中分组的名字
// 第 0 个元素表示整个正则表达式的名字,永远是空字符串。
func (re *Regexp) SubexpNames() []string// 返回正则表达式必须匹配到的字面前缀(不包含可变部分)。
// 如果整个正则表达式都是字面值,则 complete 返回 true。
func (re *Regexp) LiteralPrefix() (prefix string, complete bool)------------------------------// 示例:第一匹配和最长匹配
func main() {b := []byte("abc1def1")pat := `abc1|abc1def1`reg1 := regexp.MustCompile(pat) // 第一匹配reg2 := regexp.MustCompilePOSIX(pat) // 最长匹配fmt.Printf("%s\n", reg1.Find(b)) // abc1fmt.Printf("%s\n", reg2.Find(b)) // abc1def1b = []byte("abc1def1")pat = `(abc|abc1def)*1`reg1 = regexp.MustCompile(pat) // 第一匹配reg2 = regexp.MustCompilePOSIX(pat) // 最长匹配fmt.Printf("%s\n", reg1.Find(b)) // abc1fmt.Printf("%s\n", reg2.Find(b)) // abc1def1
}------------------------------// 示例:正则信息
func main() {pat :&#61; &#96;(abc)(def)(ghi)&#96;reg :&#61; regexp.MustCompile(pat)// 获取正则表达式字符串fmt.Println(reg.String()) // (abc)(def)(ghi)// 获取分组数量fmt.Println(reg.NumSubexp()) // 3fmt.Println()// 获取分组名称pat &#61; &#96;(?Pabc)(def)(?Pghi)&#96;reg &#61; regexp.MustCompile(pat)for i :&#61; 0; i <&#61; reg.NumSubexp(); i&#43;&#43; {fmt.Printf("%d: %q\n", i, reg.SubexpNames()[i])}// 0: ""// 1: "Name1"// 2: ""// 3: "Name3"fmt.Println()// 获取字面前缀pat &#61; &#96;(abc1)(abc2)(abc3)&#96;reg &#61; regexp.MustCompile(pat)fmt.Println(reg.LiteralPrefix()) // abc1abc2abc3 truepat &#61; &#96;(abc1)|(abc2)|(abc3)&#96;reg &#61; regexp.MustCompile(pat)fmt.Println(reg.LiteralPrefix()) // falsepat &#61; &#96;abc1|abc2|abc3&#96;reg &#61; regexp.MustCompile(pat)fmt.Println(reg.LiteralPrefix()) // abc false
}------------------------------// 判断// 判断在 b&#xff08;s、r&#xff09;中能否找到匹配的字符串
func (re *Regexp) Match(b []byte) bool
func (re *Regexp) MatchString(s string) bool
func (re *Regexp) MatchReader(r io.RuneReader) bool------------------------------// 查找// 返回第一个匹配到的结果&#xff08;结果以 b 的切片形式返回&#xff09;。
func (re *Regexp) Find(b []byte) []byte// 返回第一个匹配到的结果及其分组内容&#xff08;结果以 b 的切片形式返回&#xff09;。
// 返回值中的第 0 个元素是整个正则表达式的匹配结果&#xff0c;后续元素是各个分组的
// 匹配内容&#xff0c;分组顺序按照“(”的出现次序而定。
func (re *Regexp) FindSubmatch(b []byte) [][]byte// 功能同 Find&#xff0c;只不过返回的是匹配结果的首尾下标&#xff0c;通过这些下标可以生成切片。
// loc[0] 是结果切片的起始下标&#xff0c;loc[1] 是结果切片的结束下标。
func (re *Regexp) FindIndex(b []byte) (loc []int)// 功能同 FindSubmatch&#xff0c;只不过返回的是匹配结果的首尾下标&#xff0c;通过这些下标可以生成切片。
// loc[0] 是结果切片的起始下标&#xff0c;loc[1] 是结果切片的结束下标。
// loc[2] 是分组1切片的起始下标&#xff0c;loc[3] 是分组1切片的结束下标。
// loc[4] 是分组2切片的起始下标&#xff0c;loc[5] 是分组2切片的结束下标。
// 以此类推
func (re *Regexp) FindSubmatchIndex(b []byte) (loc []int)------------------------------// 示例&#xff1a;Find、FindSubmatch
func main() {pat :&#61; &#96;(((abc.)def.)ghi)&#96;reg :&#61; regexp.MustCompile(pat)src :&#61; []byte(&#96;abc-def-ghi abc&#43;def&#43;ghi&#96;)// 查找第一个匹配结果fmt.Printf("%s\n", reg.Find(src)) // abc-def-ghifmt.Println()// 查找第一个匹配结果及其分组字符串first :&#61; reg.FindSubmatch(src)for i :&#61; 0; i }------------------------------// 示例&#xff1a;FindIndex、FindSubmatchIndex
func main() {pat :&#61; &#96;(((abc.)def.)ghi)&#96;reg :&#61; regexp.MustCompile(pat)src :&#61; []byte(&#96;abc-def-ghi abc&#43;def&#43;ghi&#96;)// 查找第一个匹配结果matched :&#61; reg.FindIndex(src)fmt.Printf("%v\n", matched) // [0 11]m :&#61; matched[0]n :&#61; matched[1]fmt.Printf("%s\n\n", src[m:n]) // abc-def-ghi// 查找第一个匹配结果及其分组字符串matched &#61; reg.FindSubmatchIndex(src)fmt.Printf("%v\n", matched) // [0 11 0 11 0 8 0 4]for i :&#61; 0; i }------------------------------// 功能同上&#xff0c;只不过返回多个匹配的结果&#xff0c;而不只是第一个。
// n 是查找次数&#xff0c;负数表示不限次数。
func (re *Regexp) FindAll(b []byte, n int) [][]byte
func (re *Regexp) FindAllSubmatch(b []byte, n int) [][][]bytefunc (re *Regexp) FindAllIndex(b []byte, n int) [][]int
func (re *Regexp) FindAllSubmatchIndex(b []byte, n int) [][]int------------------------------// 示例&#xff1a;FindAll、FindAllSubmatch
func main() {pat :&#61; &#96;(((abc.)def.)ghi)&#96;reg :&#61; regexp.MustCompile(pat)s :&#61; []byte(&#96;abc-def-ghi abc&#43;def&#43;ghi&#96;)// 查找所有匹配结果for _, one :&#61; range reg.FindAll(s, -1) {fmt.Printf("%s\n", one)}// abc-def-ghi// abc&#43;def&#43;ghi// 查找所有匹配结果及其分组字符串all :&#61; reg.FindAllSubmatch(s, -1)for i :&#61; 0; i }------------------------------// 功能同上&#xff0c;只不过在字符串中查找
func (re *Regexp) FindString(s string) string
func (re *Regexp) FindStringSubmatch(s string) []stringfunc (re *Regexp) FindStringIndex(s string) (loc []int)
func (re *Regexp) FindStringSubmatchIndex(s string) []intfunc (re *Regexp) FindAllString(s string, n int) []string
func (re *Regexp) FindAllStringSubmatch(s string, n int) [][]stringfunc (re *Regexp) FindAllStringIndex(s string, n int) [][]int
func (re *Regexp) FindAllStringSubmatchIndex(s string, n int) [][]int// 功能同上&#xff0c;只不过在 io.RuneReader 中查找。
func (re *Regexp) FindReaderIndex(r io.RuneReader) (loc []int)
func (re *Regexp) FindReaderSubmatchIndex(r io.RuneReader) []int------------------------------// 替换&#xff08;不会修改参数&#xff0c;结果是参数的副本&#xff09;// 将 src 中匹配的内容替换为 repl&#xff08;repl 中可以使用 $1 $name 等分组引用符&#xff09;。
func (re *Regexp) ReplaceAll(src, repl []byte) []byte// 将 src 中匹配的内容经过 repl 函数处理后替换回去。
func (re *Regexp) ReplaceAllFunc(src []byte, repl func([]byte) []byte) []byte// 将 src 中匹配的内容替换为 repl&#xff08;repl 为字面值&#xff0c;不解析其中的 $1 $name 等&#xff09;。
func (re *Regexp) ReplaceAllLiteral(src, repl []byte) []byte// 功能同上&#xff0c;只不过在字符串中查找。
func (re *Regexp) ReplaceAllString(src, repl string) string
func (re *Regexp) ReplaceAllStringFunc(src string, repl func(string) string) string
func (re *Regexp) ReplaceAllLiteralString(src, repl string) string// Expand 要配合 FindSubmatchIndex 一起使用。FindSubmatchIndex 在 src 中进行
// 查找&#xff0c;将结果存入 match 中。这样就可以通过 src 和 match 得到匹配的字符串。
// template 是替换内容&#xff0c;可以使用分组引用符 $1、$2、$name 等。Expane 将其中的分
// 组引用符替换为前面匹配到的字符串。然后追加到 dst 的尾部&#xff08;dst 可以为空&#xff09;。
// 说白了 Expand 就是一次替换过程&#xff0c;只不过需要 FindSubmatchIndex 的配合。
func (re *Regexp) Expand(dst []byte, template []byte, src []byte, match []int) []byte// 功能同上&#xff0c;参数为字符串。
func (re *Regexp) ExpandString(dst []byte, template string, src string, match []int) []byte------------------------------// 示例&#xff1a;Expand
func main() {pat :&#61; &#96;(((abc.)def.)ghi)&#96;reg :&#61; regexp.MustCompile(pat)src :&#61; []byte(&#96;abc-def-ghi abc&#43;def&#43;ghi&#96;)template :&#61; []byte(&#96;$0 $1 $2 $3&#96;)// 替换第一次匹配结果match :&#61; reg.FindSubmatchIndex(src)fmt.Printf("%v\n", match) // [0 11 0 11 0 8 0 4]dst :&#61; reg.Expand(nil, template, src, match)fmt.Printf("%s\n\n", dst)// abc-def-ghi abc-def-ghi abc-def- abc-// 替换所有匹配结果for _, match :&#61; range reg.FindAllSubmatchIndex(src, -1) {fmt.Printf("%v\n", match)dst :&#61; reg.Expand(nil, template, src, match)fmt.Printf("%s\n", dst)}// [0 11 0 11 0 8 0 4]// abc-def-ghi abc-def-ghi abc-def- abc-// [12 23 12 23 12 20 12 16]// abc&#43;def&#43;ghi abc&#43;def&#43;ghi abc&#43;def&#43; abc&#43;
}------------------------------// 其它// 以 s 中的匹配结果作为分割符将 s 分割成字符串列表。
// n 是分割次数&#xff0c;负数表示不限次数。
func (re *Regexp) Split(s string, n int) []string// 将当前正则对象复制一份。在多例程中使用同一正则对象时&#xff0c;给每个例程分配一个
// 正则对象的副本&#xff0c;可以避免多例程对单个正则对象的争夺锁定。
func (re *Regexp) Copy() *Regexp------------------------------------------------------------

 


推荐阅读
  • 本指南从零开始介绍Scala编程语言的基础知识,重点讲解了Scala解释器REPL(读取-求值-打印-循环)的使用方法。REPL是Scala开发中的重要工具,能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习,读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]
  • 大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式
    大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]
  • Python内置模块详解:正则表达式re模块的应用与解析
    正则表达式是一种强大的文本处理工具,通过特定的字符序列来定义搜索模式。本文详细介绍了Python内置的`re`模块,探讨了其在字符串匹配、验证和提取中的应用。例如,可以通过正则表达式验证电子邮件地址、电话号码、QQ号、密码、URL和IP地址等。此外,文章还深入解析了`re`模块的各种函数和方法,提供了丰富的示例代码,帮助读者更好地理解和使用这一工具。 ... [详细]
  • [转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]
  • MySQL 5.7 学习指南:SQLyog 中的主键、列属性和数据类型
    本文介绍了 MySQL 5.7 中主键(Primary Key)和自增(Auto-Increment)的概念,以及如何在 SQLyog 中设置这些属性。同时,还探讨了数据类型的分类和选择,以及列属性的设置方法。 ... [详细]
  • 检查在所有可能的“?”替换中,给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]
  • 2022年7月20日:关键数据与市场动态分析
    2022年7月20日,本文对当日的关键数据和市场动态进行了深入分析。主要内容包括:1. 关键数据的解读与趋势分析;2. 市场动态的变化及其对投资策略的影响;3. 相关经济指标的评估。通过这些分析,帮助读者更好地理解当前市场环境,为决策提供参考。 ... [详细]
  • 在JavaWeb开发中,文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件,都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件,该库提供了强大的文件解析和存储能力,能够高效地处理各种文件类型。此外,为了提高系统的安全性和稳定性,还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]
  • 在软件开发过程中,经常需要将多个项目或模块进行集成和调试,尤其是当项目依赖于第三方开源库(如Cordova、CocoaPods)时。本文介绍了如何在Xcode中高效地进行多项目联合调试,分享了一些实用的技巧和最佳实践,帮助开发者解决常见的调试难题,提高开发效率。 ... [详细]
  • 如何将TS文件转换为M3U8直播流:HLS与M3U8格式详解
    在视频传输领域,MP4虽然常见,但在直播场景中直接使用MP4格式存在诸多问题。例如,MP4文件的头部信息(如ftyp、moov)较大,导致初始加载时间较长,影响用户体验。相比之下,HLS(HTTP Live Streaming)协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段,并生成一个M3U8播放列表文件,实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流,包括技术原理和具体操作步骤,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 在C#编程中,数值结果的格式化展示是提高代码可读性和用户体验的重要手段。本文探讨了多种格式化方法和技巧,如使用格式说明符、自定义格式字符串等,以实现对数值结果的精确控制。通过实例演示,展示了如何灵活运用这些技术来满足不同的展示需求。 ... [详细]
  • Python 序列图分割与可视化编程入门教程
    本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例,详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表,帮助非编程背景的用户也能轻松上手。 ... [详细]
  • Java Socket 关键参数详解与优化建议
    Java Socket 的 API 虽然被广泛使用,但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数,如 backlog 参数,它用于控制服务器等待连接请求的队列长度。此外,还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响,并提供了优化建议,帮助开发者提升网络通信的稳定性和效率。 ... [详细]
  • 通过使用 `pandas` 库中的 `scatter_matrix` 函数,可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵,还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置,以满足不同的可视化需求。此外,`diagonal` 参数允许用户选择对角线上的图表类型,例如直方图或密度图,从而提供更多的数据洞察。 ... [详细]
  • 线程能否先以安全方式获取对象,再进行非安全发布? ... [详细]
author-avatar
手机用户2602925621
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有