热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

紧急求助!如何运用正则表达式(regexp)进行高效匹配操作?

如何利用正则表达式(regexp)实现高效的模式匹配?本文探讨了正则表达式在编程中的应用,并分析了一个示例程序中存在的问题。通过具体的代码示例,指出该程序在定义和使用正则表达式时的不当之处,旨在帮助读者更好地理解和应用正则表达式技术。
如何使用regexp来进行正则表达式的匹配?
下面这个程序有何不妥,请各位打下指正:
#define INIT    register char *sp=instring;
#define GETC()  (*sp++)
#define PEEKC() (*sp)
#define UNGETC(c)   (--sp)
#define RETURN(c) return;
#define ERROR(c)    regerr()
#include 
#include 
main()
{
    char expbuf[10];
    char linebuf[80];
    strcpy(expbuf,"^[0-9]*$");
    compile((char *)0,expbuf,&expbuf[sizeof(expbuf)],'\0');
    for (;;)
    {
        printf("please input a string:\n");
        scanf("%s\n",linebuf);
        if (step(linebuf,expbuf))
        {
            printf("success!\n");
        }
        else
            printf("failed!\n");
    }
}

编译时提示regerr未定义,不知何故?希望各位大虾能以例程解答
请发email至bone_dragon@21cn.com,多谢!

5 个解决方案

#1


maybe this will help:
-----------------------------------
/*
**regtest.c: 已在linux(egcs) & solaris(gcc-2.95.2) 下调试通过
*/
#include 
#include 
main()
{
  regex_t re;
  char *expbuf="^[0-9]*$";
  char linebuf[80];
  regmatch_t pmatch[16];
 
  regcomp(&re,expbuf,0);
  for (;;){
    printf("please input a string:\n");
    scanf("%s",linebuf);
    if(0 == regexec(&re, linebuf,  16,pmatch,0))
      printf("success!\n");
    else
        printf("failed!\n");
  }
}   

#2


多谢指点,感激不尽,还有点小问题
能解释一下pmatch的作用么?

#3


pmatch用来保存匹配到的子串下标.
pmatch 是一个元素类型为regmatch_t的数组,在上例中有16个元素:
 
 typedef struct
 {
     regoff_t rm_so;
     regoff_t rm_eo;
  } regmatch_t;  

其中 rm_so 是子串首元素的下标(-1表示结束),rm_eo是子串末元素的下标加1;
pmatch[0]保存整个正则表达式的下标;
pmatch[1]保存正则表达式中第一个用"("和")"括起的部分的下标;
pmatch[2]...第二个...,

for example:
------------------------------
/* regtest2.c */

#include 
#include 
 
#define MAX_MATCH 16
 
main()
{
  int i;
  regex_t re;
  char *expbuf="(hello)[0-9]*(world)";
  char linebuf[80]="regexp_test hello123world good";
  regmatch_t pmatch[MAX_MATCH];
 
  printf("regular expression: %s\nInput string: %s\n",expbuf,linebuf);
 
  regcomp(&re,expbuf,REG_EXTENDED);
  if(0 == regexec(&re, linebuf,  MAX_MATCH,pmatch,0)){
        for(i=0;i            printf("start=%d, end=%d\n",pmatch[i].rm_so,pmatch[i].rm_eo);
  }
  else
      printf("failed!\n");
  regfree(&re);
}   
------------------------------
bash-2.04# ./regtest2
regular expression: (hello)[0-9]*(world)
Input string: regexp_test hello123world good
start=12, end=25
start=12, end=17
start=20, end=25 

#4


真想知道这个函数是怎么实现的,要是知道请不吝赐教。
开始我不知道存在这个函数,还打算写一个出来呢。
可是想来想去也没想到一个比较好的,只能通过最基本的从
上到下分析法,需要回溯,实在是麻烦的要紧。

#5


参考

推荐阅读
author-avatar
帕皮丝汀阿奎莱拉
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有