热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

在PHP中解析数组的有效方法?

背景我有一个数组,我通过使用preg_split(‘(?

背景

我有一个数组,我通过使用preg_split(‘/(?<= 0d0a)(?!$)/')基于每次出现0d0a来分割字符串.
例如:

$string = "78781110d0a78782220d0a";

将分为:

Array ( [0] => 78781110d0a [1] => 78782220d0a )

有效的数组元素必须以7878开头并以0d0a结尾.

问题

但有时,字符串中还有一个额外的0d0a,它会分成一个额外的无效数组元素,即不以7878开头.

以此字符串为例:

$string = "78781110d0a2220d0a78783330d0a";

这分为:

Array ( [0] => 78781110d0a [1] => 2220d0a [2] => 78783330d0a )

但实际应该是:

Array ( [0] => 78781110d0a2220d0a [1] => 78783330d0a)

我的解决方案

我编写了以下(杂乱)代码来解决这个问题:

$data = Array('78781110d0a','2220d0a','78783330d0a');
$i = 0; //count for $data array;
$j = 0; //count for $dataFixed array;
$dataFixed = $data;
foreach($data as $packet) {
if (substr($packet,0,4) != "7878") { //if packet doesn't start with 7878, do some fixing
if ($i != 0) { //its the first packet, can't help it!
$j++;
if ((substr(strtolower($packet), -4, 4) == "0d0a")) { //if the packet doesn't end with 0d0a, its 'mostly' not valid, so discard it
$dataFixed[$i-$j] = $dataFixed[$i-$j] . $packet;
}
unset($dataFixed[$i-$j+1]);
$dataFixed = array_values($dataFixed);
}
}
$i++;
}

描述

我首先将数组复制到另一个数组$dataFixed.在$data数组的foreach循环中,我检查它是否以7878开头.如果没有,我将它与$data中的前一个数组连接.然后我取消设置$dataFixed中的当前数组并使用array_values重置数组元素.

但我对这个解决方案并不是很有信心.有更好,更有效的方法吗?

UPDATE

如果输入字符串不像它应该的那样以0d0a结尾怎么办?它将坚持前一个数组元素..

例如:在字符串78781110d0a2220d0a78783330d0a0000中,0000应该被分隔为另一个数组元素.

解决方法:

使用另一个positive lookahead(?= 7878)来形成:

preg_split('/(?<=0d0a)(?=7878)/',$string)

注意:我删除了(?!$),因为根据您的示例数据,我不确定是什么用的.

例如,这段代码:

$string = "78781110d0a2220d0a78783330d0a";
$array = preg_split('/(?<=0d0a)(?=7878)(?!$)/',$string);
print_r($array);

结果是:

数组([0] => 78781110d0a2220d0a [1] => 78783330d0a)

更新:

根据您在输入字符串末尾添加可能的随机字符的修订问题,您可以添加三行来创建完整的程序:

$string = "78781110d0a2220d0a787830d0a330d0a0000";
$array = preg_split('/(?<=0d0a)(?=7878)/',$string);
$temp = preg_split('/(7878.*0d0a)/',$array[count($array)-1],null,PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE);
$array[count($array)-1] = $temp[0];
if(count($temp)>1) { $array[] = $temp[1]; }
print_r($array);

我们基本上进行初始拆分,然后按照预期的数据格式拆分结果数组的最后一个元素,使用PREG_SPLIT_DELIM_CAPTURE保持分隔符. PREG_SPLIT_NO_EMPTY确保如果输入字符串不以随机字符结尾,我们将不会获得空数组元素.

更新2:

根据您在下面的评论,您似乎暗示任何所需匹配项之间可能存在随机字符,并且您希望保留这些随机字符,您可以这样做:

$string = "0078781110d0a2220d0a2220d0a0000787830d0a330d0a000078781110d0a2220d0a0000787830d0a330d0a0000";
$split1 = preg_split('/(7878.*?0d0a)/',$string,null,PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE);
$result = array();
foreach($split1 as $e){
$split2 = preg_split('/(.*0d0a)/',$e,null,PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE);
foreach($split2 as $el){
// test if $el doesn't start with 7878 and ends with 0d0a
if(strpos($el,'7878') !== 0 && substr($el,-4) == '0d0a'){
//if(preg_match('/^(?!7878).*0d0a$/',$el) === 1){
$result[ count($result)-1 ] = $result[ count($result)-1 ] . $el;
} else {
$result[] = $el;
}
}
}
print_r($result);

这里采用的策略与上述不同.首先,我们使用nongreedy regex.*?来根据与所需数据匹配的分隔符拆分输入字符串.此时我们有一些字符串包含所需值的结尾和最后的一些垃圾,所以我们再次根据最后一次出现的“0d0a”和贪婪的正则表达式进行拆分.* 0d0a.然后,我们将任何不以“7878”开头但以“0d0a”结尾的结果值附加到前一个值,因为这应该修复分裂的第一和第二半,因为它包含一个额外的“0d0a”.

我为最内层的if语句提供了两种方法,一种使用正则表达式.在我的测试中,正则表达式稍慢一点,所以我留下了一个注释掉的.

我可能仍然没有满足您的全部要求,因此您必须告诉我它是否有效并且可能提供您的完整数据集.


推荐阅读
  • 简述在某个项目中需要分析PHP代码,分离出对应的函数调用(以及源代码对应的位置)。虽然这使用正则也可以实现,但无论从效率还是代码复杂度方面考虑ÿ ... [详细]
  • 本文介绍了一种在PHP中对二维数组根据某个字段进行排序的方法,以年龄字段为例,按照倒序的方式进行排序,并给出了具体的代码实现。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 本文详细介绍了PHP中与URL处理相关的三个函数:http_build_query、parse_str和查询字符串的解析。通过示例和语法说明,讲解了这些函数的使用方法和作用,帮助读者更好地理解和应用。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • 动态规划算法的基本步骤及最长递增子序列问题详解
    本文详细介绍了动态规划算法的基本步骤,包括划分阶段、选择状态、决策和状态转移方程,并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中,在以后尽可能多地利用这些子问题的解,从而提高算法的效率。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 集合的遍历方式及其局限性
    本文介绍了Java中集合的遍历方式,重点介绍了for-each语句的用法和优势。同时指出了for-each语句无法引用数组或集合的索引的局限性。通过示例代码展示了for-each语句的使用方法,并提供了改写为for语句版本的方法。 ... [详细]
  • PHP引用的概念和用法详解
    本文详细介绍了PHP中引用的概念和用法。引用是指不同的变量名访问同一个变量内容,类似于Unix文件系统中的hardlink。文章从引用的定义、作用、语法和注意事项等方面进行了解释和示例。同时还介绍了对未定义变量使用引用的情况,以及在函数和new运算符中使用引用的注意事项。 ... [详细]
  • 本文总结和分析了JDK核心源码(2)中lang包下的基础知识,包括常用的对象类型包和异常类型包。在对象类型包中,介绍了Object类、String类、StringBuilder类、StringBuffer类和基本元素的包装类。在异常类型包中,介绍了Throwable类、Error类型和Exception类型。这些基础知识对于理解和使用JDK核心源码具有重要意义。 ... [详细]
  • 本文介绍了如何对PHP二维数组进行排序以及如何获取最大值。同时还提到了在数据分析系统中使用排序的实例,以及如何统计角色等级和创建角色总数。 ... [详细]
  • 本文介绍了如何使用OpenXML按页码访问文档内容,以及在处理分页符和XML元素时的一些挑战。同时,还讨论了基于页面的引用框架的局限性和超越基于页面的引用框架的方法。最后,给出了一个使用C#的示例代码来按页码访问OpenXML内容的方法。 ... [详细]
  • 获取时间的函数js代码,js获取时区代码
    本文目录一览:1、js获取服务器时间(动态)2 ... [详细]
author-avatar
妈妈说称号长的人很牛也
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有