phptokenizer获取所有类,PHPTokenizer学习笔记

作者：沉沦 | 来源：互联网 | 2023-12-09 09:45

简述在某个项目中需要分析PHP代码，分离出对应的函数调用(以及源代码对应的位置)。虽然这使用正则也可以实现，但无论从效率还是代码复杂度方面考虑ÿ

简述

在某个项目中需要分析 PHP 代码&＃xff0c;分离出对应的函数调用(以及源代码对应的位置)。虽然这使用正则也可以实现&＃xff0c;但无论从效率还是代码复杂度方面考虑&＃xff0c;这都不是最优的方式。

查询了 PHP 手册&＃xff0c;发现其实 PHP 已经内置解析器的接口&＃xff0c;那就是 PHP Tokenizer&＃xff0c;这工具正是我想要的。使用 PHP Tokenizer 能简单、高效、准确的分析出 PHP 源代码的组成。

实例

官方站点对 Tokenizer 的文档很少&＃xff0c;不过这不影响我们理解它。Tokenizer 组件仅仅包含两个函数&＃xff1a;token_get_all 以及token_name&＃xff0c;它们分别用于分析 PHP 代码以及获取代码对应的标识符名称。

下面是个简单的实例&＃xff0c;说明如何使用这两个函数&＃xff1a;

以下为引用的内容&＃xff1a;

$code &＃61; &＃39;&＃39;;

$tokens &＃61; token_get_all($code);

foreach ($tokens as $token) {

if (is_array($token)) {

// 行号、标识符字面量、对应内容

printf("%d - %s\t%s\n", $token[2], token_name($token[0]), $token[1]);

}

对应的输出为

以下为引用的内容&＃xff1a;

1 - T_OPEN_TAG

1 - T_ECHO echo

1 - T_WHITESPACE

1 - T_CONSTANT_ENCAPSED_STRING "string1"

1 - T_CONSTANT_ENCAPSED_STRING "string2"

1 - T_WHITESPACE

1 - T_CLOSE_TAG ?>

这里顺便说明下&＃xff0c;$token 如果为数组&＃xff0c;那么分别对应的三个数组成员为 token 标识符(可以用 token_name 获得字面量)、对应的源代码内容、以及对应的行号。

还有中情况就是 $token 为字符串&＃xff0c;这可能的情况之一就是为 T_CONSTANT_ENCAPSED_STRING 等常量&＃xff0c;在分析代码时要注意。如果对这点很在意&＃xff0c;可以考虑使用这里的代码。

是的&＃xff0c;调用方式非常的简单&＃xff0c;我们的野心当然远远要比写个简单的循环要大得多。我们可以利用这个组件做写实事&＃xff0c;例如下面的代码用于“压缩” PHP 代码&＃xff0c;去除不不要的换行、空白以及注释

以下为引用的内容&＃xff1a;

/**

* “压缩”PHP 源代码

* &＃64;see http://c7y.phparch.com/c/entry/1/art,practical_uses_tokenizer

class CompactCode

{

static protected $out;

static protected $tokens;

static public function compact($source)

{

// 解析 PHP 源代码

self::$tokens &＃61; token_get_all($source);

self::$out &＃61; &＃39;&＃39;;

reset(self::$tokens);

// 递归判断每个标记符的类型

while ($t &＃61; current(self::$tokens)) {

if (is_array($t)) {

// 过滤空白、注释

if ($t[0] &＃61;&＃61; T_WHITESPACE || $t[0] &＃61;&＃61; T_DOC_COMMENT || $t[0] &＃61;&＃61; T_COMMENT) {

self::skipWhiteAndComments();

continue;

}

self::$out .&＃61; $t[1];

} else {

self::$out .&＃61; $t;

}

next(self::$tokens);

}

return self::$out;

}

static private function skipWhiteAndComments()

{

// 增加个空格&＃xff0c;用于分割关键字

self::$out .&＃61; &＃39; &＃39;;

while ($t &＃61; current(self::$tokens)) {

// 再次贪婪查找

if (is_array($t) && ($t[0] &＃61;&＃61; T_WHITESPACE || $t[0] &＃61;&＃61; T_DOC_COMMENT || $t[0] &＃61;&＃61; T_COMMENT)) {

next(self::$tokens);

} else {

return;

}

调用方式很简单&＃xff0c;只需要使用

以下为引用的内容&＃xff1a;

CompactCode::compact($source_code);

即可&＃xff0c;返回的字符串就是压缩以后的内容。在这里还有更多使用 Tokenizer 的实例&＃xff0c;推荐阅读。

推荐阅读

cookie
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
数组
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
text
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
install
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
settings
深入解析 MVC 源码：ParameterDescriptor 与 Action 方法参数绑定

在前两篇文章中，我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象，分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor，即用于描述 Action 方法参数的对象，并详细介绍其工作原理。 ... [详细]

蜡笔小新 2024-12-27 15:26:10
text
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
数组
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
数组
C# LiNQ 查询 join连接

C# LiNQ 查询 join连接 ... [详细]

蜡笔小新 2024-12-24 16:16:50
数组
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
数组
Java 类成员初始化顺序与数组创建

本文探讨了Java中类成员的初始化顺序、静态引入、可变参数以及finalize方法的应用。通过具体的代码示例，详细解释了这些概念及其在实际编程中的使用。 ... [详细]

蜡笔小新 2024-12-27 19:39:42
shell
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
shell
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
sum
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14
request
Apache Jena 中 Txn.executeWrite 方法详解与代码示例

本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法，通过多个实际代码示例展示了其在不同场景下的应用，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-26 17:55:52
utf-8
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19

沉沦

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章