PHP静态分析与跨站脚本检测(三)-PHP源码

作者：PANJIANSHUANG_406 | 来源：互联网 | 2018-07-17 12:02

ec(2);以下是我看Pixy中一些程序的记录，主要是为了之后能够比较快速的理解程序的思路，记录下来，要不然那么多东西光靠脑子怎么行。有的地方可能有所纰漏，我自己看着可能都觉得不太好。ProgramConverter-convert() 首先利用PhpParser建立一棵parseTree，但是这棵tree只在这里使用而已。利用这棵

以下是我看Pixy中一些程序的记录，主要是为了之后能够比较快速的理解程序的思路，记录下来，要不然那么多东西光靠脑子怎么行。有的地方可能有所纰漏，我自己看着可能都觉得不太好。

ProgramConverter
- convert()
首先利用PhpParser建立一棵parseTree，但是这棵tree只在这里使用而已。利用这棵tree、输入文件以及ProgramConverter对象本身建立TacConverter对象baseTac，然后调用baseTac.convert()。这个baseTac即是可以通过本对象返回的TacConverter属性。然后通过baseTac.getIncludeNodes()获得需要处理的被包含文件。
进入while循环，前提是函数内局部变量goOn为true和没有“-w”参数。该while循环命名为（w1*），设置goOn=false。如果需要处理的包含文件链表不为空，进入第二个while循环（w2*）。通过for循环将所有的CfgNodeInclude结点单独提取出来，如果这个node是需要跳过的（skip），就取下一个node；如果不是直接通过“常量”包含文件的话，就继续取下一个，这个展示不处理；如果以上两条都不满足，调用include()方法，返回一个内部枚举类型IncStatus，重设将要处理链表，继续w2*。使用baseTac处理一下之后，如果不存在non-literal includes就跳出w1*。否则，开始处理non-literal includes。（253：this.baseTac.backpatch();）。使用baseTac中得到的所有方法，包括用户方法和Main方法计算（259 - 260）。建立AliasAnalysis对象，并以之作为参数建立LiteralAnalysis对象，调用analyze()开始分析。然后，获取包含结点设置为将要处理的包含文件链表，进入for循环，逐个检测，如果已经检测过，跳过，否则即为non-literal的包含文名，按条件分别处理。在通过this.include()方法的返回值决定for循环的去向。再通过this.baseTac.assignFunctions()，然后重新设置需要处理的包含链表，继续w1*。
将之前得到的可能会有用的包含文件列表中实际没有用的都去掉。并将literalAnalysis置为null，以节省内存。如果需要使用AliasAnalysis，作出相应处理（361 - 364行），否则，利用baseTac调用replaceGlobals()，将所有函数的局部变量使用相应的全局变量替换，进行type分析，与前边的literal过程分析差不多。然后将functions转换为CfgNode，然后输出统计信息。释放资源，调用baseTac.addSuperGlobalElements()添加全局元素，将节点倒序排列。
- include()
得到应该包含的文件，如果文件不存在，返回NOTFOUND。否则，在allFiles中添加该文件，并将包含与被包含添加到includeGraph中，如果添加成功，对被包含的文件建立parseTree，并建立TacConverter对象，但是这里的对象都只是用来检测里边的include，并将这些CfgNodeInclude添加进从convert()传过来的weComeAfterwards中，以待处理。这样将goOn=true，循环检测。

CfgEdge
inEdges对于CfgNodeIf来说,是指判断条件,而outEdges是结果。对于其他的node有点说不清楚。

InterAnalysis
从这个程序看，将被扫描文件分析之后，得到的主要是TacConverter，由他得到TacFunction，然后再得到CfgNode，一个CfgNode对应一个Context，二者共同组成InteWorkListElemnt。在InterAnalysisInfo中则是每一个Cfgode对应一个InterAnalysisNode，在这个node中，由先前与刚才CfgNode对应的Context对应一个LatticeElement，而Latticelement则分别存放相应的信息。如AliasLatticelement存放MustAliases和MayAliases，而DepLatticeElement则存放TacPlace、DepSet、Vatiable等。
对于test.php来说，通过initTransferFunction()时，在ProgramConverter.convert()中产生了TransferFunctionId，而在checker.analyzeTaint()中则还得到了ConpositeTransferFunction。这时，每个InterAnalysisNode所包含的TransferFunction是确定了的实例，因而下边的transfer方法调用时会调用相应的实例的方法。对于本例，由于TransferFunctionId.transfer()返回的是传入的参数本身，故调用transfer之后得到的outValue与inValue是一样的。仅出现在当analyze()中node为后便三种的时候，第一种没有使用outValue，第二种直接使outValue = inValue。
- initGeneric()
后边的interAnalysisInfo()怎么就有长度了，没搞清楚。通过initTransferFunction()好像能够将genericAnalysisInfo添加数据，试验中是23个。但是 interAnalysisInfo也是23个。因该是这样的，二者指向同一个内存地址，对genericAnalysisInfo添加内容，就使得interAnalysisInfo也有了同样的内容。
- analyze ()
这个方法主要是针对不同的node采取不同的措施。主要分为了5类node
- CfgNodeCall
- CfgNodeExit
- CfgNodeIf
- CfgNodeCallRet
- 其他
通过inValue转换得到outValue，然后得到node的所有outgoing的边(outEdges)，将每条边的终点节点即node的继承者successor得到，然后通过当前的context和刚得到的outValue、successor共同增殖（propagete），向analysisNode设置新的 PhiValue，并向workList中添加InterWorkListElement。这里我理解propagate是产生一个InterWorkListElement，因为在analyze中使用的是它。
在analyze()刚开始的时候,workList中只有一个元素InterWorkListElement(this.mainHead, this.mainContext)。
analyze()中通过analysisNode获得的LatticeElement由test.php第一次在ProgramConverter.convert()中时都是TypeLatticeElement，而在Checker中analyzeTaint()时则全是DepLatticeElement。通过调用dump方法可知，前几个的结果即placeToDep为空，而后便则打印出整个Map。

- propagate(Context context, LatticeElement value, CfgNode target)
在analyze()中多数情况下调用都是(当前context，outValue，successor)
通过target得到InterAnalysisInfo中对应的analysisNode，不为null的话，通过context得到target的oldPhiValue，如果oldPhiValue=null，则将其设为所有LatticElementd的初始值，实际上也是null。如果value==oldPhiValue，则说明值没有改变，可以返回了。否则，在lattice中使用value和oldPhiValue计算一个newPhiValue，如果这个newPhiValue与oldPhiValue不同，则将其设置为target的Phivalue，并在workList中添加一个InterWorkListElement以便analyze()中继续分析。

DepClient
- collectSinks()
对于test0225.php而言，对XSS检测得到的functions数目为2，但是sinks数目为5；对SQL检测functions数目为2，sinks数目为1。
首先通过depAnalysis实例得到所有的TacFunction，然后对于每个TacFunction获得Cfg之后对CfgNode排序然后逐个检测。
得到的TacFunction有两个分别为：_main和foo，里边包含的CfgNode分别是21个和3个。而对于XSS检测有5个sink，均为echo，这里不管是否会产生XSS，均作为sink返回。

- findDangerousUninit(DepGraph relevant)
首先找出relevant中的uninit nodes，结果显示在上一个方法中XSS的5个sink中，后两个返回结果都为空。对于不为空的uninitNode，则是找出其父节点Predecessor，如果父结点不为1个，则抛出异常，否则取出这一个父结点，研究两种情况：
- DepGraphOpNode 直接认定为evil function返回。
- DepGraphNormalNode 调用initiallyTainted()方法查看返回值，如果为ALWAYS或者IFRG，则认为是evil function，返回。

- initiallyTainted(TacPlace place)
这里place考虑三种情况：
- Constant（常量）这种情况下，直接就认为不可能是tainted，返回NEVER
- Variable（变量）又分两种情况
- superglobals 在某些特定情况下认为是harmless，其余都是可能有害的。详见DepClient.java
- non-superglobals 同上。但是某些跟命令行“-g”选项有关。
- others 都认为是有害的。

TacConverter
- start()
通过传入的PhpTree的root建立起两个CfgNode，作为Cfg的root和exit，然后将tree中的各个node连接起来，将phptree转换成Cfg。

至于上文中提到的test0225.php，文件如下：

php
function foo ()
{

$var = $_GET[''evil''];
return $var;

}

//$a = $_GET[''evil''];
$b = foo ();

//$a=5;
//echo $a;
echo $b;
// $a is 6 here
echo $_GET[''a''];

echo $e;

$x = explode(''_'', $get);
mysql_query($x[0]);

if (true) echo "ABCD";

if ($a == ''a'' && $c == ''d'') echo "dfg";

?>

推荐阅读

php
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
php
配置PHPStudy环境并使用DVWA进行Web安全测试

本文详细介绍了如何在PHPStudy环境下配置DVWA（ Damn Vulnerable Web Application ），并利用该平台进行SQL注入和XSS攻击的练习。通过此过程，读者可以熟悉常见的Web漏洞及其利用方法。 ... [详细]

蜡笔小新 2024-12-20 18:22:20
php
KKCMS代码审计初探

本文主要介绍了KKCMS的安装过程及其基本功能，重点分析了该系统中存在的验证码重用、SQL注入及XSS等安全问题。适合初学者作为入门指南。 ... [详细]

蜡笔小新 2024-12-04 09:30:07
php
开发笔记:新手DVWACSRF

开发笔记:新手DVWACSRF ... [详细]

蜡笔小新 2024-12-03 10:33:16
php
2023年1月28日网络安全热点

涵盖最新的网络安全动态，包括OpenSSH和WordPress的安全更新、VirtualBox提权漏洞、以及谷歌推出的新证书验证机制等内容。 ... [详细]

蜡笔小新 2024-11-24 10:29:06
php
XAMPP环境下Apache和MySQL端口修改及WordPress登录指南

本文详细介绍了在XAMPP环境中如何修改Apache和MySQL的默认端口号，并确保WordPress能够正常访问。同时，提供了针对Go语言社区和Golang开发者的相关建议。 ... [详细]

蜡笔小新 2024-12-22 13:14:54
php
优化Flask应用的并发处理：解决Mysql连接过多问题

本文探讨了在Flask应用中通过优化后端架构来应对高并发请求，特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]

蜡笔小新 2024-12-21 09:21:49
php
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
java
docker镜像重启_docker怎么启动镜像

docker镜像重启_docker怎么启动镜像dock ... [详细]

蜡笔小新 2024-12-20 16:34:52
schema
解决Layui表格中固定列与普通列行高不匹配的问题

探讨了在使用Layui框架时，如何处理表格中固定列与其他列行高不一致的情况，提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-12-14 18:00:52
schema
Web安全入门：MySQL基础操作与SQL注入防范

本文详细介绍了MySQL数据库的基础操作命令，包括数据库和表的基本管理，以及数据的增删查改等常用操作。同时，针对Web安全领域常见的SQL注入问题，提供了初步的理解和防范措施。 ... [详细]

蜡笔小新 2024-12-03 14:00:48
java
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
java
深入理解 org.apache.hadoop.ha.HAServiceTarget 的 checkFencingConfigured 方法

本文详细探讨了 org.apache.hadoop.ha.HAServiceTarget 类中的 checkFencingConfigured 方法，包括其功能、应用场景及代码示例。通过实际代码片段，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-22 18:28:35
java
全面解析运维监控：白盒与黑盒监控及四大黄金指标

本文深入探讨了白盒和黑盒监控的概念，以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法，结合四个黄金指标的解读，帮助读者更好地理解和实施有效的监控策略。 ... [详细]

蜡笔小新 2024-12-22 14:02:29
java
简化报表生成：EasyReport工具的全面解析

本文详细介绍了EasyReport，一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库，能够将SQL查询结果转换为HTML表格，并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]

蜡笔小新 2024-12-22 11:11:28

PANJIANSHUANG_406

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章