热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

根据源代码修改XSD文件

2019独角兽企业重金招聘Python工程师标准这两天遇到了一个问题,就是以前的公司的VB代码是根据XSD文件自动生成的,然后呢,这

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

这两天遇到了一个问题,就是以前的公司的VB代码是根据XSD文件自动生成的,然后呢,这个XSD文件被修改了(这就有点尴尬了),以后代码也要更加XSD文件进行生成,这个时候如果人工修改的话,那成本和时间也太高了,这个时候就只能写个工具去做这个事情了,省时省力。辛亏原来的代码是和数据库对接的,虽然文件多,代码量大,但是文件的结构是统一的。我选择Java进行这个工具的开发,主要我也是学习Java平台的。

XSD文件的解析

首先得考虑的是如何解析XSD文件的问题。在Java中,对XML文件的解析主要是有四种方式:DOM,SAX,JDOM,DOM4J。每个方式都有各自的优缺点,我最后考虑选择使用的是DOM的标准实现,主要是因为访问是双向的,可以在任何时候对树上下导航,获取和操作任意部分的数据。其他性能什么的还不是主要考虑的需求,因为不知道XSD中和VB源代码对应的代码中在什么地方,所以要直接就能再任意时刻对XSD的文件进行访问。

还有一个需要考虑的是XSD文件的命名空间的问题,没有命名空间的XML文件解析十分方便,但是存在命名空间的XSD文件解析优点麻烦,但是DOM可以直接获取到命名空间中最特殊的元素的位置,这就为定位需要修改的地方提供了较大的便利性。

VB文件的解析

看到是源代码,我们的第一反应应该是通过编译原理中讲的方式,对源代码进行整体分析,然后再进行处理。其实没有那个必要,原来的代码是通过代码生成器生成出来的,其本身就有一定的规律,找到这些规律之后,其实发现更加简单。

通过源码发现在如下语句之后"Public Class "加上对于的表名之后,下面的函数就是我们需要的内容了,再匹配”Public Property “加上行的名称,精确到一对一相对的关系,在对其中的数据进行提取,和XSD文件中每一个节点的属性进行对比后修改就行了。

这样,我们就完美的避开了需要对整个文件进行分析完之后才能进行匹配的坑了,虽然效果上肯定是进行分析后的好,但是我这种设计所造成的时间损耗还是在接受范围内的,并且开发的要求也不高。

方法设计

  1. 读取待匹配文件夹下的所有文件的名称,因为VB源代码和XSD文件的名称是一一对应的
  2. 通过名称找到相关的XSD文件
  3. 获取XSD文件中的相关信息
    1. 通过document.getElementsByTagName获取节点列表,当然我找的这元素有点特殊,其在XSD文中是唯一的,这个便利性就特别大了
    2. 获取当前DOM的实例
    3. 获取所有子节点的列表
    4. 对于每一个子节点的信息与VB中的信息匹配进行修改
  4. 获取VB中的信息
    1. 读取VB文件到Buffer中
    2. 按行进行读取,直达匹配到类级别
    3. 对此继续往下读,匹配到配置的信息
    4. 获取这个函数中的信息
    5. 通过正则表达式获取其中的信息
  5. 保存修改好的XSD到新的文件中
  6. 关闭各种流
后记

其实关键的东西没有多少,剩下的东西就是编码了,其实分析源代码有时候不一定要进行完整的分析,其实可以将其看成是对一个文件中的数据进行读取和分析,根据实际的需要和要求选择自己需要的技术就可以了,不一定要一尘不变。如匹配到类和方法的时候,我就发现正则是匹配方式不好,所有直接使用按为匹配的方式,而提取数据的时候正则的优势就表现出来了,所有根据环境选择东西,也有可能是我没有完全对正则理解透的原因。


转:https://my.oschina.net/wjpwroking/blog/805355



推荐阅读
author-avatar
fggdsfgwjff4
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有