DB2 9 引入了 pureXML 支持,这意味着 XML 数据是以其自身固有的分层格式进行存储和查询的。为了查询 XML 数据,DB2 提供了两种语言:SQL/XML 和 XQuery。
您可以单独使用 XQuery 和 SQL,但也可将 XQuery 嵌入 SQL 中使用(反之亦可)。每一种可选方案在特定环境下都非常有用。本文将讨论这些可选方案,介绍其各自的优缺点,并给出根据您的需求选择恰当方案的指导原则。
DB2 中的 pureXML 支持为管理 XML 数据提供了高效且通用的功能。DB2 以 XML 数据自身固有的分层格式存储和处理这些数据,避免因为将 XML 存储为 CLOB 中的文本或将它映射为关系表而导致的性能和灵活性限制。与仅使用 XML 的不同,DB2 V9 还提供了关系型数据与 XML 数据在中的无缝集成 —— 甚至是表的某一行中的集成。这样的灵活性表现在语言支持中,使您可访问关系型数据、XML 数据,或者同时访问这两种数据。您可以通过以下四种可选方案中的任一种查询 XML:
本文假设您已经熟悉这两篇文章中介绍的基本概念。请注意,XPath 是 XQuery 的一种子语言,因此我们提到 XQuery 时,也暗中包含 XPath 语言。如果您使用过 DB2 XML Extender 中的 XSLT 样式表或位置路径,那么您应该已经了解 XPath。在很多时候,使用 XPath 足以提取 XML 值或表示 XML 谓词,因此,即便您还不熟悉 XQuery 的所有其他特性,也可以开始使用 XPath。
DB2 使您能够利用所有这些可选方案最大限度地提高生产力、使查询适应应用程序的需求。本文将说明的问题如下:
让我们先给出一个高度总结,然后再详细研究各个可选方案的细节和特定实例。
总结与指导原则
您可以在普通 XQuery、SQL/XML 或具有内置 SQL 的 XQuery 中表达许多查询。在特定情况下,您可能会发现其中之一能够比其他方案更为直观地表达您的查询逻辑。一般而言,查询 XML 的 “正确” 途径需要在 “逐个处理” 的基础上加以选择,需要考虑应用程序的具体需求和特征。但我们可总结出以下指导原则。
无论您选择在一条语句中怎样结合 SQL 和 XQuery,DB2 都使用一种混合编译器来为整个查询生成及优化一种执行规划 —— 不会导致查询执行的性能损失。
下表总结了查询 XML 数据的四种不同可选方案的各自优点。
表 1. 总结
普通 SQL | SQL/XML | 普通 XQuery | 嵌入了 SQL/XML 的 XQuery | |
---|---|---|---|---|
XML 谓词 | - | ++ | ++ | ++ |
关系谓词 | ++ | ++ | - | + |
XML 及关系谓词 | - | ++ | - | ++ |
将 XML 与关系型相连接 | - | ++ | - | ++ |
将 XML 与 XML 相连接 | - | + | ++ | ++ |
转换 XML 数据 | - | o | ++ | ++ |
插入、更新和删除 | ++ | ++ | - | - |
参数标记 | + | ++ | - | - |
全文本搜索 | + | ++ | - | ++ |
XML 聚集与分组 | - | ++ | o | o |
函数调用 | ++ | ++ | - | ++ |
在上表中,“-” 表示给定语言不支持某项特性;“+” 表示支持此特性,但存在更有效或更便捷的方式;“++” 表示给定语言极为适合表现该特性;最后,“o” 表示尽管可表现此特性,但从某种程度上来说,效果非常糟糕或者效率很低。
现在,让我们来定义一些示例数据和表,以查看具体的查询示例。