事务策略:高并发策略

我在本系列的前几篇文章中所介绍的 API 层和客户端编排策略事务策略是应用于大多数标准业务应用程序的核心策略。它们简单、可靠、相对易于实现&＃xff0c;并且提供了最高水平的数据完整性和一致性。但有时&＃xff0c;您可能需要减小事务的作用域以获取吞吐量、改善性能并提高数据库的并发性。您如何才能实现这些目的&＃xff0c;同时仍然维持高水平的数据完整性和一致性呢&＃xff1f;答案是使用 High Concurrency 事务策略。

High Concurrency 策略源自 API 层策略。API 层策略虽然非常坚固和可靠&＃xff0c;但它存在一些缺点。始终在调用栈的最高层&＃xff08;API 层&＃xff09;启动事务有时会效率低下&＃xff0c;特别是对于具有高用户吞吐量和高数据库并发性需求的应用程序。限制特定的业务需求&＃xff0c;长时间占用事务和长时间锁定都会消耗过多资源。

关于本系列

事务可以改善数据的质量、完整性和一致性&＃xff0c;并使您的应用程序更加健壮。在 Java 应用程序中实现成功的事务处理并非易事&＃xff0c;它涉及到设计和编码。在这个系列文章中&＃xff0c;Mark Richards 将指导您为从简单应用程序到高性能事务处理等各种用例设计有效的事务策略。

与 API 层策略类似&＃xff0c;High Concurrency 策略释放了客户机层的任何事务责任。但是&＃xff0c;这还意味着&＃xff0c;您只能通过客户机层调用一次任何特定的逻辑工作单元&＃xff08;LUW&＃xff09;。High Concurrency 策略旨在减小事务的总体作用域&＃xff0c;以便资源锁定的时间更短&＃xff0c;从而增加应用程序的吞吐量、并发性以及性能。

通过使用此策略所获取的好处在一定程度上将由您所使用的数据库以及它所采用的配置决定。一些数据库&＃xff08;比如说使用 InnoDB 引擎的 Oracle 和 MySQL&＃xff09;不会保留读取锁&＃xff0c;而其他数据库&＃xff08;比如没有 Snapshot Isolation Level 的 SQL Server&＃xff09;则与之相反。保留的锁越多&＃xff0c;无论它们是共享还是专用的&＃xff0c;它们对数据库&＃xff08;以及应用程序&＃xff09;的并发性、性能和吞吐量的影响就越大。

但是&＃xff0c;获取并在数据库中保留锁仅仅是高并发性任务的一个部分。并发性和吞吐量还与您释放锁的时间有关。无论您使用何种数据库&＃xff0c;不必要地长时间占用事务将更长地保留共享和专用锁。在高并发性下&＃xff0c;这可能会造成数据库将锁级别从低级锁提高到页面级锁&＃xff0c;并且在一些极端情况下&＃xff0c;从页面级锁切换到表级锁。在多数情况下&＃xff0c;您无法控制数据引擎用于选择何时升级锁级别的启发方法。一些数据库&＃xff08;比如 SQL Server&＃xff09;允许您禁用页面级锁&＃xff0c;以期它不会从行级锁切换到表级锁。有时&＃xff0c;这种赌博有用&＃xff0c;但大多数情况下&＃xff0c;您都不会实现预期中的并发性改善。

底线是&＃xff0c;在高数据库并发性的场景中&＃xff0c;数据库锁定&＃xff08;共享或专用&＃xff09;的时间越长&＃xff0c;则越有可能出现以下问题&＃xff1a;

数据库连接耗尽&＃xff0c;从而造成应用程序处于等待状态
由共享和专用锁造成的死锁&＃xff0c;从而造成性能较差以及事务失败
从页面级锁升级到表级锁

换句话说&＃xff0c;应用程序在数据库中所处的时间越长&＃xff0c;应用程序能处理的并发性就越低。我所列出的任何问题都会造成您的应用程序运行缓慢&＃xff0c;并且将直接减少总体吞吐量和降低性能 — 以及应用程序处理大型并发性用户负载的能力。

折衷

High Concurrency 策略解决了高并发性需求&＃xff0c;因为它能将事务在体系结构中的作用域尽可能减小。其结果是&＃xff0c;事务会比在 API 层事务策略中更快地完成&＃xff08;提交或回滚&＃xff09;。但是&＃xff0c;就像您从 Vasa 中学到的&＃xff08;见参考资料&＃xff09;&＃xff0c;您不能同时拥有它们。生活中充满了折衷&＃xff0c;事务处理也不例外。您不能期望提供与 API 层策略同样可靠的事务处理&＃xff0c;同时提供最大的用户并发性和最高的吞吐量。

因此&＃xff0c;您在使用 High Concurrency 事务策略时放弃了什么呢&＃xff1f;根据您的应用程序的设计&＃xff0c;您可能需要在事务作用域外部执行读取操作&＃xff0c;即使读取操作用于更新目的。“等一等&＃xff01;”您说&＃xff1a;“您不能这样做 — 您可能会更新在最后一次读取之后发生了变化的数据&＃xff01;”这是合理的担忧&＃xff0c;并且也是需要开始考虑折衷的地方。通过此策略&＃xff0c;由于您未对数据保持读取锁&＃xff0c;因此在执行更新操作时遇到失效数据异常的机率会增加。但是&＃xff0c;与 Vasa的情况一样&＃xff0c;所有这些都可以归结为一个问题&＃xff0c;即哪个特性更加重要&＃xff1a;可靠、坚固的事务策略&＃xff08;如 API 层策略&＃xff09;&＃xff0c;还是高用户并发性和吞吐量。在高并发性情形中&＃xff0c;同时实现两者是极为困难的。如果您尝试这样做&＃xff0c;则可能会适得其反。

第二个折衷之处是事务可靠性的总体缺乏。此策略难以实现&＃xff0c;并且需要更长的时间进行开发和测试&＃xff0c;并且比 API 层或 Client Orchestration 策略更易于出错。考虑到这些折衷&＃xff0c;您首先应该分析当前的情形以确定使用此策略是否是正确的方法。由于 High Concurrency 策略派生自 API 层策略&＃xff0c;因此一种比较好的方法是先使用 API 层策略&＃xff0c;并使用较高的用户负载对应用程序执行负载测试&＃xff08;比您预期的峰值负载更高&＃xff09;。如果您发现吞吐量较低、性能较第、等待次数非常多&＃xff0c;或者甚至出现死锁&＃xff0c;则要准备迁移到 High Concurrency 策略。

在本文的其余部分&＃xff0c;我将向您介绍 High Concurrency 事务策略的其他一些特性&＃xff0c;以及实现它的两种方法。

回页首

基本结构和特性

图 1 通过我在 事务策略 系列中所使用的逻辑应用程序栈展示了 High Concurrency 事务策略。包含事务逻辑的类显示为红色阴影。

图 1. 体系结构层和事务逻辑

一些 API 层策略的特性和规则是有效的 — 但并非所有。注意&＃xff0c;图 1 中的客户机层没有事务逻辑&＃xff0c;这意味着任何类型的客户机都可以用于此事务策略&＃xff0c;包括基于 Web 的客户机、桌面、Web 服务和 Java Message Service (JMS)。并且事务策略遍布于客户机下面的层中&＃xff0c;但这不是绝对的。一些事务可能在 API 层中开始&＃xff0c;一些在业务层中开始&＃xff0c;还有一些甚至在 DAO 层中开始。这种一致性的缺乏是造成策略难以实现、维护和治理的原因之一。

在大多数情况下&＃xff0c;您会发现您需要使用 Programmatic Transaction 模型来减小事务作用域&＃xff0c;但有时您仍然会使用 Declarative Transaction 模型。但是&＃xff0c;您通常不能在相同的应用程序中混用 Programmatic 和 Declarative Transaction 模型。在使用这种事务策略时&＃xff0c;不应该坚持使用这种 Programmatic Transaction 模型&＃xff0c;这样您就不会遇到各种问题。但是&＃xff0c;如果您发现自己可以在此策略中使用 Declarative Transaction 模型&＃xff0c;那么您应该在使用 REQUIRED 事务属性开始事务的层中标记所有公共写方法&＃xff08;插入、更新和删除&＃xff09;。此属性表示需要一个事务&＃xff0c;并且如果事务不存在&＃xff0c;则由方法启动。

与其他事务策略一样&＃xff0c;无论您选择开始事务的组件或层是什么&＃xff0c;启动事务的方法都被认为是事务拥有者。只要可能&＃xff0c;事务拥有者应该是对事务执行提交和回滚的唯一方法。

回页首

事务策略实现

您可以使用两个主要技巧来实现 High Concurrency 事务策略。先读取&＃xff08;read-first&＃xff09;技巧涉及在尽可能高的应用层&＃xff08;通常为 API 层&＃xff09;对事务作用域范围外的读取操作进行分组。低级&＃xff08;lower-level&＃xff09;技巧涉及在体系结构中尽可能低的层启动事务&＃xff0c;同时仍然能够更新操作的原子性和隔离。

先读取技巧

先读取技巧涉及重构&＃xff08;或编写&＃xff09;应用程序逻辑和工作流&＃xff0c;以便所有的处理和读取操作在事务作用域的外部首先发生。这种方法消除了不必要的共享或读取锁&＃xff0c;但是如果数据在您能够提交工作之前更新或提交&＃xff0c;则可能会引入失效数据异常。为了应对可能的这种情况&＃xff0c;如果在此事务策略中使用对象关系映射&＃xff08;ORM&＃xff09;框架&＃xff0c;则应确保使用了版本验证功能。

为了演示这种先读取技巧&＃xff0c;我们从一些实现 API 层事务策略的代码入手。在清单 1 中&＃xff0c;事务在 API 层中开始&＃xff0c;并且包围了整个工作单元&＃xff0c;包括所有的读取、处理和更新操作&＃xff1a;

清单 1. 使用 API 层策略

&＃64;TransactionAttribute(TransactionAttributeType.REQUIRED)
public void processTrade(TradeData trade) throws Exception {try {//first validate and insert the tradeTraderData trader &＃61; service.getTrader(trade.getTraderID());validateTraderEntitlements(trade, trader);verifyTraderLimits(trade, trader);performPreTradeCompliance(trade, trader);service.insertTrade(trade);//now adjust the accountAcctData acct &＃61; service.getAcct(trade.getAcctId());verifyFundsAvailability(acct, trade);adjustBalance(acct, trade);service.updateAcct(trade);//post processingperformPostTradeCompliance(trade, trader);} catch (Exception up) {ctx.setRollbackOnly();throw up;}
}

注意在清单 1 中&＃xff0c;所有的处理都包含在 Java Transaction API (JTA) 事务的作用域内&＃xff0c;包括所有的确认、验证和兼容性检查&＃xff08;提前和事后&＃xff09;。如果您通过探查器工具来运行 processTrade() 方法&＃xff0c;那么就会看到每个方法调用的执行时间将与表 1 相似&＃xff1a;

表 1. API 层方法探查 — 事务作用域

方法名称	执行时间 (ms)
`service.getTrader()`	100
`validateTraderEntitlements()`	300
`verifyTraderLimits()`	500
`performPreTradeCompliance()`	2300
`service.insertTrade()`	200
`service.getAcct()`	100
`verifyFundsAvailability()`	600
`adjustBalance()`	100
`service.updateAcct()`	100
`performPostTradeCompliance()`	1800

processTrade() 方法的持续时间稍微长于 6 秒 (6100 ms)。由于事务的起始时间与方法相同&＃xff0c;因此事务的持续时间也是 6100 ms。根据您所使用的数据库类型以及特定的配置设计&＃xff0c;您将在事务执行过程中保持共享和专用锁&＃xff08;从执行读取操作开始&＃xff09;。此外&＃xff0c;在由 processTrade() 方法调用的方法中执行的任何读取操作也可以在数据库中保持一个锁。您可能会猜想&＃xff0c;在本例中&＃xff0c;在数据库中保持锁持续 6 秒以上将不能扩展以支持高用户负载。

清单 1 中的代码在没有高用户并发性或高吞吐量需求的环境中可能会非常出色地运行。遗憾的是&＃xff0c;这只是大多数人用于测试的一种环境。一旦此代码进入生产环境&＃xff0c;其中数以百计的交易者&＃xff08;或者是全球的&＃xff09;都在进行交易&＃xff0c;则该系统最有可能会运行得非常糟糕&＃xff0c;并且极有可能会遇到数据库死锁&＃xff08;根据您所使用的数据库而定&＃xff09;。

现在&＃xff0c;我将修复清单 1 中的代码&＃xff0c;方法是应用 High Concurrency 事务策略的先读取技巧。在清单 1 所示的代码中&＃xff0c;第一个要注意的地方是总共只用了 300 ms 的更新操作&＃xff08;插入和更新&＃xff09;。&＃xff08;此处&＃xff0c;我假定 processTrade() 方法调用的其他方法不执行更新操作。基本技巧是在事务作用域之外执行读取操作和非更新处理&＃xff0c;并且仅将更新封装在事务内部。清单 2 中的代码演示了减小事务作用域并仍然维持原子性的必要性&＃xff1a;

清单 2. 使用 High Concurrency 策略&＃xff08;先读取技巧&＃xff09;

public void processTrade(TradeData trade) throws Exception {UserTransaction txn &＃61; null;try {//first validate the tradeTraderData trader &＃61; service.getTrader(trade.getTraderID());validateTraderEntitlements(trade, trader);verifyTraderLimits(trade, trader);performPreTradeCompliance(trade, trader);//now adjust the accountAcctData acct &＃61; service.getAcct(trade.getAcctId());verifyFundsAvailability(acct, trade);adjustBalance(acct, trade);performPostTradeCompliance(trade, trader);//start the transaction and perform the updatestxn &＃61; (UserTransaction)ctx.lookup("UserTransaction");txn.begin();service.insertTrade(trade);service.updateAcct(trade);txn.commit();} catch (Exception up) {if (txn !&＃61; null) {try {txn.rollback();} catch (Exception t) {throw up;}}throw up;}
}

注意&＃xff0c;我将 insertTrade() 和 updateAcct() 方法移动到了 processTrade() 方法的末尾&＃xff0c;并将它们封装在了一个编程事务中。通过这种方法&＃xff0c;所有读取操作和相应的处理将在事务的上下文之外执行&＃xff0c;因此不会在事务持续时间内在数据库中保持锁。在新代码中&＃xff0c;事务持续时间只有 300 ms&＃xff0c;这显著低于清单 1 中的 6100 ms。再次&＃xff0c;其目标是减少在数据库中花费的时间&＃xff0c;从而减少数据库的总体并发性&＃xff0c;以及应用程序处理较大并发用户负载的能力。通过使用清单 2 中的代码将数据库占用时间减少至 300 ms&＃xff0c;从理论上说&＃xff0c;吞吐量将实现 20 倍的提升。

如表 2 所示&＃xff0c;在事务作用域中执行的代码至减少至 300 ms&＃xff1a;

表 2. API 层方法探查 — 修改后的事务作用域

方法名称	执行时间 (ms)
`service.insertTrade()`	200
`service.updateAcct()`	100

虽然这从数据库并发性的角度来说是一种显著的改善&＃xff0c;但先读取技巧带来了一个风险&＃xff1a;由于为更新指定的对象上没有任何锁&＃xff0c;因此任何人都可以在此 LUW 过程中更新这些未锁定的实体。因此&＃xff0c;您必须确保被插入或更新的对象一般情况下不会由多个用户同时更新。在之前的交易场景中&＃xff0c;我做了一个安全的假设&＃xff0c;即只有一个交易者会在特定的时间操作特定的交易和帐户。但是&＃xff0c;并非始终都是这种情况&＃xff0c;并且可能会出现失效数据异常。

另外需要注意&＃xff1a;在使用 Enterprise JavaBeans (EJB) 3.0 时&＃xff0c;您必须通知容器您计划使用编程事务管理。为此&＃xff0c;您可以使用&＃64;TransactionManagement(TransactionManagementType.BEAN) 注释。注意&＃xff0c;这个注释是类级的&＃xff08;而不是方法级的&＃xff09;&＃xff0c;这表示您不能在相同的类中结合 Declarative 和 Programmatic 事务模型。选择并坚持其中之一。

低级技巧

假设您希望坚持使用 Declarative Transaction 模型来简化事务处理&＃xff0c;但是仍然能在高用户并发性场景中增加吞吐量。同时&＃xff0c;您应该在这种事务策略中使用低级技巧。通过此技巧&＃xff0c;您通常会遇到与先读取技巧相同的折衷问题&＃xff1a;读取操作通常是在事务作用域的外部完成的。并且&＃xff0c;实现这种技巧最有可能需要代码重构。

我仍然从清单 1 中的示例入手。不用在相同的方法中使用编程事务&＃xff0c;而是将更新操作移动到调用栈的另一个公共方法中。然后&＃xff0c;完成读取操作和处理时&＃xff0c;您可以调用更新方法&＃xff1b;它会开始一个事务&＃xff0c;调用更新方法并返回。清单 3 演示了这个技巧&＃xff1a;

清单 3. 使用 High Concurrency 策略&＃xff08;低级技巧&＃xff09;

&＃64;TransactionAttribute(TransactionAttributeType.SUPPORTS)
public void processTrade(TradeData trade) throws Exception {try {//first validate the tradeTraderData trader &＃61; service.getTrader(trade.getTraderID());validateTraderEntitlements(trade, trader);verifyTraderLimits(trade, trader);performPreTradeCompliance(trade, trader);//now adjust the accountAcctData acct &＃61; service.getAcct(trade.getAcctId());verifyFundsAvailability(acct, trade);adjustBalance(acct, trade);performPostTradeCompliance(trade, trader);//Now perform the updatesprocessTradeUpdates(trade, acct);} catch (Exception up) {throw up;}
}&＃64;TransactionAttribute(TransactionAttributeType.REQUIRED)
public void processTradeUpdates(TradeData trade, AcctData acct) throws Exception {try {service.insertTrade(trade);service.updateAcct(trade);} catch (Exception up) {ctx.setRollbackOnly();throw up;}
}

通过此技巧&＃xff0c;您可以有效地在调用栈的较低层次开始事务&＃xff0c;从而减少花费在数据库中的时间。注意&＃xff0c;processTradeUpdates() 方法仅更新在父方法&＃xff08;或以上&＃xff09;中修改中创建的实体。再次&＃xff0c;保持事务的时间不再是 6 秒&＃xff0c;您只需要 300 ms。

现在是最难的部分。与 API 层策略或 Client Orchestration 策略不同&＃xff0c;High Concurrency 策略并未使用一致的实现方法。这便是图 1 看上去为何像一名经验丰富的曲棍球员&＃xff08;包括缺少的牙齿&＃xff09;的原因。对于一些 API 调用&＃xff0c;事务可能会在 API 层的末端开始&＃xff0c;而其他时候&＃xff0c;它可能仅限于 DAO 层&＃xff08;特别是对于 LUW 中的单表更新&＃xff09;。技巧是确定在多个客户机请求之间共享的方法&＃xff0c;并确保如果某个事务是在较高级的方法中开始的&＃xff0c;则它将在较低级的方法中使用。遗憾的是&＃xff0c;此特性的效果是&＃xff0c;作为非事务拥有者的较低级方法可以对异常执行回滚。结果&＃xff0c;开始事务的父方法不能对异常采取正确的措施&＃xff0c;并且在尝试回滚&＃xff08;或提交&＃xff09;已经标记为回滚的事务时会出现异常。

回页首

实现指南

有些情况仅需要稍微小些的事务作用域来满足吞吐量和并发性需求&＃xff0c;而另一些情况需要大大缩小事务作用域来实现所需的目的。不管具体情况如何&＃xff0c;您都可以遵循以下的实现指导&＃xff0c;它们能够帮助您设计和实现 High Concurrency 策略&＃xff1a;

在着手使用低级别技术之前&＃xff0c;首先要从先读技术开始。这样&＃xff0c;事务至少包含在应用程序架构的 API 层&＃xff0c;并且不扩散到其他层中。
当使用声明性事务时&＃xff0c;经常使用 REQUIRED 事务属性而不是 MANDATORY 事务属性来获得保护&＃xff0c;避免启动某个事务的方法调用另一个事务方法。
在采用此事务策略之前&＃xff0c;确保您在事务作用域外部执行读取操作时是相对安全的。查看您的实体模型并问自己多个用户同时操作相同的实体是常见的、少见还是不可能的。举例来说&＃xff0c;两个用户可以同时修改相同的帐户吗&＃xff1f;如果您的回答是常见&＃xff0c;则面临着极高的失效数据异常风险&＃xff0c;那么这个策略对于您的应用程序探查来说是一个很差的选择。
并不需要让所有读取操作都处于事务作用域之外。如果有一个特定的实体经常会被多个用户同时更改&＃xff0c;则应该想尽一切办法将它添加到事务作用域中。但是应该清楚&＃xff0c;添加到事务作用域中的读取操作和处理越多&＃xff0c;吞吐量和用户负载功能的下降就越大。

回页首

结束语

一切都归结于如何在问题之间取得折衷。为了在应用程序或子系统中支持高吞吐量和高用户并发性&＃xff0c;您需要高数据库并发性。要支持高数据库并发性&＃xff0c;则需要减少数据库锁&＃xff0c;并尽可能缩短保持资源的时间。某些数据库类型和配置可以处理一些这种工作&＃xff0c;但在大多数情况下&＃xff0c;解决方案最终归结为如何设计代码和事务处理。对这些问题有一些了解之后&＃xff0c;您在稍后可以更加轻松地完成复杂的重构工作。选择正确的事务策略对应用程序的成功至关重要。对于高用户并发性需求&＃xff0c;可以使用 High Concurrency 事务策略作为确保高水平数据完整性&＃xff0c;同时维持高并发性和吞吐量需求的解决方案。