当前位置: 开发笔记 > 数据库 > 正文

VMwareWorkstation6.0中Cluster配置指南

作者：mobiledu2502911427 | 来源：互联网 | 2014-05-27 20:35

VMwareWorkstation6.0中Cluster配置指南目录一、群集介绍...3二、群集专业术语...3三、实验环境介绍及要求...41、拓扑图...42、软件配置说明...4(1)DC软件配置信息...4(2)ClusterNodeA软件配置信息...4(3)ClusterNodeB软件配置信

VMware Workstation 6.0 中Cluster配置指南

一、群集介绍... 3

二、群集专业术语... 3

三、实验环境介绍及要求... 4

1、拓扑图... 4

2、软件配置说明... 4

(1) DC软件配置信息... 4

(2) Cluster Node A软件配置信息... 4

(3) Cluster Node B软件配置信息... 5

3、硬件配置要求... 5

(1) 网卡... 5

(2) 共享磁盘... 5

四、安装群集前的准备工作... 6

1、创建共享磁盘... 6

(1) 创建用来保存共享磁盘的目录... 6

(2) 创建仲裁磁盘... 6

(3) 创建数据共享磁盘... 7

(4) 验证共享磁盘是否成功创建... 7

(5) 附加共享磁盘... 8

2、网络及系统配置... 10

(1) 创建群集服务帐户... 10

(2) 添加群集A记录... 12

(3) ClusterNodeA上的共享磁盘配置... 12

(4) 网络配置... 16

(5) ClusterNodeB上的共享磁盘配置... 21

五、安装群集服务... 24

1、在A节点上新建一个群集... 24

2、将B节点加入现有群集... 29

六、配置群集服务... 35

1、群集网络配置... 35

2、心跳适配器优先化... 37

3、仲裁磁盘配置... 38

4、创建一个启动延迟（此操作非必需）... 39

5、测试群集安装... 40

七、故障转移测试... 42

1、初级测试... 42

2、高级测试... 44

(1) 手工模拟故障1次... 44

(2) 手工连续模拟故障4次... 45

(3) 停止群集服务测试... 47

(4) 模拟意外断电时故障转移... 49

八、结束语... 50

(1) 创建群集服务帐户

1）群集服务需要一个属于可运行群集服务的每个节点上的本地管理员组成员的域用户帐户。因为安装群集服务时需要用到这个用户名和密码，所以该用户帐户必须在配置群集服务前予以创建。该用户帐户只能专门用于运行群集服务，而不能属于个人。建议该账户是普通域账户，而不是域管理员账户。

clip_image016[4]

2）如下图所示，必须勾选“密码永不过期”，建议同时将“用户不能更改密码”勾选。当然，如果您希望每次密码到期前都手工重设密码，以便在您的工作周报中多一个已完成的工作记录，我不反对。

clip_image018[4]

3）创建完毕后，再将其添加到各个节点的本地管理员组中即可。

clip_image020[4]

(2) 添加群集A记录

如果您需要将运行在群集服务上的应用程序服务（该服务器即为虚拟服务器）以域名的形式对内或对外发布，您可能需要在域控制器的DNS管理器中添加群集名的A记录。例如，本次试验中，我给节点A和节点B通过群集虚拟出来的地址192.168.0.10分配一个对应的A记录名:ClusterTest.test.com

clip_image022[4]

(3) ClusterNodeA上的共享磁盘配置

1）启动ClusterNodeA(不要开启ClusterNodeB，使其保持关闭状态。这样有助于保证附加到共享总线的磁盘上的数据不会丢失或遭到破坏。)

2）打开ClusterNodeA 的“磁盘管理”，系统会自动找到先前创建的两个共享磁盘。进入 “磁盘初始化和转化向导”

clip_image024[4]

clip_image026[4]

clip_image028[4]

3） “新建磁盘分区” clip_image030[4]

4）选择建立“主磁盘分区”。

clip_image032[4]

5）给仲裁磁盘分配一个约定成俗的驱动器号Q。

clip_image034[4]

6）一定要格式化成为NTFS，同时把卷标改成“Quorum”。 clip_image036[4]

7）以上是对仲裁磁盘进行操作，按照同样的方法，对共享数据磁盘进行操作。分配驱动器号为R，卷标名为Data。（具体过程略）。另外，需要补充一点的是，通常，驱动器盘符“Q”用于仲裁磁盘，而“R”、“S”等字母则常用于数据磁盘。尽管您可以按照个人喜好随意更改，但是建议采用约定成俗的规定。

8）对共享磁盘的操作完成后，建议验证一下磁盘是否可读写。方法是新建一些文件后再删除，看看是否都正常。

(4) 网络配置

1）为了接下来的实验更加直观，建议把两块网卡进行重命名操作。生产环境也推荐这样操作。

clip_image038[4]

2） Hearbeat Connection网卡（以下改称为心跳网卡）的TCP/IP属性如下。不要对心跳网卡设置默认网关和DNS地址。

clip_image040[4]

3） 按照下图修改心跳网卡的高级TCP/IP属性，目的是禁止心跳网卡的DNS和NetBios查询。这样能够消除可能出现的通信问题，也有利于减少不必要的网络流量。因为服务器群集节点间的通信对于群集的顺畅运转至关重要。

clip_image042[4]

clip_image044[4]

4）按照微软官方推荐的做法，如果您拥有一个能够以不同速度进行传输的网卡，那么您应该手动指定同一个速度及双工模式。不要对传输速度应用自动选择设置，因为某些适配器在确定速度时可能丢掉一些数据包。这直接影响到群集节点之间的通讯质量。Microsoft建议您将同一路径上的所有设备设定为“10 M”和“半双工”。同时，如果您的网卡支持Teaming冗余，而您又无法确保该特性和群集之间的兼容性时，建议取消该特性。由于虚拟机无法对网卡的物理属性进行该类设置，如下图所示。

clip_image046[4]

故特意从生产环境HP服务器上截取了如下两张图来说明。

clip_image047[4]

clip_image048[4]

5）至此，有关ClusterNodeA的前期网络和系统的相关配置已结束。接下来按照类似的方法对ClusterNodeB进行配置。

(5) ClusterNodeB上的共享磁盘配置

1） 关闭ClusterNodeA，开启ClusterNodeB。在此期间，请保持ClusterNodeA处于关闭状态。原因前面已经说明，不再赘述。（请尽量按照下图的方式关闭ClusterNodeA，而不只是简单的关闭系统）

clip_image050[4]

2）打开ClusterNodeB的磁盘管理器，可以看到之前创建的共享磁盘同样被系统发现了。只是由于Windows Server 2003系统的设计使然，没有自动为其分配驱动器号。我们需要手工对它分配和ClusterNodeA相同的驱动器号。

clip_image052[4]

clip_image053[4]

clip_image055[4]

3）为了实验的直观性，建议将卷标也进行修改。卷标名建议和ClusterNodeA上的保持一致。

clip_image057[4]

4）同样，建议用同样的方法验证一下磁盘是否可正常读写。

5）至此，我们已完成两个节点的网络和系统相关配置。下面，我们开始进入真正的群集服务安装环节。

五、安装群集服务 1、在A节点上新建一个群集

(1) 开启ClusterNodeA，同时保持ClusterNodeB处于关闭状态。展开ClusterNodeA的“开始”菜单，定位到“程序”à“管理工具”，打开“群集管理器”。

clip_image059[4]

(2) 选择“创建新群集”。

clip_image061[4]

(3) 输入您公司的域名和事先准备好的群集名。如果有需要，在DNS中对该群集名建立对应的A记录。

clip_image063[4]

(4) 输入新群集中的第一个节点的计算机名，这里我们选择ClusterNodeA

clip_image065[5]

(5) 这时会对群集配置进行一个完全分析。如果有任何一项无法通过检测，务必检查原因、排除问题。故障排除后，不需要重新再来，只需点一下“重新分析”按钮就行。

clip_image067[5]

(6) 输入群集的IP地址，该地址是ClusterNodeA和ClusterNodeB共同虚拟出来的群集IP。

其FQDN地址对应于前面的ClusterTest.test.com.

clip_image069[4]

(7) 输入前面创建的群集服务帐号。该帐号可以不是域管理员，但是必须是各节点的本地管理员。

clip_image071[4]

(8) 下图是配置信息汇总。如果发现配置有错误，可以点击“上一步”进行更改。否则点击“下一步”，开始群集创建。

clip_image073[4]

(9) 可以查看创建过程是否顺利。一般来说，只要前面群集前的分析没有问题，创建过程一般都不会有问题的。

clip_image075[4]

(10) 完成新建服务器群集向导。至此，我们已经成功的在ClusterNodeA上配置了群集服务。

clip_image077[4]

(11) 打开群集管理器，验证ClusterNodeA上的群集服务已成功安装。资源所有者均为ClusterNodeA，并均处于联机状态。

clip_image079[4]

2、将B节点加入现有群集

(1) 开启ClusterNodeB节点，同时不要关闭ClusterNodeA，否则无法加入现有群集。打开群集管理器，选择“添加节点到群集”，“浏览”，找到之前创建的群集名ClusterTest。点击“确定”。

clip_image081[5]

(2) 进入添加节点向导。

clip_image083[5]

(3) 选择您要添加到现有群集的节点。我这里选择ClusterNodeB。

clip_image085[5]

(4) 同样，节点加入前会进行群集配置分析。如果分析结果中有任何问题，请着手解决后再往下继续。

clip_image087[5]

(5) 输入群集服务帐号。

clip_image089[7]

(6) 群集配置信息汇总，返回修改请点击“上一步”，继续请点击“下一步”。

clip_image091[12]

(7) 开始“添加节点到群集”的配置操作。

clip_image093[9]

(8) 完成节点添加工作。

clip_image095[5]

(9) 从下图可以看出，ClusterNodeB已成功加入现有群集，目前处于运行状态。

clip_image097[5]

(10) 至此，我们成功的在ClusterNodeA上新建了一个名为ClusterTest的群集，并成功将ClusterNodeB加入该群集中。

(11) 细心的您在ClusterNodeB加入到现有群集后，可能会发现无法在ClusterNodeB上访问原有的共享磁盘。如下图所示。不要奇怪，只是正常现象。因为在群集服务中，同一时刻只能有一个节点对资源拥有所有权。在我这个例子中，此刻仲裁磁盘的所有者是ClusterNodeA，所以ClusterNodeB无法访问。反过来，如果所有者是ClusterNodeB，则会变成ClusterNodeA无法访问共享磁盘。

clip_image099[5]

六、配置群集服务 1、群集网络配置

(1) 进行专用网络配置。打开群集管理器，单击“群集配置”，单击“网络”，右键选择Heartbeat的属性。 clip_image100[5]

(2) 选择“为群集使用启用这个网络”和“只用于内部群集通讯（专用网络）”。

clip_image102[5]

对上图中的几个选项，我稍微做一下解释:

为群集使用启用这个网络: 如果选定了该复选框，群集服务将使用该网络。默认对所有网络选定该复选框。

只用于客户端访问（公用网络）:如果您想让群集服务仅使用该网络适配器与其它客户端进行外部通信，那么选择该选项。该网络适配器将不进行节点对节点通信。

只用于内部群集通信（专用网络）:如果您想让群集仅使用该网络进行节点对节点通信，那么选择该选项。

所有通信（混合网络）:如果您想让群集服务使用该网络适配器进行节点对节点通信和外部客户端通信，那么选择该选项。默认对所有网络选定该复选框。

在本次实验中，我们仅使用到了两个网络:Public Connection和Heartbeat Connection。基于最常见的配置，我们将这两个网络分别作为混合网络和专用网络。

(3) 同样，进行公用网络配置

clip_image104[5]

2、心跳适配器优先化

(1) 由于群集服务总是尝试使用列于首位的网络适配器进行节点间的远程过程调用（RPC）通信。只有当群集服务无法使用第一个网络适配器进行通信时，才会使用列表上的下一个网络适配器。所以我们需要调整一下心跳适配器的优先级。

(2) 启动群集管理器。右击群集名称，然后单击“属性”，在弹出的对话框中单击“网络优先级”选项卡。将Heartbeat Connection 上移至顶部。

clip_image106[5]

3、仲裁磁盘配置

启动“群集管理器”。右击左上角的群集名称，然后单击“属性”。单击“仲裁”选项卡。在“仲裁资源”列表框中，选择“磁盘Q”。

clip_image108[5]

4、创建一个启动延迟（此操作非必需）

当出现所有的群集节点均同时启动并尝试附加到仲裁资源的情况时，群集服务可能无法启动。例如：在发生电源故障后，同时对所有节点恢复电力时，可能出现这种情况。（尽管可能性比较低，但是还是有可能发生的。）要避免这种情况，可以编辑boot.ini文件。将Timeout设置不同的值，以避免两个节点同时启动。

(1) 打开ClusterNodeA上系统盘根目录下的boot.ini文件，按下图修改。

clip_image110[5]

也许您会问，为什么要添加一行同样的记录。这是因为如果是单操作系统，无论你如何设置timeout的值都是没有用的。只有多系统才会读取这个值。所以我们复制同样的记录来实现启动延迟的目的。

(2) 同样的方法，将ClusterNodeB上的boot.ini文件的timeout值设置为其他数值。如果您想在恢复电力时，ClusterNodeA能够优先启动，就把ClusterNodeB上的timeout值大于10。以错开同时启动。

5、测试群集安装

前面我们在CluterNodeA和CluterNodeB新建和加入现有群集结束后，都分别给出了一张截图用来验证群集安装的正确性。如果您觉得验证不周全，还可以采用如下几个方法来验证。

(1) 最简单的验证就是通过群集管理器。打开群集管理器，查看是否能够打开到群集的连接。

clip_image112[5]

(2) 查看群集服务是否启动

clip_image114[5]

(3) 相关事件日志

clip_image116[5]

(4) 相关注册表键值

clip_image118[5]

七、故障转移测试

前面说了这么多，终于等到最激动人心的时刻了。在这一环节中，我准备将测试分为初级测试和高级测试两块来验证群集的故障转移功能。

1、初级测试

(1) 打开群集管理器，从图中我们可以看出，目前数据共享磁盘的所有者是ClusterNodeA，状态为联机。

clip_image120[5]

(2) 右键选择组0的“属性”，再选择“移动组”。

clip_image122[5]

(3) 可以看到此时的状态为“脱机挂起”。

clip_image124[5]

(4) 从图中可以得知，共享数据磁盘R的所有者已经转移到ClusterNodeB上了，状态为联机。

clip_image126[5]

(5) 此实验说明，在群集服务中，资源能够从一个节点手动转移到另一个节点。（当然也能够自动转移，后面的实验均属于自动转移）

2、高级测试 (1) 手工模拟故障1次

(1) 打开群集管理器，对磁盘Q进行一次“初始故障”操作。此时磁盘Q的所有者为ClusterNodeA。

clip_image128[5]

(2) 可以看到磁盘Q已经联机挂起了。

clip_image130[5]

(3) 经过很短的时间后，磁盘Q又自动联机了，所有者还是ClusterNodeA。

clip_image132[5]

(4) 此实验说明，群集节点的资源，在遇到初始故障后，能够自我修复，重新回到联机状态。虽然在这个实验中没有体现出能够初始故障多少次，但是我可以告诉大家，是3次。如果初始故障次数超过3次，就不会自我修复了，而是会进行故障转移。下面的实验会证明这一点。

(2) 手工连续模拟故障4次

(1) 打开群集管理器，对磁盘R进行“初始故障”操作，重复4次。此时磁盘R的所有者还属于ClusterNodeA。

clip_image134[5]

(2) 4次模拟故障后，定位到“资源”，在右边窗口中可以看到，所有资源已自动迁移到ClusterNodeB上，处于联机状态。

clip_image136[5]

(3) 由于心跳侦测机制的作用（心跳信息大约每1.2秒一次），群集服务会发现ClusterNodeA并不是真正的宕机，所以ClusterNodeA会自动尝试联机。

clip_image138[5]

(4) 节点ClusterNodeA已恢复正常。

clip_image140[5]

(5) 此实验说明，在群集服务中，当某个节点故障超过3次后，则不会自动恢复，而是进行故障转移。同时也说明，当群集服务检测到原节点可用时，原节点会再次自动回到群集中。此过程的专业术语叫“故障回复”

(3) 停止群集服务测试

1) 在停止ClusterNodeB上的群集服务前，先打卡群集管理器，可以察看到，目前资源的所有者是ClusterNodeB。

clip_image142[5]

2) 停止ClusterNodeB的群集服务。

clip_image144[5]

3) 再次回到群集管理器，发现资源的所有者已经切换到ClusterNodeA上。因为ClusterNodeB上的服务已停止，不可能自动恢复过来。仍旧通过心跳侦测机制，当丢失4次心跳信息后，（大约5秒），则会宣告该节点失败。所以图中显示红叉，表示ClusterNodeB这个节点目前不可用。 clip_image146[5]

4) 此实验说明，当某个节点上的群集服务停止后，运行在该问题节点上的资源会自动转移到其他正常节点。

(4) 模拟意外断电时故障转移

1）测试前按照老规矩，打开集群管理器，可以看到资源的所有者是ClusterNodeB。

clip_image148[11]

2）直接关闭虚拟机后，打开ClusterNodeA上的集群管理器，发现资源已经为脱机状态，且群集组已显示不正常。

clip_image150[5]

3）群集服务试图将资源所有者切换到ClusterNodeA上。

clip_image152[5]

4）资源已全部迁移到ClusterNodeA上，且显示ClusterNodeB不正常。

clip_image154[5]

5）此实验说明，当群集中的节点遇到突发性的意外事件（如意外断电等。）后，资源会自动从问题节点转移到正常节点。

八、结束语

如果您完成了本指南全部的实验环节，那么恭喜您！您已经完成了所有节点上的群集服务配置。服务器群集已经完成可以运作了。您现在可以准备安装群集资源，比如：文件共享、打印机共享、诸如分布式的事务协调器、DHCP、WINS等群集识别服务、或者诸如Exchange Server或SQL Server等群集识别程序。

推荐阅读

mysql
Web与游戏开发的主要差异

本文探讨了Web开发与游戏开发之间的主要区别，旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]

蜡笔小新 2024-12-18 08:26:30
sql
深入探讨DB2数据库性能优化策略

本文详细介绍了IBM DB2数据库在大型应用系统中的应用，强调其卓越的可扩展性和多环境支持能力。文章深入分析了DB2在数据利用性、完整性、安全性和恢复性方面的优势，并提供了优化建议以提升其在不同规模应用程序中的表现。 ... [详细]

蜡笔小新 2024-12-28 13:22:19
insert
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
mysql
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
数据库
从JDE系统中提取完整字典数据

本文介绍如何通过SQL查询从JDE（JD Edwards）系统中提取所有字典数据，涵盖关键表的关联和字段选择。具体包括F0004和F0005系列表的数据提取方法。 ... [详细]

蜡笔小新 2024-12-26 21:04:46
mysql
网络运维工程师的前景与薪酬分析

网络运维工程师负责确保企业IT基础设施的稳定运行，保障业务连续性和数据安全。他们需要具备多种技能，包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]

蜡笔小新 2024-12-26 14:35:04
join
并发编程：深入理解设计原理与优化

本文探讨了并发编程中的关键设计原则，特别是Java内存模型（JMM）的happens-before规则及其对多线程编程的影响。文章详细介绍了DCL双重检查锁定模式的问题及解决方案，并总结了不同处理器和内存模型之间的关系，旨在为程序员提供更深入的理解和最佳实践。 ... [详细]

蜡笔小新 2024-12-26 01:14:06
json
Git 分布式版本控制系统：远程仓库的深入探讨

本文详细介绍了Git分布式版本控制系统中远程仓库的概念和操作方法。通过具体案例，帮助读者更好地理解和掌握如何高效管理代码库。 ... [详细]

蜡笔小新 2024-12-25 18:30:21
redis
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
mysql
在Linux系统上构建Web服务器的详细步骤

本文详细介绍了如何在Linux系统上搭建Web服务器的过程，包括安装Apache、PHP和MySQL等关键组件，以及遇到的一些常见问题及其解决方案。 ... [详细]

蜡笔小新 2024-12-17 19:02:43
json
深入探讨ASP.NET中的OAuth、JWT与OpenID Connect

本文作为前文关于OAuth2.0和使用.NET实现OAuth身份验证的补充，详细阐述了OAuth与JWT及OpenID Connect之间的关系和差异，旨在提供更全面的理解。 ... [详细]

蜡笔小新 2024-12-14 18:34:43
json
Windows 10 系统中禁用 F1 至 F12 功能键的方法

在 Windows 10 中，F1 至 F12 键默认设置为快捷功能键。本文将介绍几种有效方法来禁用这些快捷键，并恢复其标准功能键的作用。请注意，部分笔记本电脑的快捷键可能无法完全关闭。 ... [详细]

蜡笔小新 2024-12-28 09:13:44
数据库
2018回顾与2019展望

本文总结了2018年的关键成就，包括职业变动、购车、考取驾照等重要事件，并分享了读书、工作、家庭和朋友方面的感悟。同时，展望2019年，制定了健康、软实力提升和技术学习的具体目标。 ... [详细]

蜡笔小新 2024-12-28 09:10:26
redis
使用Windows批处理脚本监控并重启Java应用程序

本文介绍如何通过Windows批处理脚本定期检查并重启Java应用程序，确保其持续稳定运行。脚本每30分钟检查一次，并在需要时重启Java程序。同时，它会将任务结果发送到Redis。 ... [详细]

蜡笔小新 2024-12-27 10:44:39
database
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40

mobiledu2502911427

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章