当前位置: 开发笔记 > 运维 > 正文

基于一致性hash算法C++语言的实现详解

作者：豆豆豆 | 来源：互联网 | 2021-09-17 04:08

在《基于一致性hash算法(consistenthashing)的使用详解》一文中已经介绍了一致性hash的基本原理，本文将会对其具体实现细节进行描述，并用c++语言对一致性hash进行了简单的实现

一致性hash算法实现有两个关键问题需要解决，一个是用于结点存储和查找的数据结构的选择，另一个是结点hash算法的选择。

首先来谈一下一致性hash算法中用于存储结点的数据结构。通过了解一致性hash的原理，我们知道结点可以想象为是存储在一个环形的数据结构上（如下图），结点A、B、C、D按hash值在环形分布上是有序的，也就是说结点可以按hash值存储在一个有序的队列里。如下图所示，当一个hash值为-2^20的请求点P查找路由结点时，一致性hash算法会按hash值的顺时针方向路由到第一个结点上（B），也就是相当于要在存储结点的有序结构中，按查询的key值找到大于key值中的最小的那个结点。因此，我们应该选择一种数据结构，它应该高效地支持结点频繁地增删，也必须具有理想的查询效率。那么，红黑树可以满足这些要求。红黑树是一颗近似平衡的一颗二叉查找树，因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例，这个在高度上的理论上限允许红黑树在最坏情况下都是高效的，而不同于普通的二叉查找树。因此，我们选择使用红黑树作为结点的存储结构，除了需要实现红黑树基本的插入、删除、查找的基本功能，我们还应该增加另一个查询lookup函数，用于查找大于key中最小的结点。

接下来，我们来说hash算法的选择。一致性hash算法最初提出来，就是为了解决负载均衡的问题。每个实体结点会包含很多虚拟结点，虚拟结点是平衡负载的关键。我们希望虚拟结点可以均衡的散列在整个“环”上，这样不仅可以负载到不同hash值的路由请求，还可以当某个结点down掉，原来路由到down掉结点的请求也可以较均衡的路由到其他结点而不会对某个结点造成大量的负载请求。这里，我们选择使用MD5算法。通过MD5算法，可以将一个标示串（用于标示虚拟结点）转化得到一个16字节的字符数组，再对该数组进行处理，得到一个整形的hash值。由于MD5具有高度的离散性，所以生成的hash值也会具有很大的离散性，会均衡的散列到“环”上。

笔者用C++语言对一致性hash算法进行了实现，下面我将会描述下一些关键细节。

1、首先定义实体结点类、虚拟结点类。一个实体结点对应多个虚拟结点。

实体结点 CNode_s：

代码如下:

/*实体结点*/
class CNode_s 
{ 
public: 
    /*构造函数*/
    CNode_s(); 
    CNode_s(char * pIden , int pVNodeCount , void * pData); 

    /*获取结点标示*/
    const char * getIden(); 

    /*获取实体结点的虚拟结点数量*/
    int getVNodeCount(); 

    /*设置实体结点数据值*/
    void setData(void * data); 

    /*获取实体结点数据值*/
    void * getData(); 
private: 
    void setCNode_s(char * pIden, int pVNodeCount , void * pData); 
    char iden[100];/*结点标示串*/
    int vNodeCount; /*虚拟结点数目*/
    void * data;/*数据结点*/
};

虚拟结点 CVirtualNode_s：虚拟结点有一指针指向实体结点

代码如下:

/*虚拟结点*/
class CVirtualNode_s
{
public:
    /*构造函数*/
    CVirtualNode_s();
    CVirtualNode_s(CNode_s * pNode);

    /*设置虚拟结点所指向的实体结点*/
    void setNode_s(CNode_s * pNode);

    /*获取虚拟结点所指向的实体结点*/
    CNode_s * getNode_s();

    /*设置虚拟结点hash值*/
    void setHash(long pHash);

    /*获取虚拟结点hash值*/
    long getHash();
private:
    long hash; /*hash值*/
    CNode_s * node; /*虚拟结点所指向的实体结点*/
};

2、hash算法具有可选择性，定义一个hash算法接口，方便以后进行其他算法的扩展。

这里创建MD5hash类，并继承该接口，通过MD5算法求hash值。

类图：

CHashFun接口：

代码如下:

/*定义Hash函数类接口，用于计算结点的hash值*/

class CHashFun 
{ 
public: 
    virtual long getHashVal(const char *) = 0; 
}; 

CMD5HashFun 类继承CHashFun接口，实现获取hash值的getHashVal函数：

代码如下:

/*用MD5算法计算结点的hash值，继承CHashFun父类*/
class CMD5HashFun : public CHashFun 
{ 
public: 
    virtual long getHashVal (const char * ); 
}; 

long CMD5HashFun::getHashVal(const char * instr) 
{ 
    int i; 
    long hash = 0; 
    unsigned char digest[16]; 

    /*调用MD5相关函数，生成instr的MD5码，存入digest*/
    md5_state_t md5state; 
    md5_init(&md5state); 
    md5_append(&md5state, (const unsigned char *)instr, strlen(instr)); 
    md5_finish(&md5state, digest); 

    /* 每四个字节构成一个32位整数， 
    将四个32位整数相加得到instr的hash值（可能溢出） */
    for(i = 0; i <4; i++) 
    { 
        hash += ((long)(digest[i*4 + 3]&0xFF) <<24) 
            | ((long)(digest[i*4 + 2]&0xFF) <<16) 
            | ((long)(digest[i*4 + 1]&0xFF) <<  8) 
            | ((long)(digest[i*4 + 0]&0xFF)); 
    } 
    return hash; 
}

3、扩展红黑树结构中的查找函数，用于查找红黑树中大于key值中最小的结点。

代码如下:

util_rbtree_node_t* util_rbtree_lookup(util_rbtree_t *rbtree, long key) 
{ 
    if((rbtree != NULL) && !util_rbtree_isempty(rbtree)) 
    { 
        util_rbtree_node_t *node = NULL; 
        util_rbtree_node_t *temp = rbtree->root; 
        util_rbtree_node_t *null = _NULL(rbtree); 
        while(temp != null) 
        { 
            if(key <= temp->key) 
            { 
                node = temp; /* update node */
                temp = temp->left; 
            } 
            else if(key > temp->key) 
            { 
                temp = temp->right; 
            } 
        } 
        /* if node==NULL return the minimum node */
        return ((node != NULL) ? node : util_rbtree_min(rbtree)); 
    } 
    return NULL; 
} 

4、创建一致性hash类。使其具有插入、删除、查找实体结点的功能。

具体算法和操作过程已经在代码注释中说明。

代码如下:

class CConHash 
{ 
public: 
    /*构造函数*/
    CConHash(CHashFun * pFunc); 

    /*设置hash函数*/
    void setFunc(CHashFun * pFunc); 

    /*增加实体结点 , 0代表成功 , -1代表失败*/
    int addNode_s(CNode_s * pNode); 

    /*删除实体结点 , 0代表成功 , -1代表失败*/
    int delNode_s(CNode_s * pNode); 

    /*查找实体结点*/
    CNode_s * lookupNode_s(const char * object); 

    /*获取一致性hash结构的所有虚拟结点数量*/
    int getVNodes(); 
private: 
    /*Hash函数*/
    CHashFun * func; 
    /*虚拟结点总个数*/
    int vNodes; 
    /*存储虚拟结点的红黑树*/
    util_rbtree_t * vnode_tree; 
}; 
/*辅助函数，虚拟结点转化为红黑树结点*/
util_rbtree_node_t * vNode2RBNode(CVirtualNode_s * vnode); 

  
CConHash::CConHash(CHashFun * pFunc) 
{ 
    /*设置hash函数*/
    assert(pFunc!=NULL); 
    this->func = pFunc; 
    this->vNodes = 0; 
    /*初始化红黑树*/
    vnode_tree = new util_rbtree_s(); 
    util_rbtree_init(vnode_tree); 
} 

int CConHash::addNode_s(CNode_s * pNode) 
{ 
    if(pNode==NULL) return -1; 
    int vCount = pNode->getVNodeCount(); 
    if(vCount<=0) return -1; 
    CVirtualNode_s * virtualNode ; 
    util_rbtree_node_t * rbNode; 
    char str [100]; 
    char num[10]; 
    strcpy(str,pNode->getIden()); 
    long hash = 0; 
    /*生成虚拟结点并插入到红黑树中*/
    for(int i=0;i    { 
        virtualNode = new CVirtualNode_s(pNode); 
        /*采用str+“i”的方法产生不同的iden串，用于后面的hash值计算*/
        itoa(i,num,10); 
        strcat(str,num); 
        hash = func->getHashVal(str); 
        virtualNode->setHash(hash); 
        if(!util_rbtree_search(vnode_tree,hash)) 
        { 
            /*生成红黑树结点*/
            rbNode = vNode2RBNode(virtualNode);  
            if(rbNode!=NULL) 
            { 
                /*将该结点插入到红黑树中*/
                util_rbtree_insert(vnode_tree,rbNode); 
                this->vNodes++; 
            } 
        } 
    } 
    return 0; 
} 

int CConHash::delNode_s(CNode_s * pNode) 
{ 
    if(pNode==NULL) return -1; 
    util_rbtree_node_t * rbNode; 
    char str [100]; 
    char num [10]; 
    strcpy(str,pNode->getIden());  
    int vCount = pNode->getVNodeCount(); 
    long hash = 0; 
    CVirtualNode_s * node = NULL; 
    /*将该实体结点产生的所有虚拟结点进行删除*/
    for(int i=0;i    { 
        itoa(i,num,10); 
        strcat(str,num);/*采用该方法产生不同的iden串*/
        hash = func->getHashVal(str); 
        rbNode = util_rbtree_search(vnode_tree,hash); 
        if(rbNode!=NULL) 
        { 
            node = (CVirtualNode_s *) rbNode->data; 
            if(node->getNode_s()==pNode && node->getHash()==hash) 
            { 
                this->vNodes--; 
                /*将该结点从红黑树中删除*/
                util_rbtree_delete(vnode_tree,rbNode); 
                delete rbNode; 
                delete node; 
            } 
        } 
    } 
    return 0; 
} 

CNode_s * CConHash::lookupNode_s(const char * object) 
{ 
    if(object==NULL||this->vNodes==0) return NULL; 
    util_rbtree_node_t * rbNode; 
    int key = this->func->getHashVal(object); 
    /*在红黑树中查找key值比key大的最小的结点*/
    rbNode = util_rbtree_lookup(vnode_tree,key); 
    if(rbNode!=NULL) 
    { 
        return ((CVirtualNode_s *) rbNode->data)->getNode_s(); 
    } 
    return NULL; 
} 

int CConHash::getVNodes() 
{ 
    return this->vNodes; 
} 

  
util_rbtree_node_t * vNode2RBNode(CVirtualNode_s * vnode) 
{ 
    if(vnode==NULL) return NULL; 
    util_rbtree_node_t *rbNode = new util_rbtree_node_t();  
    rbNode->key = vnode->getHash(); 
    rbNode->data = vnode; 
    return rbNode; 
} 

5、创建一个客户端类，对一致性hash算法进行测试。

写了一个getIP的函数，模拟随机产生的IP字符串。

代码如下:

#include 
#include"CNode_s.h" 
#include"CVirtualNode_s.h" 
#include"CHashFun.h" 
#include"CMD5HashFun.h" 
#include"CConHash.h" 
#include 
#include 

using namespace std; 

void getIP(char * IP) 
{ 
    int a=0, b=0 , c=0 , d=0; 
    a = rand()%256; 
    b = rand()%256; 
    c = rand()%256; 
    d = rand()%256; 
    char aa[4],bb[4],cc[4],dd[4]; 
    itoa(a, aa, 10); 
    itoa(b, bb, 10); 
    itoa(c, cc, 10); 
    itoa(d, dd, 10); 
    strcpy(IP,aa); 
    strcat(IP,"."); 
    strcat(IP,bb); 
    strcat(IP,"."); 
    strcat(IP,cc); 
    strcat(IP,"."); 
    strcat(IP,dd); 
} 

int main() 
{ 
    srand(time(0)); 
    freopen("out.txt","r",stdin); 
    /*定义hash函数*/
    CHashFun * func = new CMD5HashFun(); 
    /*创建一致性hash对象*/
    CConHash * cOnhash= new CConHash(func); 

    /*定义CNode*/
    CNode_s * node1 = new CNode_s("machineA",50,"10.3.0.201"); 
    CNode_s * node2 = new CNode_s("machineB",80,"10.3.0.202"); 
    CNode_s * node3 = new CNode_s("machineC",20,"10.3.0.203"); 
    CNode_s * node4 = new CNode_s("machineD",100,"10.3.0.204"); 

    conhash->addNode_s(node1); 
    conhash->addNode_s(node2); 
    conhash->addNode_s(node3); 
    conhash->addNode_s(node4); 

    /*动态更改结点数据值*/
//  node1->setData("99999999"); 

    int ans1 ,ans2 ,ans3 ,ans4; 
    ans1=ans2=ans3=ans4=0; 

    char object[100]; 
    CNode_s * node ; 
    /*动态删除结点*/
    //conhash->delNode_s(node2); 
    for(int i =0;i<30;i++) 
    { 
    //  getIP(object); 
    //  cout<        cin>>object; 
        node = conhash->lookupNode_s(object); 
        if(node!=NULL) 
        { 
            cout<\t"<getIden()<<" \t "<<(char *)node->getData()<            if(strcmp(node->getIden(),"machineA")==0) ans1++; 
            if(strcmp(node->getIden(),"machineB")==0) ans2++; 
            if(strcmp(node->getIden(),"machineC")==0) ans3++; 
            if(strcmp(node->getIden(),"machineD")==0) ans4++; 
        } 
    } 

    cout<<"Total test cases : "<    cout<<"Map to MachineA : "<    cout<<"Map to MachineB : "<    cout<<"Map to MachineC : "<    cout<<"Map to MachineD : "<    fclose(stdin); 
    return 0; 
}

6、删除结点对hash路由的影响测试

测试结果截图：

分析：上面两幅图，左边为原始四个实体结点的路由情况，后面为删除结点2（Node2）之后的路由情况。不难发现，MachineB down之后，原先的路由请求，较均衡地负载到了其他机器结点，而且对原先路由到其他结点的请求没有影响。比如139.149.184.125这个请求仍会路由到MachineD，并不会因为结点的减少而造成影响。但是，如果是增加实体结点，可能会造成增加前后路由情况不一致的现象，因为路由区间的更加狭小，但是不会有特别大的影响。另一方面，可以发现实体结点的虚拟结点个数比例分配情况很大程度影响了结点的负载路由情况，比例大致与虚拟结点个数相一致。

总结：

本文首先通过介绍实现一致性hash算法的关键算法和数据结构的选择分析，选择了红黑树作为虚拟结点的存储结构，以及MD5算法作为Hash函数用于计算结点的hash值。并使用C++语言，对一致性hash算法进行了实现，实现了一致性hash实体结点的增加、删除、查找等基本功能，并进行了测试分析。由于笔者水平有限，存在很多有待改进的地方，因此本文仅供大家参考、讨论学习。

推荐阅读

ios
深入理解KMP算法中的next数组：北大OJ 2406题解

本文详细探讨了KMP算法中next数组的构建及其应用，重点分析了未改良和改良后的next数组在字符串匹配中的作用。通过具体实例和代码实现，帮助读者更好地理解KMP算法的核心原理。 ... [详细]

蜡笔小新 2024-12-28 11:30:01
shell
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
shell
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
grep
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
grep
深入理解一致性哈希算法及其应用

本文详细介绍了分布式系统中的一致性哈希算法，探讨其原理、优势及应用场景，帮助读者全面掌握这一关键技术。 ... [详细]

蜡笔小新 2024-12-24 14:08:10
server
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
server
Redis 架构解析：单节点、主从复制、哨兵模式与集群部署

在项目中使用 Redis 时，了解其不同架构模式（如单节点、主从复制、哨兵模式和集群）对于确保系统的高可用性和扩展性至关重要。本文将详细探讨这些模式的特点和应用场景。 ... [详细]

蜡笔小新 2024-12-20 13:34:22
apache
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
apache
全面解析：SpringCloud Alibaba 初学者指南（一）——环境搭建

本文作为SpringCloud Alibaba系列教程的第一部分，主要介绍如何搭建SpringCloud Alibaba的开发环境，帮助初学者快速入门。SpringCloud Alibaba是由阿里巴巴团队开源的一套微服务工具集，旨在简化分布式系统的构建过程。 ... [详细]

蜡笔小新 2024-12-18 10:25:11
service
使用LVS与ldirectord实现高可用负载均衡

本文介绍了如何通过LVS（Linux Virtual Server）结合ldirectord工具来实现服务器的健康检查及负载均衡功能。环境设置包括一个LVS节点和两个真实服务器节点，通过配置ldirectord进行健康状态监测，确保系统的高可用性。 ... [详细]

蜡笔小新 2024-12-17 17:30:12
server
使用Windows批处理脚本监控并重启Java应用程序

本文介绍如何通过Windows批处理脚本定期检查并重启Java应用程序，确保其持续稳定运行。脚本每30分钟检查一次，并在需要时重启Java程序。同时，它会将任务结果发送到Redis。 ... [详细]

蜡笔小新 2024-12-27 10:44:39
server
如何高效创建和使用字体图标

在Web和移动开发中，为什么选择字体图标？主要原因是其卓越的性能，可以显著减少HTTP请求并优化页面加载速度。本文详细介绍了从设计到应用的字体图标制作流程，并提供了专业建议。 ... [详细]

蜡笔小新 2024-12-26 20:48:44
server
启动MySQL服务的命令行步骤

本文详细介绍了如何通过命令行启动MySQL服务，包括打开命令提示符窗口、进入MySQL的bin目录、输入正确的连接命令以及注意事项。文中还提供了更多相关命令的资源链接。 ... [详细]

蜡笔小新 2024-12-26 20:16:36
server
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
server
如何验证Windows 7系统中U盘启动盘的制作是否成功

本文将详细介绍在Windows 7环境下，检查U盘启动盘是否制作成功的多种方法，包括通过BIOS设置和使用模拟启动工具。 ... [详细]

蜡笔小新 2024-12-26 19:40:06

豆豆豆

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章