热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

HugeGraph图数据库获ApacheTinkerPop官方认证

Apache软件基金会(ApacheSoftwareFoundation,ASF)

Apache软件基金会(Apache Software Foundation, ASF)是世界上最大的开源软件基金会,Apache目前拥有超过350个开源项目。


TinkerPop 是Apache基金会旗下的顶级项目,是一个面向实时事务处理以及批量、分析型图分析的图计算框架,其核心模块是TinkerPop Gremlin引擎。百度安全自研的图数据库HugeGraph实现了Apache TinkerPop3框架及完全兼容Gremlin查询语言,近期得到Apache TinkerPop的正式官方认证,并纳入其提供商列表大力推广。


HugeGraph是我国首个自主开源图数据库



说起图乃至于图论,在于图是对现实世界的抽象,它通过点和边来描述实体之间的关系,构成一个大型语义网络,提供一种从关系的视角来观察世界的直观方法。而传统的关系型数据库,在复杂数据关系运算处理上表现很差,随着数据量及复杂度的增加,关系型数据库极难在有效的时间内计算出结果。图数据库则更好的利用数据间的连接,将数据关系映射为实体与边的图模型结构,并提供高效的图查询语言,在海量数据的存储,关联关系分析与挖掘上更具备优势。


HugeGraph是我国首个自主开源的图数据库系统,TinkerPop评价HugeGraph为高效、易用、可扩展的图数据,因此吸引了大量用户使用它来进行社会网络分析、反诈欺和知识图谱制作(HugeGraph attracts a large amount of users and has been widely used in social network analysis, fraud detection and knowledge graph)


HugeGraph 支持千亿以上的顶点和边快速导入,支持在线与离线分析,提供毫秒级的关联关系查询能力,并可与 Hadoop、Spark 等大数据平台集成,具有丰富的API以及完善的工具链组件,助力用户构建基于图数据库之上的应用和产品,具体而言HugeGraph图数据库具有以下优势:


1、易用:HugeGraph 支持 Gremlin 图查询语言与 Restful API,同时提供图检索常用接口,具备功能齐全的周边工具,轻松实现基于图的各种查询分析运算。
2、高效:HugeGraph 在图存储和图计算方面做了深度优化,提供多种批量导入工具,轻松完成千亿级数据快速导入,通过优化过的查询达到图检索的毫秒级响应。支持数千用户并发的在线实时操作。
3、通用:HugeGraph 支持 Apache Gremlin 标准图查询语言和 Property Graph 标准图建模方法,支持基于图的 OLTP 和 OLAP 方案。集成 Apache Hadoop 及 Apache Spark 大数据平台。
4、可扩展:支持分布式存储、数据多副本及横向扩容,内置多种后端存储引擎,也可插件式轻松扩展后端存储引擎。
5、开放:HugeGraph 代码开源,客户可自主修改定制,选择性回馈开源社区。


HugeGraph以丰富功能支撑多场景应用

HugeGraph图数据库基于解决百度安全所面对的反欺诈、威胁情报、黑产打击等业务的图数据存储和建模分析需求而诞生,在此基础上逐步扩展及支持了更多的通用图应用,并在2018年开源成为百度的七大安全开源技术之一。HugeGraph由HugeGraph-Server、HugeGraph-Client、HugeGraph-Loader、HugeGraph-Hubble与HugeGraph-Tools等组件构成,可通过批量方式快速导入数据、扫描并分析现有数据自动生成Graph Schema创建语言,基于Web的可视化IDE环境,记录Gremlin查询可视化展示图的关联关系,是目前功能最丰富的开源图数据库。

强大的功能进而使HugeGraph在深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、知识图谱等图分析上高歌猛进,适用业务领域有如网络安全、电信诈骗、金融风控、广告推荐、社交网络和智能机器人等应用场景。

相对于传统的关系型数据库,新型的图数据库就像是数据中心里的“新基建”。大数据时代下非结构化数据处理需求以及高并行运算,带来数据库行业技术革新。在中国目前的数据库市场里,据Gartner报告显示,国外品牌占有90%以上的份额。而非结构化数据使国产厂商存在弯道加速的机会,可以从数据挖掘的视角去审视和发现大数据中存在的有价值的关系。

此外,即便互联网每日诞生海量的数据,但数据积累本身仅仅是图计算的充分条件,而真正催生图计算的是新型数据组织形式,它蕴含着创新商业逻辑和精益业务逻辑的兴起。2019年初 Gartner的数据与分析峰会上将图数据列为十大数据分析趋势之一,并认为自2022年起全球图处理及图数据库的应用都将以100%的速度迅猛增长。




推荐阅读
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 本文深入解析了通过JDBC实现ActiveMQ消息持久化的机制。JDBC能够将消息可靠地存储在多种关系型数据库中,如MySQL、SQL Server、Oracle和DB2等。采用JDBC持久化方式时,数据库会自动生成三个关键表:`activemq_msgs`、`activemq_lock`和`activemq_ACKS`,分别用于存储消息数据、锁定信息和确认状态。这种机制不仅提高了消息的可靠性,还增强了系统的可扩展性和容错能力。 ... [详细]
  • 优化后的标题:深入探讨网关安全:将微服务升级为OAuth2资源服务器的最佳实践
    本文深入探讨了如何将微服务升级为OAuth2资源服务器,以订单服务为例,详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖,并配置Spring Security以实现对微服务的保护。通过这一过程,不仅增强了系统的安全性,还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践,包括如何配置OAuth2客户端和资源服务器,以及如何处理常见的安全问题和错误。 ... [详细]
  • 本文深入探讨了NoSQL数据库的四大主要类型:键值对存储、文档存储、列式存储和图数据库。NoSQL(Not Only SQL)是指一系列非关系型数据库系统,它们不依赖于固定模式的数据存储方式,能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构;文档存储支持复杂的数据对象;列式存储优化了大数据量的读写性能;而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景,本文将详细分析它们的特点及应用实例。 ... [详细]
  • Web开发框架概览:Java与JavaScript技术及框架综述
    Web开发涉及服务器端和客户端的协同工作。在服务器端,Java是一种优秀的编程语言,适用于构建各种功能模块,如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示,同时借助JavaScript增强交互性和动态效果。此外,现代Web开发还广泛使用各种框架和库,如Spring Boot、React和Vue.js,以提高开发效率和应用性能。 ... [详细]
  • 本文详细介绍了一种利用 ESP8266 01S 模块构建 Web 服务器的成功实践方案。通过具体的代码示例和详细的步骤说明,帮助读者快速掌握该模块的使用方法。在疫情期间,作者重新审视并研究了这一未被充分利用的模块,最终成功实现了 Web 服务器的功能。本文不仅提供了完整的代码实现,还涵盖了调试过程中遇到的常见问题及其解决方法,为初学者提供了宝贵的参考。 ... [详细]
  • 在Java Web服务开发中,Apache CXF 和 Axis2 是两个广泛使用的框架。CXF 由于其与 Spring 框架的无缝集成能力,以及更简便的部署方式,成为了许多开发者的首选。本文将详细介绍如何使用 CXF 框架进行 Web 服务的开发,包括环境搭建、服务发布和客户端调用等关键步骤,为开发者提供一个全面的实践指南。 ... [详细]
  • Cosmos生态系统为何迅速崛起,波卡作为跨链巨头应如何应对挑战?
    Cosmos生态系统为何迅速崛起,波卡作为跨链巨头应如何应对挑战? ... [详细]
  • Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统,支持高吞吐量的发布和订阅功能,主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程,为程序员提供详尽的操作指南,涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]
  • 本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤,包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践,涵盖节点选择、网络优化和性能调优等方面,旨在提升系统的稳定性和处理能力。此外,还提供了常见的故障排查方法和监控方案,帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]
  • 如何使用mysql_nd:Python连接MySQL数据库的优雅指南
    无论是进行机器学习、Web开发还是爬虫项目,数据库操作都是必不可少的一环。本文将详细介绍如何使用Python通过 `mysql_nd` 库与 MySQL 数据库进行高效连接和数据交互。内容涵盖以下几个方面: ... [详细]
  • 利用ZFS和Gluster实现分布式存储系统的高效迁移与应用
    本文探讨了在Ubuntu 18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
author-avatar
追麾
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有