热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Oracle宣布推出MySQLHeatWaveML,可便捷向MySQL添加机器学习功能

2022年3月29日,Oracle宣布除了以前可用的事务处理和分析功能外,OracleMySQLHeatWave现在还支持数据库机器学习(ML),这是唯一一个支持这种功能的My

HeatWave ML完全自动化了模型训练、推理和解释

HeatWave ML的速度是Amazon Redshift ML的25倍,成本为1%


2022年3月29日,Oracle宣布除了以前可用的事务处理和分析功能外,Oracle MySQL HeatWave现在还支持数据库机器学习(ML),这是唯一一个支持这种功能的MySQL云数据库服务。MySQL HeatWave ML完全自动化了ML生命周期,并将所有经过培训的模型存储在MySQL数据库中,无需将数据或模型移动到机器学习工具或服务中。消除ETL可以降低应用程序的复杂性,降低成本,并提高数据和模型的安全性。在所有37个Oracle云基础设施(OCI)区域中,MySQL HeatWave数据库云服务都包含HeatWave ML。


图片.png

(PRNewsfoto/Oracle)


到目前为止,对许多开发人员来说,向MySQL应用程序添加机器学习功能是非常困难和耗时的。首先,有一个从数据库中提取数据并进入另一个系统以创建和部署ML模型的过程。这种方法创建了多个筒仓,用于将机器学习应用于应用程序数据,并在数据移动时引入延迟。它还导致数据库中的数据激增,使其更容易受到安全威胁,并增加了开发人员在多个环境中编程的复杂性。第二,现有服务期望开发人员成为指导ML模型培训过程的专家;否则,模型是次优的,这会降低预测的准确性。最后,大多数现有的ML解决方案都没有提供解释为什么开发人员构建的模型能够提供特定预测的功能。

MySQL HeatWave ML通过在MySQL数据库中本地集成机器学习功能来解决这些问题,无需将数据ETL到另一个服务。HeatWave ML完全自动化了训练过程,并为给定数据集和指定任务创建了具有最佳算法、最佳特征和最佳超参数的模型。HeatWave ML生成的所有模型都可以提供模型和预测解释。

没有其他云数据库供应商直接在其数据库服务中提供这样的高级ML功能。Oracle发布了在大量公开可用的机器学习分类和回归数据集(如Numerai、Namao和银行营销等)上执行的ML基准测试。平均而言,在最小的集群上,HeatWave ML训练机器学习模型的速度是Redshift ML的25倍。此外,在更大的HeatWave集群上进行训练时,相对于Redshift ML的性能优势会增加。培训是一个耗时的过程,由于MySQL HeatWave可以非常高效、快速地完成培训,客户现在可以更频繁地重新培训他们的模型,并跟上数据的变化。这将使模型保持最新,并提高预测的准确性。

“就像我们将分析和事务处理集成到一个数据库中一样,我们现在正在MySQL HeatWave中引入机器学习,”甲骨文首席企业架构师爱德华·斯克莱文说。“MySQL HeatWave是Oracle增长最快的云服务之一。越来越多的客户从亚马逊和其他云数据库服务迁移到MySQL HeatWave,并获得了显著的性能改进和更低的成本。今天,我们还宣布了一些其他创新,这些创新丰富了HeatWave的功能,提高了可用性,降低了成本。我们的new和完全透明的基准测试结果再次证明,Snowflake、AWS、微软和谷歌比MSQL HeatWave要慢得多,成本也要高得多。"


与其他云数据库服务相比,HeatWave ML提供以下功能:

全自动模型培训:使用HeatWave ML创建模型的所有不同阶段都是全自动的,不需要开发人员的任何干预。这将产生一个更精确的优化模型,无需手动操作,并且训练过程始终完成。Amazon Redshift等其他云数据库服务在外部服务中提供与机器学习功能的集成,这需要开发人员在ML培训过程中进行大量手动输入。

模型和推理解释:模型解释性帮助开发人员理解机器学习模型的行为。例如,如果银行拒绝客户贷款,银行需要能够确定模型的哪些参数已被考虑,或者模型是否包含任何偏差。预测可解释性是一组帮助回答机器学习模型为何做出特定预测的技术。如今,预测解释变得越来越重要,因为公司必须能够解释机器学习模型做出的决策。HeatWave ML将模型解释和预测解释集成为其模型训练过程的一部分。因此,HeatWave ML创建的所有模型都可以提供模型和推理解释,而无需在推理解释时进行训练数据。Oracle增强了现有的解释技术,以提高性能、可解释性和质量。其他云数据库服务并没有为所有的机器学习模型提供如此丰富的可解释性。

超参数调整:HeatWave ML为超参数调整实现了一种新的基于梯度搜索的简化算法。这使得超参数搜索可以并行执行,而不会影响模型的准确性。超参数调整是ML模型训练中最耗时的阶段,与其他云服务相比,这种独特的功能为HeatWave ML构建机器学习模型提供了显著的性能优势。

算法选择:HeatWave ML使用代理模型的概念,这些模型是简单的模型,展示了完整复杂模型的特性,以确定最佳的ML训练算法。使用一个简单的代理模型,算法选择是非常有效的,而不会损失准确性。没有其他用于构建机器学习模型的数据库服务具有这种代理建模功能。

智能数据采样:在模型训练期间,HeatWave ML对一小部分数据进行采样,以提高性能。这种采样的方式是在样本数据集中捕获所有代表性数据点。其他用于构建机器学习模型的云服务采用了一种效率较低的方法,即使用随机数据采样,在不考虑数据分布特征的情况下采样一小部分数据。

特征选择:特征选择有助于确定影响机器学习模型行为以进行预测的训练数据的属性。HeatWave ML中用于特征选择的技术已经在多个领域和应用程序的大量数据集上进行了培训。从这些收集的统计数据和元信息中,HeatWave ML能够有效地识别新数据集中的相关特征。

除了机器学习功能,Oracle还为MySQL HeatWave 服务发布了更多创新。实时弹性使客户能够将其 HeatWave 群集的大小调整为任意数量的节点,而无需停机或只读时间,也无需手动重新平衡群集。还包括数据压缩,它使客户能够处理每个节点两倍的数据量,并将成本降低近50%,同时保持相同的性价比。最后,新的暂停和恢复功能使客户能够暂停HeatWave以节省成本。恢复后,MySQL Autopilot所需的数据和统计信息会自动重新加载到HeatWave中。


MySQL HeatWave上的客户和合作伙伴

Astute Business Solutions是领先的Oracle云MSP合作伙伴。“我们最近有机会使用HeatWave ML的机器学习功能。我们发现它非常创新、易于使用、非常快速,最重要的是,它是安全的,因为数据或模型不会离开数据库,”Astute Business Solutions的联合创始人兼首席执行官Arvind Rajan说。“我们相信,提供数据库中的机器学习对我们的客户非常有意义,并将进一步加快MySQL HeatWave的采用。”

Estuda.com 是巴西K-12学生测试的教育SaaS提供商。Estuda联合创始人兼首席技术官维托·弗雷塔斯(Vitor Freitas)说:“MySQL HeatWave将我们复杂的查询性能在几秒钟内提高了300倍,与Google BigQuery相比,在没有代码更改的情况下,成本是后者的85%。现在我们可以更好地提供300万用户规模的实时分析,并不断改进我们的应用程序,以提高学生的性能。”。通用域名格式。

VRGlass是一家为企业客户提供metaverse应用程序和设备的巴西利亚SaaS生产商。

VRGlass首席执行官Ohmar Tacla说:“受Oracle for Startup计划取得进展的推动,VRGlass将所有应用程序数据从AWS EC2迁移到了MySQL HeatWave。在三个小时内,我们实现了一个虚拟活动的数据库性能的5倍增长,该虚拟活动容纳了超过100万名访客和170万个会话,具有更高的安全性,成本仅为原来的一半。”。

Genius Sonority是日本的视频游戏设计师、开发者和运营商。Genius Sonority首席技术官川本正幸(Masayuki Kawamoto)说:“我们发现MySQL HeatWave的性能提高了90倍,解决了我们在移动数据以实现实时分析方面的所有挑战和担忧。这对我们来说是一个巨大的惊喜。性能的极大提高帮助我们不断改善游戏体验,为世界各地的客户带来愉悦的娱乐。”。

20多年来,Neovera一直是受信任的网络安全管理解决方案提供商。Neovera Inc.高级Oracle数据库架构师Arman Rawls说:“OCI上的MySQL HeatWave将我们的查询性能提高了300倍,与我们的本地MySQL数据库环境相比,TCO降低了80%。现在我们可以在OLTP数据库中获得实时分析报告,以加速增强我们的安全应用程序。”。

IDC数据管理软件研究副总裁卡尔·奥洛夫森(Carl Olofson)表示:“去年8月,甲骨文公司宣布了MySQL HeatWave,并启用了Autopilot,这很可能是过去20年来开源云数据库领域最伟大的创新。”。“现在,Oracle已经超越了最初在HeatWave中统一OLTP和OLAP的做法,使用了MySQL HeatWave ML。Oracle将所有的机器学习处理和模型都放在数据库中,这样客户不仅可以避免在核心数据库之外管理ML数据库,还可以消除ETL的麻烦,从而获得速度、准确性和成本效益。”

文章来源:https://finance.yahoo.com/news/oracle-announces-mysql-heatwave-ml-160000679.html- ::: hljs-center



推荐阅读
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 无损压缩算法专题——LZSS算法实现
    本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程,以及代码中的注释。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • Java 11相对于Java 8,OptaPlanner性能提升有多大?
    本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明,在相同的硬件环境下,Java 11相对于Java 8在垃圾回收方面表现更好,从而提升了OptaPlanner的性能。 ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 支持向量机训练集多少个_25道题检测你对支持向量机算法的掌握程度
    介绍在我们学习机器算法的时候,可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库。你可以使用各种各样的兵器,但你要明白这些兵器是需要在合适的时间合理 ... [详细]
  • MongoDBPHP扩展本教程将向大家介绍如何在Linux、window、Mac平台上安装MongoDB扩展。Linux上安装MongoDBPHP扩展在终端上安装你可以在linux ... [详细]
author-avatar
你不知道的人
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有