热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

人工智能赋能的数据管理、分析与系统专刊前言

人工智能赋能的数据管理、分析与系统专刊前言人工智能技术与咨询来源:《软件学报》,作者李战怀等大数据时代,数据规模庞大,数据管理应用场景复杂,传统数据

人工智能赋能的数据管理、分析与系统专刊前言

人工智能技术与咨询


来源:《软件学报》 ,作者李战怀等

大数据时代,数据规模庞大,数据管理应用场景复杂,传统数据库和数据管理技术面临很大的挑战.人工智能技术因其强大的学习、推理、规划能力,为数据库系统提供了新的发展机遇.专刊强调数据管理与人工智能的深度融合,研究人工智能赋能的数据库新技术和新型系统,包括两方面:(1)传统数据管理、数据分析技术及系统与人工智能相结合,将会焕发新的生机;(2)大数据管理与分析是新一代人工智能技术发展的基石.因此,围绕传统数据管理的不同技术层面,需要新的理论和系统经验.专刊重点围绕数据库核心技术,探讨数据管理与人工智能的深度融合,探讨在人工智能大潮下,传统数据管理技术、数据分析技术与数据库系统受到的影响、契机与应对策略,通过数据管理与人工智能融合,重点关注人工智能赋能新技术对传统数据采集、数据存储、索引、查询、统计分析以及数据管理系统的促进和提升.

本专刊论文均通过了形式审查,内容涉及人工智能赋能的数据管理、分析与系统.特约编辑先后邀请了 60 多位专家参与审稿工作,最终有18 篇论文入选本专刊.根据主题,这些论文可以分为5 组.


(1)人工智能赋能的数据管理技术

《人工智能赋能的数据管理技术研究》综述人工智能赋能的数据管理新技术的研究进展,总结了现有方法的问题和解决思路,并对未来研究方向进行展望.

《基于中间层的可扩展学习索引技术》提出了基于中间层的可扩展学习型索引模型Dabble,从而解决索引更新引发的模型重训练问题.

《面向关系数据库的智能索引调优方法》提出一种面向关系数据库系统的智能索引调优技术,利用机器学习方法构造索引的量化模型,可以准确地对索引的查询优化效果进行估计,并设计了一种高效的最优索引选择算法,实现了快速的从候选索引空间中选择满足给定大小约束的最优的索引组合.

《基于时空相关属性模型的公交到站时间预测算法》提出一种基于深度神经网络的公交到站时间预测算法,采用时空组件、属性组件和融合组件预测公交车辆从起点站到终点站的总时长.


(2)数据处理与优化技术

《面向数据特征的内存跳表优化技术》给出条件社区搜索问题的形式化定义,使用布尔表达式表示搜索条件,提出解决条件社区搜索问题的通用框架及其优化方法,将条件社区搜索分解为多个单项条件社区搜索.

《面向区块链的高效物化视图维护和可信查询》提出一种面向区块链的高效物化视图机制,将视图维护操作与共识过程同时执行,降低该操作对系统性能的影响;使用字典树加快以区块为单位的多物化视图维护进程;以默克尔验证的方式确保物化结果不被恶意篡改,进而确保查询结果可信.

《时间约束的实体解析中记录对排序研究》提出基于二分图上相似性传播的记录匹配可能性计算方法,将记录对、块及其关联关系构建二分图;相似性沿着二分图不断地在记录对结点与块结点之间传播,直到收敛.收敛结果可以通过不动点计算得到.提出了近似的收敛计算方法来降低计算代价,从而保证实体解析的实时召回率


(3)人工智能赋能的数据分析与推荐

《面向多维稀疏数据仓库的欺诈销售行为挖掘》提出基于分割率的特征提取方法和基于张量重构的挂单行为挖掘算法;设计了基于挂单模式偏序格的特征提取方法,对销售数据集中存在的挂单行为进行分类.

《基于相关性分析的工业时序数据异常检测》提出一种基于序列相关性分析的多维时间序列异常检测方法.对多维时间序列进行分段、标准化计算,得到相关性矩阵,提取量化的相关关系.然后,建立了时序相关图模型,通过在时序相关图上的相关性强度,划分时间序列团,进行时间序列团内、团间以及单维的异常检测.

《基于图神经网络的动态网络异常检测算法》提出了基于图神经网络的异常检测算法,将图结构、属性,以及动态变化的信息引入模型中,以学习进行异常检测的表示向量.

《融合选择提取与子类聚类的快速Shapelet 发现算法》提出一种快速时间序列Shapelet 发现算法,通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的Shapelet,同时在选择性提取算法中加入投票机制,以解决产生Shapelet 过多的问题.

《基于注意力机制的规范化矩阵分解推荐算法》提出一种基于注意力机制的规范化矩阵分解模型,依据用户信任网络和评分记录构建用户-项目异构网络,并构建用户间的相似关系;引入注意力机制分析用户对项目各个属性特征不同的关注度来获取更准确的用户偏好.

《融合显式反馈与隐式反馈的协同过滤推荐算法》提出一种融合显式反馈与隐式反馈的协同过滤推荐算法.利用加权低秩近似处理隐式反馈数据,训练出隐式用户/物品向量;引入基线评估,将隐式用户/物品向量作为补充,通过显隐式用户/物品向量结合,训练得出用户对物品的预测偏好程度.


(4)人工智能赋能的数据库系统

《学习式数据库系统:挑战与机遇》提出一种细粒度的分类体系,从数据库架构出发,将现有工作进行了梳理,系统地介绍了学习式数据库各组件的研究动机、基本思路与关键技术,并对学习式数据库系统未来的研究方向进行了展望.

《轩辕:AI 原生数据库系统》提出了原生的支持人工智能的数据库系统,将各种人工智能技术集成到数据库中,以提供自监控、自配置、自优化、自诊断、自愈、自安全和自组装功能,并通过声明性语言让数据库提供人工智能功能,以降低人工智能使用门槛.


(5)人工智能赋能的数据应用

《基于PSP_HDP 主题模型的非结构化经济指标挖掘》根据人工构建非结构化经济指标的局限性,以及主题模型在非结构化经济指标挖掘中存在的问题,结合已有经济领域分类标准、词语之间的语义关系和词语对主题的代表性,定义了文档的领域隶属度、词语与主题的语义相关度和词语对主题的贡献度,提出相应的主题模型,提高了经济主题的区分度和辨识度,可以更有效地挖掘与经济有关的经济主题和经济要素词.

《机器学习中的隐私攻击与防御》分析了机器学习模型的训练集在数据采集、模型训练等各个环节中存在的隐私泄露风险为人工智能环境下的数据管理所提出的挑战,指出传统数据管理中的隐私保护方法无法满足机器学习中多个环节、多种场景下的隐私保护要求,总结并展望了机器学习技术中隐私攻击与防御的研究进展和趋势.

《数据集成方法发展与展望》综述数据集成领域从2001 年开始到现在的相关工作的发展脉络,并展望了未来在数据集成领域的潜在研究方向.

本专刊主要面向数据库、数据挖掘、大数据、机器学习、推荐系统等多领域的研究人员和工程人员,反映了我国学者在人工智能赋能的数据管理、分析与系统领域最新的研究进展.感谢《软件学报》编委会和数据库专委会对专刊工作的指导和帮助,感谢专刊全体评审专家及时、耐心、细致的评审工作,感谢踊跃投稿的所有作者.希望本专刊能够对人工智能赋能的数据管理、分析与系统相关领域的研究工作有所促进.

我们的服务类型

公开课程

人工智能、大数据、嵌入式                    

内训课程

普通内训、定制内训                         

项目咨询

技术路线设计、算法设计与实现(图像处理、自然语言处理、语音识别)

 


推荐阅读
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 本文旨在探讨机器学习与数据分析之间的差异,不仅在于它们处理的数据类型,还包括技术背景、业务应用场景以及参与者的不同。通过深入分析,希望能为读者提供清晰的理解。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 深入剖析 DEX 赛道:从 60 大头部项目看五大趋势
    本文通过分析 60 大头部去中心化交易平台(DEX),揭示了当前 DEX 赛道的五大发展趋势,包括市场集中度、跨链协议、AMM+NFT 结合、新公链崛起以及稳定币和衍生品交易的增长潜力。 ... [详细]
  • 智能车间调度研究进展
    本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • LambdaMART算法详解
    本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程,包括其前身RankNet和LambdaRank,然后深入探讨了LambdaMART如何结合梯度提升决策树(GBDT)和LambdaRank来优化排序问题。 ... [详细]
  • 在互联网信息爆炸的时代,当用户需求模糊或难以通过精确查询表达时,推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台,通过深入分析用户行为,运用先进的机器学习技术优化推荐算法,提升用户体验。 ... [详细]
  • 随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
author-avatar
于华521_811
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有