热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

时空大数据介绍

时空大数据的使用通过这篇论文,对于时空大数据的应用,无疑是从三个方面展开的:聚合、统计推理、建模。而按照我们项目的计划也是从这三个方面开始

时空大数据的使用

image.png

通过这篇论文,对于时空大数据的应用,无疑是从三个方面展开的:聚合、统计推理
、建模。
而按照我们项目的计划也是从这三个方面开始的,只不过是时空大数据在乎的是时空上的聚合、统计推理、建模,而我们在当初假象的时候还没注意到时间

大体的使用框架如上图所示,那么具体该怎么处理数据呢


时空轨迹数据的预处理

时空轨迹数据预处理包括:道路匹配和轨迹压缩两个基本阶段


  • 道路匹配
    所谓的道路匹配就是修正定位技术精度的偏差和自身设备的可靠性所对可视化在电子地图上时,移动对象位置会出现偏离路网道路的情况的影响
    所以,即使采集到了移动对象的轨迹数,也必须首先进行道路匹配工作,修正有偏差的位置数据
  • 轨迹压缩
    轨迹数据通常由智能移动终端的定位模块按照不同的采样频率实时产生,由于采样 d频率一般很高会产生大量冗余的位置点数据,这会严重影响挖掘算法的效率。所以,在轨迹预处理阶段的一个重要工作就是轨迹的压缩
    最常用的是DP(Douglas-Peucker)算法,通过将数据点序列替换为线段序列,保持原有轨迹的几何特征。
    在线处理方法更适合轨迹实时处理场景(如移动对象的实时监控),基于滑动窗口的算法爱变长的滑动窗口中按照指定偏离错误率的指导,对冗余位置点进行替换

时空轨迹模式


时空轨迹模式的类型定义

按照序列中元素类型的不同,可以分为时空轨迹点序列和时空轨迹边序列两种


  • 时空轨迹点序列
    由一个元组序列Sv= {v0,…,vi,…,vn},其中vi=〈xi,yi,ti〉是空间中的坐标点,ti为该点的时戳
  • 时空轨迹边序列
    时空轨迹边序列Se是由时空轨迹点序列变换而来,是一个元组序列,Se={e1,…,ei,…,en},其中ei=〈(xi-1,yi-1,ti-1),(xi,yi,ti)〉是空间中的一条边,(xi,yi,ti)表示点坐标,ti表示时戳

时空轨迹模式的类型

对于时空轨迹数据,我们要选择有价值的模式进行进一步挖掘,常见的模式有:频繁模式、伴随模式、聚集模式、异常模式和大数据模式


频繁模式

时空轨迹频繁模式是指从时空轨迹集中发现的频繁重复的序列,在进行轨迹频繁模式挖掘之前,必须对时空轨迹数据进行预处理,采用路网匹配和轨迹压缩技术处理的同时还要提取出兴趣点序列,以便找出频繁兴趣点子序列
常用算法:


  • 挖掘由兴趣区域(Region of interest,ROI)构成的频繁序列
  • 基于时间周期的 最频繁路 径 (Time period-based most frequent path,TPMFP)查询算法
  • 时空轨迹的细粒度序列模式挖掘

伴随模式

时空轨迹伴随模式是指从时空轨迹数据集中发现具有相同或者相似路线的移动对象群体。通过分析移动对象群体的行为特征和规律,可以帮助实现在时空环境中的群体跟踪、热点事件发现等

定义::给定m,k∈N,r为大于零的常数。给定时空轨迹集合,且每条轨迹由τ条线段构成。伴随模式是指在时间区间I=ti,tj中,至少包含m个移动对象,在时间区间I的每个时刻中所有位置点都集中在半径为r的圆形区域内

常用算法


  • 群体模式算法
  • 伴随模式算法
    • 相干移动簇算法(Coherent moving cluster,CMC)
    • 采用轨迹简化技术的伴随模式发现(Convoy discovery using trajectory simplification,CuTS)算法
    • 交错式进化伴随算法ID-1/2
  • 蜂群模式算法

聚集模式

首先了解三个概念


  • 快照簇:为某一时刻移动对象形成的簇,并且簇内所有移动对象密度相连
  • 群体:由一定数目的快照簇形成的集合,并且任意相邻时刻的快照簇间的距离都小于等于给定的距离阈值
  • 参与者:在群体中出现至少kp次的移动对象

聚集模式::如果群体中的每个快照簇含有至少mp个参与者,那么这个群体就属于聚集模式

常用算法:


  • 基于关联规则剪枝的聚集模式挖掘算法

    • 基于关联规则剪枝的聚集模式挖掘算法
    • 基于FP-Growth的有效组图结构挖掘算法
    • 基于轨迹的组模式挖掘 (Apriori trajectory-based group pattern mining,ATGP)算法
    • 遍历式VG-Growth(Traversal VG-Growth,TVG-Growth)算法
    • 面向移动对象的深度优先搜索算法
  • 基于密度聚类的聚集模式挖掘算法

    • 基于密度的空间聚类 (Density-based spatial clustering of applications with noise,DBSCAN)算法

异常模式

设有时空轨迹数据集D={TR1,…,TRn},TRi=p1p2p3…pj…pleni(1≤i≤n)是一条轨迹,其中,pj为d维度的点,leni为轨迹TRi的长度。轨迹段是指一条线段pipj(ii和pj是来自TRi中任意的点

离群轨迹段:如果一个轨迹段周围没有足够数量的其他轨迹段与其靠近,则它称为离群轨迹段
异常模式:轨迹的异常模式是指O={O1,…,Om},其中Oi为离群轨迹段

常用算法:


  • 静态数据集的轨迹异常检测
    • 基于R-Tree的异常轨迹检测算法
    • 实时轨迹异常检测算法
  • 轨迹数据流的异常检测
    • 基于滑动窗口定义了轨迹流的异常检

大数据模式

对于时空轨迹大数据,时空轨迹模式挖掘除了需要经典的数据挖掘技术(关联分析、分类、聚类、异常检测等)以外,通过还有特殊的技术


  • 云计算技术
    主要是对数据进行并行的计算分析处理,常用MapReduce、Storm、Spark、Flink等等
  • 轨迹数据压缩和消减技术
    其基本思想是,将原有的轨迹点序列转化成线段序列,同时保留关键性的“拐点”。例如,如果移动对象经过路口,那么此路口的坐标应该作为结点被保留在线段序列中;如果移动对象改变了交通工具,导致行为方式或者移动速度发生变化,那么这样的行为“拐点”也应该被保留下来。
  • 时空轨迹数据可视化技术

欢迎交流学习

个人博客

掘金主页


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • JVM 学习总结(三)——对象存活判定算法的两种实现
    本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法:引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活,虽然简单高效,但无法解决循环引用的问题;可达性分析算法通过判断对象是否可达来确定存活对象,是主流的Java虚拟机内存管理算法。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具,并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测,可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别,并对每一帧图像进行识别。最后,给出了一些相关的参考资料和实例。 ... [详细]
  • 程序员如何选择机械键盘轴体?红轴和茶轴对比
    本文介绍了程序员如何选择机械键盘轴体,特别是红轴和茶轴的对比。同时还介绍了U盘安装Linux镜像的步骤,以及在Linux系统中安装软件的命令行操作。此外,还介绍了nodejs和npm的安装方法,以及在VSCode中安装和配置常用插件的方法。最后,还介绍了如何在GitHub上配置SSH密钥和git的基本配置。 ... [详细]
author-avatar
你的美我chase
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有