摘要:移动群智感知是一种新的大规模感知模式,它利用随身携带的智能移动终端(智能手机、可穿戴设备等)形成大规模、随时随地且与人们日常生活密切相关的感知系统。通过广大用户参与获取的感知数据具有多模态、富内容、时空性、人本性等特征。以群智大数据为目标对象,就其感知、优选和理解等关键问题进行阐述和探讨,并对笔者在该领域的最新研究成果进行介绍。
关键词移动群智感知;群智大数据;数据优选;人机混合智能;群体智能
中图分类号:TP393 文献标识码:A doi:10.11959/j.issn.2096-0271.2017052
1 引言
随着嵌入式设备、无线传感网络、物联网、智能移动终端等的快速发展,集成感知、计算和通信能力的普适智能系统正在被广泛部署,并逐步融入人类的日常生活环境中,普适计算获取数据的能力也由此得以极大增强。在此背景下,城市和社会感知成为当前信息领域的前沿研究热点[1,2]。其总体目的在于对大量的数字脚印进行挖掘和理解,从中获取社会情境、交互模式以及大规模人类活动和城市动态规律,并把学习到的智能信息运用到各种创新性服务中。
一般而言,城市感知任务具有范围广、规模大、任务重等特点。目前的城市感知系统还主要依赖于预安装的专业传感设施(如摄像头、空气检测装置等),具有覆盖范围受限、投资及维护成本高等问题,使用范围、对象和应用效果受到了很多限制。例如,在一些没有安置摄像头的地方,难以对该地交通情况进行实时监测。在此背景下,一种新的感知模式——移动群智感知(mobile crowdsensing)应运而生[3,4]。与传统感知技术依赖于专业人员和设备不同,群智感知将目光转向大量普通用户,利用其随身携带的智能移动终端(智能手机、可穿戴设备等)形成大规模、随时随地且与人们日常生活密切相关的感知系统。
移动群智感知由众包(crowdsourcing)、参与感知(participatory sensing)等相关概念发展而来。众包是美国《连线》杂志2006年发明的一个专业术语,用来描述一种新的生产组织形式。具体就是企业/研发机构利用互联网将工作分配出去,利用大量用户的创意和能力解决技术问题。参与感知最早由美国加州大学的研究人员于2006年提出[5],强调通过用户参与的方式进行数据采集。2009年2月,AlexPentland教授等在美国《科学》杂志上撰文阐述“计算社会学”概念[6],认为可利用大规模感知数据理解个体、组织和社会,在计算目标上与群体感知不一而同。以上几个相关研究方向都以大量用户的参与或数据作为基础,但分别强调不同的层次和方面。2012年,清华大学刘云浩教授首次对以上概念进行融合,提出“群智感知计算”概念[3],即利用大量普通用户使用的移动设备作为基本感知单元,通过物联网/移动互联网进行协作,实现感知任务分发与感知数据收集利用,最终完成大规模、复杂的城市与社会感知任务。与基于传感网和物联网的感知方式不同,群智感知以大量普通用户作为感知源,强调利用大众的广泛分布性、灵活移动性和机会连接性进行感知,并为城市及社会管理提供智能辅助支持。它可应用在很多重要领域,如智能交通[7]、公共安全[8]、社会化推荐[9]、环境监测[10]、城市公共管理[11]等。
综上,群智感知作为一种全新的感知模式,为推动社会与城市管理创新带来了前所未有的机遇。与传统网络相异的感知方式也为其带来了很多新的研究问题,特别是群智感知将形成多模态、富内容、具有时空和人本特征的数据,已有的模型和方法并不能很好地满足其在数据处理和理解方面的需求,故而需要探索新的计算模型和方法。本文以群智大数据为目标对象,就其感知、优选和理解等关键问题进行阐述和探讨,并对笔者在该领域的最新研究成果进行介绍。
2 群智大数据概念与系统架构
在对群智大数据背景进行介绍的基础上,本节对其基本概念和系统架构进行阐述。首先,介绍群智大数据的两种产生模式及数据特点;然后,说明人机混合智能及其协作模式;最后,给出群智大数据系统的典型架构。
2.1 数据产生模式及特点
群智感知中用户的参与性体现为两种模式[12]:线下移动感知参与,通过人在回路(human-in-the-loop)的感知模式贡献数据;在线社交媒体参与,通过各种移动社交媒体贡献数据,移动社交媒体能够实现虚拟空间交互和物理空间元素(如地理签到、活动等)的连接。把群体通过不同参与模式贡献的数据称为“群智大数据”。在信息科学技术不断发展并融入人们日常生活的背景下,人类的行为同时存在于物理和信息空间,因此群智大数据日益呈现出群体广泛参与、数据时空交织、多维目标关联等特征。
群智大数据的两种数据产生模式具有明显区别,可分别称其为显式感知模式和隐式感知模式,如图1所示。移动感知参与属于显式感知模式,通过需求驱动方式产生感知任务,并进行任务分配和参与者选择,用户则根据任务需求贡献数据。移动社交媒体参与属于隐式感知模式,用户在使用各种既有社交服务(如微博、大众点评等)的过程中产生了大量数据,而在贡献数据时并没有明确的感知任务需求,数据后期经过二次加工利用,产生新的服务价值(如通过用户在线签到数据发现城市的热点区域或异常聚集趋势)。
由于数据产生过程中人类的参与,群智大数据相比传统感知网络数据具有许多新特点。一是群智数据通过人类线上、线下的多种参与方式获得,同时产生于信息空间和物理空间,且由于人类的纽带作用,不同空间数据实现时空交织和语义关联。二是人类行为的不确定性和自发性等特征使得群智数据常包含较多的错误或冗余,质量良莠不齐,给数据的及时准确处理造成了极大挑战。三是群智数据体现人、机、物的融合,在数据获取过程中还蕴含了丰富的群体智能信息,如群体与感知对象的交互特征(如交互时间、地点、采集情境、采集模式等),为实现人类和机器智能融合,进行高效数据处理提供了基础(参见第4.4节)。
2.2 人机混合智能
人类与机器智能相结合的研究有着悠久的历史。早在1950年图灵就曾指出“数字计算机后期的发展可以这样来展望,这些机器将不断具有任何由人类才能完成的工作的能力”[13]。他后来还提出“图灵测试”,对给定程序的智能程度进行评估。这表明人类智慧和机器智能自人工智能研究诞生以来就一直是相互关联的主题。人工智能领域先驱、美国麻省理工学院的利克莱德教授在1960年发表过一篇开创性的论文[14],提出“人机共生”思想,即让人和计算机能够共同合作,一起完成复杂任务。近期,中国工程院院刊发表人工智能2.0专题[15],指出“人机混合增强智能”是人工智能2.0的5个重要发展方向之一。群智感知延续了这一思想,它尝试通过人在回路的方式解决大规模的感知和计算问题。特别是,群智感知很好地利用了人类和机器智能的互补性。
●人类智能:人类具有学习和推理能力,比如语言、识别、预测、决策等。同时把一些可作为群智感知输入或者参数的个体或者社会情境也称为人类智能,比如社交关系、协作性、用户偏好、移动规律等。但是,人类的记忆力和运算速度受到限制,数据贡献的水平参差不齐,常会引入错误或低质量数据。
●机器智能:狭义上机器智能的定义是人工智能,即机器表现的推理能力、计算能力、知识表达、解决问题的能力等。广义的机器智能还包含系统的运行状态、网络连接等情境信息。然而,至今仍有许多问题(如图像标注、物体识别等)机器还不能达到很好的性能。
群智感知的主要特点是在大规模问题求解过程中有人类的参与。然而,人和机器的能力需要一种有效的方式来协调,以便实现感知和计算能力的增强。一个通用的群智感知系统框架包括3个层面的元素,包括物理层的群智感知、网络层的数据传输、计算层的数据处理。其中,群智感知层利用大量的移动或可穿戴设备捕捉感知目标的相关数据;数据传输层需要通过基础网络或者机会网络把信息传输到后台服务器;数据处理层则负责保证数据质量和智能分析提取信息。在不同层次,人类和机器智能可通过不同的方式进行协作,如图2所示。
●在群智感知层,计算服务器负责将复杂的任务分解,并分配给合适的群组来完成任务,人类参与者则依靠自己的知识和经验执行所分配的任务。
●在数据传输层,在群智感知环境下,由于网络的弱连接性[3](如受网络未覆盖、用户网络使用习惯等影响),常需要通过机会网络连接降低感知数据的传输延迟,而用户的移动性和交互性则是机会网络动态连接的实现基础。
●在数据处理层,人类的认知能力和专家经验可以协助机器更高效、准确地完成数据处理任务,特别是在一些任务不能够通过现有的机器智能技术得到好的解决的情况下。
2.3群智大数据系统架构
一个典型的群智大数据系统具有如图3所示的架构,包括数据源层、数据采集与传输层、数据处理与计算层、应用层。
●数据源层:人类通过两种途径贡献群智数据,分别为移动感知和移动社交网络。采用云—端融合的方式进行数据存储和处理,可根据需求在本地或服务器端完成数据存储和计算任务。访问控制是本地端的一个重要功能,用户可以决定其数据由谁访问以及访问的范围。
●数据采集与传输层:多种移动网络技术都可以被群智感知利用,包括机会网络(如蓝牙、Wi-Fi)和基于基础设施的网络(如3G/4G)等。群智感知网络应该使数据上传对参与者透明,并且能够包容不可避免的网络中断。此外,该层还具有任务优化分配和对参与者进行激励等功能。
●数据处理与计算层:采用机器学习、数据挖掘和推理技术等实现对多源异构群体贡献数据的关联、融合和理解,其中人类智能与机器智能的协同计算为关键内容。
●应用层:包括各种由群智大数据驱动的应用和服务,包括社会情境感知、城市计算、环境污染监测等。笔者之前发表的综述文章对群智大数据的应用进行了详细的分类和总结[12]。
3 研究挑战及进展
作为一个新的研究领域,群智大数据具有一系列新的研究挑战和问题,下面分别介绍其进展。
3.1 群智高效感知
群智感知依赖参与用户的移动终端具备的各种传感和计算能力等进行感知。与传统感知网络相比,参与式感知节点具有规模大、分布广、能力互补等特点,而任务则具有需求多样、多点并发、动态变化等特征。挑战在于如何选择合适的参与者,以高效完成城市感知任务。需研究针对感知任务需求的参与者优选方法,根据任务的时空特征、技能需求及用户个人偏好、移动轨迹、移动距离、激励成本等设定优化目标和约束,并进行选择。
Lee J等人[16]采用竞拍机制促进用户参与,用户收集完数据后,在上报过程中,服务器端采用逆向拍卖机制对其进行收购。Chen BB等人[17]提出基于虚拟货币的激励机制。Kawajiri R等人[18]提出了结合游戏元素指导和激励用户采集数据的方法。在参与者选择方面,Reddy S等人[19]提出了面向时空覆盖的参与者优选方法。张大庆等人[20]进一步研究了群智感知任务覆盖概率模型,并在此基础上提出了一种贪婪方法进行最小参与者集合选择。Xiao M等人[21,22]研究了移动社交网络中的任务分配问题,提出了面向任务平均完成时间最小化的参与者选择方法。Karaliopoulos M等人[23]研究机会网络中的用户选择问题,在满足所有兴趣点都覆盖的情况下最小化总成本。如何提高用户的参与积极性是群智高效感知的关键研究问题,Guo B等人[24]提出了面向质量的动态激励机制提高用户参与性,并实现高质量数据感知;此外,Guo B等人[12]对群智感知中用户社会协作和参与激励机制等进行了深入阐述。
3.2 群智数据优选
由于不同用户在活动范围上有一定重叠,群智感知采集到的数据中可能存在大量冗余。而大量未经训练的用户作为基本感知单元会带来感知数据多模态、不准确、不一致等质量问题。挑战在于如何在数据冗余、质量良莠不齐情况下实现优质数据选择和收集。
Uddin MYS等人[25]研究了灾后现场照片在容延网络环境下的传输问题,在数据上传前根据时空和内容相似度约束进行照片选择,提高了群智感知数据移交效率。Wang Y等人[26]基于位置和拍摄角度研究了最大效用和最小选择两种数据选择问题。Wu Y等人[27]提出了一种带宽和存储约束下的群体图像感知数据传输方法,能通过数据选择有效降低传输成本。Wu Y等人[28]提出一系列摄影采集规则,实现对群体贡献视频数据的融合和集成。Tuite K等人[29]通过群体感知收集建筑物照片,用于城市3D建模,它通过向参与者实时可视化呈现已收集到的数据促进参与者实现对感知对象的多角度覆盖。Kawajiri R等人[30]采用动态激励机制提高感知任务不同侧面的覆盖。
3.3 群智数据理解
如何对跨空间多源异构群体数据进行关联和融合,并实现对感知目标的高效理解是群智大数据的又一挑战。Chen S等人[31]利用群体轨迹数据构建室内地图,通过挖掘的用户访问模式过滤异常数据。Cranshaw J等人[32]提取众包用户签到数据中的时空特征和频率信息实现细粒度朋友关系识别。Redi M等人[33]采用社交网络中共享的图片信息对兴趣地点进行画像。Zheng Y等人[34]根据检测图像的ORB特征数量对群体贡献图像的模糊度进行评估。微软亚洲研究院研究人员利用手机数据进行用户相似度匹配和好友推荐①,并且提出了基于多源用户贡献数据的空气质量预测模型[35]。
4 代表性工作
近五年来,在国家自然科学基金重点项目“移动社交中感知数据收集的机会路由与交互式内容移交”、国家“973”计划项目“城市大数据三元空间协同计算理论与方法”等支持下,笔者团队开展群智大数据感知计算方向研究,下面就一些代表性工作进行介绍。
4.1 群智大数据感知与计算模型
与传统静态感知不同,群智感知数据采集首先面临的挑战是如何从泛在、移动的感知源中选择合适的参与者,并利用其交互协作完成复杂感知任务。因此对用户偏好、时空情境、移动规律、社会交互行为及社会关系等进行建模和理解是群智感知的重要基础。在对群体情境进行建模的基础上,针对智慧城市感知任务的多样性及多侧面数据覆盖需求约束,需构建统一的感知任务描述模型,为实现群体时空情境驱动的任务高效分发和数据优选提供支持[12]。
针对群智感知生态系统的3个主体:参与者、任务和数据分别进行建模。首先,构建了参与者情境感知模型,对个体的时空情境、偏好、移动规律、群体交互及社群结构等进行统一表达,构建多层次、多粒度的情境表达框架。其次,构建了统一的感知任务描述模型,能对不同类型的感知任务进行定义和发布,支持复杂的需求约束描述。最后,对感知数据进行建模,包括其类型、内容、采集时的情境信息(如拍摄角度、距离等)。3个模型彼此关联,如联合情境感知模型和任务描述模型为任务分发提供支撑,结合3个模型实现数据优选。整体模型如图4所示。
在实现层面,采用语义网、图论等理论和方法对群体时空情境、感知数据、任务约束等基本概念及概念之间的关系进行统一建模。针对高级情境语义获取、情境冲突消解等需求,采用OWLDL(web on tology language,description language)②和SWRL(semantic web rule language)实现本体推理与规则推理相结合的混合情境推理方法,以支持高层次情境语义识别。
4.2 群体感知多任务优化分配
在城市规模群智感知平台中,感知任务常并发出现,为提高感知资源的有效利用率,需要对感知能力进行优化组合。其中,参与者数量与任务数量的比例影响了感知能力优化组合的方式(如图5所示)。针对参与者匮乏情况,提出改进的基于最小费用最大流模型的多任务感知参与者发现方法,在降低任务完成成本的同时,能提高感知任务的完成率;针对参与者资源充足情况,提出基于线性加权的多目标优化方法,实现最小化移动距离和激励成本的均衡优化。通过多任务协同优化实现了群体感知资源的有效利用和高效任务分发[36]。
与静态感知节点不同,如果没有合理的激励机制,智能移动设备用户很难积极参与
群体感知任务。现有的激励机制主要面向促进用户参与和多贡献数据,但对数据质量评估不足,会出现低质量用户获得较高收益的情况,从而影响群体参与感知的效果和参与者积极性。针对该问题,提出一种面向质量的动态参与者激励机制[24]。该机制定义了基于时空特征的任务评估模型,能结合在线社区用户签到数据计算区域热度,并对任务成本进行估算;利用任务覆盖率、聚类中心距离等评价指标提出多侧面数据质量评估方法;最后,提出基于质量估计的参与者动态收益分配机制,相比一般基于报价的激励机制能在给定预算的前提下,提高移交数据的质量。
4.3 多维语义驱动的数据优选
群体参与式数据采集存在数据冗余、质量良莠不齐等问题,需研究数据优选方法,提高感知数据质量。以图像为例,现有工作主要基于内容进行质量评估,计算效率低。利用群体与感知对象交互时产生的多维物理情境信息(如光强、加速度、拍摄角度等),提出群体数据质量评估模型,提高数据处理效率。
在冗余处理方面,已有工作主要考虑图像相似度进行冗余发现,而语义层面的冗余则未考虑。针对具体感知任务,语义冗余可通过时空情境信息、拍摄角度、远近等进行刻画。提出基于分层金字塔树的冗余发现方法(如图6所示)[37],树的每一层非叶子节点代表任务特征约束(如时间、地点、拍摄角度),叶子节点表示数据。每一层根据不同的约束阈值可以形成不同分支。某层分支涵盖的数据代表该层以上特征联合聚类的结果。该方法能根据数据流和任务的语义约束,在线构造分层金字塔树,实现满足多维覆盖的群体感知冗余数据分组,进而采用时间优先或质量优先方式进行数据移交决策。
在群智感知较弱的网络环境下,数据往往需通过参与者节点机会式协作构成移动自组织网络,以实现机会式数据移交。一般机会网络采用“携带—连接—复制”的方式,在节点相遇时互相复制对方的数据,以提高数据移交效率,但同时带来存储空间要求高、数据交换成本高等问题。前面提到由于群体感知的分布式、自发式采集特点,会产生大量冗余和低质数据,如果全部移交则带来不必要的负担。在传统机会网络基础上,引入数据选择策略,形成“携带—连接—选择—复制”移交方式[38]。在实现层面,为实现高效冗余数据发现,将根据任务约束需求,采用分层金字塔树模型对每个参与者感知的数据进行表达。如图6所示,在参与者节点(如N1和N2)相遇时,不直接交换数据,而是先移交双方的树结构,并进行自顶向下的融合(嫁接、剪枝和替换等),在语义层面发现双方冗余或缺失的数据。针对语义缺失数据(N1有而N2没有的分支)进行分支“嫁接”工作;针对语义冗余数据,根据多维情境判别双方数据质量,利用高质量数据替换对方的低质量数据。
4.4 群体智能融合计算
群体数据采集过程是用户和感知对象的交互过程,除获取的直接数据内容外,还隐含了丰富的群体智能信息。如图7所示,这里将“群体智能”定义为群体与感知对象的交互特征(简称群物交互特征,如交互时间、地点、采集情境、采集模式等)及感知社群的丰富情境信息(如社群结构、社会关系、移动规律、偏好等)。现有群体贡献数据分析和处理方法主要针对数据内容(如图像、视频等),存在计算量大、效率低等问题,特别是在计算资源受限的移动设备上存在使用限制。群物交互特征等群体智能一方面融合了用户的认知、分析与决策等智能信息,另一方面体现了感知群体的统计特征与规律,为理解群体贡献数据语义(如关注度、社会性、事件演化规律)等提供了重要依据。
针对静态和动态感知对象分别开展群体智能融合数据理解研究。静态感知对象以群体公共信息采集为背景[11],针对群体贡献数据数量大、富冗余等特点,采用时空情境及行为关联方法实现快速动态分组。对各分组计算其群体社交结构、时空分布、群体—感知对象交互信息熵等隐式群体智能,采用多标签分类和启发式规则相结合方法进行语义标注。由此发现不同粒度群体和公共信息间的隐含关联,提高群体感知信息推送的精准度。动态感知对象以城市热点事件感知为背景[39],基于个体/群体行为的共性和差异性对事件进行演化分析和多侧面呈现。首先,提出梯形框模型刻画可视感知情境,通过群体感知数据融合得到不同位置网格的累积权重,并对事件定位;进而基于个体/群体与事件交互行为规律进行子事件发现和演化分析,在此基础上根据群体感知情境(角度、远近等)的差异性进行数据选择和分粒度事件呈现。通过融合群体智能实现对热点事件的实时感知与多侧面刻画。
5 结束语
本文对群智大数据这一新兴研究领域进行了阐述,对群智数据的跨空间性、时空交织性、人机智能融合等特性进行了刻画。在此基础上,论述了群智大数据面临的几大研究挑战,包括群智高效感知、群体数据优选、群智数据理解,并介绍了笔者在这方面的研究进展。群智大数据对人类社会和信息科技的发展将起到积极促进作用,将推动人—机—物三元环境的和谐融合以及大量“以人为中心”的应用和服务创新,同时更多的研究和技术挑战也等待着人们不断发现和解决。
本文摘自《大数据》 2017, 3(5):57-69