感觉,即客观事物的个别特性作用于人的感官时,在人脑中引起的直接反应。感觉是最简单的心理过程,是形成各种复杂心理和秩序的基础,同时也是人机研究的源泉和起始点。从人机交互角度关心的人的特性主要有生理特性、心理特性以及与此有关的信息输入、处理、输出特性等。
一. 人的基本感觉特性
人对客观事物的认识是从感觉开始的,它是最简单的认识形式。例如当菠萝作用于我们的感觉器官时,我们通过视觉可以反映它的颜色;通过味觉可以反映它的酸甜味;通过嗅觉可以反映它的清香气味,同时,通过触觉可以反映它的粗糙的凸起。人类是通过对客观事物的各种感觉认识到事物的各种属性。感觉器官是脑的工具,脑是借助于感觉器来反映外部世界的。
感觉不仅反映客观事物的个别属性,而且也反映我们身体各部分的运动和状态。例如,我们可以感觉到双手在举起,感觉到身体的倾斜,以及感觉到肠胃的剧烈收缩等等。
感觉虽然是一种极简单的心理过程,可是它在我们的生活实践中具有重要的意义。有了感觉,我们就可以分辨外界各种事物的属性,因此才能分辨颜色,声音、软硬、粗细、重量、温度、味道、气味等,有了感觉,我们才能了解自身各部分的位置、运动、姿势、饥饿、心跳,有了感觉,我们才能进行其它复杂的认识过程。失去感觉,就不能分辨客观事物的属性和自身状态。因此,我们说,感觉是各种复杂的心理过程(如知觉、记忆、思维)的基础,就这个意义来说,感觉是人关于世界的一切知识的源泉。
(一)感觉的分类
一般把感觉分成两大类。
第一类是外部感觉,有视觉、听觉、嗅觉、味觉和肤觉五种。这类感觉的感受器位于身体表面,或接近身体表面的地方。
视觉,人类可以看得到从0.77-0.39微米的波长之间的电磁波。
听觉,人类能听到物体振动所发出的20-20000HZ的声波。可以分辨出声音的音调(高低)、音强(大小)和音色(波形特点),通过音色我们可以分辨出哪是火车的声音,哪是汽车的声音,能够分辨出熟人的说话声,甚至走路声。还可以确定声源的位置、距离和移动。
嗅觉是挥发性物质的分子作用于嗅觉器官的结果。通过嗅觉我人也可以分辨物体。味觉溶于水的物质作用于味觉器官(舌)产生的。味觉有甜、酸、咸、苦等四种不同的性质。
肤觉也称触觉,是具有机械的和温度的特性物体作用于肤觉器官,引起的感觉。分为痛、温、冷、触(压)四种基本感觉。
第二类感觉是反映机体本身各部分运动或内部器官发生的变化,这类感觉的感觉器位于各有关组织的深处(如肌肉)或内部器官的表面(如胃壁、呼吸道)。这类感觉有运动觉、平衡觉和机体觉。
运动觉反映我们四肢的位置、运动以及肌肉收缩的程度,运动觉的感受器是肌肉、筋腱和关节表面上的感觉神经末梢。
平衡觉反映头部位置和身体平衡状态的感觉。平衡觉感受器位于内耳的半规管和前庭。
机体觉反映机体内部状态和各种器官的状态。它的感受器多半位于内部器官,分布在食道、胃肠、肺、血管以及其它器官。
(二) 感觉现象
(1)感觉后象
当刺激对感官的作用停止以后,我们对刺激的感觉并没有立即停止,而是继续维持一段很短的时间,这种现象叫感觉后象。
(2)感觉适应
当刺激持续地作用于人的感官时,人对刺激的感觉能力会发生变化,这种现象叫感觉适应。感觉适应在视觉和嗅觉中最为明显。
(3)感觉对比
当同一感官受到不同刺激的作用时,其感觉会发生变化。这种现象叫感觉对比。
(三) 感觉与知觉的对比
感觉:脑对直接作用于感觉器官的客观事物个别属性的反映。
知觉:脑对直接作用于感觉器官的客观事物整体属性的反映。
两者的区别如下:
(1)产生的来源不同。感觉是介于心理和生理之间的活动,它的产生主要来源于感觉器官的生理活动以及客观刺激的物理特性。知觉是在感觉的基础上对客观事物的各种属性进行综合和解释的心理活动过程,表现出了人的知识经验和主观因素的参与。
(2)反映的具体内容不同。感觉是人脑的客观事物的个别属性的反映,知觉则是对客观事物的各个属性的综合整体的反映。
(3)生理机制不同。感觉是单一分析器活动的结果,知觉是多种分析器协同活动对复杂刺激物或刺激物之间的关系进行分析综合的结果。
两者的联系如下:
(1)感觉是知觉产生的基础。感觉是知觉的有机组成部分,是知觉产生的基本条件,没有对客观事物个别属性反映的感觉,就不可能有反映客观事物整体的知觉。
(2)知觉是感觉的深入与发展。一般来说,若能对某客观事物或现象感觉到的个别属性越丰富,越完善,那么对该事物的知觉就越完整,越准确。
(3)知觉是高于感觉的心理活动,但并非是感觉的简单相加之总和,它是在个体知识经验的参与下,以及个体心理特征,如:需要、动机、兴趣、情绪状态等影响下产生的。
二、 神经系统与感觉
(一)神经系统
1、神经系统的组成及其功能
神经系统是由包括脑和脊髓的中枢神经以及遍布全身各处的周围神经所组成。神经系统是人体的主导系统,全身各器官、系统均在神经系统的统一控制和调节下,互相影响、互相协调,保证人体的统一及其与外界环境的相对平衡。在此过程中,首先是借助于感受器接受体内外环境的各种信息,通过脑和脊髓各级中枢的整合,最后经周围神经控制和调节各个系统的活动,从而使机体得以反应多变的外环境,同时也调节着机体内环境的平衡。
从心理学角度看,人的一切心理和意识活动也是通过神经系统的活动实现的,因此,神经系统也是心理现象的物质基础。
2、神经组织
人的神经组织主要由神经元和神经胶质细胞组成。神经元也称神经细胞,是神经系统的结构、功能和营养的基本单位,具有感受体内外刺激、整合信息和传导信息的功能。神经胶质细胞分布在神经元周围,构成网状支架,对神经元起支持、绝缘、营养、防御等作用。
(1)神经元
一个神经元有三个部分组成,一是包含有细胞核的细胞体,它是神经元代谢和营养的中心;二是由细胞体向外伸出的呈树枝状的短突部分,称为树突;三是由细胞体向外伸出的一条细长的单突,称为轴突,如图1所示。轴突的长短随神经元类型不同而异,短的轴突仅数十微米,长的可达1m以上。轴突外被髓鞘及施旺氏细胞包围组成神经纤维。神经纤维的末端有许多分枝,称为神经末梢。神经元的树突接受由其他神经元传来的信息,经细胞体整合后再由轴突将信息传递给另一神经元或机细胞和腺细胞,从而在整个机体内形成传递信息的神经元链。刺激沿神经纤维的传递速度和轴突髓鞘的厚度有关。髓鞘厚时,速度可达120m/s,髓鞘很薄,则可低至0.6m/s。传递速度还与神经元之间的间隙数目有关,因为突触间隙对刺激传递有微弱的障碍作用。
图 1 神经元模型
(a)运动神经元 (b)感觉神经元
1-运动终板 2—骨骼肌纤维 3、12—施旺氏细胞4、11—髓鞘 5、13—轴突 6—树突 7—核仁8、14—神经膜 9、10—神经末梢
(2)突触
神经系统的机能活动依赖于众多神经元之间的密切联系,而神经元之间的联系是彼此接触,突触即为神经元之间发生接触并进行信息传递的特殊联接装置。神经元之间通过突触形成密如蛛网般的联系,构成一个庞大的复杂的神经网络系统,从而使神经冲动有效地在神经系统内传导。
突触由突触前膜、突触间膜和突触后膜三部分组成,如图2所示。轴突末梢的每个分支末端都有一个膨大成球状的突触小体。突出小体内含有大量的直径约为50μm的突触小泡,贮存着高浓度的化学递质(神经递质)。突触小体的细胞膜称为突触前膜,与突触前膜对应的另一神经元的细胞膜称为突触后膜,两膜之间的空隙则称为突触间隙,宽约15~30nm。由于突触前、后神经元之间有突触间隙相隔,并无原生质联系,因此信息的传递是通过化学递质转变为电位变化而完成的。当神经冲动传至突触前膜时,突触小泡即向前膜移动并附贴于前膜形成破裂口,此时,大量的化学递质被释放到突触间隙并扩散至突触后膜,产生突触后电位。通过突触后电位的作用,使神经冲动由突触前膜单向地传向突触后膜,引起突触后神经元兴奋或抑制。正是由于突触传递的单向性,才保证了信息有效地传向中枢和大脑。
图 2 突触结构模式
1—轴突分枝 2—线粒体 3—神经胶质膜 4—突触小泡 5—突触前膜 6—突触间隙 7—突触后膜
(3)中枢神经系统
a.脊髓
脊髓是中枢神经系统的最低级部位,位于脊柱的脊椎管内,其上端进入颅腔扩展成为大脑的一部分——延髓。脊髓的功能有二,一是传导功能,来自躯干、四肢和大部分内脏的各种刺激通过脊髓传导至脑,而脑的活动又通过脊髓传导至躯体和内脏,脊髓是脊神经与脑之间的神经传导通路;二是反射功能,脊髓可以完成一些简单的躯体反射和内脏反射,如腱反射、屈肌反射和行走反射等。
b.脑
脑是中枢神经的高级部位,位于颅腔内,由大脑半球、间脑、中脑、脑桥、延髓和小脑六部分组成。通常把中脑、脑桥和延髓合称为脑干,有时也将间脑列入脑干。脑干参与传导上、下行神经冲动,是大脑半球与脊髓之间的联络通路。
(1)延髓。它为脊髓的延续,它不仅是食物反射(如唾液分泌、咀嚼、吞咽等)和某些防御反射(喷嚏、咳嗽、呕吐等)的中枢,而且是呼吸和循环系统的反射性自动调节中枢,故有“生命中枢”之称。大部分由脊髓上行的和由脑下行的神经纤维在延髓交叉,以致形成左、右大脑半球分别控制对侧躯体的状况。
(2)脑桥。位于延髓上方、小脑腹侧,是联系小脑两半球上、下行神经纤维的桥梁。脑桥参与或完成头面部肌肉(如眼外直肌、咀嚼肌、表情肌)的运动以及某些感觉(面部肤觉、味觉、平衡觉和听觉)的形成。
(3)中脑。位于脑桥上方,是视、听运动的反射中枢。中脑的反射机能对于机体的定向反射具有重要意义。
位于延髓、脑桥和中脑中央部位的一个广泛区域称为脑干网状结构,由各种来源的神经纤维交织而成的网络及散布其中的神经细胞、核团构成。该结构存在两个相互对立的调节系统——激活系统和抑制系统。激活系统不断接受来自体内外的各种刺激并经丘脑广泛地传至大脑皮质,引起大脑皮质处于醒觉状态。抑制系统则引起大脑皮质活动水平的降低。两系统的协调活动,使大脑皮质维持正常功能。脑干网状结构也调节内脏活动和躯体运动。
(4)间脑。位于脑干上方,由丘脑和下丘脑组成。丘脑是大脑皮质下的低级感觉中枢。除嗅觉外,身体各部分的感觉冲动均传至丘脑,经丘脑更换神经元后传向大脑各高级感觉中枢,引起特定的感觉,故丘脑为各种感觉的中继站。下丘脑是调节内脏活动和内分泌活动的较高级中枢,同时也参与某些情绪反应活动及昼夜周期性变化活动等。
(5)小脑。位于颅后窝内,在延髓和脑桥的背侧、大脑的后下方。小脑的主要机能,是维持身体的平衡、调节与校正肌肉的紧张度和协调肌肉的运动。
(6)大脑半球。位于中枢神经系统的最高部位,被一条纵裂分为左、右两个半球,两半球之间通过联合神经纤维——胼胝体连合与沟通。大脑表面有许多深浅不—的皱褶,皱褶凹陷部位称为沟或裂,隆起部位称为回。三条主要的沟裂将大脑分为额叶、顶叶、颞叶、枕叶等4叶。半球表面被覆2~5mm厚的灰质细胞层,称为大脑皮质。皮质的深部为髓质,亦称白质,有联系左、右大脑半球、同侧半球各区域以及皮质与低级中枢的机能。靠近大脑半球底部埋藏于白质之中的灰质核团,称为基底神经节,亦称大脑核,是调节肌肉紧张度和保证机体完成复杂活动时使肌肉协同活动的神经细胞集团,是大脑皮质下的运动中枢。
大脑皮质是统一机体的最高神经中枢。人的大脑皮质大约含有140亿神经细胞,在垂直切面上大致分六层排列。皮质浅部的1~4层为最重要的细胞层,其主要机能是对进入皮质的各种冲动进行复杂精细的分析、综合,并作出反应。皮层深部的5~6层则主要是接受并传递来自1~4层的信息。正是由于大脑皮质含有极大量的神经元以及它们相互联系的广泛性和复杂性,才使得大脑皮质具有了完善的分析、综合能力,成为人类思维和语言的物质基础。
大脑皮质的各个不同区域在功能上具有不同的分工,如感觉区和运动区,但皮质各区域这种功能上的分工又不是绝对的,一个区域只是执行某一种功能的核心部位,皮质的其他区域也分散有类似的功能。如皮质的中央前回(第4、6区),主管全身骨骼肌的运动,称运动中枢,但该区域也接受部分的感觉冲动。而中央后回(第3、1、2区)则主管全身的感觉,称感觉中枢,但刺激该区域也可产生少量的运动。中枢损伤的人依靠皮质其他功能区域的代偿,不会完全丧失该中枢所管理的功能。
图 3 大脑皮质活动区和感觉区的定位图
(a)运动区 (b)感觉区
(a)大脑半球背外侧面 (b)大脑半球内侧面
1—嗅觉中枢 2—内脏调节中枢 3、7—运动中枢 4—运动性语言中枢 5—眼球协调运动中枢 6—书写中枢 8、13—感觉中枢 9—视性语言中枢
10、14—视觉中枢 11—听性语言中枢 12—听觉中枢
1909年K.布罗德曼(K.Brodmann)根据皮质不同部位的组织结构特点不同、功能不同,将大脑皮质分为52区,并注上阿拉伯数字号码,成为至今仍有权威意义的细胞构筑图或脑地图。1950年加拿大的潘菲尔德(Penfield)也绘制出了相当精确的皮质第1躯体感觉区和运动区的定位图如图3所示。该图所显示的是沿中央沟纵切的切面部位。由于控制身体某部的大脑皮质与被控制部位的实际大小不成比例,因此,图中用两个变形的人体表示皮质部位与身体解剖各对应部位的关系。
第1躯体运动中枢也称大脑皮质运动区,位于中央前回第4、6区。每个半球的大脑皮质运动中枢控制对侧躯体的运动(控制头面部的运动是双侧的),且具有精细的定位,即一定的区域支配一定部位肌肉的运动,具体地说,中央前回的下部支配头面部肌肉的运动;中央前回的中部支配上肢和躯干肌肉的运动;中央前回的上部则支配下肢肌肉的运动,从而使身体各部位在皮质运动中枢的投影呈一倒置的人形(头面部在其内部排列呈正立)。同时身体各部位在皮质运动中枢的投影的大小与该部位所从事的运动的精细复杂程度有关,如在人体上尽管口和手比下肢要小得多,但由于口和手是从事精细运动的部位,所以它们在运动中枢的投影特别大。
第1躯体感觉中枢也称大脑皮质感觉区,位于中央后回和中央旁小叶的后部,包括第3、1、2区。它是皮肤的触、压、冷、温、痛等感觉的高级中枢,也是躯体动觉和平衡觉的中枢。人体各部位在大脑皮质感觉中枢的投影与其在运动中枢的投影具有相类似的特点。
在大脑皮质中,除上述运动中枢和感觉中枢外,还有距状裂两侧的视觉中枢(第17区)、颞上回和颞横回的听觉中枢(第41、42区)、海马旁回沟附近的嗅觉中枢等。
如图4所示,在大脑皮质中除上述区域以外的广大区域为机能联合区。联合区具有高度的整合能力。人的语言、记忆、抽象思维、运筹计划等复杂心理活动和动机行为均与联合区的机能有关。
人的语言功能区包括视性语言中枢(第39区)、听性语言中枢(第22区)、运动性语言中枢(第44区)以及位于额中回后部的书写中枢均位于大脑皮质的机能联合区。这4个语言中枢是构成人类特有的第二信号系统的生理基础。
(4)周围神经系统
周围神经系统是由脑和脊髓发出,其末梢分布于身体各器官和组织的神经系统。它包括脊神经、脑神经和植物性神经。周围神经的功能有二:一是接受来自体内外的各种刺激并将其传导至中枢神经;二是传递由中枢神经发出的指令并完成运动反应。
三、 人的深度态势感知
深度态势感知含义是“对态势感知的感知,是一种人机智慧,既包括了人的智慧,也融合了机器的智能”, 是能指+所指,既涉及事物的属性(能指、感觉)又关联它们之间的关系(所指、知觉),既能够理解事物原本之意,也能够明白弦外之音。它是在以Endsley为主体的态势感知(包括信息输入、处理、输出环节)基础上,加上人、机(物)、环境(自然、社会)及其相互关系的整体系统趋势分析,具有“软/硬”两种调节反馈机制;既包括自组织、自适应,也包括他组织、互适应;既包括局部的定量计算预测,也包括全局的定性算计评估,是一种具有自主、自动弥聚效应的信息修正、补偿的期望-选择-预测-控制体系。如果说视觉是由物体反光的漫射形成的,那么深度态势感知就相当于在暗室里打开开关看到事物的本原。
在深度态势感知系统中,我们主要目的不是构建态势,而是建构起态势的意义框架,进而在众多不确定的情境下实现深层次的预测和规划。
一般而言,感对应的常是碎片化的属性,知则是同时进行的关联(关系)建立,人的感、知过程常常是同时进行的(机的不然),而且人可以同时进行物理、心理、生理等属性、关系的感与知,还可以混合交叉感觉、知觉,日久就会生成某种直觉或情感,从无关到弱关、从弱关到相关、从相关到强关,甚至形成“跳蛙现象”,类比在这个过程中起着非常重要的作用,是把隐性默会知识转化成显性规则/概率的桥梁。根据现象学,意识最关键的是知觉,就是能觉知到周边物体和自身构成的世界。而对物体的知觉是自身和物体的互动经验整合而得到的自身对物体的可以做的行动。比如对附近桌子上的一个苹果的知觉是可以吃,走过去可以拿在手里,可以抛起来等。一般认为知觉是信号输入,但事实上,计算机接受视频信号输入但是没有视觉,因为计算机没有行动能力。知觉需要和自身行动结合起来,这赋予输入信号语义,输入信号不一定导致一定的行动,必须要结合动作才有知觉。知觉的产生先经过输入信号、自身运动和环境物体协调整合,整合形成经验记忆,再遇到相关的信号是就会产生对物体的知觉(对物体可作的行动)。当然只有知觉可能还不够,智能系统还需要有推理、思考、规划的能力。但这些能力可以在知觉平台基础上构建。
人与机器在语言及信息的处理差异方面,主要体现在能否把表面上无关之事物相关在一起的能力。尽管大数据时代可能会有所变化,但对机器而言,抽象表征的提炼亦即基于规则条件及概率统计的决策方式与基于情感感动及顿悟冥想的判断(人类特有的)机理之间的鸿沟依然存在。
爱因斯坦曾这样描述逻辑与想像的差异:“Logic will get you from A to B, imagination will take you everywhere”,其实,人最大的特点就是能根据特定情境把逻辑与想像、具象与抽象进行有目的的弥聚融合。这种灵活弹性的弥散聚合机制往往与任务情境紧密相关。正如涉及词语概念时,有些哲学家坚持认为,单词的含义是世界上所存在的物理对象所固有的,而维特根斯坦则认为,单词的含义是由人们使用单词时的语境所决定的一样。究其因,大概源于类似二极管机理中的竞争冒险现象吧。这种现象在人的意识里也有,如欲言又止,左右为难,瞻前顾后。思想斗争的根源与不确定性有关,与人、物、情境的不确定有关,有限的理性也许与之有某种联系吧,关键是如何平衡,找到满意解(碗中捞针),而不是找最优解(海中捞针)。相比之下,最近战胜围棋世界冠军李世石的机器程序阿尔法狗参数调的就很好,这种参数的平衡恰恰就是竞争冒险机制的临界线,就像太极图中阴阳鱼的分界线一般。竞争冒险行为中定性与定量调整参数之间一直有个矛盾,定性是方向性问题,而定量是精确性问题,如何又红又专,往往有点to be or not to be的味道。
对人类而言最最神秘的意识是如何产生的,这个问题一直受到学者们的关注。其中有两个主要问题,一是意识产生的基本结构,二是交互积累的经验。前者可以是生理的也可以是抽象的,是人类和机器的差异,后者对人或机器都是必须的。意识是人机环境系统交互的产物,目前的机器理论上没有人机环境系统的(主动)交互,所以没有你我他这些参照坐标系。有人说“当前的人工智能里面没有智能,时下的知识系统里面没有知识,一切都是人类跟自己玩,努力玩得似乎符合逻辑、自然、方便而且容易记忆和维护”,此话固然有些偏颇,但也反映出了一定的道理,即意识是人机环境系统交互的产物,目前的机器理论上没有人机环境系统的(主动)交互,所以没有你我他这些参照坐标系,从而很难反映出各种隐含着稳定和连续意义的某种秩序。笔者曾经和一位有名的摄影家交流,他曾不无深意地给摄影人说过十句话:1.照片拍得不够好,是因为你离生活还不够近。2.用眼睛捕捉的镜头只能称照片,用心灵捕捉的镜头才能叫艺术。3.我所表达的都是真实的自我,是真正出于我的内心。4.有时候最简单的照片是最困难的。5.只有好照片,没有好照片的准则。6.摄影师必须是照片的一部分。7.我觉得影子比物体本身更吸引我。8.名著、音乐、绘画都给我很多灵感和启发。9.我不喜欢把摄影当作镜子只反映事实,所以在表达上留有想象空间。10.我一生都在等待光与景物的交织,然后让魔法在相机中产生。这十句话似乎对深度态势感知中的意义建构也同样有意义。
有时可把数据理解或定义为人对刺激的表示或应对,即使是看见一个字,听到一个声等等。没有各种刺激,智能可能无法发育、生长(不是组装),爱因斯坦原话说过:“单词和语言在我的思考工程中似乎不起任何作用。我思索时的物理实体是符号和图像,它们按照我的意愿可以随时地重生和组合。”语言是符号的线性化,语言也限制思维,这些许像人机智能的差异:一种记忆型(类机),一种模糊型(类人),人的优点在于可以更大范围、更大尺度(甚至超越语言)的无关相关化,机的局限性恰在于此:有限的相关。如描述一个能在三维空间跟踪定位物体的系统,通过将位置和方向纳入一个目标的属性,系统能够推断出这些三维物体的关系。尽管大数据冗余也可能造成精度干扰或认知过载(信息冗余是大数据时代的自保策略),但在许多应用场合,小数据也应该有很大助益,因为毕竟小数据更加依赖分析的精度,其短板是没有大数据的信息冗余作为补偿。
(二)再谈深度态势感知
从某种意义上讲,深度态势感知是为完成主题任务在特定环境下组织系统充分运用各种人的认知活动的综合体现,如目的、感觉、注意、动因、预测、自动性、运动技能、计划、模式识别、决策、动机、经验及知识的提取、存储、执行、反馈等。既能够在信息、资源不足情境下运转,也能够在信息、资源超载情境下作用。
通过实验模拟和现场调查分析,我们认为深度态势感知系统中存在着“跳蛙”现象(自动反应),即从信息输入阶段直接进入输出控制阶段(跳过了信息处理整合阶段),这主要是由于任务主题的明确、组织/个体注意力的集中和长期针对性训练的条件习惯反射引起的,如同某个人边嚼口香糖边聊天边打伞边走路一样可以无意识地协调各种自然活动的秩序,该系统进行的是近乎完美的自动控制,而不是有意识的规则条件反应。这与《意识探秘》一书中说的当学会一件事物时,有意识的参与反而会影响效率的说法不谋而合。与普通态势感知系统相比,它们信息的采样会更离散一些,尤其是在感知各种刺激后的信息过滤中,表现了较强的“去伪存真、去粗取精”的能力。信息“过滤器”的基本功能是让指定的信号能比较顺利地通过,而对其他的信号起衰减作用,利用它可以突出有用的信号,抑制/衰减干扰、噪声信号,达到提高信噪比或选择的目的。对于每个刺激客体而言,既包括有用的信息特征,又包括冗余的其它特征,而深度态势感知系统具备了准确把握刺激客体的关键信息特征的能力(可以理解为“由小见大、窥斑知豹”的能力),所以能够形成阶跃式人工智能的快速搜索比对提炼和运筹学的优化修剪规划预测的认知能力,可以做到执行主题任务自动迅速。对于普通态势感知系统来说,由于没有形成深度态势感知系统所具备的认知反应能力,所以觉察到的刺激客体中不但包括有用的信息特征,又包括冗余的其它特征,所以信息采样量大,信息融合慢,预测规划迟缓,执行力弱。
在有时间、任务压力的情境下,“经验丰富”的深度态势感知系统常常是基于离散的经验性思维图式/脚本认知决策活动(而不是基于评估),这些图式/脚本认知活动是形成自动性模式(即不需要每一步都进行分析)的基础。事实上,它们是基于以前的经验积累进行反应和行动,而不是通过常规统计概率的方法进行决策选择(基本认知决策中的情境评估是基于图式和脚本的。图式是一类概念或事件的描述,是形成长期记忆组织的基础。“Top-Down”信息控制处理过程中,被感知事件的信息可按照最匹配的存在思维图式进行映射,而在“Bottom-Up”信息自动处理过程中,根据被感知事件激起的思维图式调整不一致的匹配,或通过积极的搜索匹配最新变化的思维图式结构)。
另一方面,深度态势感知系统有时也要被迫对一些变化了的任务情境做有意识的分析决策(自动性模式已不能保证准确操作的精度要求),但深度态势感知系统很少把注意转移到非主题或背景因素上,这将会让它的“分心”。这种现象也许与复杂的训练规则有关,因为在规则中普通态势感知系统被要求依程序执行,而规则程序设定了触发其情境认知的阈值(即遇到规定的信息被激或),而实际上,动态的情境常常会使阈值发生变化;对此,深度态势感知系统通过大量的实践和训练经验,形成了一种内隐的动态触发情境认知阈值。即遇到对自己有用的关键信息特征就被激活,而不是规定的。
一个“Top-Down”处理过程提取信息依赖于(至少受其影响)对事物特性的以前认识;一个“Bottom-Up”处理过程提取信息只与当前的刺激有关。所以,任何涉及对一个事物识别的过程都是“Top-Down”处理过程,即对于该事物已知信息的组织过程。“Top-Down”处理过程已被证实对深度知觉及视错觉有影响。“Top-Down”与“Bottom-Up”过程是可以并行处理的。
在大多数正常情境下,态势感知系统是按“Top-Down”处理过程达到目标;而在不正常或紧急情境下,态势感知系统则可能会按“Bottom-Up”处理过程达到新的目标。无论如何,深度态势感知系统应在情境中保持主动性的(前摄的,如使用前馈控制策略保持在情境变化的前面)而不是反应性的(如使用反馈控制策略跟上情境的变化),这一点是很重要的。这种主动性的(前摄的)策略可以通过对不正常或紧急情境下的反应训练获得。
在真实的复杂背景下,对深度态势感知系统及技术进行整体、全面的研究,根据人-机-环境系统过程中的信息传递机理,建造精确、可靠的数学模型已成为研究者所追求的目标。人类认知的经验表明:人具有从复杂环境中搜索特定目标,并对特定目标信息选择处理的能力。这种搜索与选择的过程被称为注意力集中(focus attention)。在多批量、多目标、多任务情况下,快速有效地获取所需要的信息是人面临的一大难题。如何将人的认知系统所具有的环境聚焦(environment focus)和自聚焦(self focus)机制应用于多模块深度态势感知技术系统的学习,根据处理任务确定注意机制的输入,使整个深度态势感知系统在注意机制的控制之下有效地完成信息处理任务并形成高效、准确的信息输出,有可能为上述问题的解决提供新的途径。如何建立适度规模的多模块深度态势感知技术系统是首先解决的问题,另外,如何控制系统各功能模块间的整和与协调也是需要解决的一个重要问题。
通过研究,我们是这样看待深度态势感知认知技术问题的:首先深度态势感知过程不是被动地对环境的响应,而是一种主动行为,深度态势感知系统在环境信息的刺激下,通过采集、过滤,改变态势分析策略,从动态的信息流中抽取不变性,在人机环境交互作用下产生近乎知觉的操作或控制;其次,深度态势感知技术中的计算是动态的、非线形的(同认知技术计算相似),通常不需要一次将所有的问题都计算清楚,而是对所需要的信息加以计算;再者,深度态势感知技术中的计算应该是自适应的,指挥控制系统的特性应该随着与外界的交互而变化。因此,深度态势感知技术中的计算应该是外界环境、装备和人的认知感知器共同作用的结果,三者缺一不可。
研究基于人类行为特征的深度态势感知系统技术,即研究在不确定性动态环境中组织的感知及反应能力,对于社会系统中重大事变(战争、自然灾害、金融危机等)的应急指挥和组织系统、复杂工业系统中的故障快速处理、系统重构与修复、复杂坏境中仿人机器人的设计与管理等问题的解决都有着重要的参考价值。
人机融合智能的关键还是“和而不同”的思想
对此,形式化很难做到,包括数学和物理