互联网朝着开放性、异构性、移动性、动态性、并发性的方向发展。数据成为互联网中心的关注点。
信息内容安全:研究利用计算机从包含海量信息并且迅速变化的网络中对特定的安全主题相关信息进行自动获取、识别和分析的技术。根据它所处的网络环境,也称为网络内容安全。
信息内容安全研究不仅具有重要的学术意义,也具有重要的社会意义。
内容安全建立在保密性、完整性、可用性之上。
命名攻击可以分为监视攻击和嗅探攻击。
早期传统网络媒体信息获取的方法的技术的实质,可以统一归属于采用网络交互过程编程重构机制实现网络媒体信息获取。
网络爬虫是在互联网上实施信息获取的主要工具。网络爬虫是一种按照一定的规则,自动抓取互联网信息的程序或者脚本。
一类爬虫是服务于搜索引擎等搜索类应用的网络爬虫。另一类是服务于针对性进行信息收集的应用的网络爬虫。
网络爬虫通常采用分布式机制来保证信息获取的全面性和时效性。
信噪比源于信号处理领域,表示信号强度与背景噪声的差值。
基于帧的音频特征主要有以下几种:
1.MFCC
2.频域能量
3.子带能量比
4.过零比
5.基音频率
常见的基于片段的音频特征主要有以下几种:
1.静音帧频
2.高过零帧频
3.低能量帧频
4.谱通量
5.和谐度
颜色直方图仅仅从某种颜色出现的概率来描述图像的颜色特征。
海量信息内容分析的基本处理环节可以归结为分类和过滤。
任何分类器构建都可以抽象为一个学习的过程,学习可分为监督学习和无监督学习。
线性分类器通过训练集构造一个线性判别函数,在运行过程中根据该判别函数的输出,确定数据类别。
最近邻分类法是图像分类和识别领域比较常用的分类方法,没有复杂的学习过程。
支持向量机是一种监督学习的方法,广泛应用于统计分类以及回归分析中。
信息过滤是大规模内容处理的一种典型操作:从动态的信息流中将满足用户兴趣的信息挑选出来,用户的兴趣一般在较长一段时间内不会改变(静态)。
信息内容过滤的常见应用:
1.Internet搜索结果的过滤
2.用户电子邮件过滤
3.服务器/新闻组过滤
4.浏览器过滤
5.专为未成年人的过滤
6.为客户的过滤
网络舆论检测技术的发展趋势可归为:
1.针对信息源的深入信息采集
2.异构信息的融合分析。
3.非结构的结构化表达
互联网信息的一大特征就是高度的异构化。所谓异构化,指的是互联网信息在编码、数据格式以及结构组成方面都存在巨大的差异。
互联网信息的一大特征就是高度的异构化和非结构化。
高仿真网络信息(论坛、聊天室)深度提取技术
基于语义的海量媒体内容特征快速提取与分类技术
非结构信息自组织聚合表达技术
一方面,异构信息归一化存储是后续各类信息处理工作的根本保障。另一方面,基于海量数据实现网络热点自动发现,更有利于互联网媒体监控人员全面把握互联网舆情分布情况。
内容中心网络通过提供面向内容本身的网络协议,包括以内容为中心的订阅机制和语义主导的命名、路由和缓存策略。
内容信息对象。信息对象是指内容本身,是CCN的关注焦点。
缓存 原则:统一性、民主性、普遍存在的
路由相关攻击可分为分布式拒绝攻击和欺骗攻击。DDoS攻击可分为资源耗尽和时间攻击,欺骗攻击可分为阻塞攻击、劫持攻击和拦截攻击。