热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

微信流量识别和分析的几个方法

DPI和DFI传统方法•传统的报文检测仅分析IP包的ISO层4以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。•DPI,DeepPacketInspection,深度包检测•基于应





DPIDFI传统方法

•传统的报文检测仅分析IP包的ISO层4以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。 •DPI,Deep Packet Inspection,深度包检测 •基于应用层的流量检测和控制技术 •DFI,Dynamic Flow Inspection,动态流检测 •基于检测数据流基于五元组的到达过程、间隔等特征的检测技术




微信识别方法总括:



•基于人工拨测的bit-level级的DPI检测方法
•基于机器学习的检测方法:Flow-level,Packet-level,Bit-level.


方法一:人工拨测DPI的检测方法



机器学习-样本集选取


•机器学习过程:建立模型和分类。•建立模型:采用训练数据( 样本) 建立分类模型; •分类:基于该模型产生一个分类器对未知数据集进行分类。•建立样本集•人工拨测•自动拨测•DPI,对现网数据深度解析,导出host数据


方法二:Flow-Level分析:


•采用期望最大化算法(EM)来识别不同应用每个连接的网络流量,并采用总包数、上行平均包大小、下行平均包大小、总时延、邻包间隔时延这五个流量统计特征来标示。统计得出微信的五个流量统计特征。•缺点:训练时间较长,可以用以下前置步骤缓解。•改进:利用K-means和DBSCAN的聚类方法来对流量进行初步分类并大致识别微信的五个流量统计特征。这两种方法可以在较短的时间内构造出所需的模型。•缺点:分类的准确度有所下降•这两种方法都要提前指定某些参数的值,当选取不当时,需要较多的实验。

方法三:Packet-level流量分析



方法四:Bit-Level流量分析




微信流量分析思路


•从原始流量中提取有意义的特征属性。因为准确的特征选取是模型构建的基础, 只有选取的特征有效, 才能对网络流量进行有意义的划分, 它们决定了流量分类模型的有效性。
•流量分类模型的构建与有效性。融合各种聚类、分类技术的思想, 综合利用不同算法的优点, 采用两阶段的分析方法: 用聚类的方法进行离线学习, 用分类的方法进行在线分类,使得构建的流量分类与应用识别模型能够在动态变化的网络中进行主动学习, 降低训练时间, 提高其泛化能力。•将人的指导信息引入模型构建过程。人的指导信息有助于分析不同应用的流量特征、选择合适的流量分类算法, 从而进一步提高流量分类模型的有效性。


推荐阅读
  • 投融资周报 | Circle 达成 4 亿美元融资协议,唯一艺术平台 A 轮融资超千万美元 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 【系统架构师精讲】(16):操作系统核心概念——寄存器、内存与缓存机制详解
    在计算机系统架构中,中央处理器(CPU)内部集成了多种高速存储组件,用于临时存储指令、数据和地址。这些组件包括指令寄存器(IR)、程序计数器(PC)和累加器(ACC)。寄存器作为集成电路中的关键存储单元,由触发器构成,具备极高的读写速度,使得数据传输非常迅速。根据功能不同,寄存器可分为基本寄存器和移位寄存器,各自在数据处理中发挥重要作用。此外,寄存器与内存和缓存机制的协同工作,确保了系统的高效运行。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 蓝桥杯算法实战:节点选取策略优化分析
    本文针对蓝桥杯算法竞赛中的节点选取策略进行了深入分析与优化。通过对比不同节点选择方法的效果,提出了基于贪心算法和动态规划的综合优化方案,旨在提高算法效率和准确性。实验结果表明,该优化策略在处理大规模数据集时表现出色,显著提升了算法性能。 ... [详细]
  • 本文介绍了UUID(通用唯一标识符)的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符,广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID,并提供了多种优化方法,以提高生成效率和兼容性。 ... [详细]
  • HBase Java API 进阶:过滤器详解与应用实例
    本文详细探讨了HBase 1.2.6版本中Java API的高级应用,重点介绍了过滤器的使用方法和实际案例。首先,文章对几种常见的HBase过滤器进行了概述,包括列前缀过滤器(ColumnPrefixFilter)和时间戳过滤器(TimestampsFilter)。此外,还详细讲解了分页过滤器(PageFilter)的实现原理及其在大数据查询中的应用场景。通过具体的代码示例,读者可以更好地理解和掌握这些过滤器的使用技巧,从而提高数据处理的效率和灵活性。 ... [详细]
  • 设计实战 | 10个Kotlin项目深度解析:首页模块开发详解
    设计实战 | 10个Kotlin项目深度解析:首页模块开发详解 ... [详细]
  • 本文源自极分享,详细内容请参阅原文。技术债务如同信用卡负债,随着时间推移,修复成本会越来越高,因此程序员必须对此有深刻认识。此外,团队应致力于培养一种持续维护和优化代码的文化,以减少技术债务的累积。 ... [详细]
  • 深入浅出解读奇异值分解,助你轻松掌握核心概念 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 在洛谷 P1344 的坏牛奶追踪问题中,第一问要求计算最小割,而第二问则需要找到割边数量最少的最小割。通过为每条边附加一个单位权值,可以在求解最小割时优先选择边数较少的方案,从而同时解决两个问题。这种策略不仅简化了问题的求解过程,还确保了结果的最优性。 ... [详细]
  • SRM 553:深入解析供应链管理系统的最新进展与应用本文详细探讨了供应链管理系统(SCM)的最新发展及其在实际应用中的影响。通过对当前技术趋势的分析,文章揭示了 SCM 在提高效率、降低成本和增强透明度方面的关键作用。此外,还介绍了几种创新的 SCM 解决方案,如区块链技术和人工智能的应用,以及这些技术如何帮助企业更好地应对市场变化和挑战。 ... [详细]
  • 本文深入探讨了二叉树路径和问题的算法优化方法。具体而言,给定一棵二叉树,需要找出所有从根节点到叶节点的路径,其中各节点值的总和等于指定的目标值。通过详细分析和优化,提出了一种高效的解决方案,并通过多个样例验证了其有效性和性能。 ... [详细]
author-avatar
表发给上完善
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有