热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

请教:一个关于数据均匀性(波动性,稳定性)的算法

数据1:1460146014603951460146014601460数据2:167468345789365102414481460801比如上术
数据1:1460 1460 1460 395 1460  1460 1460  1460 

数据2:167  468 345 789 365 1024 1448 1460 801

比如上术的一组数据,寻找一种算法,这个算法能检测出数据1具有均匀性(更稳定,波动不大),近乎完美,能检测检测出数据2不具有
均匀性。

请问各位大侠 有没有什么好的算法或者是想法,给小弟分享一下...

15 个解决方案

#1


没有阀值么?怎么算均匀,怎么算不均匀?还是相比较而言?

#2


根据平均值来比较算了啊。。。
先求平均值,然后把所有的元素与其想减,就是差值,把这些差值相加,那个小,就那个稳定。。。

这是比较直观的,当然还要看你的实际问题中,稳定性是怎么度量的。。。。

#3


引用 1 楼 litaoye 的回复:
没有阀值么?怎么算均匀,怎么算不均匀?还是相比较而言?

没有阈值,就是看数据是不是处在同一个级别上,相对而言。

#4


引用 2 楼 asxinyu_usst 的回复:
根据平均值来比较算了啊。。。
先求平均值,然后把所有的元素与其想减,就是差值,把这些差值相加,那个小,就那个稳定。。。

这是比较直观的,当然还要看你的实际问题中,稳定性是怎么度量的。。。。

嗯,这个均值我想过了,貌似不行,实际问题中,就是给一个数据流(没有一个标准数据流与之对比),加入就是:
1460 1460 1460 395 1460  1460 1460  1460 
,那么就判断这串数据均匀不,如果判断是均匀的,就pass掉,否则就进行后续处理。

#5


取差分

#6


引用 5 楼 new_006 的回复:
取差分

差分,楼上的什么意思。。。?

#7


均值,方差, 高阶矩 

#8


瞎说的

我的意思是依次取差分的绝对值,累加到最后,再比较两组数的差分绝对值之和的大小(如果两组数的取值范围不一样可以乘一个比例因子)。

我觉得这样适合这种数据流的处理。

#9


引用 8 楼 new_006 的回复:
瞎说的

我的意思是依次取差分的绝对值,累加到最后,再比较两组数的差分绝对值之和的大小(如果两组数的取值范围不一样可以乘一个比例因子)。

我觉得这样适合这种数据流的处理。

嗯 实际应用中就是给一个数据流而已,不是真正的有俩组数据

#10


引用 7 楼 feathersky 的回复:
均值,方差, 高阶矩

能说明白一点吗 谢谢了

#11


转换到频域分析波动情况
令数据1:1460 1460 1460 395 1460  1460 1460  1460 对应时刻t=1,2,3,4,5,6,...
做FFT变换,得到频谱,如果频谱越靠近0,那么表示波动性越小

#12


求出方差,建议你参考一下《概率论与数理统计》

#13


用彩票中求“散度”的公式就可以了

#14


中奖号码的散度分析

    散度的概念叙述和理解起来都有一定的难度。举例来说,有这样两组号码:3、7、12、18、23、28、31和10、11、14、15、17、23、24,很显然,这两组号码的集中程度差别很大,前者非常分散,而后者的号码相当集中,出现了多个号码集中的区间。

    我们可以引入一个新的指标来度量基本号码的集中程度,那就是基本号码的散度。所谓散度,指的是01~32这32个号码(以北京风采为例),如果是北京体彩,那么就是01~36共36个号码与7个基本号码之差(以结果的绝对值为准)的最小值中的最大的一个。这样说理解起来可能有点费劲,我们不妨来看一个例子。
   

    例16 以北京风采32选7为例
     一组中奖号码:3,7,12,18,23,28,31,我们可以看出,01与这7个号码的差分别为2、6、11、17、22、27、30,最小的差为2;同理,02与这7个基本号码的差中最小为1;03为0;……,32与这7个基本号的差的绝对值最小为1。具体计算过程见下表(表3-40)。可以看出,这32个最小的差中一定会有一个最大的值,在本例中该值为3。所以这组号码的散度为3。具体计算过程如下表。
   

   散度计算表
    基本号码 基本号减中奖号码                 绝对值                                    最小值
   01 -2,-6,-11,-17,-22,-27,-30 2,6,11,17,22,27,30    2
   02 -1,-5,-10,-16,-21,-26,-29 1,5,10,16,21,26,29    1
   03 0,-4,-9,-15,-20,-25,-28 0,4,9,15,20,25,28       0
   04 1,-3,-18,-14,-19,-24,-27 1,3,8,14,19,24,27      1
   05 2,-2,-7,-13,-18,-23,-26 2,2,7,13,18,23,26       2
   06 3,-1,-16,-12,-17,-22,-25 3,1,16,12,17,22,25    1
   07 以下类推 以下类推                                         0
   08 以下类推 以下类推                                         1
   09  2
   10 2
   11 1
   12 0
   13 1
   14 2
   15 3
   16 2
   17 1
   18 0
   19 1
   20 2
   21 2
   22 1
   23 0
   24 1
   25 2
   26 2
   27 1
   28 0
   29 1
   30 1
   31 0
   32 1

    再以10,11,14,15,17,23,24为例:01与这7个号码的差分别为9、10、13、14、16、22、23,最小的差为9;同理02与这7个基本号码的差的最小值为8;03为7;……依此类推,32与这7个基本号的差的绝对值最小为8。这32个号码最小的差中的最大值为9,所以这组号码的散度为9。
   注意,散度的值越大,说明号码的集中程度越高;散度的值越小,说明号码越分散。理论上,散度有最大值和最小值。以北京风采32选7型为例,最小的散度为3,最大的散度为25,但这只是理论上存在,只有两号码才具这个散度:01、02、03、04、05、06、07与26、27、28、29、30、31、32。实际上,散度为5或6的号码是最常同见的,散度大于10的号码很少见。
     各种彩票的散度走势是很有规律的

#15


引用 13 楼 lc2228 的回复:
用彩票中求“散度”的公式就可以了

qiangren

推荐阅读
  • 本文介绍了Paxos的世界中关于复制日志与状态机的概念和重要性。通过存储日志来实现数据的持久化,并通过日志流来记录数据的变化,而不是直接持久化数据本身。这样做的好处是简化了持久化存储的操作,并且方便多机之间的数据同步。 ... [详细]
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
author-avatar
mobiledu2502928311
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有