当前位置: 开发笔记 > 后端 > 正文

机器学习为什么也可以像人一样认识cang老师

作者：双子座-海_358 | 来源：互联网 | 2023-07-25 15:46

机器学习为什么也可以像人一样认识cang老师随着互联网的高速发展，互联网已经渗透到我们生活的方方面面，我们每天都在网上浏览着大量的数据信息，

机器学习为什么也可以像人一样认识cang老师

随着互联网的高速发展&＃xff0c;互联网已经渗透到我们生活的方方面面&＃xff0c;我们每天都在网上浏览着大量的数据信息&＃xff0c;你几乎可以在任何地方任何地点&＃xff0c;都可以看到任何人拿着手机在信息消费&＃xff0c;互联网进入信息爆炸的时代&＃xff0c;为我们提供着各种类型的信息资讯&＃xff0c;丰富着我们的生活&＃xff0c;但是有利就有弊&＃xff0c;在这些海量信息里面&＃xff0c;充斥着大量的以图片、视频等为载体的色情内容。特别是以内容为载体的快餐式消费的社交软件&＃xff0c;面临这个问题尤其严重&＃xff0c;如:新浪微博&＃xff0c;QQ空间,朋友圈。这也是任何国家为了维护互联网健康发展所不能容忍的&＃xff0c;但是这个问题怎么解决了&＃xff0c;之前由十数家互联网公司组成的“安全联盟”发出招聘&＃xff0c;专门招聘人员&＃xff0c;每天看大量图片和限制级视频&＃xff0c;进行内容分辨&＃xff0c;违法信息进行手动删除&＃xff0c;这一职位的正式名称为“首席淫秽色情鉴定官”&＃xff0c;广大单身狗们&＃xff0c;心里有没有一丝丝的小激动了&＃xff0c;有没有想去试试这一职业的了。而且年薪20多万哦&＃xff01;&＃xff01;&＃xff01;

QQ图片20160326114301

但是人家是有规定的&＃xff0c;必须结婚的&＃xff0c;为什么非要结婚的了&＃xff0c;这个你懂得嘛&＃xff0c;常年看片的人&＃xff0c;一日之内会武功全失&＃xff0c;记忆衰退&＃xff0c;分泌紊乱&＃xff0c;元气大伤&＃xff0c;前列腺肿大&＃xff0c;筋脉逆流&＃xff0c;胡思乱想&＃xff0c;而致走火入魔&＃xff0c;最后&＃xff0c;就没有最后了。

202634.48498679_o

p41906758

这个行业根本就没有广大屌丝意淫的那么好&＃xff0c;真的是伤身又伤神&＃xff0c;不过腾讯就推出了一款万象优图—智能鉴黄服务。有了这款服务&＃xff0c;"鉴黄师"基本可以洗洗睡了。

QQ图片20160326113556

感兴趣的可以去看看&＃xff0c;准确率还行&＃xff0c;但是肯定有漏掉的&＃xff0c;因为机器毕竟不是人。机器没有感情&＃xff0c;没有眼睛&＃xff0c;没有原始的冲动&＃xff0c;他只有一颗冰冷的心&＃xff0c;图像识别技术其实很早之前就有了&＃xff0c;但是一直是科学界一个共同的难题&＃xff0c;识别图片&＃xff0c;现在的技术已经可以做的相当好了&＃xff0c;而且准确度非常高&＃xff0c;但是问题来了&＃xff0c;机器不会和人一样有主观意识判断&＃xff0c;它不会和人一样&＃xff0c;能够在规定的情境下&＃xff0c;规定的环境里&＃xff0c;做出人性的判断&＃xff0c;机器是完全理智性的。有些图片在规定的情境下&＃xff0c;他是允许存在的&＃xff0c;比如

link

这两张图片&＃xff0c;在现实中是完全可以光明正大曝光在公众面前的&＃xff0c;但是机器的结果了

QQ图片20160326121659

判断标准&＃xff0c;机器识别出来这两张图片露点了&＃xff0c;直接定为色情&＃xff0c;所以机器要像人一样能够做出这种人类思维的判断&＃xff0c;可能还需要人工智能更近一步的发展&＃xff0c;也有可能还需要几代科学家艰苦卓绝的不懈努力。但是人有时凭主观判定也不一定能服众&＃xff0c;央视&＃xff0c;那个很大的电视台&＃xff0c;就给打上马赛克了。人判断尚且如此&＃xff0c;更何况机器了。

再看一张图&＃xff0c;这是我们德艺双馨的苍老师。岛国最佳女主角。

u&＃61;2962204351,517088140&fm&＃61;21&gp&＃61;0

那机器是怎么识别的了&＃xff0c;看图

QQ图片20160326122613

这次机器识别还是挺准确的&＃xff0c;没有归为色情。性感概率很高。所以苍老师穿衣服的照片在网站是可以搜索到非常多的&＃xff0c;并不是违法信息&＃xff0c;另外一个&＃xff0c;咱们苍老师还是很有德的嘛&＃xff0c;说她德艺双馨我们是有根据的嘛。“钓鱼岛是中国的”&＃xff0c;小编都有一丝丝感动了。

060828381f30e924a269a8b54c086e061c95f760

那有的人可能会说了&＃xff0c;那你说露点就定为色情&＃xff0c;那广大女性的男神们&＃xff0c;每天网上各种秀肌肉&＃xff0c;会不会被屏蔽了&＃xff0c;来看下。

1423880611339

看下机器的结果&＃xff1a;

QQ图片20160326124324

妹纸们&＃xff0c;你们可以放心了&＃xff0c;你们的男神是不会抛弃你们的。

大家知道&＃xff0c;很多艺术作品是画人体的&＃xff0c;欣赏者是怀着艺术的眼光去欣赏的&＃xff0c;那艺术作品机器识别是什么效果了&＃xff1f;

看这幅---《沉睡的维纳斯》

link

机器识别的效果是&＃xff1a;

link (3)

再来看一张&＃xff0c;也是著名的油画--《熟睡中的保险顾问》&＃xff1a;

link (2)

机器识别的效果是&＃xff1a;

link (4)

好吧&＃xff0c;终于知道胖子和瘦子的区别了&＃xff0c;连机器都鄙视了&＃xff0c;广大胖妹纸们&＃xff0c;坚持住。

20150603212731_UkrPh

机器学习究竟是怎么识别图片的&＃xff1f;

前面举了那么多例子&＃xff0c;可以看出机器在绝大部分时候是可以正确识别图片的&＃xff0c;那机器到底是怎么做到的了&＃xff1f;

首先&＃xff0c;识色&＃xff0c;也就是识别皮肤的颜色&＃xff0c;研究者发现虽然不同肤色的人在光线明暗不同环境下拍出来的皮肤颜色不尽相同&＃xff0c;但是画面里人体皮肤的颜色总是在一定的范围内。任何一张图片里的任何一个点都包括亮度值、色相值、饱和度值&＃xff0c;通过这三个值的大小的范围&＃xff0c;电脑就能看出我们皮肤的颜色&＃xff0c;进而猜测出图片里裸露的人体皮肤区域。那些色图与正常图片最主要的区别就是裸露的人体皮肤区域会比较大&＃xff0c;这时整张图片就会偏黄&＃xff0c;另外&＃xff0c;研究人员还发现暴露的区域图片一般纹理值比较小&＃xff0c;颜色比较平滑&＃xff0c;这也可以作为判断人体皮肤的依据之一。

我们还是请出我们德艺双馨的苍老师。

4K_F3E4%OZK(6[A&＃96;WY}HG~I

上面左边是电脑自动识别出图片里的人体皮肤区域&＃xff0c;可以看到机器识别出了裸露的皮肤。

接着&＃xff0c;机器识别出来裸露的皮肤后&＃xff0c;并不能确认图片有没有涉黄&＃xff0c;这就需要对皮肤进行连通区域分析&＃xff0c;比如确认人体“三点”的位置&＃xff0c;

TPR{R}B[}U7RSTQ[9F]OJ[4

&＃xff08;图片来自原研究&＃xff09;

假设两块黄色区域分别是两条腿或两只胳膊&＃xff0c;另外一块区域是人的身体&＃xff0c;这些区域的长度值、宽度值必须符合人体的大小比例&＃xff0c;之间的位置必须满足一定的几何关系&＃xff0c;这些都可以依靠电脑的计算得出“三点”的位置。如果这些区域之间大小和位置不像是人的身体&＃xff0c;就可以排除掉色情图片的嫌疑了。反之就可以认定这张图片涉黄了。但是各种图片拍摄都是不同的&＃xff0c;所处环境&＃xff0c;曝光度都有差异&＃xff0c;这时识别时就会出现误差。

G1GN0HNLJ%FS(MS}&＃64;I8SL2K

这张图片&＃xff0c;机器识别的时候&＃xff0c;苍老师已经近乎毁容&＃xff0c;也没有正确的识别出裸露皮肤的正确位置&＃xff0c;这种情况&＃xff0c;就会给机器造成干扰&＃xff0c;从而无法正确判断出图片是否涉黄&＃xff0c;于是研究人员又发明了一种“小波分析”的技术&＃xff0c;“小波”&＃xff0c;请不要过多联想&＃xff0c;“小波”就是小的波形。所谓“小”是指它具有衰减性&＃xff1b;而称之为“波”则是指它的波动性&＃xff0c;其振幅正负相间的震荡形式&＃xff0c;这种技术可以把色情图片里的人体轮廓提取出来。

Y2WXX$T~3{DO5UTM$URFJ09

最后&＃xff0c;通过小波分析&＃xff0c;可以检测出上面图片中红色的圈为人脸的区域&＃xff0c;这样根据人脸&＃xff0c;在按照人体的大小比例&＃xff0c;可以推算出躯干的位置以及大小&＃xff0c;那么人体的躯干应该是在绿色区域以内&＃xff0c;所以我们不必费力去检测绿框以外的部分。而内部的区域检测出的肤色区域很小&＃xff0c;因此&＃xff0c;这是一张正常图片。

上述三步的阈值&＃xff0c;比如人体的大小比例&＃xff0c;连通区域分析&＃xff0c;识色&＃xff0c;这些值都是我们凭经验而定&＃xff0c;我们可能把人体的大小比例定为1:0.618&＃xff0c;但是这个比例称为黄金比例&＃xff0c;是最能引起人的美感的比例&＃xff0c;但是绝大多数人&＃xff0c;并不是这个比例&＃xff0c;如果凭经验而定往往不科学&＃xff0c;因此最终的第四步就是对机器学习进行训练&＃xff0c;比如SVM、决策树或者贝叶斯分类器。

我们之前已经讲过&＃xff0c;机器学习是需要测试数据来训练的&＃xff0c;这样机器学习才会不断的自我进化和不断的自我校正&＃xff0c;从而提高识别的准确度&＃xff0c;从上图可以看出&＃xff0c;我们拿了大量的训练样本&＃xff0c;不断的提取图像的相关特征&＃xff0c;从而不断优化模型&＃xff0c;最后将图片进行分类&＃xff08;正常&＃xff0c;性感&＃xff0c;色情&＃xff09;&＃xff0c;这样我们拿张待识别的样本丢给机器&＃xff0c;这时机器就会通过模型学习&＃xff0c;分类器&＃xff0c;对图片进行判断&＃xff0c;如果涉黄&＃xff0c;就会进行相应的处理&＃xff0c;比如删除该图片。

机器学习是怎么识别限制级视频的&＃xff1f;

你以为机器学习只能识别图片吗&＃xff1f;那你错了&＃xff0c;研究人员提出一种方法,为了可以辨别视频是否是违法限制类型的视频,可以从视频的声音入手,色情视频的特点就是有很多“嗯嗯啊啊”的声音片段&＃xff0c;这些你懂得,于是研究人员收集了很多“声优”的声音片段,提供给给机器学习进行训练,我们知道训练的视频越多,机器学习的判断会越准确,因为机器学习会不断的进化,我们可以想象研究人员一定从某个地方下载了大量的限制级视频&＃xff0c;不管什么类型,应该是应有尽有的,工作累了,随时可以看看这些视频,想想也是挺幸福,研究人员然后分析这些声音的特点,从中提取出来了几十项参数,如果被测试的视频里面的声音片段的参数和收集的声音片段很接近,那么可以算出这段视频“限制级”的概率&＃xff0c;如果概率越大&＃xff0c;就基本可以判断食品是否属于限制级了&＃xff0c;就可以对视频就行相应的处理,否则就是正常的视频。

在这里小编也要奉劝大家一句,少发布和传播这些违法信息,净化网络空间是我们每个网民的责任,未成年需要一个干净的网络环境促进身心发展&＃xff0c;净化网络,匹夫有责。

对于偏爱这些的,小编也奉劝一句:小撸怡情,大撸伤身,强撸灰飞烟灭。

20150708095716732_325x180

结束语

我们可以看到,机器已经越来越智能,越来越普及,他已经渗透到我们的生活的方方面面,影响着我们的生活,在不久的将来,机器会代替人类做越来越多的工作&＃xff0c;分担人类的劳动,人工智能将会彻底改变我们这个世界,虽然目前还有很多路要走,但是我们有理由相信,也必须相信,以后的世界是智能的世界。

以上言论,如有错误之处,欢迎交流,本文属于图灵人原创文章&＃xff0c;转载必须说明出处&＃xff0c;并请附上(图灵人)及本页链接。原文链接:http://www.tulingr.com/?p&＃61;1242&preview&＃61;true

推荐阅读

http
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
ci
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
http
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
ci
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
爬虫
Google 实验框架优化：实现更高效、更精准、更快速的测试

为了评估精心优化的模型与策略在实际环境中的表现，Google对其实验框架进行了全面升级，旨在实现更高效、更精准和更快速的在线测试。新的框架支持更多的实验场景，提供更好的数据洞察，并显著缩短了实验周期，从而加速产品迭代和优化过程。 ... [详细]

蜡笔小新 2024-11-04 21:02:34
ci
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
http
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
http
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
http
Android 自定义加载对话框 CustomProgressDialog

本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog，包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]

蜡笔小新 2024-11-12 21:51:00
port
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
port
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
ci
AI TIME联合2021世界人工智能大会，共探图神经网络与认知智能前沿话题

AI TIME携手2021世界人工智能大会，共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来，WAIC已成为全球AI领域的年度盛会，吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]

蜡笔小新 2024-10-29 11:34:09
asp.net
scikitlearn学习之SVM算法

分隔超平面：将数据集分割开来的直线叫做分隔超平面。超平面：如果数据集是N维的，那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面，也就是分类的决策边界。间隔：一个点 ... [详细]

蜡笔小新 2024-10-14 22:47:51
asp.net
山东大学机器学习复习

这是我在复习时整理的笔记，过一遍就稳了，建议还是把PPT过一遍，老师考的都是基础题，大部分都在PPT上，特别是 ... [详细]

蜡笔小新 2024-10-11 22:31:15
asp.net
圣诞节到了，智能菌想送你一份礼物

关注网易智能，聚焦AI大事件，读懂下一个大时代！（机器学习算法地图见文末）圣诞节的赠书活动来了！ ... [详细]

蜡笔小新 2024-09-29 11:06:55

双子座-海_358

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章