既然使用神经网络也可以解决分类问题，那SVM、决策树这些算法还有什么意义呢？...

作者：玩偶0-0 | 来源：互联网 | 2023-09-05 04:57

来源：Jerry的算法和NLPJerry的算法和NLP先说下结论：没有一个模型是万能的，需要根据数据选择适合的模型。在机器学习中ÿ

640?wx_fmt&＃61;jpeg

来源&＃xff1a;Jerry的算法和NLP

Jerry的算法和NLP

先说下结论&＃xff1a;没有一个模型是万能的&＃xff0c;需要根据数据选择适合的模型。

在机器学习中&＃xff0c;数据大概可以分成四大类&＃xff1a;图像 (Image)&＃xff0c;序列(Sequence)&＃xff0c;图(Graph) 和表格(Tabular) 数据。其中&＃xff0c;前3类数据有比较明显的模式&＃xff0c;比如图像和图的空间局部性&＃xff0c;序列的上下文关系和时序依赖等。而表格数据常见于各种工业界的任务&＃xff0c;如广告点击率预测&＃xff0c;推荐系统等。在表格数据中&＃xff0c;每个特征表示一个属性&＃xff0c;如性别&＃xff0c;价格等等&＃xff0c;特征之间一般没有明显且通用的模式。

神经网络适合的是前三类数据&＃xff0c;也就是有明显模式的数据。因为我们可以根据数据的模式&＃xff0c;设计对应的网络结构&＃xff0c;从而高效地自动抽取“高级”的特征表达。如常见的 CNN (卷积神经网络) 就是为图像而设计的&＃xff0c;RNN (循环神经网络) 为序列数据而设计的。而表格数据&＃xff0c;因没有明显的模式&＃xff0c;非要用神经网络的话&＃xff0c;就只能用低效的全连接网络&＃xff0c;一般效果都不太好。在实践中&＃xff0c;对于表格数据&＃xff0c;除了专门对特定任务设计的网络结构如DeepFM等&＃xff0c;更多时候还是用传统机器学习模型。尤其是 GBDT (梯度提升树)&＃xff0c;因其自动的特征选择能力及动态的模型复杂度&＃xff0c;算得上是一个万金油模型&＃xff0c;在各种类型的表格数据上都表现很好。但对于表格数据而言&＃xff0c;其实特征工程才是更关键的。在给定数据的情况下&＃xff0c;模型决定了下限&＃xff0c;特征决定了上限。特征工程类似于神经网络的结构设计&＃xff0c;目的是把先验知识融入数据&＃xff0c;并且让模型更好地理解数据&＃xff0c;让模型可以学得更好。

另外&＃xff0c;神经网络实质上不算是一个模型&＃xff0c;而是一类可以自由“搭积木”的模型。结构不同的神经网络可以认为是不同的模型了。

总结下&＃xff0c;no free lunch&＃xff0c;没有一个万能的模型&＃xff0c;可以直接用于各种数据。有多少人工就有多少智能&＃xff1a;用神经网络的话&＃xff0c;你需要结构设计&＃xff1b;而用传统模型的话&＃xff0c;你需要特征工程。

首先说大家熟悉的监督学习任务&＃xff0c;比如分类和回归。

神经网络的优势要在数据量很大&＃xff0c;计算力很强的时候才能体现&＃xff0c;数据量小的话&＃xff0c;很多任务上的表现都不是很好。

SVM属于非参数方法&＃xff0c;拥有很强的理论基础和统计保障。损失函数拥有全局最优解&＃xff0c;而且当数据量不大的时候&＃xff0c;收敛速度很快&＃xff0c;超参数即便需要调整&＃xff0c;但也有具体的含义&＃xff0c;比如高斯kernel的大小可以理解为数据点之间的中位数距离(Median heuristic)。在神经网络普及之前&＃xff0c;引领了机器学习的主流&＃xff0c;那时候理论和实验都同样重要。

决策树也是非参数方法之一。我的经验告诉我&＃xff0c;很多时候随机森林要比SVM要好&＃xff0c;而且森林的训练时间可以很短&＃xff0c;但感觉超参数调节上不是很intuitive&＃xff0c;几棵树&＃xff1f;收敛条件&＃xff1f;都需要一个个试。

神秘网络拥有很多局部最优&＃xff0c;而且理论上过拟合很容易&＃xff0c;但各种tricks神奇的避免了这些理论弊端&＃xff0c;但很多时候人们并不清楚它的工作和训练原理&＃xff0c;而且泛化能力为什么高(各种竞赛结果)/低(对抗样本)&＃xff0c;也没有解释。在给定计算量下&＃xff0c;神经网络基本上没办法和传统方法比。好在GPU解决了这个弊端。

总之&＃xff0c;当数据量小的时候&＃xff0c;传统方法依靠理论保障(kernel methods)&＃xff0c;或者用先验(贝叶斯方法)来控制解的空间&＃xff0c;通常会有很好的表现。

再说一些光看神经网络还用不到的任务。答主可能也只是问在监督范畴内&＃xff0c;传统方法有什么价值。但我想在更广泛的背景下介绍一下传统方法的意义何在。

一般认为监督式学习是已经解决了的问题&＃xff0c;所以最前沿的理论研究都集中在非监督领域。炼丹在此略过。

非监督学习领域&＃xff0c;虽然神经网络也被用作模型一部分&＃xff0c;但主要还是以方程近似的角色体现。GAN&＃xff0c;Normalizing flow, VAE&＃xff0c;energy-based models... 这些方法还依靠统计理论。比如&＃xff0c;kernel methods加上神经网络可以用于密度估计&＃xff0c;但主要的原理还是建立在传统体系下(max likelihood&＃xff0c;score matching等)&＃xff0c;神经网络只不过是更复杂的kernel超参数而已。

最后提一项神经网络基本不可能用到的任务

假设检验是非常重要的科研工具&＃xff0c;用在很多关键领域上。医学上判断药物是否有作用&＃xff0c;社会学上判断一项政策是否改变了社会参数&＃xff0c;金融上判断两只产品的之间是否有关联&＃xff0c;机器学习上判断两个GAN生成的图片那个更真实…都需要用到假设检验。

大家熟悉的t-test, rank test, K-S test等都只适用于一维数据&＃xff0c;而且数据的收集可能不理想(比如长期监测的病人提前退出测试)&＃xff0c;数据本身并不满足参数性假设(如残差为高斯分布)…

如果要开发一项检验方法&＃xff0c;需要控制Type-1 error&＃xff0c;也就是当H0为真的时候&＃xff0c;错误拒绝H0的概率。这个时候神经网络这个黑箱就成了很大的障碍&＃xff0c;因为没有任何理论基础。而kernel方法依靠深厚的理论基础&＃xff0c;可以在几乎没有任何数据分布假设下&＃xff0c;从数学上给出Type-1 error的保障&＃xff0c;也就可以被用在很多关键领域的检测。同时&＃xff0c;数据收集不理想的时候&＃xff0c;也可以通过一大堆数学推倒来实现这些test。如果有了黑箱&＃xff0c;那基本就相当于把理论给扔了。

640?wx_fmt&＃61;jpeg

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能&＃xff0c;互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括&＃xff1a;建立AI智能系统智商评测体系&＃xff0c;开展世界人工智能智商评测&＃xff1b;开展互联网&＃xff08;城市&＃xff09;云脑研究计划&＃xff0c;构建互联网&＃xff08;城市&＃xff09;云脑技术和企业图谱&＃xff0c;为提升企业&＃xff0c;行业与城市的智能水平服务。

如果您对实验室的研究感兴趣&＃xff0c;欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt&＃61;jpeg

推荐阅读

io
利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口

作者|VincentMühle编译|姗姗出品|人工智能头条（公众号ID：AI_Thinker）【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]

蜡笔小新 2024-10-23 10:50:38
io
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
io
计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述（上篇）

本文介绍了计算机视觉领域的最新进展，特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点，为读者提供了全面的概述。 ... [详细]

蜡笔小新 2024-11-07 12:41:08
version
深入解析 Kubernetes 亲和性调度机制及其优化策略

在 Kubernetes 中，Pod 的调度通常由集群的自动调度策略决定，这些策略主要关注资源充足性和负载均衡。然而，在某些场景下，用户可能需要更精细地控制 Pod 的调度行为，例如将特定的服务（如 GitLab）部署到特定节点上，以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制，并探讨了多种优化策略，帮助用户实现更高效、更灵活的资源管理。 ... [详细]

蜡笔小新 2024-11-05 17:27:07
io
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
uri
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
io
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
uri
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
uri
自然语言处理如何助力人机共鸣

欢迎关注我们微信公众号，可以加入我们QQ人工智能行业交流群626784247.01在当前飞速发展的创新步伐中，科技似乎正在积极地解决人类最紧迫的难 ... [详细]

蜡笔小新 2024-10-17 18:24:20
uri
lightgbm过去版本安装包_集成学习算法LightGBM

LightGBM在Kaggle，KDD等各类数据竞赛中，无论是分类问题还是回归问题亦或是排序问题，以GBDT（分类回归决策树 ... [详细]

蜡笔小新 2024-10-16 20:53:55
python
高清图解：神经网络、机器学习、数据科学一网打尽

|导|读BY：AI-Beetle完全图解人工智能、NLP、机器学习、深度学习、大数据！这份备忘单涵盖了上述领域几乎全部的知识点，并使用信息图、脑图等多种可视化方式呈现，设计精美，实 ... [详细]

蜡笔小新 2024-10-09 13:33:56
python
中国安全防护服务运营分析：视频监控维护服务的未来走向与发展潜力

本文探讨了视频监控运维服务在中国的发展趋势与潜力。近年来，随着对安全防护需求的不断增加，视频监控系统作为高效、直观且准确的防范工具，逐渐受到政府和企业的高度重视。该系统能够实时呈现设防区域的现场情况，为安全管理和应急响应提供了重要支持。未来，随着技术的不断进步和应用场景的拓展，视频监控运维服务有望迎来更加广阔的发展空间。 ... [详细]

蜡笔小新 2024-10-28 11:13:27
python
基于MATLAB的图像相似度分析：余弦相似度算法的实现与应用

本文探讨了利用MATLAB实现图像相似度分析的方法，重点介绍了余弦相似度算法的实现及其在实际应用中的效果。通过实验验证，该方法在图像匹配和检索任务中表现出较高的准确性和效率，为图像处理领域提供了有力的技术支持。 ... [详细]

蜡笔小新 2024-10-27 11:16:36
io
面部识别技术面临关键转折点：伦理与应用的平衡挑战

面部识别技术正面临一个关键的转折点，其伦理与应用之间的平衡问题日益凸显。近日，该技术再次遭遇重大事件。本周二，由90个倡议组织组成的联盟发布了一份联合声明，呼吁全球范围内暂停使用面部识别技术，直到制定出明确的监管框架。这一举措反映了社会各界对隐私保护和技术滥用的担忧，同时也引发了关于如何在保障公共安全和维护个人隐私之间找到合理平衡的广泛讨论。 ... [详细]

蜡笔小新 2024-10-26 21:02:36
io
在\ n \ n \ n \ n之间的文本中修剪图案 - Trim pattern in a text between \n\n\n\n

IamcleaningtextinR.Mytexthastheform我在R中清理文本。我的文字有表格buthecouldnotavoidthesubje ... [详细]

蜡笔小新 2024-10-21 18:22:11

玩偶0-0

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章