当前位置: 开发笔记 > 编程语言 > 正文

「Smile」一下，轻松用Java玩转机器学习

作者：wodewodewoe | 来源：互联网 | 2023-08-17 20:50

金磊发自凹非寺量子位报道|公众号QbitAISmile，如其名，会是一个让你「笑着用」的好工具。它的全名叫做StatisticalMachineInte

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

Smile&＃xff0c;如其名&＃xff0c;会是一个让你「笑着用」的好工具。

它的全名叫做 Statistical Machine Intelligence and Learning Engine&＃xff0c;是一个快速、全面的机器学习系统。

试问有多全&＃xff1f;可以说是「方方面面」。

机器学习方面&＃xff0c;例如分类、回归、聚类、关联规则挖掘、特征选取、流形学习、多维尺度分析、遗传算法、最邻近搜索等等。

当然还有像数据可视化、数理统计等其他任务也是 hold 得住。

还体现在语言方面&＃xff0c;例如 Java、Scala、Kotlin 和 Clojure 都可以轻松驾驭。

而且&＃xff0c;还可以在线试用&＃xff01;

几行代码就能用起来

一个工具好不好&＃xff0c;「易用性」很关键。

先来看下 Smile 用起来有多方便。

以「随机森林」为例&＃xff0c;Java 代码如下&＃xff1a;

Scala、Kotlin 的代码分别是&＃xff1a;

简单定义、调用即可&＃xff0c;确实挺方便。

Smile 提供了数百种高级算法&＃xff0c;并且界面十分简洁。其中&＃xff0c;Scala API 还提供了高级运算符&＃xff0c;可以轻松构建机器学习应用。

全面的机器学习

说到 Smile 的「全面性」&＃xff0c;先来看下它在机器学习上都能做些啥。

分类&＃xff1a;支持向量机、决策树、AdaBoost、随机森林、梯度提升、神经网络、最大熵分类器&＃xff0c;KNN&＃xff0c;朴素贝叶斯&＃xff0c;fisher/线性/二次/正则判别分析等。
回归&＃xff1a;支持向量回归、高斯过程、回归树、梯度提升、随机森林、RBF 网络、OLS、LASSO、ElasticNet、岭回归等。
特征选择&＃xff1a;基于遗传算法的特征选择、基于集成学习的特征选择、树形图、信噪比等。
聚类&＃xff1a;BIRCH,、CLARANS、 DBSCAN、DENCLUE、Neural Gas、K-Means、X-Means等。
关联规则和频繁项集挖掘&＃xff1a;FP-growth 挖掘算法。
流形学习&＃xff1a;IsoMap、LLE、Laplacian 特征映射、t-SNE、UMAP、PCA、核 PCA、概率 PCA。
多维缩放&＃xff1a;经典 MDS、等渗 MDS、Sammon 映射。
最近邻搜索&＃xff1a;BK树、Cover树、kd树、SimHash、LSH。
序列学习&＃xff1a;隐马尔可夫模型&＃xff0c;条件随机域。
自然语言处理&＃xff1a;分句器和分词器、Bigram 统计测试、短语提取器、关键词提取器、词性标注器、相关性排序。

由于排版问题&＃xff0c;有一些能够实现的机器学习方法还没有列完。

但从上面列举的方法中可以看出&＃xff0c;Smile 能够处理的机器学习方法还是较为全面。

数学、统计和可视化

Smile 还提供先进的数值计算环境&＃xff1a;从特殊函数、线性代数&＃xff0c;到随机数发生器、统计分布和假设检验。

另外&＃xff0c;还实现了图形、波形和各种插值算法。

除此之外&＃xff0c;还能够实现数据可视化。

例如散点图、直线图、阶梯图、条形图、箱形图、热力图等等。

Java or Python&＃xff1f;

虽然 Smile 工具好用是好用&＃xff0c;但在 Reddit 上还是激起了一番争议。

矛盾点还是语言之间的较量。

拥护Python的选手便说&＃xff1a;

如果没有Python API&＃xff0c;你不可能在这个社区&＃xff08;实现&＃xff09;太多能力。

还有对Java语言的「嘲讽」&＃xff1a;

你说Scala、Kotlin 和 Clojure&＃xff0c;你只是换了不同的方式说Java而已。

但 Smile 也官网上强有力的做出了「回应」&＃xff1a;

Smile 性能比R、Python好。

那么&＃xff0c;你看好这款Smile工具吗?

参考链接&＃xff1a;
http://haifengl.github.io/

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容&＃xff0c;未经账号授权&＃xff0c;禁止随意转载。

每天5分钟&＃xff0c;抓住行业发展机遇

如何关注、学习、用好人工智能&＃xff1f;

每个工作日&＃xff0c;量子位AI内参精选全球科技和研究最新动态&＃xff0c;汇总新技术、新产品和新应用&＃xff0c;梳理当日最热行业趋势和政策&＃xff0c;搜索有价值的论文、教程、研究等。

同时&＃xff0c;AI内参群为大家提供了交流和分享的平台&＃xff0c;更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅&＃xff1a;

加入AI社群&＃xff0c;与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

推荐阅读

int
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
ip
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
ip
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
python
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
ip
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
python
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
int
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
int
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
python
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
int
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
int
概论组合最优化问题、计算复杂性和启发式算法概念（现代优化计算方法）

1.组合最优化问题定义：是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述：最优化问题的数学模型的一般描述是，x为决策 ... [详细]

蜡笔小新 2023-10-17 18:23:43
python
python可以做什么工作好Python入门后，想要从事自由职业可以做哪方面工作？

Python入门后，想要从事自由职业可以做哪方面工作？1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ... [详细]

蜡笔小新 2023-10-17 16:29:09
python
支持向量机训练集多少个_25道题检测你对支持向量机算法的掌握程度

介绍在我们学习机器算法的时候，可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库。你可以使用各种各样的兵器，但你要明白这些兵器是需要在合适的时间合理 ... [详细]

蜡笔小新 2023-10-17 16:21:13
python
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58