首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 编程语言 > 正文

大数据基础大数据挖掘工具（刘鹏《大数据》课后习题答案）

作者：life-death-swallow_204 | 来源：互联网 | 2023-10-11 18:32

1.简述常用机器学习系统和大数据挖掘工具有哪些。（1）Mahout，ApacheMahout是一个由Java语言实现的开源的可拓展的机器学习算法库。（2）SparkMLli

1.简述常用机器学习系统和大数据挖掘工具有哪些。

　　（1）Mahout，Apache Mahout是一个由Java语言实现的开源的可拓展的机器学习算法库。

　　（2）Spark MLlib,运行在Spark平台上专门为集群上并行运行而设计，内存中更快地实现多次迭代，适用于大规模数据集。

　　（3）其他数据挖掘工具，有SystemML、GraphLab、Parameter Server、Scikit-Learn、Weka、基于R语言的机器学习库、H2O、腾讯大规模主题模型训练系统Peacock与深度学习平台Mariana、百度大规模机器学习框架ELT与机器学习云平台BML、阿里数据挖掘平台DT PAI等。

2.Mahout的适用场合与特点有哪些？

　　Apache Mahout主要运作于MapReduce计算模型上，Mahout具有高吞吐、高并发、高可靠的特点，这就保证了其适合于大规模数据的机器学习。

3.Spark MLlib的适用场合和特点有哪些？

　　Spark MLlib运行在Spark平台上专门为集群上并行运行而设计，适用于大规模数据集。运行时间和计算成本较低，适用于数据挖掘算法。

4.简述SystemML的体系结构。

　　

5.简述Parameter Server的工作原理。

　　基于模型参数数据的抽样方法，把所有机器学习算法抽象为对学习过程中一组模型参数的管理和控制，并提供对大规模场景下大量模型参数的有效管理与访问。

　　

6.简述Scikit-Learn的主要模块。

　　Scikit-Learn是基于Python的机器学习库，建立在Numpy、Scipy和matplotlib基础之上，使用BSD开源许可证，主要模块有分类、回归、聚类、数据降维、模型选择与数据预处理。

7.简述Weka的工作原理。

　　Weka作为一个基于Java的开源数据挖掘平台，实现了大量的机器学习算法，使用GUI界面与数据文件交互并生成可视化的结果，提供了通用API，可以将Weka嵌入应用程序完成特定任务，通过接口，开发者还可加入自行实现的数据挖掘算法。

8.基于R语言的机器学习库有哪些？

　　主要有：

Clever Algorithms For Machine Learning
Machine Learning For Hackers
Machine Learning Task View on CRAN—R语言机器学习包列表，按算法类型分组。
caret—R语言150个机器学习算法的统一接口
SuperLearner and subsemble—该包集合了多种机器学习算法
Introduction to Statistical Learning

9.简述H2O机器学习系统的主要功能。

　　（1）为应用提供快速的机器学习引擎。

　　（2）通过H2O提供的API接口，开发者可以将H2O提供的机器学习服务整合进自己的应用。

　　（3）提供易用的WebUI、R、Python、Scala、Java、JSON和Javascript接口，可连接到HDFS、S３、SQL与NoSQL数据源。

推荐阅读

数组
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
python
我的读书清单（持续更新）

我的读书清单（持续更新）201705311.《一千零一夜》2006（四五年级）2.《中华上下五千年》2008（初一）3.《鲁滨孙漂流记》2008（初二）4.《钢铁是怎样炼成的》20 ... [详细]

蜡笔小新 2024-11-21 13:01:23
default
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
object
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
python
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
format
Java 中的十进制样式 getZeroDigit()方法，示例

Java 中的十进制样式 getZeroDigit()方法，示例 ... [详细]

蜡笔小新 2024-11-21 16:53:03
object
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19
数组
Go从入门到精通系列视频之go编程语言密码学哈希算法（二）

Go从入门到精通系列视频之go编程语言密码学哈希算法（二） ... [详细]

蜡笔小新 2024-11-21 10:55:36
config
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
config
大厂Java研发岗位面试总结与资料分享

本文总结了一次针对大厂Java研发岗位的面试经历，探讨了面试中常见的问题及其背后的原因，并分享了一些实用的面试准备资料。 ... [详细]

蜡笔小新 2024-11-20 19:00:01
config
TCP协议中的可靠传输机制分析

本文深入探讨了TCP协议如何通过滑动窗口和超时重传来确保数据传输的可靠性，同时介绍了流量控制和拥塞控制的基本原理及其在实际网络通信中的应用。 ... [详细]

蜡笔小新 2024-11-21 18:52:07
object
如何使用 org.apache.tinkerpop.gremlin.structure.VertexProperty 的 key 方法

本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法，并提供了多个实际应用的代码示例。通过这些示例，读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]

蜡笔小新 2024-11-21 17:38:10
default
spring boot使用jetty无法启动

spring boot使用jetty无法启动 ... [详细]

蜡笔小新 2024-11-21 10:15:52
python
Python 领跑！2019年2月编程语言排名更新

根据最新的编程语言流行指数（PYPL）排行榜，Python 在2019年2月的份额达到了26.42%，稳坐榜首位置。 ... [详细]

蜡笔小新 2024-11-21 09:18:39
default
Ubuntu 16.04 上 PostgreSQL 的高效安装与配置指南

本文详细介绍了在 Ubuntu 16.04 系统上安装和配置 PostgreSQL 数据库的方法，包括如何设置监听地址、启用密码加密、更改默认用户密码以及调整客户端访问控制。 ... [详细]

蜡笔小新 2024-11-20 22:17:50

life-death-swallow_204

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有