热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

送你10本机器学习和数据科学必读书(附PDF下载)

在读完本文列出的书单之后,如果你想要更多免费、高质量的书单,可以查看这个系列之前的帖子:这本书介绍了

在读完本文列出的书单之后,如果你想要更多免费、高质量的书单,可以查看这个系列之前的帖子:

https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html

送你10本机器学习和数据科学必读书(附PDF下载)

1. Python Data Science Handbook

链接:

https://github.com/jakevdp/PythonDataScienceHandbook

作者:Jake VanderPlas

这本书介绍了在 Python 中处理数据所需要的基本而重要的库,包括IPython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关的包。该书假定读者对Python语言有一定的了解。如果你需要快速入门Python这门语言,可以查看免费的配套项目:

A Whirlwind Tour of Python:

https://github.com/jakevdp/WhirlwindTourOfPython

它会帮助研究员和科学家快速入门Python。

2. Neural Networks and Deep Learning

链接:

http://neuralnetworksanddeeplearning.com/

作者:Michael Nielsen

Neural Networksand Deep Learning是一本在线书籍。这本书会告诉你:

  • 神经网络是一种优美的仿生编程范例,它使得计算机能够通过观测数据进行学习。

  • 深度学习是一系列强大的技术, 以帮助实现在神经网络中学习。

神经网络和深度学习目前是图像识别、语言识别和自然语言处理等领域的最佳方案。该书同时也会教你神经网络与深度学习的各种核心概念。

3. Think Bayes

链接:

http://greenteapress.com/wp/think-bayes/

作者:Allen B. Downey

Think Bayes是介绍如何通过编程方法进行贝叶斯统计的书籍。

这本书和其他Think X系列书籍的想法一样,他们认为只要你知道如何编程,那么你就可以通过这项技能来学习其他的课题。

大多数的贝叶斯统计书籍会使用数学符号并且通过微积分一类的数学概念来展现其统计思想。这本书则使用Python代码、离散逼近而非数学、连续数学来解释贝叶斯统计。通过这样的方式,在数学书里的积分,将会转变为求和。许多在概率分布上的操作将会通过简单的循环而实现。

4. Machine Learning & Big Data

链接:

http://www.kareemalkaseer.com/books/ml

作者:Kareem Alkaseer

这本书还没写完,我把它添加到表单,你可以稍后才看[H1] 。这个项目的目的在于平衡软件工程师的理论与实践,使他们能轻松地运行机器学习模型而并不需要过分依赖各种各样的库。大多数时候,模型或技术背后的概念是简单而直观的,但却在大量的细节或者术语中被掩盖了。同时,大多数情况下,现有的库能够解决手头的问题,但是他们却被视作一个黑盒子,通常因他们自身的抽象与架构隐藏了背后的基本概念。这本书将阐释这些基本概念。

5. Statistical Learning with Sparsity: 

The Lasso andGeneralizations

链接:

https://web.stanford.edu/~hastie/StatLearnSparsity/

作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright

过去的十年里,计算和信息技术出现了爆炸性增长,同时出现了大量的源自不同领域的数据,例如医疗、生物、金融和市场营销。这本书将在一个通用的概念性框架下来讲解这些领域的重要思想。

6. Statistical inference for data science

链接:

https://leanpub.com/LittleInferenceBook

作者:Brian Caffo

这本书是Coursera数据科学项目(Data Science Specialization)中的统计推断(Statistical Inference)课程配套书籍。但是你并不需要上这门课,因为这本书的大部分内容可以独立使用。这本书其中一个重要的部分是一系列组成Coursera 课程的Youtube视频。这本书的出版诣在提供一个成本低廉的统计推断入门。目标读者是有数学或计算机背景的并且希望在统计和数据科学领域中得以运用的学生。这本书在Github上以markdown文档的形式免费提供。同时也以更便捷的形式(epub,mobi)在LeanPub和零售店提供。

7. Convex Optimization

链接:

http://stanford.edu/~boyd/cvxbook/

作者:Stephen Boyd,Lieven Vandenberghe

这本书是关于凸优化的,即一类数学优化问题,包括最小二乘方和线性规划。众所周知,最小二乘方和线性规划是非常完整的理论,它们有着各式各样的应用,并且可以用数学的方法高效地得出解。这本书的中心即阐述更多的凸优化问题。

8. Natural Language Processing 

with Python

链接:

https://www.nltk.org/book/

作者:Steven Bird,Ewan Klein,Edward Loper

这是一本关于自然语言处理的书。“自然语言”指的是人类日常交流使用的语言,例如英语、印度语和葡萄牙语。相较于数学符号、编程语言等人造语言,自然语言在时代变迁中不断进化,很难通过明确的规则来界定。我们这里定义的是广义上的自然语言处理,本书将会介绍计算机对自然语言各种形式的操作。

这本书基于Python语言,并同时提供名叫Natural Language Toolkit的开放资源库。

9. Automate the Boring Stuff 

with Python

链接:

https://automatetheboringstuff.com/

作者:Al Sweigart

如果你曾花过数小时时间在文件重命名和更新数百个电子表格数据上,那么你知道这些工作有多么枯燥乏味。但如果你能够让电脑可以帮你做这些呢?

这本书里,你会学习如何使用Python来编辑程序,来代替你做需要花几个小时的事情,并且你不需要有编程基础。当你很纯熟地掌握这些编程基础,你将能够使用Python编程毫不费力地实现许多有用并惊艳的自动化特技。

10. Social Media Mining: An Introduction

链接:

http://dmml.asu.edu/smm/

作者:Reza Zafarani, Mohammad Ali Abbasi and Huan Liu

过去十年中,社交媒体颠覆了个体的交流和行业间的经营方式。个体以史无前例的速度通过在社交媒体上交流、分享和消费内容产生大量数据。理解和分析这类新数据来收集可行的模型成为了交叉领域研究、新型算法和 工具 开发所面临的新机遇与新挑战。这本书结合了社交媒体,社交网络分析和数据挖掘,帮助学生、从业者、研究员和项目经理快速、清晰地理解社交媒体挖掘的基础和未来的可能性。

原文标题:

10 More Free Must-Read Books for Machine Learning and Data Science

原文链接:

https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 我们


推荐阅读
  • 探索偶数次幂二项式系数的求和方法及其数学意义 ... [详细]
  • 在List和Set集合中存储Object类型的数据元素 ... [详细]
  • MATLAB字典学习工具箱SPAMS:稀疏与字典学习的详细介绍、配置及应用实例
    SPAMS(Sparse Modeling Software)是一个强大的开源优化工具箱,专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB,提供了丰富的算法和函数,适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例,帮助用户更好地理解和使用这一工具箱。 ... [详细]
  • 本文详细介绍了一种利用 ESP8266 01S 模块构建 Web 服务器的成功实践方案。通过具体的代码示例和详细的步骤说明,帮助读者快速掌握该模块的使用方法。在疫情期间,作者重新审视并研究了这一未被充分利用的模块,最终成功实现了 Web 服务器的功能。本文不仅提供了完整的代码实现,还涵盖了调试过程中遇到的常见问题及其解决方法,为初学者提供了宝贵的参考。 ... [详细]
  • 在Kohana 3框架中,实现最优的即时消息显示方法是许多开发者关注的问题。本文将探讨如何高效、优雅地展示flash消息,包括最佳实践和技术细节,以提升用户体验和代码可维护性。 ... [详细]
  • 本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤,包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践,涵盖节点选择、网络优化和性能调优等方面,旨在提升系统的稳定性和处理能力。此外,还提供了常见的故障排查方法和监控方案,帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]
  • 在Python多进程编程中,`multiprocessing`模块是不可或缺的工具。本文详细探讨了该模块在多进程管理中的核心原理,并通过实际代码示例进行了深入分析。文章不仅总结了常见的多进程编程技巧,还提供了解决常见问题的实用方法,帮助读者更好地理解和应用多进程编程技术。 ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 在对WordPress Duplicator插件0.4.4版本的安全评估中,发现其存在跨站脚本(XSS)攻击漏洞。此漏洞可能被利用进行恶意操作,建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的,使用时需自行承担风险。漏洞编号:HTB23162。 ... [详细]
  • 为了确保iOS应用能够安全地访问网站数据,本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程,可以确保应用始终使用HTTPS协议,从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法,帮助读者快速上手并成功部署SSL证书。 ... [详细]
  • Python 伦理黑客技术:深入探讨后门攻击(第三部分)
    在《Python 伦理黑客技术:深入探讨后门攻击(第三部分)》中,作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流,难以确定消息批次的结束点,这给后门攻击的实现带来了挑战。为了解决这一问题,文章提出了一系列有效的技术方案,包括使用特定的分隔符和长度前缀,以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性,还为安全研究人员提供了宝贵的参考。 ... [详细]
  • Python 程序转换为 EXE 文件:详细解析 .py 脚本打包成独立可执行文件的方法与技巧
    在开发了几个简单的爬虫 Python 程序后,我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标,首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中,我选择了 Qt 作为 GUI 框架,因为之前对此并不熟悉,希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程,包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]
  • Web开发框架概览:Java与JavaScript技术及框架综述
    Web开发涉及服务器端和客户端的协同工作。在服务器端,Java是一种优秀的编程语言,适用于构建各种功能模块,如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示,同时借助JavaScript增强交互性和动态效果。此外,现代Web开发还广泛使用各种框架和库,如Spring Boot、React和Vue.js,以提高开发效率和应用性能。 ... [详细]
  • 为了优化用户体验,本文探讨了如何调整下拉菜单的宽度。通过合理设置宽度,可以提升界面的美观性和易用性。文章提供了具体的代码示例,帮助开发者实现这一目标。例如,可以通过 CSS 或 JavaScript 来动态调整下拉菜单的宽度,确保其在不同设备和屏幕尺寸上都能保持良好的显示效果。 ... [详细]
author-avatar
欢姨oi
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有