本文将给大家介绍五个十分可怕但还鲜为人知的人工智能/机器学习项目,囊括了一些潜在的机器学习以及人工智能的新想法。它们基本都是Python项目。
1. Live Loss Plot
这是一个由Piotr migdaet al提供的开源Python库,可以在Jupyter Notebook中为Keras、PyTorch和其他框架提供训练损失图像。当使用Keras时,Live Loss Plot是一个简单的回调函数。
2. Magnitude
Magnitude是一个快速、简单的矢量嵌入实用程序库。它是由Plasticity开发的一个功能丰富的Python库和矢量存储文件格式,以快速、高效、简单地进行机器学习模型中的矢量嵌入。它主要是为Gensim提供一个更简单和更快的替代方案,但也可以用作NLP之外的领域的通用密钥矢量存储。repo提供了各种流行的嵌入模型的链接,这些模型已经以量级的格式做好了准备,还包括将任何其他的单词嵌入文件转换成相同格式的指令。
如何导入?
from pymagnitude import *
vectors = Magnitude("/path/to/vectors.magnitude")
Github repo中有更多信息,包括你熟悉的使用这个简化的库来做预先训练的单词嵌入。
3. Yellowbrick
Yellowbrick是以一个“促进机器学习模型选择的可视化分析和诊断工具”。更确切地,Yellowbrick是一套视觉诊断的可视化工具,它扩展了scikit-learn API,以引导人们选择模型。简单地说,Yellowbrick将scikit-learn与matplotlib结合在一起,这是scikit-learn文档的传统优点,但它可以为您的模型生成可视化!
请参阅Github上的示例以及更多详细的文档。
4. Parfit
这个项目来自Jason Carpenter,他是旧金山大学数据科学硕士研究生,同时也是一名机器学习工程师。这个库可以将sklearn机器学习模型的拟合和评分情况并行化和可视化。一旦导入,您可以自由地使用bestFit()或其他函数。
5. textgenrnn
textgenrnn为文本生成任务带来了额外的抽象层,旨在让您“轻松在任何文本数据集上仅用几行代码就训练自己的文本生成神经网络”。
该项目建立在Keras上,并拥有以下功能:
一种新的神经网络架构,利用新技术作为注意力加权和跳跃嵌入来加速训练模型和提高模型质量。
能够在字符级或文字级上训练并生成文本。
能够配置RNN大小,RNN的层数,以及是否使用双向RNN。
能够在任何输入文本文件上进行训练,甚至包括大型文件。
能够在GPU上训练模型,然后用它们来生成含有CPU的文本。
能够在GPU上使用强大的CuDNN实现RNN,与典型的LSTM实现相比,这将大大加快训练时间。
Textgenrnn很容易上手及运行。
6.动手实践工具:
Voice Kit作为一款语音工具,可以连接云服务,如 Google 的 Assistant SDK 或者 Cloud Speech API 均可,也可以使用自身系统,其自身采用的系统很简单,为全球流行的树莓派(Raspberry Pi)。
用户可在此基础上创建虚拟语音助手、为自己的项目添加语音交互功能。Voice Kit 的组成,主要有声音捕捉、回放附件,非常易用的连接器、子板、扬声器、微伺服系统等等。
AIY Vision Kit包括纸板外壳、按钮、扬声器、以及Raspberry Pi Zero WH,Raspberry Pi 相机,SD卡等等。这款酷炫的盒子套件的计算机视觉功能均由附带的Vision Bonnet板控制。
VisionBonnet板是该项目的核心,采用Intel Movidius MA2450芯片。 这种低功率视觉处理单元能够运行神经网络模型来识别物体。