热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PythonLatentDirichletAllocation拟合问题

Problemspic我正在尝

Problems pic

我正在尝试使用LDA,但是当我运行LDA时在python中发生了一些问题.LDA.fit(doc_term_matrix)问题

import numpy as np
import pandas as pd
import os
reviews_datasets = pd.read_csv("Reviews.csv")
reviews_datasets = reviews_datasets.head(20000)
reviews_datasets.dropna()
from sklearn.feature_extraction.text import CountVectorizer
count_vect = CountVectorizer(max_df=0.8,min_df=2,stop_words='english')
doc_term_matrix = count_vect.fit_transform(reviews_datasets['Text'].values.astype('U'))
from sklearn.decomposition import LatentDirichletallocation
LDA = LatentDirichletallocation(n_compOnents=5,random_state=42)
LDA.fit(doc_term_matrix)

我的错误提示

File "",line 1,in
runfile('C:/Users/PC/.spyder-py3/temp.py',wdir='C:/Users/PC/.spyder-py3')
File "C:\Users\PC\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",line 827,in runfile
execfile(filename,namespace)
File "C:\Users\PC\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",line 110,in execfile
exec(compile(f.read(),filename,'exec'),namespace)
File "C:/Users/PC/.spyder-py3/temp.py",line 8,in
reviews_datasets = pd.read_csv("Reviews.csv")
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 702,in parser_f
return _read(filepath_or_buffer,kwds)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 435,in _read
data = parser.read(nrows)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 1154,in read
df = DataFrame(col_dict,columns=columns,index=index)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\frame.py",line 392,in __init__
mgr = init_dict(data,index,columns,dtype=dtype)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\construction.py",line 212,in init_dict
return arrays_to_mgr(arrays,data_names,line 61,in arrays_to_mgr
return create_block_manager_from_arrays(arrays,arr_names,axes)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1666,in create_block_manager_from_arrays
blocks = form_blocks(arrays,names,line 1754,in form_blocks
object_blocks = _simple_blockify(items_dict['ObjectBlock'],np.object_)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1800,in _simple_blockify
values,placement = _stack_arrays(tuples,dtype)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1863,in _stack_arrays
stacked[i] = _asarray_compat(arr)





推荐阅读
  • 在多线程并发环境中,普通变量的操作往往是线程不安全的。本文通过一个简单的例子,展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]
  • 本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例,帮助读者更好地理解和使用Java反射。 ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 本文详细介绍了如何使用 Python 进行主成分分析(PCA),包括数据导入、预处理、模型训练和结果可视化等步骤。通过具体的代码示例,帮助读者理解和应用 PCA 技术。 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • DAO(Data Access Object)模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法,它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]
  • 本文介绍了在 Java 编程中遇到的一个常见错误:对象无法转换为 long 类型,并提供了详细的解决方案。 ... [详细]
  • 原文网址:https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么?2、需求3、解决办法1:使用静态代理4 ... [详细]
  • 如何将Python与Excel高效结合:常用操作技巧解析
    本文深入探讨了如何将Python与Excel高效结合,涵盖了一系列实用的操作技巧。文章内容详尽,步骤清晰,注重细节处理,旨在帮助读者掌握Python与Excel之间的无缝对接方法,提升数据处理效率。 ... [详细]
  • 本指南从零开始介绍Scala编程语言的基础知识,重点讲解了Scala解释器REPL(读取-求值-打印-循环)的使用方法。REPL是Scala开发中的重要工具,能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习,读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]
  • 针对图像分类任务的训练方案进行了优化设计。通过引入PyTorch等深度学习框架,利用其丰富的工具包和模块,如 `torch.nn` 和 `torch.nn.functional`,提升了模型的训练效率和分类准确性。优化方案包括数据预处理、模型架构选择和损失函数的设计等方面,旨在提高图像分类任务的整体性能。 ... [详细]
  • 本文介绍了如何在iOS平台上使用GLSL着色器将YV12格式的视频帧数据转换为RGB格式,并展示了转换后的图像效果。通过详细的技术实现步骤和代码示例,读者可以轻松掌握这一过程,适用于需要进行视频处理的应用开发。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 探索聚类分析中的K-Means与DBSCAN算法及其应用
    聚类分析是一种用于解决样本或特征分类问题的统计分析方法,也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分,适用于球形分布的数据集;而DBSCAN算法则基于密度进行聚类,能够有效识别任意形状的簇,并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析,本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]
author-avatar
落幕YL他
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有