热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PythonLatentDirichletAllocation拟合问题

Problemspic我正在尝

Problems pic

我正在尝试使用LDA,但是当我运行LDA时在python中发生了一些问题.LDA.fit(doc_term_matrix)问题

import numpy as np
import pandas as pd
import os
reviews_datasets = pd.read_csv("Reviews.csv")
reviews_datasets = reviews_datasets.head(20000)
reviews_datasets.dropna()
from sklearn.feature_extraction.text import CountVectorizer
count_vect = CountVectorizer(max_df=0.8,min_df=2,stop_words='english')
doc_term_matrix = count_vect.fit_transform(reviews_datasets['Text'].values.astype('U'))
from sklearn.decomposition import LatentDirichletallocation
LDA = LatentDirichletallocation(n_compOnents=5,random_state=42)
LDA.fit(doc_term_matrix)

我的错误提示

File "",line 1,in
runfile('C:/Users/PC/.spyder-py3/temp.py',wdir='C:/Users/PC/.spyder-py3')
File "C:\Users\PC\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",line 827,in runfile
execfile(filename,namespace)
File "C:\Users\PC\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",line 110,in execfile
exec(compile(f.read(),filename,'exec'),namespace)
File "C:/Users/PC/.spyder-py3/temp.py",line 8,in
reviews_datasets = pd.read_csv("Reviews.csv")
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 702,in parser_f
return _read(filepath_or_buffer,kwds)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 435,in _read
data = parser.read(nrows)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\io\parsers.py",line 1154,in read
df = DataFrame(col_dict,columns=columns,index=index)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\frame.py",line 392,in __init__
mgr = init_dict(data,index,columns,dtype=dtype)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\construction.py",line 212,in init_dict
return arrays_to_mgr(arrays,data_names,line 61,in arrays_to_mgr
return create_block_manager_from_arrays(arrays,arr_names,axes)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1666,in create_block_manager_from_arrays
blocks = form_blocks(arrays,names,line 1754,in form_blocks
object_blocks = _simple_blockify(items_dict['ObjectBlock'],np.object_)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1800,in _simple_blockify
values,placement = _stack_arrays(tuples,dtype)
File "C:\Users\PC\Anaconda3\lib\site-packages\pandas\core\internals\managers.py",line 1863,in _stack_arrays
stacked[i] = _asarray_compat(arr)





推荐阅读
  • Android工程师面试准备及设计模式使用场景
    本文介绍了Android工程师面试准备的经验,包括面试流程和重点准备内容。同时,还介绍了建造者模式的使用场景,以及在Android开发中的具体应用。 ... [详细]
  • IhaveconfiguredanactionforaremotenotificationwhenitarrivestomyiOsapp.Iwanttwodiff ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • Python语法上的区别及注意事项
    本文介绍了Python2x和Python3x在语法上的区别,包括print语句的变化、除法运算结果的不同、raw_input函数的替代、class写法的变化等。同时还介绍了Python脚本的解释程序的指定方法,以及在不同版本的Python中如何执行脚本。对于想要学习Python的人来说,本文提供了一些注意事项和技巧。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 个人学习使用:谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]
  • 本文介绍了UVALive6575题目Odd and Even Zeroes的解法,使用了数位dp和找规律的方法。阶乘的定义和性质被介绍,并给出了一些例子。其中,部分阶乘的尾零个数为奇数,部分为偶数。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • Linux环境变量函数getenv、putenv、setenv和unsetenv详解
    本文详细解释了Linux中的环境变量函数getenv、putenv、setenv和unsetenv的用法和功能。通过使用这些函数,可以获取、设置和删除环境变量的值。同时给出了相应的函数原型、参数说明和返回值。通过示例代码演示了如何使用getenv函数获取环境变量的值,并打印出来。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Imtryingtofigureoutawaytogeneratetorrentfilesfromabucket,usingtheAWSSDKforGo.我正 ... [详细]
author-avatar
落幕YL他
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有