热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:降维案例

篇首语:本文由编程笔记#小编为大家整理,主要介绍了降维案例相关的知识,希望对你有一定的参考价值。一、数据集介绍 该案例描述的是一段时间

篇首语:本文由编程笔记#小编为大家整理,主要介绍了降维案例相关的知识,希望对你有一定的参考价值。



一、数据集介绍

 该案例描述的是一段时间内客户的订单,预测用户下一次将会买那些订单。

数据集的信息如下:



  • products.csv  商品信息

  • order_products__prior.csv 订单与商品关系信息

  • orders.csv 订单信息

  • aisles.csv 商品所属的具体类别


1、 products.csv


import pandas as pd
product_df
= pd.read_csv(rI:machine_learnexample_products.csv)
product_df.head(
10)

技术图片

该文件是产品数据,里面的字段有product_id(产品ID),product_name(产品名称),aisle_id(产品类型)等。


2、order_products__prior.csv


order_products__prior_df = pd.read_csv(rI:machine_learnexample_order_products__prior.csv)
order_products__prior_df.head(
10)

技术图片

该文件是产品和订单数据,里面的字段有product_id(产品ID),order_id(订单ID)等。


 3、orders.csv


orders_df = pd.read_csv(rI:machine_learnexample_orders.csv)
orders_df .head(
10)

技术图片

 该文件是订单数据,里面的字段有user_id(用户ID),order_id(订单ID)等。


4、aisles.csv


aisles_df = pd.read_csv(rI:machine_learnexample_aisles.csv)
aisles_df .head(
10)

技术图片

 该文件是产品类型数据,里面的字段有aisle_id(产品数据类型ID),aisle(产品类型名称)。


二、预测

现在探究的是用户和物品类型的关系:

技术图片


1、读取四张表


import pandas as pd
from sklearn.depositions import PCA
product_df
= pd.read_csv(rI:machine_learnexample_products.csv)
order_products__prior_df
= pd.read_csv(rI:machine_learnexample_order_products__prior.csv)
orders_df
= pd.read_csv(rI:machine_learnexample_orders.csv)
aisles_df
= pd.read_csv(rI:machine_learnexample_aisles.csv)


2、合并四张表


_mg = pd.merge(order_products__prior_df,product_df,on=[product_id,product_id])
_mg
= pd.merge(_mg,orders_df,on=[order_id,order_id])
_ma
= pd.merge(_mg,aisles_df,on=[aisle_id,aisle_id])
_ma.head(
10) #输出

技术图片

  上面就是用户(user_id)与产品类型(aisle)的关系,但是现在需要统计的每一个用户的产品类型,所以用到交叉表(特殊的分组表)。可以查出每一个用户aisle(产品类型)的个数。


crossTab_df = pd.crosstab(_ma["user_id"],_ma["aisle"])

crossTab_df #输出

技术图片

技术图片


3、主成分分析 


pca = PCA(n_compOnents=0.9)
data
= pca.fit_transform(crossTab_df)
data
#输出

技术图片

可以看看输出的行列:


data.shape
"""
(206209, 27)
"""

 


推荐阅读
  • 如何在mysqlshell命令中执行sql命令行本文介绍MySQL8.0shell子模块Util的两个导入特性importTableimport_table(JS和python版本 ... [详细]
  • 动量|收益率_基于MT策略的实战分析
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了基于MT策略的实战分析相关的知识,希望对你有一定的参考价值。基于MT策略的实战分析 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • Metasploit攻击渗透实践
    本文介绍了Metasploit攻击渗透实践的内容和要求,包括主动攻击、针对浏览器和客户端的攻击,以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码,以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 本文讨论了如何使用GStreamer来删除H264格式视频文件中的中间部分,而不需要进行重编码。作者提出了使用gst_element_seek(...)函数来实现这个目标的思路,并提到遇到了一个解决不了的BUG。文章还列举了8个解决方案,希望能够得到更好的思路。 ... [详细]
  • 本文讨论了在dva中引入antd组件table时没有显示样式的问题。提供了.roadhogrc文件的配置,包括环境和import的设置。同时介绍了extraBabelPlugins和transform-runtime的使用方法,并解释了libraryName和css的含义。 ... [详细]
  • 本文介绍了使用readlink命令获取文件的完整路径的简单方法,并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
  • 关于如何快速定义自己的数据集,可以参考我的前一篇文章PyTorch中快速加载自定义数据(入门)_晨曦473的博客-CSDN博客刚开始学习P ... [详细]
  • LaTeX使用XeLaTeX入门基础(一)
    主机平台:GentooLinux11.2内核版本:LinuxKernel3.2.1编译环境:XeTeX3.1415926-2.3-0. ... [详细]
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
author-avatar
崔佳丽童鞋
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有