pyspark行转列、列转行或宽表转窄表、窄表转宽表

作者：mobiledu2502872733 | 来源：互联网 | 2023-09-07 08:10

列转行（宽表转窄表）frompyspark.sqlimportfunctionsasFdefunpivot(df,keys):#参数说明dfdatafr

列转行&＃xff08;宽表转窄表&＃xff09;

from pyspark.sql import functions as Fdef unpivot(df, keys):# 参数说明 df dataframe keys 待转换表中需要保留的主键key&＃xff0c;以list[]类型传入# 转换是为了避免字段类不匹配&＃xff0c;统一将数据转换为string类型&＃xff0c;如果保证数据类型完全一致&＃xff0c;可以省略该句df &＃61; df.select(*[F.col(_).astype("string") for _ in df.columns])cols &＃61; [_ for _ in df.columns if _ not in keys]stack_str &＃61; &＃39;,&＃39;.join(map(lambda x: "&＃39;%s&＃39;, %s" % (x, x), cols))# feature, value 转换后的列名&＃xff0c;可自定义df &＃61; df.selectExpr(*keys, "stack(%s, %s) as (feature, value)" % (len(cols), stack_str))return df

代码演示

行转列&＃xff08;窄表转宽表&＃xff09;

from pyspark.sql import functions as Fdef pivot(df, keys, column, column_value, column_value_list):# 参数说明 df dataframe keys 待转换表中需要保留的主键key&＃xff0c;以list[]类型传入 # column 待转换的列名 column_value column对应值的列名 column_value_list column内需要成列值&＃xff0c;也是新生成表的列名# .fillna(-999.0) 行转列时有时对应的列没有值&＃xff0c;就会产生null值&＃xff0c;fillna会对null做处理&＃xff0c;转换为其他值&＃xff0c;如不需要可以删除return df.groupBy(keys).pivot(column, column_value_list).agg(F.first(column_value, ignorenulls&＃61;True)).fillna(-999.0)

代码演示

推荐阅读

text
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
function
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38
io
如何自行分析定位SAP BSP错误

The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]

蜡笔小新 2023-12-14 19:58:05
function
vue使用

关键词： ... [详细]

蜡笔小新 2023-12-14 19:14:56
text
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
controller
SpringBoot uri统一权限管理的实现方法及步骤详解

本文详细介绍了SpringBoot中实现uri统一权限管理的方法，包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性，实现对系统任意接口的权限拦截验证。 ... [详细]

蜡笔小新 2023-12-14 16:11:30
function
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
email
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
email
Mac OS 升级到11.2.2 Eclipse打不开了，报错Failed to create the Java Virtual Machine

本文介绍了在Mac OS升级到11.2.2版本后，使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 12:01:13
email
如何在有序字符序列中插入新字符并保持有序

本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ... [详细]

蜡笔小新 2023-12-14 11:16:33
function
安卓select模态框样式改变_微软Office风格的多端（Web、安卓、iOS）组件库——Fabric UI...

介绍FabricUI是微软开源的一套Office风格的多端组件库，共有三套针对性的组件，分别适用于web、android以及iOS，Fab ... [详细]

蜡笔小新 2023-12-14 05:55:08
python
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
function
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
io
Golang如何使用Cookie跟踪位置

关键词：Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]

蜡笔小新 2023-12-13 15:47:22
io
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11

mobiledu2502872733

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章