热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何在PySP中使用Python将数据框中的字符串列转换为双精度浮点类型

这里不需要UDF。Column已提供simpleString方法和simpleString实例:frompyspark.sql.typesimportDoubleTy

这里不需要UDF。 Column已提供simpleString方法和simpleString实例:

from pyspark.sql.types import DoubleType

changedTypedf = joindf.withColumn("label", joindf["show"].cast(DoubleType()))

或短字符串:

changedTypedf = joindf.withColumn("label", joindf["show"].cast("double"))

其中规范的字符串名称(也可以支持其他变体)对应于simpleString值。 因此对于原子类型:

from pyspark.sql import types

for t in ['BinaryType', 'BooleanType', 'ByteType', 'DateType',

'DecimalType', 'DoubleType', 'FloatType', 'IntegerType',

'LongType', 'ShortType', 'StringType', 'TimestampType']:

print(f"{t}: {getattr(types, t)().simpleString()}")

BinaryType: binary

BooleanType: boolean

ByteType: tinyint

DateType: date

DecimalType: decimal(10,0)

DoubleType: double

FloatType: float

IntegerType: int

LongType: bigint

ShortType: smallint

StringType: string

TimestampType: timestamp

例如复杂类型

types.ArrayType(types.IntegerType()).simpleString()

'array'

types.MapType(types.StringType(), types.IntegerType()).simpleString()

'map'



推荐阅读
author-avatar
金豪情圣
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有