热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python运用反射机制实现Excel数据与对象属性的高效映射转换

本文探讨了如何利用Python的反射机制,高效地将Excel中的数据映射并转换为类对象属性。通过反射技术,可以动态地读取Excel文件中的数据,并将其加载到内存中,转换为相应的类对象,从而方便进行后续的数据处理和操作。该方法适用于需要频繁从Excel导入数据的场景,能够显著提高开发效率和代码可维护性。

Python使用反射实现Excel与对象之间的转换

代码在最下方,伸手党直接滚动到最后

场景

需要从Excel中加载到内存中,转换为class对象执行操作

环境

Python3.8

openpyxl==3.0.5

前置知识

反射(仅介绍这个帮助类用到的几个反射方法)

setattr、getattr

class Person():

name = None

def __init__(self, name):

self.name = name

p = Person("laowang")

n = getattr(p, "name")

print(n)

# 打印结果: laowang

setattr(p, "name", "laoxu")

n2 = getattr(p, "name")

print(n2)

# 打印结果: laoxu

反射实例化对象

class Person():

name = None

def print_sth(self):

print("测试实例化方法", self.name)

def test(clazz):

"""

实例化对象

:param clazz: 要实例化的类型

"""

x = clazz()

setattr(x, "name", "老王")

x.print_sth()

# 打印: 测试实例化方法 老王

test(Person)

Excel操作类库 - openpyxl

创建Excel

from openpyxl import Workbook

wb = Workbook()

ws1 = wb.active

ws1.append(['name', 'age', 'isManager', 'remark'])

ws1.append(['', '', '', ' '])

ws1.append(['老王', '18', 'false', ' '])

ws1.append(['laoxu', '28.4', 'TRUE', 'zaoricaifuziyou'])

ws1.append(['', '', '', ' '])

ws2 = wb.create_sheet("ws2")

ws2.append(['name', 'age', 'isManager', 'remark'])

ws2.append(['小李', '50', 'TRuE', 'fly knife'])

ws2.append(['', '', '', ' '])

ws2.append(['aaa', '11', 'false', 'hehehe'])

wb.save("test_convert_2_class.xlsx")

读取Excel

from openpyxl import Workbook

def print_row(arr):

"""为了显示方便,打印行"""

for item in arr:

print(item,end="\t\t|")

print()

# 读取上一个代码块创建的Excel代码

work_book = load_workbook("test_convert_2_class.xlsx")

result = []

for sheet_name in work_book.sheetnames:

print("-----------------",sheet_name,"-----------------")

ws = work_book[sheet_name]

# 获取表头

table_heads = []

for title_row in ws.iter_rows(max_row=1):

for cell in title_row:

table_heads.append(cell.value)

print_row(table_heads)

# 获取表数据

table = []

for row in ws.iter_rows(min_row=2):

row_data=[]

for column_index in range(len(row)):

row_data.append(row[column_index].value)

print_row(row_data)

# 打印结果如下:

# ----------------- Sheet -----------------

# name |age |isManager |remark |

# None |None |None | |

# 老王 |18 |false | |

# laoxu |28.4 |TRUE |zaoricaifuziyou |

# None |None |None | |

# ----------------- ws2 -----------------

# name |age |isManager |remark |

# 小李 |50 |TRuE |fly knife |

# None |None |None | |

# aaa |11 |false |hehehe |

伸手党代码

excel_helper.py

import os

import re

from os.path import isfile

from openpyxl import load_workbook, Workbook

def _convert_value(value):

"""

将单元格中数据,区分基本类型

类似"true"/"false"(不区分大小写)转换为bool值

长得像数字的转换为float类型

其他(空格、空行)转换为None

:param value: 单元格的值

:return: 转换后的类型

"""

value_str = str(value).lower()

if value_str == 'true':

return True

elif value_str == 'false':

return False

elif re.match(r"^[+|-]?\d+.?\d*$", value_str):

return float(value_str)

elif re.match(r"^\s*$", value_str):

return None

else:

return value

class ExcelHelper:

"""

Excel帮助类

"""

@classmethod

def convert_2_class(cls, file_path, clazz):

"""

转换为class,可转换多张sheet表,转换为统一clazz对象

过滤掉为空行

:param file_path:Excel文件路径

:param clazz:结果转换为clazz对象

:return: 对象列表的列表,结构为[[clazz(),clazz()],[clazz()]]

"""

if not file_path.endswith(".xlsx"):

raise ValueError("文件必须为.xlsx结尾的Excel文件")

if not isfile(file_path):

raise FileNotFoundError("文件路径 {0} 不存在".format(file_path))

work_book = load_workbook(file_path)

result = []

for sheet_name in work_book.sheetnames:

ws = work_book[sheet_name]

# 获取表头

table_heads = []

for title_row in ws.iter_rows(max_row=1):

for cell in title_row:

table_heads.append(cell.value)

# 获取表数据

table = []

for row in ws.iter_rows(min_row=2):

# 实例化对象

instance = clazz()

for column_index in range(len(row)):

setattr(instance, table_heads[column_index], _convert_value(row[column_index].value))

# 过滤空行(所有属性均为None的对象)

is_valid = False

for attr in instance.__dict__:

if not attr.startswith("_") and instance.__dict__[attr] is not None:

is_valid = True

break

if is_valid:

table.append(instance)

result.append(table)

return result

@classmethod

def save(cls, file_path, tables):

if not file_path.endswith(".xlsx"):

raise ValueError("文件必须为.xlsx结尾的Excel文件")

work_book = Workbook()

is_first = True

for table in tables:

if is_first:

ws = work_book.active

is_first = False

else:

ws = work_book.create_sheet()

# 添加表头

table_heads = []

for attr in table[0].__dict__:

# 过滤"_"开头的属性

if not attr.startswith("_"):

table_heads.append(attr)

ws.append(table_heads)

# 添加数据

for row in table:

data = []

for head in table_heads:

data.append(getattr(row, head))

ws.append(data)

try:

# 生成保存文件夹路径

folder_index = max(file_path.rfind("\\"), file_path.rfind("/"))

if folder_index != -1:

folder_path = file_path[0:folder_index]

if not os.path.exists(folder_path):

os.mkdir(folder_path)

work_book.save(file_path)

except Exception:

raise OSError("创建Excel失败")

使用方法

# 导入类

from excel_helper import ExcelHelper

# 示例对象

class A:

name=None

age=None

isManager=None

# 读取Excel文件,并转换为指定类型对象列表

tables = ExcelHelper.convert_2_class("123.xlsx", A)

# 保存为Excel

a1=A()

table=[a1]

ExcelHelper.save("456.xls", [table])

注意

该帮助类均为@classmethod

该帮助类使用反射实现,所以表头名称需要与对象的字段名一一对应(如代码中的class A 与 下表"表1-1")

Excel中可以有多张表(sheet tab),所以参数为对象列表的列表,请注意对应关系

当前读取Excel仅能转换为一个class类型,所以多种表结构请使用多张表

表1-1

name

age

isManager

老王

18

True

Tom

28

FALSE

参考资料

以上



推荐阅读
  • python时间序列之ADF检验(1)
    读取数据,pd.read_csv默认生成DataFrame对象,需将其转换成Series对象DataFrame和Series是pandas中最常见的2 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 主要用了2个类来实现的,话不多说,直接看运行结果,然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • Java 类成员初始化顺序与数组创建
    本文探讨了Java中类成员的初始化顺序、静态引入、可变参数以及finalize方法的应用。通过具体的代码示例,详细解释了这些概念及其在实际编程中的使用。 ... [详细]
author-avatar
寻找另一半哥哥_335
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有