热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【Python技巧】十分钟就能够实现Excel数据整合/拆分,为啥要花一天?|附源码

相关文件想学Python的小伙伴可以关注小编的公众号【Python日志】有很多的资源可以白嫖的哈,不定时会更新一下Python的小知识的哈!ÿ

相关文件

想学Python的小伙伴可以关注小编的公众号【Python日志】
有很多的资源可以白嫖的哈,不定时会更新一下Python的小知识的哈!!
需要源码的小伙伴可以在公众号回复Excel表格
Python源码、问题解答学习交流群:773162165


需求分析

现在有一大堆的Excel数据文件,需要根据每个Excel数据文件里面的Sheet批量将数据文件合并成为一个汇总后的Excel数据文件。或者是将一个汇总后的Excel数据文件按照Sheet拆分成很多个Excel数据文件。根据上面的需求,我们先来进行UI界面的布局设计。

导入UI界面设计相关的PyQt5模块

from PyQt5.QtWidgets import *from PyQt5.QtCore import *from PyQt5.QtGui import *

应用操作相关的模块

import sysimport os

excel 数据处理模块

import openpyxl as pxlimport pandas as pd

看一下 UI 界面的功能和布局,感觉还可以…
在这里插入图片描述


代码实现

下面是布局相关的代码块实例

def init_ui(self):self.setWindowTitle('Excel数据汇总/拆分器')self.setWindowIcon(QIcon('数据.ico'))self.brower = QTextBrowser()self.brower.setReadOnly(True)self.brower.setFont(QFont('宋体', 8))self.brower.setPlaceholderText('批量数据处理进度显示区域...')self.brower.ensureCursorVisible()self.excels = QLineEdit()self.excels.setReadOnly(True)self.excels_btn = QPushButton()self.excels_btn.setText('加载批文件')self.excels_btn.clicked.connect(self.excels_btn_click)self.oprate_type = QLabel()self.oprate_type.setText('操作类型')self.oprate_combox = QComboBox()self.oprate_combox.addItems(['数据合并', '数据拆分'])self.data_type = QLabel()self.data_type.setText('合并/拆分')self.data_combox = QComboBox()self.data_combox.addItems(['按照Sheet拆分'])self.new_file_path = QLineEdit()self.new_file_path.setReadOnly(True)self.new_file_path_btn = QPushButton()self.new_file_path_btn.setText('新文件路径')self.new_file_path_btn.clicked.connect(self.new_file_path_btn_click)self.thread_ = DataThread(self)self.thread_.trigger.connect(self.update_log)self.thread_.finished.connect(self.finished)self.start_btn = QPushButton()self.start_btn.setText('开始数据汇总/拆分')self.start_btn.clicked.connect(self.start_btn_click)form = QFormLayout()form.addRow(self.excels, self.excels_btn)form.addRow(self.oprate_type, self.oprate_combox)form.addRow(self.data_type, self.data_combox)form.addRow(self.new_file_path, self.new_file_path_btn)vbox = QVBoxLayout()vbox.addLayout(form)vbox.addWidget(self.start_btn)hbox = QHBoxLayout()hbox.addWidget(self.brower)hbox.addLayout(vbox)self.setLayout(hbox)

槽函数 update_log,将运行过程通过文本浏览器的方式实时展示,方便查看程序的运行。

def update_log(self, text):cursor = self.brower.textCursor()cursor.movePosition(QTextCursor.End)self.brower.append(text)self.brower.setTextCursor(cursor)self.brower.ensureCursorVisible()

槽函数 excels_btn_click,绑定到文件加载按钮,处理源文件的加载过程。

def excels_btn_click(self):paths = QFileDialog.getOpenFileNames(self, '选择文件', os.getcwd(), 'Excel File(*.xlsx)')files = paths[0]path_strs = ''for file in files:path_strs = path_strs + file + ';'self.excels.setText(path_strs)self.update_log('已经完成批文件路径加载!')

槽函数 new_file_path_btn_click,选择新文件要保存的路径。

def new_file_path_btn_click(self):directory = QFileDialog.getExistingDirectory(self, '选择文件夹', os.getcwd())self.new_file_path.setText(directory)

槽函数 start_btn_click,绑定到开始按钮上,使用开始按钮启动子线程工作。

def start_btn_click(self):self.start_btn.setEnabled(False)self.thread_.start()

函数 finished,这个函数是用来接收子线程传过来的运行完成的信号,通过判断使子线程执行完成时让开始按钮处于可以点击的状态。

def finished(self, finished):if finished is True:self.start_btn.setEnabled(True)

下面是最重要的逻辑处理部分,将所有的逻辑处理相关的部分全部放到子线程中去执行。

class DataThread(QThread):trigger = pyqtSignal(str)finished = pyqtSignal(bool)def __init__(self, parent=None):super(DataThread, self).__init__(parent)self.parent = parentself.working = Truedef __del__(self):self.working = Falseself.wait()def run(self):self.trigger.emit('启动批量处理子线程...')oprate_type = self.parent.oprate_combox.currentText().strip()data_type = self.parent.data_combox.currentText().strip()files = self.parent.excels.text().strip()new_file_path = self.parent.new_file_path.text()if data_type == '按照Sheet拆分' and oprate_type == '数据合并':self.merge_data(files=files, new_file_path=new_file_path)elif data_type == '按照Sheet拆分' and oprate_type == '数据拆分':self.split_data(files=files, new_file_path=new_file_path)else:passself.trigger.emit('数据处理完成...')self.finished.emit(True)def merge_data(self, files, new_file_path):num = 1new_file = new_file_path + '/数据汇总.xlsx'writer = pd.ExcelWriter(new_file)for file in files.split(';'):if file.strip() != '':web_sheet = pxl.load_workbook(file)sheets = web_sheet.sheetnamesfor sheet in sheets:sheet_name = sheet.title()self.trigger.emit('准备处理工作表名称:' + str(sheet.title()))data_frame = pd.read_excel(file, sheet_name=sheet_name)sheet_name = sheet_name + 'TO数据合并' + str(num)data_frame.to_excel(writer, sheet_name, index=False)num = num + 1else:self.trigger.emit('当前路径为空,继续...')writer.save()writer.close()def split_data(self, files, new_file_path):num = 1for file in files.split(';'):if file.strip() != '':web_sheet = pxl.load_workbook(file)sheets = web_sheet.sheetnamesfor sheet in sheets:sheet_name = sheet.title()self.trigger.emit('准备处理工作表名称:' + str(sheet.title()))data_frame = pd.read_excel(file, sheet_name=sheet_name)writer = pd.ExcelWriter(new_file_path + '/数据拆分' + str(num) + '.xlsx')data_frame.to_excel(writer, '数据拆分', index=False)writer.save()writer.close()num = num + 1else:self.trigger.emit('当前路径为空,继续...')

上面就是主要的代码块实现过程,有需要的可以参考一下。欢迎大佬在评论区进行留言。


效果展示

搞了一个程序运行效果图,看一下执行效果。在这里插入图片描述

公众号:Python日志
公众号内回复 Excel表格,获取完整源代码,直接运行即可。


推荐阅读
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • Android LED 数字字体的应用与实现
    本文介绍了一种适用于 Android 应用的 LED 数字字体(digital font),并详细描述了其在 UI 设计中的应用场景及其实现方法。这种字体常用于视频、广告倒计时等场景,能够增强视觉效果。 ... [详细]
  • RecyclerView初步学习(一)
    RecyclerView初步学习(一)ReCyclerView提供了一种插件式的编程模式,除了提供ViewHolder缓存模式,还可以自定义动画,分割符,布局样式,相比于传统的ListVi ... [详细]
  • 高效解决应用崩溃问题!友盟新版错误分析工具全面升级
    友盟推出的最新版错误分析工具,专为移动开发者设计,提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态,快速发现并修复错误,显著提升应用的稳定性和用户体验。 ... [详细]
  • andr ... [详细]
  • 本文详细介绍了MicroATX(也称Mini ATX)和MATX主板规格,探讨了它们的结构特点、应用场景及对电脑系统成本和性能的影响。同时,文章还涵盖了相关操作系统的实用技巧,如蓝牙设备图标删除、磁盘管理等。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
author-avatar
yun悠然_434
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有