有没有python与机械结合的工作用Python自动化办公，我与大神之间的差距一下就...

作者：liu-zebing_284 | 来源：互联网 | 2023-07-27 14:26

我想介绍一下我是如何从每天工作8小时，进化成每天工作10分钟的，以下不涉及太多的技术细节。0.先自我介绍一下：我不是程序员࿰

我想介绍一下我是如何从每天工作8小时&＃xff0c;进化成每天工作10分钟的&＃xff0c;以下不涉及太多的技术细节。

0.先自我介绍一下&＃xff1a;

我不是程序员&＃xff0c;大学学的也不是IT专业。

ukeZu3yPOoWkCW8woO&＃61;2TRwHnJN8NaDV3uTpmpkc9IaLK1563243202371.jpg

我在一个主要业务是成品粮交易的企业工作&＃xff0c;我的岗位的主要工作就是制作各类数据统计报表、台账、数据图表等等&＃xff0c;反正就是各类日报&＃xff0c;每天都要做一遍&＃xff0c;此外还有什么周报月报什么的……这个岗位之前的同事&＃xff0c;每天至少要花3.5到4个小时去折腾Excel&＃xff0c;使用数据透视图、vlookup、其他各类函数去做出一份内含3000多个数据的日报。如果领导临时安排什么工作的话&＃xff0c;那就要加班从浩如烟海的数据里找领导要的东西了。

1.噩梦开始时&＃xff1a;

我刚接手工作时&＃xff0c;我们有一个巨大的&＃xff0c;达70多M的Excel文件&＃xff0c;每次公司配发的破电脑打开就需要小二十分钟&＃xff0c;里面存着我们近十年的采购的每一车的详细信息……然后里面的数据格式还都是混乱的&＃xff0c;

打个比方&＃xff0c;比如我们有个供货商全名叫&＃xff1a;ABCD有限责任公司&＃xff0c;

那么这个Excel中会存有

AB公司、

AB有限公司、

CD有限责任公司、

CD责任有限公司、

ACBD有限公司

ABD公司

等等等等名字

在我第一天看到这个Excel的时候

N0jDyVZIEtVLmCduYxuMQKk2cIEVyKevFJjxCLRrLJbPY1563243202375.jpg

后来交接的同事告诉我&＃xff0c;她用的Excel的 vlookup 函数&＃xff0c;当匹配不上的时候&＃xff0c;就手工搜索……

然后……我……

p8V3jHpjZIw6WJkrT1Krbudt5rcz&＃61;5oBRwJnQtsJN7Jwh1563243202377.jpg

就这样&＃xff0c;经历了噩梦般的几个月……

等到了2017年年初&＃xff0c;看到一个词:

图灵完备。

一个图灵完备的语言理论上能解决任何算法。

显然&＃xff0c;Python是一种图灵完备的语言。

那Python应该在理论上能替我处理所有事情&＃xff08;生孩子应该不行~~&＃xff09;

我为什么不试着用Python去替我完成工作呢&＃xff1f;

2.走了一些弯路&＃xff0c;但胜过原地踏步

我的第一步是从数据清洗开始的。&＃xff08;当然那时并不知道这个叫数据清洗&＃xff09;

先把刚才说的那个70M的Excel导成csv&＃xff0c;去掉了其中不必要的格式、样式、对象等。

然后我想统一一下各个数据的标准名称&＃xff0c;刚才说了&＃xff0c;由于经手的人太多&＃xff0c;同一个数据&＃xff0c;怎么表述的都有&＃xff0c;几十万的数据量&＃xff0c;人工交叉比对的话显然是不现实的。&＃xff08;后来才知道了笛卡尔积这个词&＃xff09;

我第一步先使用了Excel自身的去重功能&＃xff0c;将所有的供货商名称进行了一个去重&＃xff0c;剩下了大概5000个左右的名称。

然后&＃xff0c;作为一个懒人&＃xff0c;我肯定不会用人工去比对了。

Python有一个库&＃xff0c;叫做fuzzywuzzy&＃xff0c;用它来进行模糊匹配。

from fuzzywuzzy import fuzz

print( fuzz.ratio("内容1", "内容2")&＃xff09;

会输出一个0——100的数字&＃xff0c;数字越大代表这两个内容越相似。

所以我就写了一个循环&＃xff0c;把这5000多个项目里面&＃xff0c;匹配度超过70%以上的数据组都筛了出来&＃xff0c;再去Excel里面手工替换&＃xff08;没办法&＃xff0c;那时候还不会操作Excel&＃xff09;

然后整理了一下各个行列的位置&＃xff0c;这样我就有了一个相对准确的数据源。

后来思考了一下&＃xff0c;把数据存在Excel里面不是个长久之计啊&＃xff0c;毕竟几十万数据呢&＃xff0c;就想把数据导入到数据库里。大学时候考过计算机二级的Access&＃xff08;当然&＃xff0c;虽然我考过&＃xff0c;但是没考过……&＃xff09;&＃xff0c;就想导入Access&＃xff0c;可是那个Python库没弄明白&＃xff0c;硬是读不出来&＃xff0c;就卡死了。

后来想到&＃xff0c;之前自己从网上下载的某某私服的一键端里&＃xff0c;有个MySQL数据库的一键启动方式&＃xff0c;试了试居然能用&＃xff0c;就把那个MySQL程序整个拷出来、清干净&＃xff0c;作为了我的数据库。&＃xff08;当时想学怎么自己配置MySQL来着&＃xff0c;没研究明白……这个数据库也就是我们现在提供的MySQL数据库的前身&＃xff0c;当然了&＃xff0c;我们现在提供的是重新制作的无毒的船新版本&＃xff09;

然后就是使用Navicat导入Excel&＃xff0c;使用pymysql库进行读取&＃xff0c;这样&＃xff0c;咱也是趁数据库的人了~

KhffHx0&＃61;&＃61;1SwVCRRH6381o57bdmC2AJaZ844pWzPCA3u81563243202374.jpg

接下来&＃xff0c;就是要进行数据分析了&＃xff0c;由于当时没学会pandas&＃xff0c;数据透视图的效果死活做不出来&＃xff0c;不得已&＃xff0c;只好新建N个列表&＃xff0c;用一堆if...else... &＃xff0c;把同类数据存入同一个列表中&＃xff0c;求和&＃xff0c;求平均值之类的&＃xff08;笨办法也是办法&＃xff0c;能抓住耗子就是好猫&＃xff0c;先把程序跑起来能用就好&＃xff09;

推荐阅读

string
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
python
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
const
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
const
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新 2024-11-11 18:27:44
search
如何高效启动大数据应用之旅？

在前一篇文章中，我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目，涵盖关键步骤和最佳实践，帮助读者快速踏上大数据之旅。 ... [详细]

蜡笔小新 2024-11-04 18:30:38
python
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10
hash
PHP中元素的计量单位是什么？

PHP中元素的计量单位是什么？ ... [详细]

蜡笔小新 2024-11-01 15:06:51
substring
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
string
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
string
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
string
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
header
使用Python和smtplib实现邮件发送功能

本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件，并提供了完整的代码示例。作者：多测师_王sir，时间：2020年5月20日 17:24，微信：15367499889，公司：上海多测师信息有限公司。 ... [详细]

蜡笔小新 2024-11-12 12:21:27
python
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23
header
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
python
SQLmap自动化注入工具命令详解（第28-29天实战演练）

SQL注入工具如SQLMap等在网络安全测试中广泛应用。SQLMap是一款开源的自动化SQL注入工具，支持12种不同的数据库，具体支持的数据库类型可在其插件目录中查看。作为当前最强大的注入工具之一，SQLMap在实际应用中具有极高的效率和准确性。 ... [详细]

蜡笔小新 2024-10-30 11:16:15

liu-zebing_284

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章