5分钟快速筛选特定候选人的简历

作者：VI_宁小豆2502874431 | 来源：互联网 | 2024-11-18 12:12

介绍一个新的系列，专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例，展示如何快速从大量简历中筛选出特定候选人的简历。

5分钟快速筛选特定候选人的简历

本系列专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例，展示如何快速从大量简历中筛选出特定候选人的简历。

假设你的老板给你上万份候选人的简历，并且给了你一个Excel表格，要求你在下班前将表格中列出的人员的简历挑出来并发送给他。此时距离下班只剩5分钟，而你不想加班。

幸运的是，所有简历文件名中都包含人名。你可以通过以下步骤快速完成任务：

步骤1：导入必要的库

import pandas as pd
import os
from shutil import copyfile

打开Excel表格，找到“姓名”所在的列。假设是第一列，可以直接读取该列数据：

df = pd.read_excel(menu_path, usecols=[0])

步骤2：遍历简历文件夹

遍历存放简历的文件夹，获取所有文件名：

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):

步骤3：处理文件名中的空格

为了防止人名中间有空格导致匹配失败，需要去除文件名中的空格：

file_no_space = ''.join(file.split())

步骤4：匹配并复制简历

遍历Excel表格中的姓名，检查是否与文件名匹配。如果匹配成功，则将该文件复制到目标文件夹：

for key in df['姓名']:
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, file))
        print(file)

步骤5：按顺序排列简历（可选）

如果希望按Excel表格中的顺序排列简历，可以在复制文件时加上索引：

for i, key in enumerate(df['姓名']):
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
        print(file)

处理重名问题

如果存在重名的情况，可以使用“学号”或“身份证号”等不易重复的信息作为匹配键值。前提是简历文件名中包含这些信息。

完整代码

# -*- coding: utf-8 -*-
import pandas as pd
import os
from shutil import copyfile

resume_path = './resume'
menu_path = './1组分组名单.xlsx'
destination_path = './sorted'

if not os.path.exists(destination_path):
    os.makedirs(destination_path)

df = pd.read_excel(menu_path, usecols=[0])  # 以第1列（人名）作为检索key

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):
        file_no_space = ''.join(file.split())
        for i, key in enumerate(df['姓名']):
            if key in file_no_space:
                copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
                print(file)

运行上述代码后，可以看到筛选出的简历已经按顺序排列在目标文件夹中。检查时间，发现距离下班还有5分01秒，任务顺利完成。

推荐阅读

ip
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
shell
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
foreach
Apache Jena 中 Txn.executeWrite 方法详解与代码示例

本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法，通过多个实际代码示例展示了其在不同场景下的应用，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-26 17:55:52
runtime
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
ip
Web前端开发中的HTML与CSS命名规范

作为一名专业的Web前端工程师，掌握HTML和CSS的命名规范是至关重要的。良好的命名习惯不仅有助于提高代码的可读性和维护性，还能促进团队协作。本文将详细介绍Web前端开发中常用的HTML和CSS命名规范，并提供实用的建议。 ... [详细]

蜡笔小新 2024-12-25 11:06:17
ip
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
runtime
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
ip
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
io
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
foreach
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
version
C#中获取进程主窗口句柄的实现方法

本文介绍了如何在C#中启动一个应用程序，并通过枚举窗口来获取其主窗口句柄。当使用Process类启动程序时，我们通常只能获得进程的句柄，而主窗口句柄可能为0。因此，我们需要使用API函数和回调机制来准确获取主窗口句柄。 ... [详细]

蜡笔小新 2024-12-27 03:39:09
io
Objective-C 编程中的关键语法点

本文探讨了 Objective-C 中的一些重要语法特性，包括 goto 语句、块（block）的使用、访问修饰符以及属性管理等。通过实例代码和详细解释，帮助开发者更好地理解和应用这些特性。 ... [详细]

蜡笔小新 2024-12-26 19:42:38
int
探索1000以内的完美数：因数和等于自身

本文探讨了如何在1000以内找到所有完美数，即一个数的因数（不包括自身）之和等于该数本身。例如，6是一个完美数，因为1 + 2 + 3 = 6。通过编程实现这一过程，可以更好地理解完美数的特性。 ... [详细]

蜡笔小新 2024-12-25 19:21:06
ip
GDI基础介绍之几何绘图

使用GDI的一些AIP函数我们可以轻易的绘制出简 ... [详细]

蜡笔小新 2024-12-25 18:23:37
object
Java多线程并发控制：解决相同key的线程互斥问题

本文探讨了在Java多线程环境下，如何确保具有相同key值的线程能够互斥执行并按顺序输出结果。通过优化代码结构和使用线程安全的数据结构，我们解决了线程同步问题，并实现了预期的并发行为。 ... [详细]

蜡笔小新 2024-12-25 14:15:29

VI_宁小豆2502874431

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章