热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

5分钟快速筛选特定候选人的简历

介绍一个新的系列,专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例,展示如何快速从大量简历中筛选出特定候选人的简历。

5分钟快速筛选特定候选人的简历

本系列专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例,展示如何快速从大量简历中筛选出特定候选人的简历。

假设你的老板给你上万份候选人的简历,并且给了你一个Excel表格,要求你在下班前将表格中列出的人员的简历挑出来并发送给他。此时距离下班只剩5分钟,而你不想加班。

幸运的是,所有简历文件名中都包含人名。你可以通过以下步骤快速完成任务:

步骤1:导入必要的库

import pandas as pd
import os
from shutil import copyfile

打开Excel表格,找到“姓名”所在的列。假设是第一列,可以直接读取该列数据:

df = pd.read_excel(menu_path, usecols=[0])

步骤2:遍历简历文件夹

遍历存放简历的文件夹,获取所有文件名:

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):

步骤3:处理文件名中的空格

为了防止人名中间有空格导致匹配失败,需要去除文件名中的空格:

file_no_space = ''.join(file.split())

步骤4:匹配并复制简历

遍历Excel表格中的姓名,检查是否与文件名匹配。如果匹配成功,则将该文件复制到目标文件夹:

for key in df['姓名']:
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, file))
        print(file)

步骤5:按顺序排列简历(可选)

如果希望按Excel表格中的顺序排列简历,可以在复制文件时加上索引:

for i, key in enumerate(df['姓名']):
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
        print(file)

处理重名问题

如果存在重名的情况,可以使用“学号”或“身份证号”等不易重复的信息作为匹配键值。前提是简历文件名中包含这些信息。

完整代码

# -*- coding: utf-8 -*-
import pandas as pd
import os
from shutil import copyfile

resume_path = './resume'
menu_path = './1组分组名单.xlsx'
destination_path = './sorted'

if not os.path.exists(destination_path):
    os.makedirs(destination_path)

df = pd.read_excel(menu_path, usecols=[0])  # 以第1列(人名)作为检索key

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):
        file_no_space = ''.join(file.split())
        for i, key in enumerate(df['姓名']):
            if key in file_no_space:
                copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
                print(file)

运行上述代码后,可以看到筛选出的简历已经按顺序排列在目标文件夹中。检查时间,发现距离下班还有5分01秒,任务顺利完成。


推荐阅读
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • XNA 3.0 游戏编程:从 XML 文件加载数据
    本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件,并通过内容管道加载到游戏中。此外,还会涉及自定义类型读取器和写入器的实现。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 本文详细介绍如何在Linux系统中配置SSH密钥对,以实现从一台主机到另一台主机的无密码登录。内容涵盖密钥对生成、公钥分发及权限设置等关键步骤。 ... [详细]
  • 本文介绍了如何使用 Spring Boot DevTools 实现应用程序在开发过程中自动重启。这一特性显著提高了开发效率,特别是在集成开发环境(IDE)中工作时,能够提供快速的反馈循环。默认情况下,DevTools 会监控类路径上的文件变化,并根据需要触发应用重启。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 在前两篇文章中,我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象,分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor,即用于描述 Action 方法参数的对象,并详细介绍其工作原理。 ... [详细]
  • 本文详细介绍了如何构建一个高效的UI管理系统,集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑,实现功能逻辑分散化和代码复用,支持多人协作开发。 ... [详细]
  • 本文探讨了 Objective-C 中的一些重要语法特性,包括 goto 语句、块(block)的使用、访问修饰符以及属性管理等。通过实例代码和详细解释,帮助开发者更好地理解和应用这些特性。 ... [详细]
  • 使用GDI的一些AIP函数我们可以轻易的绘制出简 ... [详细]
  • 20100423:Fixes:更新批处理,以兼容WIN7。第一次系统地玩QT,于是诞生了此预备式:【QT版本4.6.0&#x ... [详细]
author-avatar
VI_宁小豆2502874431
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有