热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

5分钟快速筛选特定候选人的简历

介绍一个新的系列,专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例,展示如何快速从大量简历中筛选出特定候选人的简历。

5分钟快速筛选特定候选人的简历

本系列专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例,展示如何快速从大量简历中筛选出特定候选人的简历。

假设你的老板给你上万份候选人的简历,并且给了你一个Excel表格,要求你在下班前将表格中列出的人员的简历挑出来并发送给他。此时距离下班只剩5分钟,而你不想加班。

幸运的是,所有简历文件名中都包含人名。你可以通过以下步骤快速完成任务:

步骤1:导入必要的库

import pandas as pd
import os
from shutil import copyfile

打开Excel表格,找到“姓名”所在的列。假设是第一列,可以直接读取该列数据:

df = pd.read_excel(menu_path, usecols=[0])

步骤2:遍历简历文件夹

遍历存放简历的文件夹,获取所有文件名:

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):

步骤3:处理文件名中的空格

为了防止人名中间有空格导致匹配失败,需要去除文件名中的空格:

file_no_space = ''.join(file.split())

步骤4:匹配并复制简历

遍历Excel表格中的姓名,检查是否与文件名匹配。如果匹配成功,则将该文件复制到目标文件夹:

for key in df['姓名']:
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, file))
        print(file)

步骤5:按顺序排列简历(可选)

如果希望按Excel表格中的顺序排列简历,可以在复制文件时加上索引:

for i, key in enumerate(df['姓名']):
    if key in file_no_space:
        copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
        print(file)

处理重名问题

如果存在重名的情况,可以使用“学号”或“身份证号”等不易重复的信息作为匹配键值。前提是简历文件名中包含这些信息。

完整代码

# -*- coding: utf-8 -*-
import pandas as pd
import os
from shutil import copyfile

resume_path = './resume'
menu_path = './1组分组名单.xlsx'
destination_path = './sorted'

if not os.path.exists(destination_path):
    os.makedirs(destination_path)

df = pd.read_excel(menu_path, usecols=[0])  # 以第1列(人名)作为检索key

for maindir, subdir, filename in os.walk(resume_path):
    for i, file in enumerate(filename):
        file_no_space = ''.join(file.split())
        for i, key in enumerate(df['姓名']):
            if key in file_no_space:
                copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
                print(file)

运行上述代码后,可以看到筛选出的简历已经按顺序排列在目标文件夹中。检查时间,发现距离下班还有5分01秒,任务顺利完成。


推荐阅读
  • 在寻找轻量级Ruby Web框架的过程中,您可能会遇到Sinatra和Ramaze。两者都以简洁、轻便著称,但它们之间存在一些关键区别。本文将探讨这些差异,并提供详细的分析,帮助您做出最佳选择。 ... [详细]
  • 本文将详细探讨 Java 中提供的不可变集合(如 `Collections.unmodifiableXXX`)和同步集合(如 `Collections.synchronizedXXX`)的实现原理及使用方法,帮助开发者更好地理解和应用这些工具。 ... [详细]
  • 主调|大侠_重温C++ ... [详细]
  • 本文探讨了如何利用HTML5和JavaScript在浏览器中进行本地文件的读取和写入操作,并介绍了获取本地文件路径的方法。HTML5提供了一系列API,使得这些操作变得更加简便和安全。 ... [详细]
  • 精选多款高效实用软件及工具推荐
    本文介绍并推荐多款高效实用的软件和工具,涵盖系统优化、网络加速、多媒体处理等多个领域,并提供安全可靠的下载途径。 ... [详细]
  • 本文详细探讨了Java中的ClassLoader类加载器的工作原理,包括其如何将class文件加载至JVM中,以及JVM启动时的动态加载策略。文章还介绍了JVM内置的三种类加载器及其工作方式,并解释了类加载器的继承关系和双亲委托机制。 ... [详细]
  • 2017-2018年度《网络编程与安全》第五次实验报告
    本报告详细记录了2017-2018学年《网络编程与安全》课程第五次实验的具体内容、实验过程、遇到的问题及解决方案。 ... [详细]
  • ListView简单使用
    先上效果:主要实现了Listview的绑定和点击事件。项目资源结构如下:先创建一个动物类,用来装载数据:Animal类如下:packagecom.example.simplelis ... [详细]
  • 本文详细介绍了Java中实现异步调用的多种方式,包括线程创建、Future接口、CompletableFuture类以及Spring框架的@Async注解。通过代码示例和深入解析,帮助读者理解并掌握这些技术。 ... [详细]
  • 本文介绍如何在Java中实现一个罗马数字计算器,重点在于如何通过循环和字符验证确保用户输入合法。我们将探讨创建一个方法来检查字符串中的非法字符,并使用循环不断提示用户输入,直到输入符合要求。 ... [详细]
  • 1.基本原理边缘检测一般是利用微分等方法,通过对灰度跃变的分析寻找图像上区域边缘的技术。今天的猪脚是梯度算子和Roberts算子。1.梯度算子是怎么来的? ... [详细]
  • 软件工程课堂测试2
    要做一个简单的保存网页界面,首先用jsp写出保存界面,本次界面比较简单,首先是三个提示语,后面是三个输入框,然 ... [详细]
  • 本文详细介绍了虚拟专用网(Virtual Private Network, VPN)的概念及其通过公共网络(如互联网)构建临时且安全连接的技术特点。文章探讨了不同类型的隧道协议,包括第二层和第三层隧道协议,并提供了针对IPSec、GRE以及MPLS VPN的具体配置指导。 ... [详细]
  • 本文详细介绍了如何在Linux系统中创建和管理DB2数据库,包括用户切换、数据库创建、错误处理、连接与断开、表空间和缓冲池的创建,以及用户权限管理和数据导入导出等操作。 ... [详细]
  • 本文介绍了如何在iOS应用中自定义导航栏按钮,包括使用普通按钮和图片生成导航条专用按钮的方法。同时,探讨了在不同版本的iOS系统中实现多按钮布局的技术方案。 ... [详细]
author-avatar
VI_宁小豆2502874431
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有