作者:VI_宁小豆2502874431 | 来源:互联网 | 2024-11-18 12:12
5分钟快速筛选特定候选人的简历
本系列专注于提供能在5分钟内完成的简单实用案例。本文将以办公中常见的需求为例,展示如何快速从大量简历中筛选出特定候选人的简历。
假设你的老板给你上万份候选人的简历,并且给了你一个Excel表格,要求你在下班前将表格中列出的人员的简历挑出来并发送给他。此时距离下班只剩5分钟,而你不想加班。
幸运的是,所有简历文件名中都包含人名。你可以通过以下步骤快速完成任务:
步骤1:导入必要的库
import pandas as pd
import os
from shutil import copyfile
打开Excel表格,找到“姓名”所在的列。假设是第一列,可以直接读取该列数据:
df = pd.read_excel(menu_path, usecols=[0])
步骤2:遍历简历文件夹
遍历存放简历的文件夹,获取所有文件名:
for maindir, subdir, filename in os.walk(resume_path):
for i, file in enumerate(filename):
步骤3:处理文件名中的空格
为了防止人名中间有空格导致匹配失败,需要去除文件名中的空格:
file_no_space = ''.join(file.split())
步骤4:匹配并复制简历
遍历Excel表格中的姓名,检查是否与文件名匹配。如果匹配成功,则将该文件复制到目标文件夹:
for key in df['姓名']:
if key in file_no_space:
copyfile(os.path.join(maindir, file), os.path.join(destination_path, file))
print(file)
步骤5:按顺序排列简历(可选)
如果希望按Excel表格中的顺序排列简历,可以在复制文件时加上索引:
for i, key in enumerate(df['姓名']):
if key in file_no_space:
copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
print(file)
处理重名问题
如果存在重名的情况,可以使用“学号”或“身份证号”等不易重复的信息作为匹配键值。前提是简历文件名中包含这些信息。
完整代码
# -*- coding: utf-8 -*-
import pandas as pd
import os
from shutil import copyfile
resume_path = './resume'
menu_path = './1组分组名单.xlsx'
destination_path = './sorted'
if not os.path.exists(destination_path):
os.makedirs(destination_path)
df = pd.read_excel(menu_path, usecols=[0]) # 以第1列(人名)作为检索key
for maindir, subdir, filename in os.walk(resume_path):
for i, file in enumerate(filename):
file_no_space = ''.join(file.split())
for i, key in enumerate(df['姓名']):
if key in file_no_space:
copyfile(os.path.join(maindir, file), os.path.join(destination_path, str(i) + file))
print(file)
运行上述代码后,可以看到筛选出的简历已经按顺序排列在目标文件夹中。检查时间,发现距离下班还有5分01秒,任务顺利完成。