AI帮你筛简历:开源Hiring Agent,一键评估候选人真实水平

发布时间:2026/6/26 20:21:08
AI帮你筛简历:开源Hiring Agent,一键评估候选人真实水平 输入一份PDF简历自动提取结构化信息结合GitHub代码信号输出公平、可解释的评分全程可本地运行数据不外传 先看痛点招聘筛简历为什么又慢又不准你是一个技术团队的招聘负责人、HR、或者技术面试官。你收到100份简历要从中找出合适的候选人。问题来了每份简历5分钟 → 100份要花8小时以上还不一定能看完简历里的“项目经历”可能夸大 → 你没法验证GitHub上写了“贡献过开源项目” → 你真的会去一个个查吗不同人的简历格式不同 → 比较起来很困难评估标准不统一 → 不同面试官看法不同核心矛盾简历太多看不过来简历里的信息不可验证评估标准主观。但招聘又必须做——每个错过的优秀候选人和每个被误招的不合适的人都代价巨大。✅ Hiring Agent 的解法Hiring Agent 是一个开源的、AI驱动的简历评估工具。一句话输入PDF简历 → AI提取结构化信息 GitHub信号 → 输出公平、可解释的评分它不做“简历是否通过”的武断判断。它做的是从简历PDF里提取基本信息、工作经历、教育背景、技能、项目、获奖如果简历里有GitHub信息拉取真实代码数据对候选人进行分类打分附带证据、加分和扣分理由输出一份可解释的评估报告你可以完全本地运行用Ollama也可以用Google Gemini API。数据不需要上传到任何第三方。 它解决了什么1. 手工看简历 vs AI提取结构化信息传统手工看简历Hiring Agent一份简历耗时5-10分钟几秒钟信息提取完整性依赖个人注意力✅ 结构化提取全部字段格式不统一时容易漏信息✅ 统一转换成标准格式批量处理100份要10小时✅ 循环跑即可2. 简历内容 vs GitHub真实代码信号只看简历 GitHub信号项目经历验证无法验证对方说了算✅ 能看真实代码、commit历史开源贡献可能夸大✅ 能看到实际参与的项目和贡献量技术栈熟练度自己写的“精通”✅ 能看到实际使用的语言和工具3. 主观判断 vs 可解释评分传统主观判断Hiring Agent评分评分标准面试官个人感觉✅ 统一的评分维度证据“感觉还行”✅ 每条分数都有具体依据公平性可能存在偏差✅ 相同标准降低主观偏差可追溯难以复盘✅ 评分报告可留存、可审查它不替你做决定。它帮你做决定前把候选人的信息整理好、量化好、对比好。 工作流程五个步骤PDF简历 → 提取文本 → 分块提取结构化数据 → GitHub信号补充 → 评分输出第1步PDF转文本用pymupdf_rag.py把PDF转换成Markdown格式的文本。第2步分块提取结构化信息用LLM按模块提取基本信息Basics姓名、邮箱、位置、个人链接工作经历Work公司、职位、时间、描述教育背景Education学校、专业、学历、时间技能Skills技术栈、工具、语言项目Projects项目名称、描述、技术栈、链接获奖Awards奖项名称、时间、级别每个模块有独立的提示词模板prompts/templates/*.jinja确保提取的一致性和准确性。第3步GitHub信息补充从简历里提取GitHub用户名拉取个人资料和仓库列表用LLM从候选人的所有仓库里选出最重要的7个分类开源项目 / 个人项目 / 课程项目 / 生产项目第4步综合评估评估维度开源贡献Open Source贡献了多少开源项目影响力如何个人项目Self Projects独立完成的项目质量和复杂度生产项目Production有没有在生产环境中使用过的项目技术技能Technical Skills技术栈的广度和深度加减分机制加分有影响力的开源贡献、技术博客、专利、获奖减分GitHub活跃度低、项目描述模糊、技术栈过时第5步输出报告控制台打印可读的评分报告CSV导出开发模式resume_evaluations.csv包含关键字段中间结果缓存开发模式cache/目录输出示例 评估报告候选人_X 开源贡献72/1003个活跃开源项目7次贡献 个人项目58/1002个项目其中1个有技术深度 生产项目—无生产级项目 技术技能65/100Python/Go/React 加分项 5 有技术博客月访问1000 3 1个开源项目被50人fork 减分项 -5 GitHub活跃度低近3个月无提交 -3 项目描述缺少技术细节 综合推荐★★★☆☆3.5/5 证据详见评估详情... 怎么用前提条件Python 3.11一个LLM后端任选Ollama本地免费ollama pull gemma3:4bGoogle Gemini需要API Key安装gitclone 项目地址cdhiring-agent python-mvenv .venvsource.venv/bin/activate# Windows: .venv\Scripts\activatepipinstall-rrequirements.txt配置cp.env.example .env在.env里设置LLM_PROVIDERollama# 或 geminiDEFAULT_MODELgemma3:4bGEMINI_API_KEYyour-key# 如果用GeminiGITHUB_TOKENyour-token# 可选提升API配额运行python score.py /path/to/resume.pdf输出控制台打印评估报告 CSV开发模式。 谁最适合用人群为什么适合HR/招聘专员批量快速筛选简历省下大量时间技术面试官快速了解候选人的真实技术实力GitHub信号招聘经理有统一的评估标准减少主观偏差人力资源系统开发者可集成到现有招聘流程开源、可定制求职者自我测试自己在简历里放真实信息看看AI会打多少分提前发现不足对数据隐私敏感的组织完全本地运行数据不离开内部网络一个典型的“批量筛选”场景问题某科技公司收到300份技术岗简历。HR团队只有2个人要在一周内筛出50份进入下一轮。传统方式每人分150份每份5-8分钟总计10-20小时。精神疲劳后判断质量下降。Hiring Agent方式批量运行python score.py resume_001.pdf、resume_002.pdf……输出所有候选人的评分和CSVHR按评分排序优先看高分候选人的详细报告结合报告里的证据开源贡献、项目质量做决策时间300份简历自动化跑完约30分钟模型推理时间。HR用2小时看完高分候选人的详细报告。效率提升10倍以上。⚙️ 技术亮点1. 模块化设计可替换每个环节环节可替换PDF解析可换其他解析库LLM提供商Ollama / Gemini / 可扩展提示词模板Jinja模板可自定义评分规则可调整评估维度2. 严格的评分约束避免“套利”不能用“我参与了Linux内核开发”拿高分必须提供可验证的GitHub证据保证公平同样条件下评分标准一致证据驱动每条分数都要有具体依据3. 缓存机制开发模式PDF解析结果缓存不用重复读文件GitHub数据缓存不用重复拉取API方便迭代调试和批量跑⚠️ 注意事项1. 它不是“决策工具”是“信息工具”它提供结构化的评分和证据最终招不招还是要看面试、文化匹配、团队需求2. GitHub不是唯一的评估维度候选人可能没有GitHub账号尤其是非技术岗或资深专家没有GitHub信号时评分会依赖其他维度3. 本地运行需要足够的硬件4B模型如gemma3:4b在普通笔记本上可跑更大模型需要更多内存/显存 链接GitHubgithub.com/interviewstreet/hiring-agent许可证MIT作者HackerRank✅ 总结层次核心内容解决了什么简历筛选耗时费力、信息不可验证、评估标准不统一的问题核心能力①PDF→结构化信息 ②GitHub信号补充 ③可解释评分怎么用python score.py resume.pdf谁适合HR、技术面试官、招聘经理、招聘系统开发者、求职者自我测试成本开源免费可完全本地运行Hiring Agent—— 让简历筛选从“凭感觉”变成“看证据”。MIT协议开源免费数据自托管。