@article{Zhu2025SmartResume,
title={Layout-Aware Parsing Meets Efficient LLMs: A Unified, Scalable Framework for Resume Information Extraction and Evaluation},
author={Fanwei Zhu and Jinke Yu and Zulong Chen and Ying Zhou and Junhao Ji and Zhibo Yang and Yuxue Zhang and Haoyuan Hu and Zhenghao Liu},
journal={arXiv preprint arXiv:2510.09722},
year={2025},
url={https://arxiv.org/abs/2510.09722}
}
SmartResume - 智能简历解析系统
💻 Code | 🤗 Model | 🤖 Demo | 📑 Technical Report
English | 中文
项目介绍
SmartResume 是一个面向版面结构的智能简历解析系统,系统支持 PDF、图片及常见 Office 文档格式,融合 OCR 与 PDF 元数据完成文本提取,结合版面检测重建阅读顺序,并通过 LLM 将内容转换为结构化字段(如:基本信息、教育经历、工作经历等)。系统同时支持远程 API 和本地模型部署,提供灵活的使用方式。
demo
快速开始
环境要求
本地模型部署额外要求
安装步骤
克隆项目
创建conda环境
安装依赖
配置环境
基本使用
方法1: 使用命令行界面(推荐)
方法2: 使用Python API
本地模型部署
SmartResume 现在支持使用 vLLM 进行本地模型部署,减少对外部 API 的依赖:
详细的本地模型部署指南请参考 LOCAL_MODELS。
核心特色
基准结果
详细的基准测试结果请参考 基准测试结果。
配置说明
详细的配置选项请参考 配置指南。
快速配置
复制配置模板并根据需要编辑:
主要配置区域:
License Information
本项目采用 LICENSE。
未来我们将逐步替换为更宽松许可的方案,以提升用户友好度与灵活性。
重要说明
受限于开源合规性问题,代码是重构版本,内部PDF解析和OCR无法公布,使用的开源版本平替,部分功能未全部兼容。
TODO List
Acknowledgments
Citation
注意: 请确保项目使用遵守相关法律法规和隐私政策。