1. 아이디어 분석 및 추출
1. 이력서 템플릿의 종류, 가로형, 세로형
수평 버전
수직 버전
2. 이력서는 사진, 워드 문서, PDF 문서, 대략 3가지 상황이 될 수 있습니다.
3. 먼저 위 파일에서 모든 텍스트 콘텐츠를 추출합니다.
텍스트 추출은 비교적 간단하지만 상대적으로 추출률이 높은 기술을 찾아야 함
4. 텍스트 내용은 대략 모듈로 나뉩니다.
일반적으로 이력서는 경력, 학력 등의 모듈로 나뉩니다.
전체 내용은 먼저 모듈 내용으로 나눌 수 있습니다.
5. 모듈 내용의 전반적인 구분
예를 들어, 시간, 회사, 프로젝트, 직위 등을 포함하는 업무 경험 모듈의 내용은 법률 또는 품사 등에 따라 추출될 수 있습니다.
현재 연구의 추출 결과의 정확도는 여전히 개선되어야 합니다.