PDF에서 정보를 추출하려면 고려해야할 사항, 그리고 관련된 툴들이 너무 다양합니다. 여기에 관련된 내용을 정리를 틈틈히 하려고 합니다. 최종 완성되면 완성되었다라고 표기를 하겠습니다. 그동안은 '작업 중' 글로 이해해 주세요. 목차: 1. PDF 텍스트 추출을 위한 라이브러리2. 인공지능 기반의 PDF, 이미지 처리 툴3. Base64 - 왜? 언제? 어떻게 ? ✅ 문서 정보 추출 기법 개요현재 문서 정보 추출 기법은 크게 네 가지 주요 접근 방식으로 나눌 수 있다.✅ 1. OCR 기반 텍스트 추출✔ OCR (Optical Character Recognition) 모델을 사용하여 문서에서 직접 텍스트를 추출한다.✔ 텍스트 위주의 문서에서는 효과적이지만, 이미지, 표, 수식 등이 포함된 문서에서는 ..