Chandra - 복잡한 테이블, 양식, 손글씨를 처리하는 OCR 모델

datalab-to/chandra (Python)

요약

Chandra는 복잡한 테이블, 양식, 손글씨를 전체 레이아웃과 함께 처리하는 OCR 모델입니다. 문서의 구조적 정보를 이해하면서 텍스트를 인식합니다.

핵심 포인트

  • 테이블, 양식, 손글씨 등 다양한 문서 형식을 단일 모델로 처리
  • 전체 페이지 레이아웃을 고려한 정확한 OCR 수행

왜 중요한가

복잡한 문서 처리가 필요한 스캔 시스템, 데이터 추출 파이프라인 개발에 유용한 도구입니다.