개요TrOCR는 Microsoft가 제안한 Transformer 기반 OCR 모델로, CNN+RNN 구조 중심의 전통적 OCR 방식에서 벗어나 Vision Transformer(ViT) 인코더와 Transformer 디코더를 결합한 End-to-End 문자 인식 모델이다. 이미지에서 직접 텍스트를 생성하는 Sequence-to-Sequence 구조를 채택하여, 별도의 문자 분리(Character Segmentation) 과정 없이 고정밀 인식이 가능하다.특히 인쇄체 및 필기체(Handwritten Text Recognition, HTR) 영역에서 기존 OCR 대비 높은 정확도를 보이며, Document AI 및 Multimodal AI 파이프라인의 핵심 모델로 활용되고 있다.1. 개념 및 정의TrOCR는..