결제요청된 문서를 읽어서 은행에 송금차리하는것 만들기
하는방법
- OCR (Optical Character Recognition) 기술을 사용
- Python 에서 Tesseract OCR 라이브러리를 통해 이미지에서 텍스트를 추출한다.
Prerequisite
Tesseract: Tesseract OCR 엔진을 설치
brew install tesseract
sudo apt-get install tesseract-ocr
Python 라이브러리 설치: pytesseract와 Pillow 라이브러리를 설치
pip install pytesseract Pillow
Tesseract는 기본적으로 영어만 지원하므로, 한글을 인식하려면 한글 언어 데이터 파일을 설치
한글언어데이터 : https://github.com/tesseract-ocr/tessdata/blob/main/kor.traineddata
실제 설치
brew install tesseract
설치이후
/usr/local/share/tessdata
파일생김
*Linux와 macOS에서는 일반적으로 시스템에 설치된 Tesseract를 자동으로 인식하므로, 별도의 경로 설정이 필요하지 않을 수 있습니다.



