Tesseract, PyTesseract 설치방법
Tesseract는 OCR(광학 문자 인식) 엔진으로, 이미지에서 텍스트를 추출하는 데 사용됩니다. PyTesseract는 Tesseract를 Python에서 사용하기 쉽게 만든 래퍼입니다. Tesseract를 사용하려면 두 가지를 설치해야 합니다: Tesseract 엔진 자체와 PyTesseract Python 래퍼.
아래는 Tesseract와 PyTesseract를 설치하는 방법입니다.
1. Tesseract 설치
1.테서랙트 설치 파일을 다운로드.
Windows용은 https://github.com/UB-Mannheim/tesseract/wiki 에서 다운로드 가능.
Windows 64비트용 설치 파일: tesseract-ocr-w64-setup-v5.0.1.20220118.exe
설치
2.다운로드한 설치 프로그램을 실행.
Choose Components 화면에서 Additional language data (download)를 선택하고 Korean 선택
!!! 한국어 추가 하기
설치경로는 :C:/Program Files/Tesseract-OCR/tesseract.exe
macOS:
Ubuntu:
2. PyTesseract 설치
3. 테스트
다음 코드를 사용하여 PyTesseract가 제대로 설치되었는지 확인할 수 있습니다:
위 코드에서 `your_image_path.png` 부분을 사용하고자 하는 이미지 파일의 경로로 변경하세요. 또한, Windows에서는 Tesseract 엔진의 경로를 지정해야 할 수 있습니다.
이제 Tesseract와 PyTesseract가 정상적으로 설치되었고, 이미지에서 텍스트를 추출할 수 있게 됩니다.