Tesseract는 OCR(광학 문자 인식) 엔진으로, 이미지에서 텍스트를 추출하는 데 사용됩니다. PyTesseract는 Tesseract를 Python에서 사용하기 쉽게 만든 래퍼입니다. Tesseract를 사용하려면 두 가지를 설치해야 합니다: Tesseract 엔진 자체와 PyTesseract Python 래퍼.
아래는 Tesseract와 PyTesseract를 설치하는 방법입니다.
1. Tesseract 설치
1.테서랙트 설치 파일을 다운로드.
Windows용은 https://github.com/UB-Mannheim/tesseract/wiki 에서 다운로드 가능.
Windows 64비트용 설치 파일: tesseract-ocr-w64-setup-v5.0.1.20220118.exe
설치
2.다운로드한 설치 프로그램을 실행.
Choose Components 화면에서 Additional language data (download)를 선택하고 Korean 선택
!!! 한국어 추가 하기
설치경로는 :C:/Program Files/Tesseract-OCR/tesseract.exe
macOS:
Ubuntu:
2. PyTesseract 설치
3. 테스트
다음 코드를 사용하여 PyTesseract가 제대로 설치되었는지 확인할 수 있습니다:
위 코드에서 `your_image_path.png` 부분을 사용하고자 하는 이미지 파일의 경로로 변경하세요. 또한, Windows에서는 Tesseract 엔진의 경로를 지정해야 할 수 있습니다.
이제 Tesseract와 PyTesseract가 정상적으로 설치되었고, 이미지에서 텍스트를 추출할 수 있게 됩니다.
'python3 selenium' 카테고리의 다른 글
Python selenium Thread 를 사용하여 함수를 병렬로 실행하고, 각 스레드가 실행을 완료할 때까지 대기하는 예제입니다 (0) | 2023.12.08 |
---|---|
python selenium pyqt5 창닫힘 이벤트 추가 (1) | 2023.12.08 |
python selenium 서버 시간 가져오기 & timer (0) | 2023.11.30 |
Python selenium pyqt5 창닫힘 이벤트 (0) | 2023.11.30 |
Python Pyqt5 입려값 json 파일로 저장, 불러오기, 수정, 삭제 (0) | 2023.11.29 |