agencies

파이썬으로 이미지 내용을 텍스트로 추출하여 읽기 (ocr) 본문

Ⅰ. 프로그래밍

파이썬으로 이미지 내용을 텍스트로 추출하여 읽기 (ocr)

agencies 2024. 11. 28. 11:00

tesseract 를 이용하여 이미지 안의 텍스트를 읽을 수 있다고 합니다.

(소스코드)

#pip install pytesseract
import pytesseract
from PIL import Image

# Tesseract 실행 파일 경로 설정 (Windows 설치 경로)
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# 이미지 로드
image_path = "./image.png"
image = Image.open(image_path)

# 이미지에서 텍스트 추출
text = pytesseract.image_to_string(image)
print(text)

 

(테스트 이미지)

 

(실행결과)

 


사전 준비물

환경 : 윈도우

tesseract-ocr-w64-setup-5.5.0.20241111.zip
0.81MB
tesseract-ocr-w64-setup-5.5.0.20241111.z01
19.53MB

 

 

위 파일을 다운받아 설치를 진행하면 되겠습니다.

(공식) github : https://github.com/UB-Mannheim/tesseract/wiki

 

Home

Tesseract Open Source OCR Engine (main repository) - UB-Mannheim/tesseract

github.com

 

 파일을 실행하여 설치하면,

기본 경로는 아래와 같습니다.


이를 통해 이미지 안에 적혀있는 글을 추출하여, 텍스트로 변환하여 볼 수 있겠습니다!

여담으로... ctf에 misc로 출제하면 좋을 것 같습니다.

사진안에 엄청나게 많은 글씨가 있는것이죠(예를들면 base64)로 적혀있는 사진을 문제파일로 제공하면,

 

사용자들은 해당 사진을 ocr로 추출하여 플래그를 획득할 수 있도록이요!