개발일지

  • 홈
  • 태그
  • 방명록

TEXT 추출 1

[Python] PDF 텍스트 추출

PDF 텍스트 추출 개요 대학교에서 하는 수업들은 대게 PDF로 진행한다. 그래서 해당 내용을 정리할 때 PDF에 있는 텍스트 내용을 추출하면 편한 경우가 많다. 구글에 PDF 텍스트 추출을 검색하면 다양한 플랫폼이 나오지만, 직접 커스터마이징을 하고 싶어 파이썬으로 구현해 보았다. 본문 PyPDF2 파이썬에서는 Python으로 작성된 PDF 파일을 다루기 위한 라이브러리다. 이 라이브러리를 사용하면 PDF 파일을 읽고, 쓰고, 분할하는 등 다양한 작업을 수행할 수 있다. 이번 시간에는 파일을 읽는 것이 목적이므로 관련 함수인 PdfReader에 대해 알아보자. 일반적으로 PdfReader는 페이지 수 얻기, 개별 페이지 접근 등 다양한 읽기가 가능하다. 아래는 그 예제이므로 참고하자. # PDF 파일 ..

Language/Python 2023.10.31
이전
1
다음
더보기
프로필사진

게임 및 개발에 대한 일지

  • 분류 전체보기 (275)
    • CS (100)
      • 자료구조 (20)
      • 알고리즘 (14)
      • 컴퓨터구조 (12)
      • 컴퓨터비전 (1)
      • 데이터베이스 (4)
      • 딥러닝 (6)
      • 마이크로프로세서 (17)
      • 디지털영상처리 (21)
      • 임베디드 (3)
      • 통신 (2)
    • Language (40)
      • C++ (24)
      • Python (8)
      • C (3)
      • C# (5)
    • Game (21)
      • LostArk (4)
      • Unity (17)
    • Algorithm (100)
      • 백준 (75)
      • 프로그래머스 (25)
    • Version (4)
      • Git (4)
    • Program (7)
      • TeamCreator (1)
      • Dictionary (3)
      • Arduino (1)
      • Raspberry Pi (1)
    • Develope (2)

Tag

알고리즘, Algorithm, C++, 문자열, 마이크로컴퓨터, Cpp, Python, unity, String, DIGITAL IMAGE PROCESSING, stack, 백준, 프로그래머스, 자료구조, 마이크로프로세서, 정렬, 디지털 영상 처리, 유니티, DIP, 그리디,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바