MENTAで教わった情報をシェアします。 ①PDFがデジタルテキストの場合でPyPDF2を用いた文字抽出方法をシェアします! PyPDF2: PythonでPDFを操作するためのライブラリ。ここではPDFからテキストを抽出するために使います。 pandas: データ分析用のライブラリ。
PyPDF2をインストールします。 import os #*****は、自分の名前 os.chdir(r"/Users/*****/Downloads") print(os.getcwd()) from PyPDF2 import PdfReader ...