MENTAで教わった情報をシェアします。 ①PDFがデジタルテキストの場合でPyPDF2を用いた文字抽出方法をシェアします! PyPDF2: PythonでPDFを操作するためのライブラリ。ここではPDFからテキストを抽出するために使います。 pandas: データ分析用のライブラリ。
PyPDF2をインストールします。 import os #*****は、自分の名前 os.chdir(r"/Users/*****/Downloads") print(os.getcwd()) from PyPDF2 import PdfReader ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する