この連載で説明しているサンプルでは、テキストの抽出はPDFViewControllerクラスで行っていた。これを拡張していこう。 前にも説明したが、PDFデータはストリームとして与えられる。テキストとエンコーディングがどのような関係でストリームに登場するか見 ...
例によって、Voyeurを使ってPDFデータを確認してみよう。テキストデータが格納されているのは、Tjオペレータの前だった。そのデータの前を見てみると、「Tf」というオペレータがあるのが分かる。PDFの仕様書によると、Tfは「Set text font and size」を示す ...