PDFの校正について

このページでは、PDFの校正について説明します。

PDFの校正とは、PDFからテキストを抽出し、それを校正する機能です。

最終的なPDFに潜む問題を検出できます。

PDFを構造化されたテキストとして抽出するのは非常に難しく、完全なテキストとして抽出するのは困難です。

そのため、PDFを作成する前の段階で、Wordファイル・テキストファイル・Markdownの時点で校正を行うのがオススメです。

テキストファイルやMarkdownを、ZIPファイルに固めて本サービスにアップロードすれば、プロジェクトとしてまとめて校正作業ができます。

『(cid:数値)』はPDFのフォントが埋め込みサブセットになっているために表示されてしまう問題です。

PDFの解析時に元の文字を類推するのは非常に困難です。作成元ソフトで「フォント埋め込み＋ToUnicodeマップを含める」設定を有効にしてから、PDFを生成してください。