文書校正ちゃん

AI校正について

このページでは、PDFの校正について説明します。

PDFの校正とは

PDFの校正とは、PDFからテキストを抽出し、それを校正する機能です。

最終的なPDFに潜む問題を検出できます。

本格的な文書校正はPDF化の前に行うのがオススメ

PDFを構造化されたテキストとして抽出するのは非常に難しく、完全なテキストとして抽出するのは困難です。

そのため、PDFを作成する前の段階で、Wordファイル・テキストファイル・Markdownの時点で校正を行うのがオススメです。

テキストファイルやMarkdownを、ZIPファイルに固めて本サービスにアップロードすれば、プロジェクトとしてまとめて校正作業ができます。

PDFの校正エラーに登場する『(cid:数値)』とは?

『(cid:数値)』はPDFのフォントが埋め込みサブセットになっているために表示されてしまう問題です。

PDFの解析時に元の文字を類推するのは非常に困難です。作成元ソフトで「フォント埋め込み+ToUnicodeマップを含める」設定を有効にしてから、PDFを生成してください。


→ヘルプ > トップ