ナレッジベースにドキュメントを読み込む際のエラー

ナレッジベースにドキュメントを追加する際、ステータスがエラーになるドキュメントが多く困っています。

回避するためのトライとして、パイプラインでドキュメントからテキストのみを抽出しチャンキングする処理を追加してみたのですが、エラー率は(体感)変化がありません。

何か良い解決策はありますか?