Free Support Forum - groupdocs.com

GroupDocs Parser のGetTextのバグ

日本語による技術サポート

jfeadco July 7, 2020, 8:35am 1

GroupDocs.Parser でPDFファイルをGetTextを実行した際に永遠にメモリを消費し実行が終わらないファイルがあります。
回避する方法はありませんか？

1 Like

jfeadco July 7, 2020, 9:00am 2

PDFファイルを直接サポートに送ることはできますか？

jfeadco July 7, 2020, 9:10am 3

以下のコードで再現します。

  var ret = openFileDialog1.ShowDialog();
        if(ret != DialogResult.OK)
            return;

        string file = openFileDialog1.FileName;
        Parser parser = new Parser(file);
        using (TextReader reader = parser.GetText())
        {
            string readText = reader.ReadToEnd();
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : readText);
        }
        parser.Dispose();

atir.tahir July 7, 2020, 12:49pm 4

はい、問題のあるPDFを私たちと共有してください。ここでファイルを共有したくない場合は、プライベートメッセージで送信できます。次に、アプリケーションで使用しているAPIバージョン（20.1、20.5など）を共有してください。

jfeadco July 8, 2020, 3:22am 5

プライベートメッセージでPDFを送信しました。
APIバージョンは 20.6.1 です。

1 Like

atir.tahir July 8, 2020, 8:33am 6

詳細ありがとうございます。この問題は最後に再現されますが、スキャンされたPDFドキュメントを解析しようとしているためと考えられます。ただし、さらに調査するために、ID PARSERNET-1578でチケットを内部の問題追跡システムに記録しました。更新があるため、通知されます。

jfeadco July 9, 2020, 12:06am 7

複数のPDFファイルを読み取るため，スキャンされたPDFを判断できません。
例外が発生すれば対応できますが，例外も発生せずメモリを永遠に消費するためGroupdocs Parserを使用できません。
Parser または他の方法でスキャンされたPDFかどうか判断できますか？

1 Like

atir.tahir July 9, 2020, 9:02am 8

はい、この問題を改善する可能性を調査しています。更新がある場合は通知されます。

atir.tahir October 28, 2020, 6:32am 9

報告された問題 PARSERNET-1578は、APIバージョン20.10で修正されました。