对含有空格的 词组进行脱敏,文字部分可以正常脱敏,图片部分不能进行脱敏

您好:
我使用 脱敏23.9版本 和 在线测试工具 对附件中的内容进行脱敏验证,结果显示 文字部分 被正常脱敏, 图片部分没有被脱敏。 应该如何处理?

测试文件:
OCR_sample.pdf (175.5 KB)

测试关键字: 1234 5678 9098 7654
测试结果:
image.png (56.3 KB)

在线测试工具:Document Redaction: Remove Sensitive Content Online

@weilin
我们已在内部问题跟踪系统中打开以下新票证,并将根据 Free Support Policies 中提到的条款提供修复。

 问题 ID:REDACTIONJAVA-180

如果您需要优先支持,以及直接联系我们的付费支持管理团队,您可以获取 Paid Support Services

@weilin

在这种情况下,问题是任何 OCR 都可能包含识别错误,例如多余的空格、制表符而不是空格、被识别为点的光学噪声等。 模式“1234 5678 9098 7654”与识别的字符序列不匹配。 但如果您在 Document Redaction: Remove Sensitive Content Online 提供“\d{4}”(4 位数字)模式,您将获得附加结果:
OCR_sample-3.pdf (203.4 KB)