创建Parser出错

通过word或者Excel文件路径创建Parser的时候,如果当前文件已经被其他进程打开,则Parser创建会失败,但是如果是ppt或者pdf等文件,Parser却能够创建成功,可否帮忙解答一下原因,谢谢

1 Like

@Feg.xh

您能否指定 API 平台(您使用的是 API 的 .NET 或 Java 变体)? 还与我们分享解析器代码。 然后我们将调查这种情况。

你好,我使用的windows 10,.NET framework应该是4.6,我这边复现很容易,一个word或者Excel文档,使用office或者wps打开,然后使用文件路径创建GroupDocs Parser,就会触发这个问题,我本地的GroupDocs版本是23.3

1 Like

@Feg.xh

感谢您提供详细信息。 这个问题在我们这边被复现了。 因此,我们已将其记录在我们的内部问题跟踪系统中。 您的调查单 ID 是 PARSERNET-2114。 如果有任何进展更新,我们会通知您。
如果您需要优先支持,以及直接联系我们的付费支持管理团队,您可以获得付费支持服务

我这边在使用还发现了两个问题,也麻烦关注一下
1、我在ppt中添加了一个pdf附件,其文件名中包含了中文,当我使用Parser的getContainer解析出来之后,获取该containerItem的名称、路径等,中文部分全都是乱码;
2、也是在ppt中,我添加了一个doc格式的附件,当我解析出来之后,其名称是“对象1.doc”,并不是这个文件原本的名字,因此,无法提取该文件,也不能继续解析这个文件。

感谢!!!

上一个回复中的第二个问题,我发现使用Parser是可以解析的,但是我想请教一下,是否可以获取到真是的文件名称,从而获取到文件本身。

谢谢!!

@Feg.xh

您介意共享这些有问题的文件吗? 我们也会在最后调查它们。

test.7z (67.5 KB)
我上传文件了,复现问题的方法
1.解压之后,使用你们的Parser解析
2.使用getContainer获取到附件之后,有一个名称中含有中文的pdf,使用containerItem获取其名称和路径,中文部分均为乱码,
3.其中有一个doc的附件,通过containerItem获取其名称是 “对象 1.doc”,我希望能够获取到这个文件本身的名字。
以上就是我目前发现的问题,请帮忙验证一下,谢谢!

1 Like

@Feg.xh

感谢您提供详细信息。 我们已在内部问题跟踪系统中针对此问题记录了另一张票。 您的调查单 ID 是 PARSERNET-2115。 如有任何更新,我们会通知您。

你好,我想跟你们确认一下,这个问题是否可以解决?我目前可以不需要具体的解决方案和新的版本

@Feg.xh

您的门票仍在调查中。 如有任何更新,我们会通知您。