创建Parser出错

Feg.xh · May 29, 2023, 11:11am

通过word或者Excel文件路径创建Parser的时候，如果当前文件已经被其他进程打开，则Parser创建会失败，但是如果是ppt或者pdf等文件，Parser却能够创建成功，可否帮忙解答一下原因，谢谢

atir.tahir · May 29, 2023, 11:27am

您能否指定 API 平台（您使用的是 API 的 .NET 或 Java 变体）？还与我们分享解析器代码。然后我们将调查这种情况。

Feg.xh · May 29, 2023, 11:57am

你好，我使用的windows 10，.NET framework应该是4.6，我这边复现很容易，一个word或者Excel文档，使用office或者wps打开，然后使用文件路径创建GroupDocs Parser，就会触发这个问题，我本地的GroupDocs版本是23.3

atir.tahir · May 29, 2023, 7:45pm

@Feg.xh

感谢您提供详细信息。这个问题在我们这边被复现了。因此，我们已将其记录在我们的内部问题跟踪系统中。您的调查单 ID 是 PARSERNET-2114。如果有任何进展更新，我们会通知您。
如果您需要优先支持，以及直接联系我们的付费支持管理团队，您可以获得付费支持服务。

Feg.xh · May 30, 2023, 2:03am

我这边在使用还发现了两个问题，也麻烦关注一下
1、我在ppt中添加了一个pdf附件，其文件名中包含了中文，当我使用Parser的getContainer解析出来之后，获取该containerItem的名称、路径等，中文部分全都是乱码；
2、也是在ppt中，我添加了一个doc格式的附件，当我解析出来之后，其名称是“对象1.doc”，并不是这个文件原本的名字，因此，无法提取该文件，也不能继续解析这个文件。

感谢！！！

Feg.xh · May 30, 2023, 6:10am

上一个回复中的第二个问题，我发现使用Parser是可以解析的，但是我想请教一下，是否可以获取到真是的文件名称，从而获取到文件本身。

谢谢！！

atir.tahir · May 30, 2023, 9:39am

@Feg.xh

您介意共享这些有问题的文件吗？我们也会在最后调查它们。

Feg.xh · May 31, 2023, 11:56am

test.7z (67.5 KB)
我上传文件了，复现问题的方法
1.解压之后，使用你们的Parser解析
2.使用getContainer获取到附件之后，有一个名称中含有中文的pdf，使用containerItem获取其名称和路径，中文部分均为乱码，
3.其中有一个doc的附件，通过containerItem获取其名称是 “对象 1.doc”，我希望能够获取到这个文件本身的名字。
以上就是我目前发现的问题，请帮忙验证一下，谢谢！

atir.tahir · May 31, 2023, 12:58pm

@Feg.xh

感谢您提供详细信息。我们已在内部问题跟踪系统中针对此问题记录了另一张票。您的调查单 ID 是 PARSERNET-2115。如有任何更新，我们会通知您。

Feg.xh · June 5, 2023, 3:38am

你好，我想跟你们确认一下，这个问题是否可以解决？我目前可以不需要具体的解决方案和新的版本

atir.tahir · June 5, 2023, 7:16am

@Feg.xh

您的门票仍在调查中。如有任何更新，我们会通知您。