作者:mobiledu2502884523 | 来源:互联网 | 2023-10-11 18:47
有谁知道像Unix这样的系统中python中文档元数据的良好解析器.在Java中,apache tika很棒.
没有通讯…请:)
谢谢
解决方法:
您不必使用Jython即可使用Tika.您可以使用JCC从Python调用Java.您可以找到有关here的不错的说明.
安装JCC时,您必须使用setuptools提供的两个补丁之一,以便它可以构建共享对象. c7版本在Ubuntu 10.04上对我有用.
另一个选择是使用python子进程模块来调用和捕获Tika的标准输出.