Grobid解析器#
- class langchain_community.document_loaders.parsers.grobid.GrobidParser(segment_sentences: bool, grobid_server: str = 'http://localhost:8070/api/processFulltextDocument')[source]#
使用Grobid加载文章PDF文件。
方法
__init__(segment_sentences[, grobid_server])lazy_parse(blob)懒解析接口。
parse(blob)急切地将blob解析为一个或多个文档。
process_xml(file_path, xml_data, ...)处理来自Grobin的XML文件。
- Parameters:
segment_sentences (bool)
grobid_server (str)
- __init__(segment_sentences: bool, grobid_server: str = 'http://localhost:8070/api/processFulltextDocument') None[source]#
- Parameters:
segment_sentences (bool)
grobid_server (str)
- Return type:
无
使用 GrobidParser 的示例