Grobid解析器#
- class langchain_community.document_loaders.parsers.grobid.GrobidParser(segment_sentences: bool, grobid_server: str = 'http://localhost:8070/api/processFulltextDocument')[source]#
使用Grobid加载文章PDF文件。
方法
__init__
(segment_sentences[, grobid_server])lazy_parse
(blob)懒解析接口。
parse
(blob)急切地将blob解析为一个或多个文档。
process_xml
(file_path, xml_data, ...)处理来自Grobin的XML文件。
- Parameters:
segment_sentences (bool)
grobid_server (str)
- __init__(segment_sentences: bool, grobid_server: str = 'http://localhost:8070/api/processFulltextDocument') None [source]#
- Parameters:
segment_sentences (bool)
grobid_server (str)
- Return type:
无
使用 GrobidParser 的示例