Source code for langchain_community.document_loaders.image
from typing import List
from langchain_community.document_loaders.unstructured import UnstructuredFileLoader
[docs]class UnstructuredImageLoader(UnstructuredFileLoader):
"""使用`Unstructured`加载`PNG`和`JPG`文件。
您可以在两种模式中的一种中运行加载程序:"single"和"elements"。
如果使用"single"模式,文档将作为单个langchain Document对象返回。
如果使用"elements"模式,unstructured库将文档拆分为诸如Title和NarrativeText之类的元素。
您可以在模式之后传递额外的unstructured kwargs以应用不同的unstructured设置。
示例
--------
from langchain_community.document_loaders import UnstructuredImageLoader
loader = UnstructuredImageLoader(
"example.png", mode="elements", strategy="fast",
)
docs = loader.load()
参考资料
----------
https://unstructured-io.github.io/unstructured/bricks.html#partition-image"""
def _get_elements(self) -> List:
from unstructured.partition.image import partition_image
return partition_image(filename=self.file_path, **self.unstructured_kwargs)