使用rapidocr从图像中提取#

langchain_community.document_loaders.parsers.pdf.extract_from_images_with_rapidocr(images: Sequence[Iterable[ndarray] | bytes]) str[source]#

使用RapidOCR从图像中提取文本。

Parameters:

images (Sequence[Iterable[ndarray] | bytes]) – 从中提取文本的图像。

Returns:

从图像中提取的文本。

Raises:

ImportError – 如果未安装 rapidocr-onnxruntime 包。

Return type:

字符串