📄️ acreom
acreom 是一个以开发者为先的知识库,任务运行在本地的 markdown 文件上。
📄️ AirbyteLoader
Airbyte 是一个用于从 API、数据库和文件到数据仓库和数据湖的 ELT 管道的数据集成平台。它拥有最大的 ELT 连接器目录,可连接到数据仓库和数据库。
📄️ Airbyte CDK (已弃用)
注意:AirbyteCDKLoader 已弃用。请使用 AirbyteLoader。
📄️ Airbyte Gong (已弃用)
注意:此特定连接器已弃用。请改用 AirbyteLoader。
📄️ Airbyte Hubspot(已弃用)
注意:AirbyteHubspotLoader已被弃用。请改用AirbyteLoader。
📄️ Airbyte JSON(已弃用)
注意:AirbyteJSONLoader已被弃用。请改用AirbyteLoader。
📄️ Airbyte Salesforce(已弃用)
注意:此连接器特定的加载程序已被弃用。请改用 AirbyteLoader。
📄️ Airbyte Shopify(已弃用)
注意:此特定连接器加载程序已被弃用。请改用 AirbyteLoader。
📄️ Airbyte Stripe(已弃用)
注意:此连接器特定的加载程序已被弃用。请改用 AirbyteLoader。
📄️ Airbyte Typeform(已弃用)
注意:此特定于连接器的加载程序已被弃用。请改用 AirbyteLoader。
📄️ Airbyte Zendesk Support(已弃用)
注意:此连接器特定的加载程序已被弃用。请改用 AirbyteLoader。
📄️ Airtable
* 在这里获取你的 API 密钥。
📄️ 阿里云MaxCompute
阿里云MaxCompute(以前称为ODPS)是一个通用的、完全托管的、多租户的大规模数据仓库数据处理平台。MaxCompute支持各种数据导入解决方案和分布式计算模型,使用户能够高效地查询海量数据集,降低生产成本,并确保数据安全。MaxComputeLoader允许您执行MaxCompute SQL查询并将结果加载为每行一个文档。
📄️ 亚马逊文本提取
亚马逊文本提取是一项机器学习(ML)服务,可以自动从扫描文档中提取文本、手写内容和数据。
📄️ Apify 数据集
Apify 数据集 是一个可扩展的追加存储系统,支持顺序访问,专为存储结构化的网络爬虫结果而构建,例如产品列表或 Google SERP,然后可以将其导出为 JSON、CSV 或 Excel 等各种格式。数据集主要用于保存 Apify Actors 的结果,这些是用于各种网络爬虫、爬取和数据提取用例的无服务器云程序。
📄️ ArcGIS
本文介绍了如何使用 langchaincommunity.documentloaders.ArcGISLoader 类。
📄️ Arxiv
arXiv 是一个开放获取的存档,收录了来自物理学、数学、计算机科学、数量生物学、数量金融、统计学、电气工程与系统科学以及经济学等领域的 200 万篇学术文章。
📄️ AssemblyAI 音频转录
AssemblyAIAudioTranscriptLoader 允许使用 AssemblyAI API 对音频文件进行转录,并将转录的文本加载到文档中。
📄️ AstraDB
DataStax 的 Astra DB 是建立在 Cassandra 基础上的无服务器矢量数据库,通过易于使用的 JSON API 方便地提供。
📄️ 异步 Chromium
Chromium 是 Playwright 支持的浏览器之一,Playwright 是一个用于控制浏览器自动化的库。
📄️ 异步HTML
AsyncHtmlLoader可以同时从一组URL中加载原始HTML。
📄️ Athena
Amazon Athena 是一个基于开源框架构建的无服务器交互式分析服务,支持开放表格和文件格式。Athena 提供了一种简化、灵活的方式来分析存储在数据湖中的千兆字节数据。您可以使用 SQL 或 Python 分析数据或构建应用程序,这些数据可以来自 Amazon Simple Storage Service (S3) 数据湖和 30 个数据源,包括本地数据源或其他云系统。Athena 基于开源的 Trino 和 Presto 引擎以及 Apache Spark 框架构建,无需进行任何配置或配置工作。
📄️ AWS S3 目录
Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务。
📄️ AWS S3 文件
Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务。
📄️ AZLyrics
AZLyrics 是一个庞大、合法且每天都在增长的歌词收集库。
📄️ Azure AI 数据
Azure AI Studio 提供了将数据资产上传到云存储并从以下来源注册现有数据资产的功能:
📄️ Azure Blob Storage 容器
Azure Blob Storage 是微软的云对象存储解决方案。Blob Storage 专为存储大量非结构化数据进行了优化。非结构化数据是指不符合特定数据模型或定义的数据,例如文本或二进制数据。
📄️ Azure Blob 存储文件
Azure Files 提供了在云中可通过行业标准的 Server Message Block (SMB) 协议、Network File System (NFS) 协议和 Azure Files REST API 访问的完全托管文件共享。
📄️ Azure AI 文档智能
Azure AI 文档智能(以前称为 Azure Form Recognizer)是基于机器学习的服务,可以从数字或扫描的 PDF、图像、Office 和 HTML 文件中提取文本(包括手写文字)、表格、文档结构(例如标题、章节标题等)和键值对。
📄️ BibTeX
BibTeX 是一种文件格式和参考文献管理系统,通常与 LaTeX 排版一起使用。它用于组织和存储学术和研究文档的文献信息。
📄️ 哔哩哔哩
哔哩哔哩是中国最受喜爱的长视频网站之一。
📄️ 黑板
Blackboard Learn(之前称为 Blackboard 学习管理系统)是由 Blackboard 公司开发的基于网络的虚拟学习环境和学习管理系统。该软件具有课程管理、可定制的开放式架构和可扩展的设计,可以与学生信息系统和认证协议集成。它可以安装在本地服务器上,由 Blackboard ASP Solutions 托管,也可以作为由 Amazon Web Services 托管的软件即服务提供。其主要目的是在传统面对面课程中添加在线元素,并开发几乎没有或没有面对面会议的完全在线课程。
📄️ 区块链
概述
📄️ 勇敢搜索
勇敢搜索 是由勇敢软件开发的搜索引擎。
📄️ Browserbase
Browserbase 是一个开发者平台,可可靠地运行、管理和监控无头浏览器。
📄️ Browserless
Browserless 是一个允许你在云端运行无头 Chrome 实例的服务。这是一个在大规模运行基于浏览器的自动化任务时,无需担心管理自己的基础设施的绝佳方式。
📄️ Cassandra
Cassandra 是一种 NoSQL、面向行的、高度可扩展且高度可用的数据库。从 5.0 版本开始,该数据库具备了向量搜索功能。
📄️ ChatGPT 数据
ChatGPT 是由 OpenAI 开发的人工智能(AI)聊天机器人。
📄️ 大学机密
College Confidential 提供了3800多所大学和大学的信息。
📄️ 并发加载器
对于那些选择优化工作流程的人来说,与通用加载器的工作方式相同,但具有并发加载功能。
📄️ Confluence
Confluence 是一个维基协作平台,用于保存和组织与项目相关的所有材料。Confluence 是一个主要处理内容管理活动的知识库。
📄️ CoNLL-U
CoNLL-U 是 CoNLL-X 格式的修订版本。注释以纯文本文件的形式进行编码(UTF-8 编码,使用 LF 字符作为换行符,文件末尾包含一个 LF 字符),文件中包含三种类型的行:
📄️ 复制粘贴
本文介绍如何从你想要复制粘贴的内容中加载一个文档对象。在这种情况下,你甚至不需要使用 DocumentLoader,而是可以直接构造 Document 对象。
📄️ Couchbase
Couchbase 是一款备受赞誉的分布式 NoSQL 云数据库,为您的云端、移动、人工智能和边缘计算应用程序提供无与伦比的多功能性、性能、可伸缩性和财务价值。
📄️ CSV
逗号分隔值(CSV)文件是一种使用逗号来分隔值的定界文本文件。文件的每一行都是一个数据记录。每个记录由一个或多个字段组成,字段之间用逗号分隔。
📄️ Cube 语义层
本笔记本演示了检索 Cube 数据模型元数据的过程,以适合作为嵌入传递给 LLMs,从而增强上下文信息。
📄️ Datadog 日志
Datadog 是一个针对云规模应用的监控和分析平台。
📄️ Diffbot
Diffbot 是一套基于机器学习的产品,可以轻松地结构化网络数据。
📄️ Discord
Discord 是一款语音通话和即时消息社交平台。用户可以通过语音通话、视频通话、文字消息、媒体和文件在私聊或作为名为“服务器”的社区的一部分进行沟通。服务器是一组持久的聊天室和语音频道,可以通过邀请链接访问。
📄️ Docugami
本笔记介绍如何从 Docugami 加载文档。它提供了使用该系统相对于其他数据加载器的优势。
📄️ Docusaurus
Docusaurus 是一个静态网站生成器,提供开箱即用的文档功能。
📄️ Dropbox
Dropbox 是一个文件托管服务,它将传统文件、云内容和网页快捷方式集合到一个地方。
📄️ DuckDB
DuckDB 是一种内置的 SQL OLAP 数据库管理系统。
📄️ 电子邮件
本笔记展示了如何加载电子邮件(.eml)或 Microsoft Outlook(.msg)文件。
📄️ EPub
EPUB 是一种使用“.epub”文件扩展名的电子书文件格式。该术语缩写自电子出版物,有时写作 ePub。EPUB 受到许多电子阅读器的支持,并且大多数智能手机、平板电脑和计算机都有兼容的软件可用。
📄️ Etherscan
Etherscan 是领先的以太坊区块链浏览器、搜索、API 和分析平台,用于以太坊这一去中心化智能合约平台。
📄️ 印象笔记
EverNote 旨在存档和创建笔记,其中可以嵌入照片、音频和保存的网页内容。笔记存储在虚拟的 "笔记本" 中,可以进行标记、注释、编辑、搜索和导出。
📄️ Facebook 聊天
Messenger) 是一款由 Meta Platforms 开发的美国专有即时通讯应用程序和平台。最初于 2008 年开发为 Facebook Chat,该公司在 2010 年改进了其消息服务。
📄️ Fauna
Fauna 是一种文档数据库。
📄️ Figma
Figma 是一个用于界面设计的协作式 Web 应用程序。
📄️ FireCrawl
FireCrawl 是一个将任何网站爬取并转换为 LLM-ready 数据的工具。它会爬取所有可访问的子页面,并为每个页面提供干净的 markdown 和元数据。无需网站地图。
📄️ Geopandas
Geopandas 是一个开源项目,旨在使在 Python 中处理地理空间数据变得更加容易。
📄️ Git
Git 是一种分布式版本控制系统,用于跟踪任何一组计算机文件的更改,通常用于协调在软件开发过程中共同开发源代码的程序员之间的工作。
📄️ GitBook
GitBook 是一个现代文档平台,团队可以在上面记录从产品到内部知识库和 API 等各种内容。
📄️ GitHub
这个笔记本展示了如何在 GitHub 上加载给定存储库的问题和拉取请求(PRs)。还展示了如何在 GitHub 上为给定存储库加载 github 文件。我们将使用 LangChain Python 存储库作为示例。
📄️ Glue 目录
AWS Glue 数据目录 是一个集中的元数据存储库,允许您管理、访问和共享存储在 AWS 中的数据的元数据。它充当您的数据资产的元数据存储,使各种 AWS 服务和您的应用程序能够高效地查询和连接到它们所需的数据。
📄️ Google AlloyDB for PostgreSQL
AlloyDB 是一个完全托管的关系型数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。AlloyDB 与 PostgreSQL 100% 兼容。通过 AlloyDB 的 Langchain 集成,扩展您的数据库应用程序以构建基于人工智能的体验。
📄️ Google BigQuery
Google BigQuery 是一个无服务器且成本效益高的企业数据仓库,可跨云工作并随数据扩展。BigQuery 是 Google Cloud Platform 的一部分。
📄️ Google Bigtable
Bigtable 是一种键-值和宽列存储,非常适合快速访问结构化、半结构化或非结构化数据。通过 Bigtable 的 Langchain 集成,可以扩展数据库应用程序以构建利用人工智能的体验。
📄️ Google Cloud SQL for SQL server
Cloud SQL 是一个完全托管的关系型数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。它提供 MySQL、PostgreSQL 和 SQL Server 数据库引擎。通过 Cloud SQL 的 Langchain 集成,可以扩展数据库应用程序以构建利用人工智能的体验。
📄️ Google Cloud SQL for MySQL
Cloud SQL 是一个完全托管的关系型数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。它提供 MySQL、PostgreSQL 和 SQL Server 数据库引擎。通过 Cloud SQL 的 Langchain 集成,可以扩展数据库应用程序以构建利用人工智能的体验。
📄️ Google Cloud SQL for PostgreSQL
Cloud SQL for PostgreSQL 是一个完全托管的数据库服务,可帮助您在 Google 云平台上设置、维护、管理和管理您的 PostgreSQL 关系数据库。通过 Cloud SQL for PostgreSQL 的 Langchain 集成,扩展您的数据库应用程序以构建基于人工智能的体验。
📄️ 谷歌云存储目录
谷歌云存储是一项用于存储非结构化数据的托管服务。
📄️ 谷歌云存储文件
谷歌云存储 是一个用于存储非结构化数据的托管服务。
📄️ Google Firestore 数据库模式中的 Datastore
Firestore 数据库模式中的 Datastore 是一个专为自动扩展、高性能和应用开发便利性而构建的 NoSQL 文档数据库。通过 Datastore 的 Langchain 集成,您可以扩展数据库应用程序,构建利用人工智能的体验。
📄️ 谷歌云盘
谷歌云盘 是由谷歌开发的文件存储和同步服务。
📄️ 为 Oracle 工作负载准备 Google El Carro
Google 的 El Carro Oracle Operator 提供了一种在 Kubernetes 中运行 Oracle 数据库的方式,作为一个便携、开源、社区驱动、无供应商锁定的容器编排系统。El Carro 提供了一个强大的声明式 API,用于全面和一致的配置和部署,以及实时操作和监控。
📄️ Google Firestore(原生模式)
Firestore 是一个无服务器的面向文档的数据库,可以根据需求进行扩展。通过使用Firestore的Langchain集成,扩展您的数据库应用程序以构建基于人工智能的体验。
📄️ Google Memorystore for Redis
Google Memorystore for Redis 是一项由 Redis 内存数据存储支持的全托管服务,用于构建应用程序缓存,提供亚毫秒级数据访问。利用 Memorystore for Redis 的 Langchain 集成,可以扩展数据库应用程序,构建基于人工智能的体验。
📄️ 谷歌Spanner
Spanner 是一个高度可扩展的数据库,它将无限可扩展性与关系语义结合在一起,例如次要索引、强一致性、模式和 SQL,提供了一个简单的解决方案,可实现 99.999% 的可用性。
📄️ 谷歌语音转文字音频转录
GoogleSpeechToTextLoader 允许使用 Google Cloud 语音转文字 API 对音频文件进行转录,并将转录的文本加载到文档中。
📄️ Grobid
GROBID 是一个用于提取、解析和重构原始文档的机器学习库。
📄️ 古腾堡计划
古腾堡计划是一个提供免费电子书的在线图书馆。
📄️ Hacker News
Hacker News(有时缩写为HN)是一个专注于计算机科学和创业的社交新闻网站。它由投资基金和创业孵化器Y Combinator运营。一般来说,可以提交的内容被定义为“满足人们的知识好奇心的任何东西”。
📄️ 华为 OBS 目录
以下代码演示了如何从华为 OBS(对象存储服务)中加载对象作为文档。
📄️ 华为 OBS 文件
以下代码演示了如何从华为 OBS(对象存储服务)加载对象作为文档。
📄️ HuggingFace 数据集
Hugging Face Hub 是一个拥有超过 5,000 个数据集的平台,涵盖了100多种语言,可用于自然语言处理、计算机视觉和音频等广泛领域的任务。这些数据集可用于各种任务,例如翻译、自动语音识别和图像分类。
📄️ iFixit
iFixit 是网络上最大的开放维修社区。该网站包含近10万份维修手册,42,000款设备的20万个问答,所有数据均在 CC-BY-NC-SA 3.0 许可下发布。
📄️ 图像
这部分介绍了如何将 JPG 或 PNG 等图像加载到我们可以在下游使用的文档格式中。
📄️ 图像说明
默认情况下,加载器使用预训练的Salesforce BLIP图像说明模型。
📄️ IMSDb
IMSDb 是“互联网电影剧本数据库”。
📄️ Iugu
Iugu 是一家巴西服务和软件即服务(SaaS)公司。它提供用于电子商务网站和移动应用程序的支付处理软件和应用程序编程接口。
📄️ Joplin
Joplin 是一款开源的笔记应用。您可以记录自己的想法,并安全地从任何设备访问它们。
📄️ Jupyter Notebook
Jupyter Notebook(前身为 IPython Notebook)是一个基于网络的交互式计算环境,用于创建笔记本文档。
📄️ Kinetica
这个笔记本介绍了如何从 Kinetica 加载文档。
📄️ lakeFS
lakeFS 提供了对数据湖的可扩展版本控制,并使用类似 Git 的语义来创建和访问这些版本。
📄️ LarkSuite(飞书)
LarkSuite 是字节跳动开发的企业协作平台。
📄️ LLM Sherpa
本文介绍如何使用 LLM Sherpa 加载多种类型的文件。LLM Sherpa 支持不同的文件格式,包括 DOCX、PPTX、HTML、TXT 和 XML。
📄️ 猛犸象
Mastodon 是一个联合式社交媒体和社交网络服务。
📄️ MediaWiki Dump
MediaWiki XML Dumps 包含了维基的内容(包括所有修订版本的维基页面),但不包含与网站相关的数据。XML dump 并不是维基数据库的完整备份,它不包含用户账户、图片、编辑日志等。
📄️ 合并文档加载器
合并一组指定数据加载器返回的文档。
📄️ MHTML
MHTML 既可用于电子邮件,也可用于存档网页。MHTML,有时也称为 MHT,代表 MIME HTML,是一个包含整个网页的单个文件。当将网页保存为 MHTML 格式时,该文件扩展名将包含 HTML 代码、图像、音频文件、Flash 动画等。
📄️ 微软 Excel
UnstructuredExcelLoader 用于加载 Microsoft Excel 文件。该加载器适用于 .xlsx 和 .xls 文件。页面内容将是 Excel 文件的原始文本。如果您在 "elements" 模式下使用加载器,则可以在文档元数据中的 textashtml 键下找到 Excel 文件的 HTML 表示形式。
📄️ 微软 OneDrive
微软 OneDrive(原名 SkyDrive)是由微软运营的文件托管服务。
📄️ 微软 OneNote
本笔记本涵盖了如何从 OneNote 中加载文档。
📄️ 微软 PowerPoint
微软 PowerPoint 是微软的一款演示文稿程序。
📄️ 微软 SharePoint
微软 SharePoint 是一个基于网站的协作系统,使用工作流应用程序、“列表”数据库和其他网络部件以及安全功能,以赋予业务团队共同工作的能力,由微软开发。
📄️ Microsoft Word
Microsoft Word 是由 Microsoft 开发的文字处理软件。
📄️ Near 区块链
概述
📄️ 现代财务
现代财务简化了复杂的支付操作。它是一个统一的平台,用于支持移动资金的产品和流程。
📄️ MongoDB
MongoDB 是一种 NoSQL、面向文档的数据库,支持具有动态模式的类似 JSON 的文档。
📄️ 新闻网址
这篇文章介绍了如何从一系列网址中加载 HTML 新闻文章,并将其转换成我们可以在下游使用的文档格式。
📄️ Notion 数据库 1/2
Notion 是一个协作平台,支持修改的 Markdown,并集成了看板、任务、维基和数据库功能。它是一个集合了笔记、知识和数据管理以及项目和任务管理的多合一工作空间。
📄️ Notion 数据库 2/2
Notion 是一个协作平台,支持修改后的 Markdown,并集成了看板、任务、维基和数据库。它是一个集合了笔记、知识和数据管理以及项目和任务管理的全能工作空间。
📄️ Nuclia
Nuclia 自动索引您来自任何内部和外部来源的非结构化数据,提供优化的搜索结果和生成式答案。它可以处理视频和音频转录,图像内容提取和文档解析。
📄️ Obsidian
Obsidian 是一个功能强大且可扩展的知识库,它可以在本地的纯文本文件夹上运行。
📄️ 开放文档格式(ODT)
办公应用开放文档格式(ODF),也称为 OpenDocument,是一种用于文字处理文档、电子表格、演示文稿和图形的开放文件格式,使用 ZIP 压缩的 XML 文件。它的开发目的是为办公应用提供一种开放的基于 XML 的文件格式规范。
📄️ 开放城市数据
Socrata 提供了一个城市开放数据的 API。
📄️ Oracle 自主数据库
Oracle自主数据库是一种云数据库,利用机器学习来自动化数据库调优、安全性、备份、更新以及其他传统由数据库管理员(DBAs)执行的例行管理任务。
📄️ Oracle AI Vector Search: 文档处理
Oracle AI Vector Search 专为人工智能(AI)工作负载设计,允许您基于语义而不是关键词查询数据。
📄️ Org-mode
Org Mode 是一种用于编辑、格式化和组织文档的模式,专为在自由软件文本编辑器 Emacs 中进行笔记、计划和撰写而设计。
📄️ Pandas DataFrame
这篇笔记介绍了如何从 pandas DataFrame 中加载数据。
📄️ Pebblo 安全文档加载器
Pebblo 可以帮助开发人员在不担心组织的合规性和安全要求的情况下加载数据并推广他们的 Gen AI 应用程序。该项目可以识别加载数据中的语义主题和实体,并在用户界面或 PDF 报告中对其进行总结。
📄️ Polars DataFrame
本文档介绍了如何从 polars DataFrame 加载数据。
📄️ 心灵感应
本文介绍如何从 Psychic 加载文档。更多详情请参见这里。
📄️ PubMed
PubMed®由美国国家生物技术信息中心、国家医学图书馆提供,包括来自MEDLINE、生命科学期刊和在线图书的超过3500万条生物医学文献引用。引用可能包括来自PubMed Central和出版商网站的全文内容链接。
📄️ PySpark
这篇笔记介绍了如何从 PySpark DataFrame 中加载数据。
📄️ Quip
Quip 是一款面向移动端和 Web 的协作办公软件套件。它允许一群人一起创建和编辑文档和电子表格,通常用于商务目的。
📄️ ReadTheDocs 文档
Read the Docs 是一个开源的免费软件文档托管平台。它使用 Sphinx 文档生成器生成文档。
📄️ 递归 URL
我们可能希望处理根目录下的所有 URL。
Reddit 是一个美国社交新闻聚合、内容评级和讨论网站。
📄️ Roam
ROAM 是一个用于网络化思维的笔记工具,旨在创建个人知识库。
📄️ Rockset
Rockset 是一个实时分析数据库,可以在不增加操作负担的情况下对海量半结构化数据进行查询。使用 Rockset,摄入的数据可以在一秒内进行查询,并且针对该数据的分析查询通常在毫秒内执行。Rockset 是计算优化的,适用于处理子 100TB 范围内的高并发应用程序(或者使用汇总后的大于数百 TB 的数据)。
📄️ rspace
这份笔记展示了如何使用 RSpace 文档加载器将研究笔记和文档从 RSpace 电子实验室笔记本导入到 Langchain 流程中。
📄️ RSS 订阅
这里介绍了如何从一系列 RSS 订阅 URL 中加载 HTML 新闻文章,并将其转换为我们可以在下游使用的文档格式。
📄️ RST
reStructured Text (RST) 文件是一种用于文本数据的文件格式,主要在 Python 编程语言社区中用于技术文档。
📄️ 网站地图
SitemapLoader 是基于 WebBaseLoader 的扩展,用于从给定的 URL 加载网站地图,然后并发地进行页面抓取和加载,将每个页面作为一个文档返回。
📄️ Slack
Slack 是一款即时通讯程序。
📄️ 雪花
这篇笔记介绍了如何从雪花(Snowflake)加载文档。
📄️ 源代码
本文介绍了如何使用语言解析的特殊方法加载源代码文件:代码中的每个顶层函数和类都会被加载到单独的文档中。任何剩余的顶层代码(即已加载的函数和类之外的代码)将被加载到单独的文档中。
📄️ Spider
Spider 是最快速且价格最实惠的网络爬虫和数据抓取工具,可返回适用于大型语言模型的数据。
📄️ Spreedly
Spreedly 是一项服务,允许您安全地存储信用卡并将其用于与任意数量的支付网关和第三方 API 进行交易。它通过同时提供卡片标记/保险库服务以及网关和接收器集成服务来实现这一点。由 Spreedly 标记化的支付方式存储在 Spreedly,允许您独立存储一张卡,并根据您的业务需求将该卡传递给不同的终点。
📄️ Stripe
Stripe 是一家爱尔兰-美国的金融服务和软件即服务(SaaS)公司。它提供支付处理软件和应用程序编程接口,用于电子商务网站和移动应用程序。
📄️ 字幕文件格式
SubRip 文件格式 在 Matroska 多媒体容器格式的网站上被描述为“也许是所有字幕格式中最基本的一个。” SubRip (SubRip Text) 文件的扩展名为 .srt,其中包含由空行分隔的分组中的格式化纯文本行。字幕按顺序编号,从 1 开始。使用的时间码格式为小时秒,毫秒,时间单位固定为两个零填充数字,分数固定为三个零填充数字 (0000,000)。使用逗号作为小数分隔符,因为该程序是在法国编写的。
📄️ SurrealDB
SurrealDB 是一种端到端的云原生数据库,专为现代应用程序设计,包括 Web、移动、无服务器、Jamstack、后端和传统应用程序。使用 SurrealDB,您可以简化数据库和 API 基础架构,减少开发时间,并快速、具有成本效益地构建安全、高性能的应用程序。
📄️ 电报
Telegram Messenger 是一种全球可访问的免费即时通讯服务,支持跨平台、加密、基于云的集中式服务。该应用还提供可选的端到端加密聊天和视频通话、VoIP、文件共享以及其他几项功能。
📄️ 腾讯云对象存储 (COS) 目录
腾讯云对象存储 (COS) 是一项分布式存储服务,可以通过 HTTP/HTTPS 协议从任何地方存储任意数量的数据。COS 对数据结构或格式没有限制。它还没有存储桶大小限制和分区管理,适用于几乎任何用例,如数据传输、数据处理和数据湖。COS 提供基于 Web 的控制台、多语言 SDK 和 API、命令行工具以及图形工具。它与 Amazon S3 API 配合良好,可以快速访问社区工具和插件。
📄️ 腾讯云对象存储(COS)
腾讯云对象存储(COS)是一项分布式存储服务,可以通过HTTP/HTTPS协议从任何地方存储任意数量的数据。COS对数据结构或格式没有限制。它还没有存储桶大小限制和分区管理,适用于几乎任何用例,如数据传输、数据处理和数据湖。COS提供基于Web的控制台、多语言SDK和API、命令行工具和图形工具。它与Amazon S3 API配合良好,允许您快速访问社区工具和插件。
📄️ TensorFlow 数据集
TensorFlow 数据集 是一个已经准备好可以与 TensorFlow 或其他 Python 机器学习框架(如 Jax)一起使用的数据集合。所有数据集都以 tf.data.Datasets 的形式提供,可以轻松使用并具有高性能的输入流水线。要开始使用,请参阅指南和数据集列表。
📄️ TiDB
TiDB Cloud 是一款全面的数据库即服务(DBaaS)解决方案,提供了专用和无服务器选项。TiDB 无服务器现在正在将内置的向量搜索集成到 MySQL 环境中。通过这一增强功能,您可以在不需要新数据库或额外技术堆栈的情况下,无缝开发使用 TiDB 无服务器的人工智能应用程序。成为第一批体验者,加入私人测试版的等待列表,网址为 https://tidb.cloud/ai。
📄️ 2Markdown
2markdown 服务可以将网站内容转换为结构化的 markdown 文件。
📄️ TOML
TOML 是一种用于配置文件的文件格式。它旨在易于阅读和编写,并设计为能够明确映射到字典。其规范是开源的。TOML 已在许多编程语言中实现。TOML 这个名称是 "Tom's Obvious, Minimal Language" 的首字母缩写,指的是其创始人 Tom Preston-Werner。
📄️ Trello
Trello 是一个基于网络的项目管理和协作工具,允许个人和团队组织和跟踪他们的任务和项目。它提供了一个被称为“看板”的可视化界面,用户可以在其中创建列表和卡片来代表他们的任务和活动。
📄️ TSV
制表符分隔值(TSV)文件是一种简单的基于文本的文件格式,用于存储表格数据。[3] 记录之间由换行符分隔,记录内的值由制表符分隔。
Twitter 是一个在线社交媒体和社交网络服务。
📄️ 非结构化文件
本文介绍如何使用 Unstructured 软件包加载多种类型的文件。Unstructured 目前支持加载文本文件、PowerPoint 文件、HTML、PDF、图像等。
📄️ UpstageLayoutAnalysisLoader
本文介绍如何使用UpstageLayoutAnalysisLoader开始工作。
📄️ URL
本示例介绍了如何从一系列URL中加载HTML文档,并将其转换为我们可以在下游使用的Document格式。
📄️ Vsdx
一个 visio 文件(扩展名为 .vsdx)与 Microsoft Visio 软件相关联,这是一款用于创建图表的软件。它存储有关图表结构、布局和图形元素的信息。这种格式有助于在业务、工程和计算机科学等领域创建和共享可视化内容。
📄️ 天气
OpenWeatherMap 是一个开源的天气服务提供商。
📄️ WebBaseLoader
本文介绍了如何使用 WebBaseLoader 从 HTML 网页中加载所有文本,并将其转换为我们可以在下游使用的文档格式。如果需要更多定制化的网页加载逻辑,请查看一些子类示例,比如 IMSDbLoader, AZLyricsLoader 和 CollegeConfidentialLoader。
📄️ WhatsApp 聊天
WhatsApp(也称为 WhatsApp Messenger)是一款免费的跨平台集中式即时通讯(IM)和网络电话(VoIP)服务。它允许用户发送文本和语音消息,进行语音和视频通话,以及分享图片、文档、用户位置和其他内容。
📄️ 维基百科
维基百科是一个由志愿者社区(称为维基人)撰写和维护的多语言免费在线百科全书,通过开放协作并使用名为MediaWiki的基于维基的编辑系统。维基百科是历史上最大且阅读量最高的参考作品。
📄️ XML
UnstructuredXMLLoader 用于加载 XML 文件。该加载器适用于 .xml 文件。页面内容将是从 XML 标签中提取的文本。
📄️ Xorbits Pandas DataFrame
本文介绍了如何从 xorbits.pandas DataFrame 中加载数据。
📄️ YouTube音频
在YouTube视频上构建聊天或问答应用程序是一个非常感兴趣的话题。
📄️ YouTube 字幕
YouTube 是由 Google 创建的在线视频分享和社交媒体平台。
📄️ 语雀
语雀 是一个专业的基于云的知识库,用于团队协作文档。