Skip to main content
Open on GitHub

Microsoft

所有与Microsoft Azure和其他Microsoft产品相关的功能。

聊天模型

Azure OpenAI

Microsoft Azure,通常被称为Azure,是由Microsoft运营的云计算平台,它通过全球数据中心提供应用程序和服务的访问、管理和开发。它提供了一系列功能,包括软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)。Microsoft Azure支持许多编程语言、工具和框架,包括微软特有的和第三方的软件和系统。

Azure OpenAI 是一项 Azure 服务,提供来自 OpenAI 的强大语言模型,包括用于内容生成、摘要、语义搜索和自然语言到代码翻译的 GPT-3CodexEmbeddings model 系列。

pip install langchain-openai

设置环境变量以获取对Azure OpenAI服务的访问权限。

import os

os.environ["AZURE_OPENAI_ENDPOINT"] = "https://<your-endpoint.openai.azure.com/"
os.environ["AZURE_OPENAI_API_KEY"] = "your AzureOpenAI key"

查看使用示例

from langchain_openai import AzureChatOpenAI
API Reference:AzureChatOpenAI

Azure ML 在线聊天端点

请参阅此处的文档,了解如何访问托管在Azure Machine Learning上的聊天模型。

大型语言模型

Azure ML

查看使用示例

from langchain_community.llms.azureml_endpoint import AzureMLOnlineEndpoint
API Reference:AzureMLOnlineEndpoint

Azure OpenAI

查看使用示例

from langchain_openai import AzureOpenAI
API Reference:AzureOpenAI

嵌入模型

Azure OpenAI

查看使用示例

from langchain_openai import AzureOpenAIEmbeddings
API Reference:AzureOpenAIEmbeddings

文档加载器

Azure AI 数据

Azure AI Studio 提供了将数据资产上传到云存储并从以下来源注册现有数据资产的功能:

  • Microsoft OneLake
  • Azure Blob Storage
  • Azure Data Lake gen 2

首先,你需要安装几个Python包。

pip install azureml-fsspec, azure-ai-generative

查看使用示例

from langchain.document_loaders import AzureAIDataLoader
API Reference:AzureAIDataLoader

Azure AI 文档智能

Azure AI 文档智能(以前称为 Azure Form Recognizer)是一种基于机器学习的 服务,可以从数字或扫描的PDF、图像、Office和HTML文件中 提取文本(包括手写)、表格、文档结构 和键值对。

文档智能支持 PDF, JPEG/JPG, PNG, BMP, TIFF, HEIF, DOCX, XLSX, PPTXHTML

首先,你需要安装一个python包。

pip install azure-ai-documentintelligence

查看使用示例

from langchain.document_loaders import AzureAIDocumentIntelligenceLoader

Azure Blob 存储

Azure Blob Storage 是微软为云提供的对象存储解决方案。Blob Storage 针对存储大量非结构化数据进行了优化。非结构化数据是指不遵循特定数据模型或定义的数据,例如文本或二进制数据。

Azure Files 提供了完全托管的云文件共享,可通过行业标准的服务器消息块(SMB)协议、网络文件系统(NFS)协议和Azure Files REST API访问。Azure Files 基于 Azure Blob Storage

Azure Blob Storage 设计用于:

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 流媒体视频和音频。
  • 写入日志文件。
  • 存储数据以进行备份和恢复、灾难恢复以及归档。
  • 存储数据以供本地或Azure托管服务进行分析。
pip install azure-storage-blob

查看Azure Blob Storage的使用示例

from langchain_community.document_loaders import AzureBlobStorageContainerLoader

查看Azure Files 的使用示例

from langchain_community.document_loaders import AzureBlobStorageFileLoader

微软OneDrive

Microsoft OneDrive(以前称为SkyDrive)是由微软运营的文件托管服务。

首先,你需要安装一个python包。

pip install o365

查看使用示例

from langchain_community.document_loaders import OneDriveLoader
API Reference:OneDriveLoader

Microsoft OneDrive 文件

Microsoft OneDrive(以前称为SkyDrive)是由微软运营的文件托管服务。

首先,你需要安装一个python包。

pip install o365
from langchain_community.document_loaders import OneDriveFileLoader
API Reference:OneDriveFileLoader

微软Word

Microsoft Word 是由微软开发的文字处理软件。

查看使用示例

from langchain_community.document_loaders import UnstructuredWordDocumentLoader

Microsoft Excel

Microsoft Excel 是由微软为Windows、macOS、Android、iOS和iPadOS开发的电子表格编辑器。它具有计算或计算能力、图表工具、数据透视表以及一种名为Visual Basic for Applications (VBA)的宏编程语言。Excel是Microsoft 365软件套件的一部分。

UnstructuredExcelLoader 用于加载 Microsoft Excel 文件。该加载器适用于 .xlsx.xls 文件。 页面内容将是 Excel 文件的原始文本。如果您在 "elements" 模式下使用加载器,Excel 文件的 HTML 表示将在文档元数据中的 text_as_html 键下可用。

查看使用示例

from langchain_community.document_loaders import UnstructuredExcelLoader

Microsoft SharePoint

Microsoft SharePoint 是一个基于网站的协作系统,它使用工作流应用程序、“列表”数据库以及其他网页部件和安全功能,使业务团队能够共同工作,由微软开发。

查看使用示例

from langchain_community.document_loaders.sharepoint import SharePointLoader
API Reference:SharePointLoader

Microsoft PowerPoint

Microsoft PowerPoint 是微软公司的一款演示文稿程序。

查看使用示例

from langchain_community.document_loaders import UnstructuredPowerPointLoader

微软OneNote

首先,让我们安装依赖项:

pip install bs4 msal

查看使用示例

from langchain_community.document_loaders.onenote import OneNoteLoader
API Reference:OneNoteLoader

Playwright URL 加载器

Playwright 是一个由 Microsoft 开发的开源自动化工具,它允许你以编程方式控制和自动化网页浏览器。它设计用于端到端测试、抓取和自动化各种网页浏览器的任务,如 ChromiumFirefoxWebKit

首先,让我们安装依赖项:

pip install playwright unstructured

查看使用示例

from langchain_community.document_loaders.onenote import OneNoteLoader
API Reference:OneNoteLoader

向量存储

Azure Cosmos DB

AI代理可以依赖Azure Cosmos DB作为统一的内存系统解决方案,享受速度、规模和简单性。该服务成功支持了OpenAI的ChatGPT服务,使其能够以高可靠性和低维护成本动态扩展。由原子记录序列引擎驱动,它是世界上第一个全球分布的NoSQL关系型向量数据库服务,提供无服务器模式。

以下是两个可用的Azure Cosmos DB API,它们可以提供向量存储功能。

Azure Cosmos DB for MongoDB (vCore)

Azure Cosmos DB for MongoDB vCore 使得创建具有完整原生MongoDB支持的数据库变得容易。 您可以通过将应用程序指向MongoDB vCore帐户的连接字符串,应用您的MongoDB经验并继续使用您喜欢的MongoDB驱动程序、SDK和工具。 在Azure Cosmos DB for MongoDB vCore中使用向量搜索,将您的基于AI的应用程序与存储在Azure Cosmos DB中的数据无缝集成。

安装与设置

请参阅详细配置说明

我们需要安装 pymongo python 包。

pip install pymongo
在 Microsoft Azure 上部署 Azure Cosmos DB

Azure Cosmos DB for MongoDB vCore 为开发人员提供了一个完全托管的、与MongoDB兼容的数据库服务,用于使用熟悉的架构构建现代应用程序。

使用Cosmos DB for MongoDB vCore,开发者在迁移现有应用程序或构建新应用程序时,可以享受原生Azure集成、低总拥有成本(TCO)以及熟悉的vCore架构的优势。

Sign Up 免费注册,立即开始。

查看使用示例

from langchain_community.vectorstores import AzureCosmosDBVectorSearch

Azure Cosmos DB NoSQL

Azure Cosmos DB for NoSQL 现在提供向量索引和搜索的预览功能。 此功能旨在处理高维向量,实现任何规模下的高效和准确的向量搜索。您现在可以直接在文档中存储向量,与您的数据一起。这意味着数据库中的每个文档不仅可以包含传统的无模式数据, 还可以包含高维向量作为文档的其他属性。数据和向量的这种共置允许高效的索引和搜索,因为向量与它们所代表的数据存储在相同的逻辑单元中。这简化了数据管理、AI应用程序架构以及基于向量的操作的效率。

安装与设置

查看详细配置说明

我们需要安装 azure-cosmos python 包。

pip install azure-cosmos
在 Microsoft Azure 上部署 Azure Cosmos DB

Azure Cosmos DB 通过动态和弹性的自动扩展,为现代应用和智能工作负载提供了一个非常响应的解决方案。它在每个 Azure 区域都可用,并且可以自动将数据复制到更接近用户的位置。它具有 SLA 保证的低延迟和高可用性。

Sign Up 免费注册,立即开始。

查看使用示例

from langchain_community.vectorstores import AzureCosmosDBNoSQLVectorSearch

Azure 数据库 for PostgreSQL

Azure Database for PostgreSQL - Flexible Server 是一个基于开源Postgres数据库引擎的关系型数据库服务。它是一个完全托管的数据库即服务,能够处理关键任务工作负载,具有可预测的性能、安全性、高可用性和动态扩展性。

请参阅设置说明以了解Azure Database for PostgreSQL。

查看使用示例。只需使用来自Azure门户的连接字符串

由于 Azure Database for PostgreSQL 是开源的 Postgres,您可以使用 LangChain 的 Postgres 支持 连接到 Azure Database for PostgreSQL。

Azure SQL 数据库

Azure SQL Database 是一个强大的服务,结合了可扩展性、安全性和高可用性,提供了现代数据库解决方案的所有优势。它还提供了专用的向量数据类型和内置函数,简化了在关系数据库中直接存储和查询向量嵌入的过程。这消除了对单独的向量数据库和相关集成的需求,提高了解决方案的安全性,同时降低了整体复杂性。

通过利用您当前的SQL Server数据库进行向量搜索,您可以增强数据能力,同时最大限度地减少开支,并避免转向新系统的挑战。

安装与设置

请参阅详细配置说明

我们需要安装langchain-sqlserver python包。

!pip install langchain-sqlserver==0.1.1
在 Microsoft Azure 上部署 Azure SQL DB

Sign Up 今天免费注册开始使用。

查看使用示例

from langchain_sqlserver import SQLServer_VectorStore
API Reference:SQLServer_VectorStore

Azure AI Search 是一个云搜索服务,为开发者提供基础设施、API 和工具,用于大规模检索向量、关键字和混合查询的信息。查看 这里 获取使用示例。

from langchain_community.vectorstores.azuresearch import AzureSearch
API Reference:AzureSearch

检索器

Azure AI 搜索

Azure AI Search(以前称为Azure SearchAzure Cognitive Search)是一种云搜索服务,为开发者提供基础设施、API和工具,用于在Web、移动和企业应用程序中构建丰富的搜索体验,覆盖私有的、异构的内容。

搜索是任何向用户展示文本的应用程序的基础,常见场景包括目录或文档搜索、在线零售应用程序或专有内容的数据探索。当你创建一个搜索服务时,你将使用以下功能:

  • 一个搜索引擎,用于对包含用户拥有内容的搜索索引进行全文搜索
  • 丰富的索引功能,带有词法分析和可选的AI增强,用于内容提取和转换
  • 丰富的查询语法,支持文本搜索、模糊搜索、自动完成、地理搜索等
  • 通过REST API和Azure SDK中的客户端库实现可编程性
  • 数据层、机器学习层和AI(AI服务)的Azure集成

请参阅设置说明

查看使用示例

from langchain_community.retrievers import AzureAISearchRetriever

向量存储

Azure Database for PostgreSQL

Azure Database for PostgreSQL - Flexible Server 是一个基于开源Postgres数据库引擎的关系型数据库服务。它是一个完全托管的数据库即服务,能够处理关键任务工作负载,具有可预测的性能、安全性、高可用性和动态扩展性。

请参阅设置说明以了解Azure Database for PostgreSQL。

您需要在数据库中启用pgvector扩展以使用Postgres作为向量存储。一旦启用了扩展,您可以使用LangChain中的PGVector连接到Azure Database for PostgreSQL。

查看一个使用示例。只需使用来自Azure门户的连接字符串

工具

Azure 容器应用动态会话

我们需要从Azure Container Apps服务中获取POOL_MANAGEMENT_ENDPOINT环境变量。 请参阅此处的说明。

我们需要安装一个python包。

pip install langchain-azure-dynamic-sessions

查看使用示例

from langchain_azure_dynamic_sessions import SessionsPythonREPLTool

按照文档这里获取此工具的详细解释和说明。

环境变量 BING_SUBSCRIPTION_KEYBING_SEARCH_URL 是 Bing 搜索资源所必需的。

from langchain_community.tools.bing_search import BingSearchResults
from langchain_community.utilities import BingSearchAPIWrapper

api_wrapper = BingSearchAPIWrapper()
tool = BingSearchResults(api_wrapper=api_wrapper)

工具包

Azure AI 服务

我们需要安装几个Python包。

pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis

查看使用示例

from langchain_community.agent_toolkits import azure_ai_services
API Reference:azure_ai_services

Azure AI 服务独立工具

azure_ai_services 工具包包括以下工具:

Azure 认知服务

我们需要安装几个Python包。

pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis

查看使用示例

from langchain_community.agent_toolkits import AzureCognitiveServicesToolkit

Azure AI Services 独立工具

azure_ai_services 工具包包含用于查询 Azure Cognitive Services 的工具:

  • AzureCogsFormRecognizerTool: 表单识别器 API
  • AzureCogsImageAnalysisTool: 图像分析 API
  • AzureCogsSpeech2TextTool: 语音转文本 API
  • AzureCogsText2SpeechTool: 文本转语音 API
  • AzureCogsTextAnalyticsHealthTool: 健康文本分析 API
from langchain_community.tools.azure_cognitive_services import (
AzureCogsFormRecognizerTool,
AzureCogsImageAnalysisTool,
AzureCogsSpeech2TextTool,
AzureCogsText2SpeechTool,
AzureCogsTextAnalyticsHealthTool,
)

Microsoft Office 365 电子邮件和日历

我们需要安装 O365 python 包。

pip install O365

查看使用示例

from langchain_community.agent_toolkits import O365Toolkit
API Reference:O365Toolkit

Office 365 个人工具

您可以使用Office 365工具包中的单个工具:

  • O365CreateDraftMessage: 在Office 365中创建草稿邮件
  • O365SearchEmails: 在Office 365中搜索电子邮件
  • O365SearchEvents: 在Office 365中搜索日历事件
  • O365SendEvent: 在Office 365中发送日历事件
  • O365SendMessage: 在Office 365中发送电子邮件
from langchain_community.tools.office365 import O365CreateDraftMessage
from langchain_community.tools.office365 import O365SearchEmails
from langchain_community.tools.office365 import O365SearchEvents
from langchain_community.tools.office365 import O365SendEvent
from langchain_community.tools.office365 import O365SendMessage

Microsoft Azure PowerBI

我们需要安装 azure-identity python 包。

pip install azure-identity

查看一个使用示例

from langchain_community.agent_toolkits import PowerBIToolkit
from langchain_community.utilities.powerbi import PowerBIDataset

PowerBI 独立工具

您可以使用Azure PowerBI工具包中的各个工具:

  • InfoPowerBITool: 获取关于PowerBI数据集的元数据
  • ListPowerBITool: 获取表名
  • QueryPowerBITool: 查询一个PowerBI数据集
from langchain_community.tools.powerbi.tool import InfoPowerBITool
from langchain_community.tools.powerbi.tool import ListPowerBITool
from langchain_community.tools.powerbi.tool import QueryPowerBITool

PlayWright 浏览器工具包

Playwright 是一个由 Microsoft 开发的开源自动化工具,它允许你以编程方式控制和自动化网页浏览器。它设计用于端到端测试、抓取和自动化各种网页浏览器的任务,如 ChromiumFirefoxWebKit

我们需要安装几个Python包。

pip install playwright lxml

查看一个使用示例

from langchain_community.agent_toolkits import PlayWrightBrowserToolkit

PlayWright 浏览器独立工具

您可以使用PlayWright浏览器工具包中的单个工具。

from langchain_community.tools.playwright import ClickTool
from langchain_community.tools.playwright import CurrentWebPageTool
from langchain_community.tools.playwright import ExtractHyperlinksTool
from langchain_community.tools.playwright import ExtractTextTool
from langchain_community.tools.playwright import GetElementsTool
from langchain_community.tools.playwright import NavigateTool
from langchain_community.tools.playwright import NavigateBackTool

图表

Azure Cosmos DB for Apache Gremlin

我们需要安装一个python包。

pip install gremlinpython

查看使用示例

from langchain_community.graphs import GremlinGraph
from langchain_community.graphs.graph_document import GraphDocument, Node, Relationship

实用工具

必应搜索API

Microsoft Bing,通常被称为BingBing Search,是由Microsoft拥有和运营的网络搜索引擎。

查看使用示例

from langchain_community.utilities import BingSearchAPIWrapper
API Reference:BingSearchAPIWrapper

更多

微软Presidio

Presidio(源自拉丁语praesidium,意为“保护、驻军”)有助于确保敏感数据得到适当的管理和治理。它提供了快速识别和匿名化模块,用于处理文本和图像中的私人实体,如信用卡号码、姓名、位置、社会安全号码、比特币钱包、美国电话号码、财务数据等。

首先,你需要安装几个python包并下载一个SpaCy模型。

pip install langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg

参见使用示例

from langchain_experimental.data_anonymizer import PresidioAnonymizer, PresidioReversibleAnonymizer

这个页面有帮助吗?