Microsoft
所有与Microsoft Azure
和其他Microsoft
产品相关的功能。
聊天模型
Azure OpenAI
Microsoft Azure,通常被称为
Azure
,是由Microsoft
运营的云计算平台,它通过全球数据中心提供应用程序和服务的访问、管理和开发。它提供了一系列功能,包括软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)。Microsoft Azure
支持许多编程语言、工具和框架,包括微软特有的和第三方的软件和系统。
Azure OpenAI 是一项
Azure
服务,提供来自OpenAI
的强大语言模型,包括用于内容生成、摘要、语义搜索和自然语言到代码翻译的GPT-3
、Codex
和Embeddings model
系列。
pip install langchain-openai
设置环境变量以获取对Azure OpenAI
服务的访问权限。
import os
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://<your-endpoint.openai.azure.com/"
os.environ["AZURE_OPENAI_API_KEY"] = "your AzureOpenAI key"
查看使用示例
from langchain_openai import AzureChatOpenAI
Azure ML 在线聊天端点
请参阅此处的文档,了解如何访问托管在Azure Machine Learning上的聊天模型。
大型语言模型
Azure ML
查看使用示例。
from langchain_community.llms.azureml_endpoint import AzureMLOnlineEndpoint
Azure OpenAI
查看使用示例。
from langchain_openai import AzureOpenAI
嵌入模型
Azure OpenAI
查看使用示例
from langchain_openai import AzureOpenAIEmbeddings
文档加载器
Azure AI 数据
Azure AI Studio 提供了将数据资产上传到云存储并从以下来源注册现有数据资产的功能:
Microsoft OneLake
Azure Blob Storage
Azure Data Lake gen 2
首先,你需要安装几个Python包。
pip install azureml-fsspec, azure-ai-generative
查看使用示例。
from langchain.document_loaders import AzureAIDataLoader
Azure AI 文档智能
Azure AI 文档智能(以前称为
Azure Form Recognizer
)是一种基于机器学习的 服务,可以从数字或扫描的PDF、图像、Office和HTML文件中 提取文本(包括手写)、表格、文档结构 和键值对。文档智能支持
JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
,DOCX
,XLSX
,PPTX
和HTML
。
首先,你需要安装一个python包。
pip install azure-ai-documentintelligence
查看使用示例。
from langchain.document_loaders import AzureAIDocumentIntelligenceLoader
Azure Blob 存储
Azure Blob Storage 是微软为云提供的对象存储解决方案。Blob Storage 针对存储大量非结构化数据进行了优化。非结构化数据是指不遵循特定数据模型或定义的数据,例如文本或二进制数据。
Azure Files 提供了完全托管的云文件共享,可通过行业标准的服务器消息块(
SMB
)协议、网络文件系统(NFS
)协议和Azure Files REST API
访问。Azure Files
基于Azure Blob Storage
。
Azure Blob Storage
设计用于:
- 直接向浏览器提供图像或文档。
- 存储文件以供分布式访问。
- 流媒体视频和音频。
- 写入日志文件。
- 存储数据以进行备份和恢复、灾难恢复以及归档。
- 存储数据以供本地或Azure托管服务进行分析。
pip install azure-storage-blob
from langchain_community.document_loaders import AzureBlobStorageContainerLoader
from langchain_community.document_loaders import AzureBlobStorageFileLoader
微软OneDrive
Microsoft OneDrive(以前称为
SkyDrive
)是由微软运营的文件托管服务。
首先,你需要安装一个python包。
pip install o365
查看使用示例。
from langchain_community.document_loaders import OneDriveLoader
Microsoft OneDrive 文件
Microsoft OneDrive(以前称为
SkyDrive
)是由微软运营的文件托管服务。
首先,你需要安装一个python包。
pip install o365
from langchain_community.document_loaders import OneDriveFileLoader
微软Word
Microsoft Word 是由微软开发的文字处理软件。
查看使用示例。
from langchain_community.document_loaders import UnstructuredWordDocumentLoader
Microsoft Excel
Microsoft Excel 是由微软为Windows、macOS、Android、iOS和iPadOS开发的电子表格编辑器。它具有计算或计算能力、图表工具、数据透视表以及一种名为Visual Basic for Applications (VBA)的宏编程语言。Excel是Microsoft 365软件套件的一部分。
UnstructuredExcelLoader
用于加载 Microsoft Excel
文件。该加载器适用于 .xlsx
和 .xls
文件。
页面内容将是 Excel 文件的原始文本。如果您在 "elements"
模式下使用加载器,Excel 文件的 HTML 表示将在文档元数据中的 text_as_html
键下可用。
查看使用示例。
from langchain_community.document_loaders import UnstructuredExcelLoader
Microsoft SharePoint
Microsoft SharePoint 是一个基于网站的协作系统,它使用工作流应用程序、“列表”数据库以及其他网页部件和安全功能,使业务团队能够共同工作,由微软开发。
查看使用示例。
from langchain_community.document_loaders.sharepoint import SharePointLoader
Microsoft PowerPoint
Microsoft PowerPoint 是微软公司的一款演示文稿程序。
查看使用示例。
from langchain_community.document_loaders import UnstructuredPowerPointLoader
微软OneNote
首先,让我们安装依赖项:
pip install bs4 msal
查看使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoader
Playwright URL 加载器
Playwright 是一个由
Microsoft
开发的开源自动化工具,它允许你以编程方式控制和自动化网页浏览器。它设计用于端到端测试、抓取和自动化各种网页浏览器的任务,如Chromium
、Firefox
和WebKit
。
首先,让我们安装依赖项:
pip install playwright unstructured
查看使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoader
向量存储
Azure Cosmos DB
AI代理可以依赖Azure Cosmos DB作为统一的内存系统解决方案,享受速度、规模和简单性。该服务成功支持了OpenAI的ChatGPT服务,使其能够以高可靠性和低维护成本动态扩展。由原子记录序列引擎驱动,它是世界上第一个全球分布的NoSQL、关系型和向量数据库服务,提供无服务器模式。
以下是两个可用的Azure Cosmos DB API,它们可以提供向量存储功能。
Azure Cosmos DB for MongoDB (vCore)
Azure Cosmos DB for MongoDB vCore 使得创建具有完整原生MongoDB支持的数据库变得容易。 您可以通过将应用程序指向MongoDB vCore帐户的连接字符串,应用您的MongoDB经验并继续使用您喜欢的MongoDB驱动程序、SDK和工具。 在Azure Cosmos DB for MongoDB vCore中使用向量搜索,将您的基于AI的应用程序与存储在Azure Cosmos DB中的数据无缝集成。
安装与设置
请参阅详细配置说明。
我们需要安装 pymongo
python 包。
pip install pymongo
在 Microsoft Azure 上部署 Azure Cosmos DB
Azure Cosmos DB for MongoDB vCore 为开发人员提供了一个完全托管的、与MongoDB兼容的数据库服务,用于使用熟悉的架构构建现代应用程序。
使用Cosmos DB for MongoDB vCore,开发者在迁移现有应用程序或构建新应用程序时,可以享受原生Azure集成、低总拥有成本(TCO)以及熟悉的vCore架构的优势。
Sign Up 免费注册,立即开始。
查看使用示例。
from langchain_community.vectorstores import AzureCosmosDBVectorSearch
Azure Cosmos DB NoSQL
Azure Cosmos DB for NoSQL 现在提供向量索引和搜索的预览功能。 此功能旨在处理高维向量,实现任何规模下的高效和准确的向量搜索。您现在可以直接在文档中存储向量,与您的数据一起。这意味着数据库中的每个文档不仅可以包含传统的无模式数据, 还可以包含高维向量作为文档的其他属性。数据和向量的这种共置允许高效的索引和搜索,因为向量与它们所代表的数据存储在相同的逻辑单元中。这简化了数据管理、AI应用程序架构以及基于向量的操作的效率。
安装与设置
查看详细配置说明。
我们需要安装 azure-cosmos
python 包。
pip install azure-cosmos
在 Microsoft Azure 上部署 Azure Cosmos DB
Azure Cosmos DB 通过动态和弹性的自动扩展,为现代应用和智能工作负载提供了一个非常响应的解决方案。它在每个 Azure 区域都可用,并且可以自动将数据复制到更接近用户的位置。它具有 SLA 保证的低延迟和高可用性。
Sign Up 免费注册,立即开始。
查看使用示例。
from langchain_community.vectorstores import AzureCosmosDBNoSQLVectorSearch
Azure 数据库 for PostgreSQL
Azure Database for PostgreSQL - Flexible Server 是一个基于开源Postgres数据库引擎的关系型数据库服务。它是一个完全托管的数据库即服务,能够处理关键任务工作负载,具有可预测的性能、安全性、高可用性和动态扩展性。
请参阅设置说明以了解Azure Database for PostgreSQL。
由于 Azure Database for PostgreSQL 是开源的 Postgres,您可以使用 LangChain 的 Postgres 支持 连接到 Azure Database for PostgreSQL。
Azure SQL 数据库
Azure SQL Database 是一个强大的服务,结合了可扩展性、安全性和高可用性,提供了现代数据库解决方案的所有优势。它还提供了专用的向量数据类型和内置函数,简化了在关系数据库中直接存储和查询向量嵌入的过程。这消除了对单独的向量数据库和相关集成的需求,提高了解决方案的安全性,同时降低了整体复杂性。
通过利用您当前的SQL Server数据库进行向量搜索,您可以增强数据能力,同时最大限度地减少开支,并避免转向新系统的挑战。
安装与设置
请参阅详细配置说明。
我们需要安装langchain-sqlserver
python包。
!pip install langchain-sqlserver==0.1.1
在 Microsoft Azure 上部署 Azure SQL DB
Sign Up 今天免费注册开始使用。
查看使用示例。
from langchain_sqlserver import SQLServer_VectorStore
Azure AI 搜索
Azure AI Search 是一个云搜索服务,为开发者提供基础设施、API 和工具,用于大规模检索向量、关键字和混合查询的信息。查看 这里 获取使用示例。
from langchain_community.vectorstores.azuresearch import AzureSearch
检索器
Azure AI 搜索
Azure AI Search(以前称为
Azure Search
或Azure Cognitive Search
)是一种云搜索服务,为开发者提供基础设施、API和工具,用于在Web、移动和企业应用程序中构建丰富的搜索体验,覆盖私有的、异构的内容。
搜索是任何向用户展示文本的应用程序的基础,常见场景包括目录或文档搜索、在线零售应用程序或专有内容的数据探索。当你创建一个搜索服务时,你将使用以下功能:
- 一个搜索引擎,用于对包含用户拥有内容的搜索索引进行全文搜索
- 丰富的索引功能,带有词法分析和可选的AI增强,用于内容提取和转换
- 丰富的查询语法,支持文本搜索、模糊搜索、自动完成、地理搜索等
- 通过REST API和Azure SDK中的客户端库实现可编程性
- 数据层、机器学习层和AI(AI服务)的Azure集成
请参阅设置说明。
查看使用示例。
from langchain_community.retrievers import AzureAISearchRetriever
向量存储
Azure Database for PostgreSQL
Azure Database for PostgreSQL - Flexible Server 是一个基于开源Postgres数据库引擎的关系型数据库服务。它是一个完全托管的数据库即服务,能够处理关键任务工作负载,具有可预测的性能、安全性、高可用性和动态扩展性。
请参阅设置说明以了解Azure Database for PostgreSQL。
您需要在数据库中启用pgvector扩展以使用Postgres作为向量存储。一旦启用了扩展,您可以使用LangChain中的PGVector连接到Azure Database for PostgreSQL。
工具
Azure 容器应用动态会话
我们需要从Azure Container Apps服务中获取POOL_MANAGEMENT_ENDPOINT
环境变量。
请参阅此处的说明。
我们需要安装一个python包。
pip install langchain-azure-dynamic-sessions
查看使用示例。
from langchain_azure_dynamic_sessions import SessionsPythonREPLTool
必应搜索
按照文档这里获取此工具的详细解释和说明。
环境变量 BING_SUBSCRIPTION_KEY
和 BING_SEARCH_URL
是 Bing 搜索资源所必需的。
from langchain_community.tools.bing_search import BingSearchResults
from langchain_community.utilities import BingSearchAPIWrapper
api_wrapper = BingSearchAPIWrapper()
tool = BingSearchResults(api_wrapper=api_wrapper)
工具包
Azure AI 服务
我们需要安装几个Python包。
pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis
查看使用示例。
from langchain_community.agent_toolkits import azure_ai_services
Azure AI 服务独立工具
azure_ai_services
工具包包括以下工具:
- 图像分析: AzureAiServicesImageAnalysisTool
- 文档智能:AzureAiServicesDocumentIntelligenceTool
- 语音转文本: AzureAiServicesSpeechToTextTool
- 文本转语音: AzureAiServicesTextToSpeechTool
- 健康文本分析:AzureAiServicesTextAnalyticsForHealthTool
Azure 认知服务
我们需要安装几个Python包。
pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis
查看使用示例。
from langchain_community.agent_toolkits import AzureCognitiveServicesToolkit
Azure AI Services 独立工具
azure_ai_services
工具包包含用于查询 Azure Cognitive Services
的工具:
AzureCogsFormRecognizerTool
: 表单识别器 APIAzureCogsImageAnalysisTool
: 图像分析 APIAzureCogsSpeech2TextTool
: 语音转文本 APIAzureCogsText2SpeechTool
: 文本转语音 APIAzureCogsTextAnalyticsHealthTool
: 健康文本分析 API
from langchain_community.tools.azure_cognitive_services import (
AzureCogsFormRecognizerTool,
AzureCogsImageAnalysisTool,
AzureCogsSpeech2TextTool,
AzureCogsText2SpeechTool,
AzureCogsTextAnalyticsHealthTool,
)
Microsoft Office 365 电子邮件和日历
我们需要安装 O365
python 包。
pip install O365
查看使用示例。
from langchain_community.agent_toolkits import O365Toolkit
Office 365 个人工具
您可以使用Office 365工具包中的单个工具:
O365CreateDraftMessage
: 在Office 365中创建草稿邮件O365SearchEmails
: 在Office 365中搜索电子邮件O365SearchEvents
: 在Office 365中搜索日历事件O365SendEvent
: 在Office 365中发送日历事件O365SendMessage
: 在Office 365中发送电子邮件
from langchain_community.tools.office365 import O365CreateDraftMessage
from langchain_community.tools.office365 import O365SearchEmails
from langchain_community.tools.office365 import O365SearchEvents
from langchain_community.tools.office365 import O365SendEvent
from langchain_community.tools.office365 import O365SendMessage
Microsoft Azure PowerBI
我们需要安装 azure-identity
python 包。
pip install azure-identity
查看一个使用示例。
from langchain_community.agent_toolkits import PowerBIToolkit
from langchain_community.utilities.powerbi import PowerBIDataset
PowerBI 独立工具
您可以使用Azure PowerBI工具包中的各个工具:
InfoPowerBITool
: 获取关于PowerBI数据集的元数据ListPowerBITool
: 获取表名QueryPowerBITool
: 查询一个PowerBI数据集
from langchain_community.tools.powerbi.tool import InfoPowerBITool
from langchain_community.tools.powerbi.tool import ListPowerBITool
from langchain_community.tools.powerbi.tool import QueryPowerBITool
PlayWright 浏览器工具包
Playwright 是一个由
Microsoft
开发的开源自动化工具,它允许你以编程方式控制和自动化网页浏览器。它设计用于端到端测试、抓取和自动化各种网页浏览器的任务,如Chromium
、Firefox
和WebKit
。
我们需要安装几个Python包。
pip install playwright lxml
查看一个使用示例。
from langchain_community.agent_toolkits import PlayWrightBrowserToolkit
PlayWright 浏览器独立工具
您可以使用PlayWright浏览器工具包中的单个工具。
from langchain_community.tools.playwright import ClickTool
from langchain_community.tools.playwright import CurrentWebPageTool
from langchain_community.tools.playwright import ExtractHyperlinksTool
from langchain_community.tools.playwright import ExtractTextTool
from langchain_community.tools.playwright import GetElementsTool
from langchain_community.tools.playwright import NavigateTool
from langchain_community.tools.playwright import NavigateBackTool
图表
Azure Cosmos DB for Apache Gremlin
我们需要安装一个python包。
pip install gremlinpython
查看使用示例。
from langchain_community.graphs import GremlinGraph
from langchain_community.graphs.graph_document import GraphDocument, Node, Relationship
实用工具
必应搜索API
Microsoft Bing,通常被称为
Bing
或Bing Search
,是由Microsoft
拥有和运营的网络搜索引擎。
查看使用示例。
from langchain_community.utilities import BingSearchAPIWrapper
更多
微软Presidio
Presidio(源自拉丁语praesidium,意为“保护、驻军”)有助于确保敏感数据得到适当的管理和治理。它提供了快速识别和匿名化模块,用于处理文本和图像中的私人实体,如信用卡号码、姓名、位置、社会安全号码、比特币钱包、美国电话号码、财务数据等。
首先,你需要安装几个python包并下载一个SpaCy
模型。
pip install langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg
参见使用示例。
from langchain_experimental.data_anonymizer import PresidioAnonymizer, PresidioReversibleAnonymizer