阿里云PAI EAS
Alibaba Cloud PAI (Platform for AI) 是一个轻量级且经济高效的机器学习平台,采用云原生技术。它为您提供端到端的建模服务。基于超过100个场景中的数百亿特征和数千亿样本,它加速了模型训练。
阿里云的人工智能机器学习平台是一个面向企业和开发者的机器学习或深度学习工程平台。它提供了易于使用、成本效益高、性能优越且易于扩展的插件,可应用于各种行业场景。通过内置的140多种优化算法,
Machine Learning Platform for AI
提供了全流程的人工智能工程能力,包括数据标注(PAI-iTAG
)、模型构建(PAI-Designer
和PAI-DSW
)、模型训练(PAI-DLC
)、编译优化和推理部署(PAI-EAS
)。
PAI-EAS
支持不同类型的硬件资源,包括CPU和GPU,并具有高吞吐量和低延迟的特点。它允许您通过几次点击部署大规模复杂模型,并实时执行弹性缩容和扩容。它还提供全面的运维和监控系统。
设置EAS服务
设置环境变量以初始化EAS服务URL和令牌。 使用此文档获取更多信息。
export EAS_SERVICE_URL=XXX
export EAS_SERVICE_TOKEN=XXX
另一个选择是使用此代码:
import os
from langchain_community.chat_models import PaiEasChatEndpoint
from langchain_core.language_models.chat_models import HumanMessage
os.environ["EAS_SERVICE_URL"] = "Your_EAS_Service_URL"
os.environ["EAS_SERVICE_TOKEN"] = "Your_EAS_Service_Token"
chat = PaiEasChatEndpoint(
eas_service_url=os.environ["EAS_SERVICE_URL"],
eas_service_token=os.environ["EAS_SERVICE_TOKEN"],
)
API Reference:PaiEasChatEndpoint | HumanMessage
运行聊天模型
您可以使用默认设置调用EAS服务,如下所示:
output = chat.invoke([HumanMessage(content="write a funny joke")])
print("output:", output)
或者,使用新的推理参数调用EAS服务:
kwargs = {"temperature": 0.8, "top_p": 0.8, "top_k": 5}
output = chat.invoke([HumanMessage(content="write a funny joke")], **kwargs)
print("output:", output)
或者,运行一个流调用以获取流响应:
outputs = chat.stream([HumanMessage(content="hi")], streaming=True)
for output in outputs:
print("stream output:", output)