langchain_experimental.tabular_synthetic_data.openai.create_openai_data_generator

langchain_experimental.tabular_synthetic_data.openai.create_openai_data_generator(output_schema: Union[Dict[str, Any], Type[BaseModel]], llm: ChatOpenAI, prompt: BasePromptTemplate, output_parser: Optional[BaseLLMOutputParser] = None, **kwargs: Any) SyntheticDataGenerator[source]

创建一个针对OpenAI模型定制的SyntheticDataGenerator实例。

此函数创建一个LLM链,设计用于基于提供的模式(schema)、语言模型(llm)和提示模板(prompt)的结构化输出。然后使用生成的链来实例化并返回一个SyntheticDataGenerator。

Parameters
  • output_schema (Union[Dict[str, Any], Type[BaseModel]]) – 预期输出的模式(schema)。可以是表示有效JsonSchema的字典,也可以是Pydantic BaseModel类。

  • llm (ChatOpenAI) – 要使用的OpenAI语言模型。

  • prompt (BasePromptTemplate) – 用于生成提示的模板。

  • output_parser (Optional[BaseLLMOutputParser], optional) – 处理模型输出的解析器。如果未提供,则将从函数类型中推断默认值。

  • **kwargs – 要传递给`create_structured_output_chain`的其他关键字参数。

  • kwargs (Any) –

Returns

使用构建的链设置的数据生成器实例。

Return type

SyntheticDataGenerator

Usage:

要生成结构化输出的合成数据,首先定义所需的输出模式(schema)。然后,使用此函数创建SyntheticDataGenerator实例。获取生成器后,可以利用其方法生成所需的合成数据。

Examples using create_openai_data_generator