创建Spark数据框代理#

langchain_experimental.agents.agent_toolkits.spark.base.create_spark_dataframe_agent(llm: BaseLLM, df: Any, callback_manager: BaseCallbackManager | None = None, prefix: str = '\nYou are working with a spark dataframe in Python. The name of the dataframe is `df`.\nYou should use the tools below to answer the question posed of you:', suffix: str = '\nThis is the result of `print(df.first())`:\n{df}\n\nBegin!\nQuestion: {input}\n{agent_scratchpad}', input_variables: List[str] | None = None, verbose: bool = False, return_intermediate_steps: bool = False, max_iterations: int | None = 15, max_execution_time: float | None = None, early_stopping_method: str = 'force', agent_executor_kwargs: Dict[str, Any] | None = None, allow_dangerous_code: bool = False, **kwargs: Any) AgentExecutor[源代码]#

从LLM和数据框构建一个Spark代理。

Security Notice:

此代理依赖于可以执行任意代码的python repl工具的访问。这可能是危险的,需要一个特别沙盒化的环境才能安全使用。如果未能在适当沙盒化的环境中运行此代码,可能会导致任意代码执行漏洞,从而导致数据泄露、数据丢失或其他安全事件。

不要在不信任的输入、提升的权限下使用此代码,或在未咨询安全团队关于适当的沙箱设置的情况下使用!

您必须通过设置allow_dangerous_code=True来选择使用此功能。

Parameters:
  • allow_dangerous_code (bool) – bool, 默认 False 此代理依赖于访问可以执行任意代码的python repl工具。这可能是危险的,需要一个特别沙盒化的环境才能安全使用。 未能正确沙盒化此类可能导致任意代码执行漏洞,这可能导致数据泄露、数据丢失或其他安全事件。 您必须通过设置allow_dangerous_code=True来选择使用此功能。

  • llm (BaseLLM)

  • df (任何)

  • callback_manager (BaseCallbackManager | None)

  • prefix (str)

  • suffix (str)

  • input_variables (List[str] | None)

  • verbose (布尔值)

  • return_intermediate_steps (bool)

  • max_iterations (int | None)

  • max_execution_time (float | None)

  • early_stopping_method (str)

  • agent_executor_kwargs (Dict[str, Any] | None)

  • kwargs (Any)

Return type:

AgentExecutor