FSM - 用户可以输入发言者转换约束

AutoGen提供了由LLM、工具或人类驱动的可对话代理，可以通过自动聊天来共同执行任务。该框架允许通过多代理对话进行工具使用和人类参与。有关此功能的文档，请参阅此处。

本笔记本介绍了使用图形来定义发言者之间的转换路径。

优势 - 这个贡献填补了GroupChat类（自动、手动、轮流）和一个表达能力强的有向图之间的差距。有关更详细的讨论，请参见动机。

需求

安装 pyautogen：

pip install pyautogen

有关更多信息，请参阅安装指南。

%%capture --no-stderr
%pip install pyautogen[graph]>=0.2.11

import random  # noqa E402

import matplotlib.pyplot as plt  # noqa E402
import networkx as nx  # noqa E402

import autogen  # noqa E402
from autogen.agentchat.conversable_agent import ConversableAgent  # noqa E402
from autogen.agentchat.assistant_agent import AssistantAgent  # noqa E402
from autogen.agentchat.groupchat import GroupChat  # noqa E402
from autogen.graph_utils import visualize_speaker_transitions_dict  # noqa E402

print(autogen.__version__)

0.2.25

动机

当前的GroupChat类允许转换到任何代理（有或没有LLM的决策），但某些用例可能需要更多对转换的控制。图形是一种可能的控制转换路径的方式，其中每个节点表示一个代理，每个有向边表示可能的转换路径。让我们以五个代理的GroupChat为例，说明当前的转换路径。

config_list_gpt4 = {
    "timeout": 600,
    "cache_seed": 44,  # change the seed for different trials
    "config_list": autogen.config_list_from_json(
        "OAI_CONFIG_LIST",
        filter_dict={"tags": ["gpt-4", "gpt-4-32k"]},  # comment out to get all
    ),
    "temperature": 0,
}

agents = [ConversableAgent(name=f"Agent{i}", llm_config=False) for i in range(5)]
allowed_speaker_transitions_dict = {agent: [other_agent for other_agent in agents] for agent in agents}

visualize_speaker_transitions_dict(allowed_speaker_transitions_dict, agents)

agents = [ConversableAgent(name=f"Agent{i}", llm_config=False) for i in range(5)]
allowed_speaker_transitions_dict = {agent: [other_agent for other_agent in agents] for agent in agents}

visualize_speaker_transitions_dict(allowed_speaker_transitions_dict, agents)

可能有趣的转换路径

集线器和辐射
顺序团队操作
大声思考和辩论

agents = [ConversableAgent(name=f"Agent{i}", llm_config=False) for i in range(5)]
allowed_speaker_transitions_dict = {
    agents[0]: [agents[1], agents[2], agents[3], agents[4]],
    agents[1]: [agents[0]],
    agents[2]: [agents[0]],
    agents[3]: [agents[0]],
    agents[4]: [agents[0]],
}

visualize_speaker_transitions_dict(allowed_speaker_transitions_dict, agents)

# 顺序团队操作
# 创建一个空的有向图

speaker_transitions_dict = {}
teams = ["A", "B", "C"]
team_size = 5


def get_agent_of_name(agents, name) -> ConversableAgent:
    for agent in agents:
        if agent.name == name:
            return agent


# 创建一个由15个代理组成的列表，3个团队 x 5个代理
agents = [ConversableAgent(name=f"{team}{i}", llm_config=False) for team in teams for i in range(team_size)]

# 遍历每个团队并添加成员及其连接
for team in teams:
    for i in range(team_size):
        member = f"{team}{i}"
        # 将每个成员连接到同一团队的其他成员
        speaker_transitions_dict[get_agent_of_name(agents, member)] = [
            get_agent_of_name(agents, name=f"{team}{j}") for j in range(team_size) if j != i
        ]

# 团队领导者的连接
print(get_agent_of_name(agents, name="B0"))
speaker_transitions_dict[get_agent_of_name(agents, "A0")].append(get_agent_of_name(agents, name="B0"))
speaker_transitions_dict[get_agent_of_name(agents, "B0")].append(get_agent_of_name(agents, name="C0"))

visualize_speaker_transitions_dict(speaker_transitions_dict, agents)

<autogen.agentchat.conversable_agent.ConversableAgent object at 0x7f605e116260>

agents = [ConversableAgent(name=f"Agent{i}", llm_config=False) for i in range(2)]
allowed_speaker_transitions_dict = {
    agents[0]: [agents[0], agents[1]],
    agents[1]: [agents[0], agents[1]],
}

visualize_speaker_transitions_dict(allowed_speaker_transitions_dict, agents)

演示

GroupChat 现在接受两个可选参数。- allowed_or_disallowed_speaker_transitions：键是源代理，值是键代理可以/不可以转移到的代理，取决于 speaker_transitions_type。默认为 None，表示所有代理都可以转移到其他所有代理。- speaker_transitions_type：speaker_transitions_type 是否为包含允许代理或禁止代理列表的字典。"allowed" 表示允许的代理列表， allowed_or_disallowed_speaker_transitions 是一个包含允许代理人列表的字典。

团队操作

# Create an empty directed graph
agents = []
speaker_transitions_dict = {}
secret_values = {}

# Outer loop for prefixes 'A', 'B', 'C'
for prefix in ["A", "B", "C"]:
    # Add 3 nodes with each prefix to the graph using a for loop
    for i in range(3):
        node_id = f"{prefix}{i}"
        secret_value = random.randint(1, 5)  # Generate a random secret value
        secret_values[node_id] = secret_value

        # Create an AssistantAgent for each node (assuming AssistantAgent is a defined class)
        agents.append(
            AssistantAgent(
                name=node_id,
                system_message=f"""Your name is {node_id}.
                                          Do not respond as the speaker named in the NEXT tag if your name is not in the NEXT tag. Instead, suggest a relevant team leader to handle the mis-tag, with the NEXT: tag.

                                          You have {secret_value} chocolates.

                                          The list of players are [A0, A1, A2, B0, B1, B2, C0, C1, C2].

                                            Your first character of your name is your team, and your second character denotes that you are a team leader if it is 0.
                                            CONSTRAINTS: Team members can only talk within the team, whilst team leader can talk to team leaders of other teams but not team members of other teams.

                                            You can use NEXT: to suggest the next speaker. You have to respect the CONSTRAINTS, and can only suggest one player from the list of players, i.e., do not suggest A3 because A3 is not from the list of players.
                                            Team leaders must make sure that they know the sum of the individual chocolate count of all three players in their own team, i.e., A0 is responsible for team A only.

                                          Keep track of the player's tally using a JSON format so that others can check the total tally. Use
                                          A0:?, A1:?, A2:?,
                                          B0:?, B1:?, B2:?,
                                          C0:?, C1:?, C2:?

                                          If you are the team leader, you should aggregate your team's total chocolate count to cooperate.
                                          Once the team leader know their team's tally, they can suggest another team leader for them to find their team tally, because we need all three team tallys to succeed.
                                          Use NEXT: to suggest the next speaker, e.g., NEXT: A0.

                                          Once we have the total tally from all nine players, sum up all three teams' tally, then terminate the discussion using TERMINATE.

                                          """,
                llm_config=config_list_gpt4,
            )
        )
        speaker_transitions_dict[agents[-1]] = []

    # Add edges between nodes with the same prefix using a nested for loop
    for source_node in range(3):
        source_id = f"{prefix}{source_node}"
        for target_node in range(3):
            target_id = f"{prefix}{target_node}"
            if source_node != target_node:  # To avoid self-loops
                speaker_transitions_dict[get_agent_of_name(agents, source_id)].append(
                    get_agent_of_name(agents, name=target_id)
                )


# Adding edges between teams
speaker_transitions_dict[get_agent_of_name(agents, "A0")].append(get_agent_of_name(agents, name="B0"))
speaker_transitions_dict[get_agent_of_name(agents, "A0")].append(get_agent_of_name(agents, name="C0"))
speaker_transitions_dict[get_agent_of_name(agents, "B0")].append(get_agent_of_name(agents, name="A0"))
speaker_transitions_dict[get_agent_of_name(agents, "B0")].append(get_agent_of_name(agents, name="C0"))
speaker_transitions_dict[get_agent_of_name(agents, "C0")].append(get_agent_of_name(agents, name="A0"))
speaker_transitions_dict[get_agent_of_name(agents, "C0")].append(get_agent_of_name(agents, name="B0"))


# Visualization only
graph = nx.DiGraph()

# Add nodes
graph.add_nodes_from([agent.name for agent in agents])

# Add edges
for key, value in speaker_transitions_dict.items():
    for agent in value:
        graph.add_edge(key.name, agent.name)

# Visualize
# Draw the graph with secret values annotated
plt.figure(figsize=(12, 10))
pos = nx.spring_layout(graph)  # positions for all nodes

# Draw nodes with their colors
nx.draw(graph, pos, with_labels=True, font_weight="bold")

# Annotate secret values
for node, (x, y) in pos.items():
    secret_value = secret_values[node]
    plt.text(x, y + 0.1, s=f"Secret: {secret_value}", horizontalalignment="center")

plt.show()

# 终止消息检测


def is_termination_msg(content) -> bool:
    have_content = content.get("content", None) is not None
    if have_content and "TERMINATE" in content["content"]:
        return True
    return False


# 当检测到TERMINATE时终止对话。
user_proxy = autogen.UserProxyAgent(
    name="用户代理",
    system_message="终止者管理员。",
    code_execution_config=False,
    is_termination_msg=is_termination_msg,
    human_input_mode="NEVER",
)

agents.append(user_proxy)

group_chat = GroupChat(
    agents=agents,
    messages=[],
    max_round=20,
    allowed_or_disallowed_speaker_transitions=speaker_transitions_dict,
    speaker_transitions_type="allowed",
)


# 创建管理器
manager = autogen.GroupChatManager(
    groupchat=group_chat,
    llm_config=config_list_gpt4,
    code_execution_config=False,
    is_termination_msg=is_termination_msg,
)


# 与Alice开始对话
agents[0].initiate_chat(
    manager,
    message="""
                        这个游戏有9个玩家，平均分为A队、B队、C队。因此每个队有3个玩家，包括队长。
                        任务是找出所有九个玩家的巧克力数量总和。我现在从我的队开始。
                        NEXT: A1""",
)

WARNING:root:警告：存在孤立的代理节点，既没有入边也没有出边。孤立的代理：['用户代理']
WARNING:root:警告：allowed_speaker_transitions中的代理集合与代理不匹配。有问题的代理：['用户代理']

A0（向 chat_manager 说）：

这个游戏中有9名玩家，平均分成A队、B队、C队。因此每个队有3名玩家，包括队长在内。任务是找出所有九名玩家的巧克力总数。现在我要从我的队伍开始。下一步：A1

A1（向 chat_manager 说）：

作为A队的队长，我有责任收集我的队员的巧克力数量。我有1块巧克力。

A0:？, A1:1, A2:？,

B0:？, B1:？, B2:？,

C0:？, C1:？, C2:？

下一步：A2

A2（向 chat_manager 说）：

我有5块巧克力。

A0:？, A1:1, A2:5,

B0:？, B1:？, B2:？,

C0:？, C1:？, C2:？

下一步：A0

A0（向 chat_manager 说）：

我有1块巧克力。现在我已经知道了A1和A2的数量，可以计算我们队的总数。

A0:1, A1:1, A2:5,

B0:？, B1:？, B2:？,

C0:？, C1:？, C2:？

A队的总数是7块巧克力。现在是时候找出另一个队的总数了。我会把这个传给下一个队长。

下一步：B0

B0（向 chat_manager 说）：

作为B队的队长，我有责任收集我的队员的巧克力数量。我有1块巧克力。

A0:1, A1:1, A2:5,

B0:1, B1:？, B2:？,

C0:？, C1:？, C2:？

现在，我需要知道B1和B2的巧克力数量。

下一步：B1

B1（向 chat_manager 说）：

我有3块巧克力。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:？,

C0:？, C1:？, C2:？

下一步：B2

B2（向 chat_manager 说）：

我有4块巧克力。现在我已经知道了B0和B1的数量，可以计算我们队的总数。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:4,

C0:？, C1:？, C2:？

B队的总数是8块巧克力。现在是时候找出最后一个队的总数了。我会把这个传给下一个队长。

下一步：C0

B0（向 chat_manager 说）：

很抱歉造成任何困惑，但似乎在沟通流程中有一些误解。作为B0，我应该总结B队的总数并将对话传给下一个队长。让我来纠正一下。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:4,

C0:？, C1:？, C2:？

根据B1和B2的数量，B队的总数确实是8块巧克力。现在是时候找出C队的总数了。我会把这个传给下一个队长。

下一步：C0

C0（向 chat_manager 说）：

作为C队的队长，我有责任收集我的队员的巧克力数量。我有3块巧克力。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:4,

C0:3, C1:？, C2:？

现在，我需要知道C1和C2的巧克力数量。

下一步：C1

C1（向 chat_manager 说）：

我有3块巧克力。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:4,

C0:3, C1:3, C2:？

下一步：C2

C2（向 chat_manager 说）：

我有2块巧克力。现在我已经知道了C0和C1的数量，可以计算我们队的总数。

A0:1, A1:1, A2:5,

B0:1, B1:3, B2:4,

C0:3, C1:3, C2:2

C队的总数是8块巧克力。现在我们已经知道了所有队的总数，我们可以把它们加起来。

A队的总数是7块巧克力，B队的总数是8块巧克力，C队的总数是8块巧克力。总共是23块巧克力。

终止

标题一

这是一篇关于某个主题的科普文章。在这篇文章中，我们将介绍一些关于该主题的基本概念和背景信息。

段落一

在过去的几十年中，人工智能（Artificial Intelligence，简称AI）已经取得了巨大的进展。AI技术已经应用于各个领域，包括医疗、交通、金融等。然而，尽管AI在许多任务上表现出色，但在某些方面，它仍然存在一些限制和挑战。

段落二

一个重要的挑战是AI系统的可解释性。可解释性是指AI系统能够解释其决策和行为的能力。在许多应用中，特别是在医疗和法律领域，人们对AI系统的决策过程和依据有着合理的期望。然而，目前大多数AI系统都是黑盒子，难以解释其决策的原因。这给人们带来了一定的困扰和不信任。

段落三

为了解决这个问题，研究人员提出了一种新的方法，称为可解释性机器学习（Explainable Machine Learning，简称XML）。XML是一种将机器学习模型的决策过程可视化和解释的方法。通过XML，人们可以更好地理解AI系统的决策原因，并对其进行验证和审查。

段落四

在XML中，有许多不同的技术和方法可以用来实现可解释性。其中一种常见的方法是特征重要性分析。这种方法通过计算每个特征对模型决策的贡献程度来评估特征的重要性。另一种方法是局部解释性模型，它通过在输入空间的局部区域内构建简单的模型来解释模型的决策。

段落五

除了技术方法，还有一些其他因素也会影响AI系统的可解释性。例如，数据的质量和可用性、模型的复杂性和可理解性等。因此，在设计和开发AI系统时，需要综合考虑这些因素，以实现更好的可解释性。

结论

在本文中，我们介绍了AI系统可解释性的重要性和挑战。我们还介绍了可解释性机器学习的基本概念和方法。希望通过这些内容的介绍，读者能够更好地理解AI系统的可解释性，并在实践中应用相关的技术和方法。

参考文献： [20] Smith, J. et al. (2020). "Explaining AI: A Guide to Understanding and Interpreting Machine Learning Models." Journal of Artificial Intelligence Research, 45(2), 256-289.

ChatResult(chat_id=None, chat_history=[{'content': '\n                        这个游戏中有9个玩家，平均分为A队、B队、C队。因此每个队有3个玩家，包括队长。\n                        任务是找出所有九个玩家的巧克力总数。现在我要从我的队伍开始。\n                        下一个：A1', 'role': 'assistant'}, {'content': '作为A队的队长，我有责任收集我的队员的巧克力数量。我有1块巧克力。\n\nA0:？, A1:1, A2:？,\n\nB0:？, B1:？, B2:？,\n\nC0:？, C1:？, C2:？\n\n下一个：A2', 'name': 'A1', 'role': 'user'}, {'content': '我有5块巧克力。\n\nA0:？, A1:1, A2:5,\n\nB0:？, B1:？, B2:？,\n\nC0:？, C1:？, C2:？\n\n下一个：A0', 'name': 'A2', 'role': 'user'}, {'content': '我有1块巧克力。现在我已经得到了A1和A2的数量，我可以计算我们队的总数。\n\nA0:1, A1:1, A2:5,\n\nB0:？, B1:？, B2:？,\n\nC0:？, C1:？, C2:？\n\nA队的总计是7块巧克力。现在是时候找出另一个队的总计了。我会把这个交给下一个队的队长。\n\n下一个：B0', 'role': 'assistant'}, {'content': '作为B队的队长，我有责任收集我的队员的巧克力数量。我有1块巧克力。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:？, B2:？,\n\nC0:？, C1:？, C2:？\n\n现在，我需要找出B1和B2的巧克力数量。\n\n下一个：B1', 'name': 'B0', 'role': 'user'}, {'content': '我有3块巧克力。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:？,\n\nC0:？, C1:？, C2:？\n\n下一个：B2', 'name': 'B1', 'role': 'user'}, {'content': '我有4块巧克力。现在我已经得到了B0和B1的数量，我可以计算我们队的总数。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:？, C1:？, C2:？\n\nB队的总计是8块巧克力。现在是时候找出最后一个队的总计了。我会把这个交给下一个队的队长。\n\n下一个：C0', 'name': 'B2', 'role': 'user'}, {'content': '很抱歉给您带来任何困惑，但似乎在沟通流程中有一些误解。作为B0，我应该总结B队的总计并将对话传递给下一个队的队长。让我纠正一下。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:？, C1:？, C2:？\n\n通过B1和B2的数量，B队的总计确实是8块巧克力。现在是时候找出C队的总计了。我会把这个交给下一个队的队长。\n\n下一个：C0', 'name': 'B0', 'role': 'user'}, {'content': '作为C队的队长，我有责任收集我的队员的巧克力数量。我有3块巧克力。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:3, C1:？, C2:？\n\n现在，我需要找出C1和C2的巧克力数量。\n\n下一个：C1', 'name': 'C0', 'role': 'user'}, {'content': '我有3块巧克力。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:3, C1:3, C2:？\n\n下一个：C2', 'name': 'C1', 'role': 'user'}, {'content': '我有2块巧克力。现在我已经得到了C0和C1的数量，我可以计算我们队的总数。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:3, C1:3, C2:2\n\nC队的总计是8块巧克力。现在我们已经得到了所有队的总计，我们可以把它们加起来。\n\nA队的总计是7块巧克力，B队的总计是8块巧克力，C队的总计是8块巧克力。总计是23块巧克力。\n\n结束', 'name': 'C2', 'role': 'user'}], summary="我有2块巧克力。现在我已经得到了C0和C1的数量，我可以计算我们队的总数。\n\nA0:1, A1:1, A2:5,\n\nB0:1, B1:3, B2:4,\n\nC0:3, C1:3, C2:2\n\nC队的总计是8块巧克力。现在我们已经得到了所有队的总计，我们可以把它们加起来。\n\nA队的总计是7块巧克力，B队的总计是8块巧克力，C队的总计是8块巧克力。总计是23块巧克力。\n\n", cost={'usage_including_cached_inference': {'total_cost': 0.5525399999999999, 'gpt-4': {'cost': 0.5525399999999999, 'prompt_tokens': 18174, 'completion_tokens': 122, 'total_tokens': 18296}}, 'usage_excluding_cached_inference': {'total_cost': 0.5525399999999999, 'gpt-4': {'cost': 0.5525399999999999, 'prompt_tokens': 18174, 'completion_tokens': 122, 'total_tokens': 18296}}}, human_input=[])

标题一

这是一段关于某个主题的科普文章。文章介绍了该主题的背景和相关概念，并提供了一些实例和数据来支持论点。

小节一

在这个小节中，我们将讨论主题的定义和重要性。我们将介绍一些相关的研究和论文，以支持我们的观点。例如，[20] 提到了一个关于主题的重要研究。

小节二

在这个小节中，我们将探讨主题的应用和影响。我们将介绍一些实际案例和应用场景，以帮助读者更好地理解主题的实际意义。例如，我们将介绍一些公司如何利用主题来改进他们的产品和服务。

小节三

在这个小节中，我们将讨论主题的未来发展趋势和挑战。我们将探讨一些可能的解决方案和创新技术，以应对未来可能出现的问题。我们还将介绍一些相关的研究和论文，以支持我们的观点。

结论

在这篇文章中，我们介绍了主题的背景和重要性，并探讨了它的应用和影响。我们还讨论了主题的未来发展趋势和挑战。通过这篇文章，我们希望读者能够更好地理解主题，并对其未来发展有更深入的了解。

图片描述

FSM - 用户可以输入发言者转换约束

动机​

可能有趣的转换路径​

演示​

团队操作​

标题一

段落一​

段落二​

段落三​

段落四​

段落五​

结论​

标题一

小节一​

小节二​

小节三​

结论​

动机

可能有趣的转换路径

演示

团队操作

段落一

段落二

段落三

段落四

段落五

结论

小节一

小节二

小节三

结论