rl_chain#

RL(强化学习)链利用Vowpal Wabbit (VW)模型进行带有上下文的强化学习,目的是在调用LLM之前修改提示。

[Vowpal Wabbit](https://vowpalwabbit.org/) 提供了快速、高效且灵活的在线机器学习技术,适用于强化学习、监督学习等。

rl_chain.base.AutoSelectionScorer

自动选择评分器。

rl_chain.base.Embedder(*args, **kwargs)

表示嵌入器的抽象类。

rl_chain.base.Event(inputs[, selected])

表示事件的抽象类。

rl_chain.base.Policy(**kwargs)

表示策略的抽象类。

rl_chain.base.RLChain

利用Vowpal Wabbit (VW)模型作为强化学习的学习策略的链。

rl_chain.base.RLChain[PickBestEvent]

利用Vowpal Wabbit (VW)模型作为学习策略的强化学习链。

rl_chain.base.Selected()

表示所选项目的抽象类。

rl_chain.base.SelectionScorer

用于评分所选选择或llm响应的抽象类。

rl_chain.base.VwPolicy(model_repo, vw_cmd, ...)

Vowpal Wabbit 策略。

rl_chain.metrics.MetricsTrackerAverage(step)

指标跟踪器平均值。

rl_chain.metrics.MetricsTrackerRollingWindow(...)

指标跟踪器滚动窗口。

rl_chain.model_repository.ModelRepository(folder)

模型仓库。

rl_chain.pick_best_chain.PickBest

利用Vowpal Wabbit (VW)模型进行上下文强化学习的链,目标是在LLM调用之前修改提示。

rl_chain.pick_best_chain.PickBestEvent(...)

PickBest链的事件类。

rl_chain.pick_best_chain.PickBestFeatureEmbedder(...)

BasedOnToSelectFrom输入嵌入到学习策略可以使用的格式中。

rl_chain.pick_best_chain.PickBestRandomPolicy(...)

PickBest链的随机策略。

rl_chain.pick_best_chain.PickBestSelected([...])

PickBest链的选择类。

rl_chain.vw_logger.VwLogger(path)

Vowpal Wabbit 自定义日志记录器。

函数

rl_chain.base.BasedOn(anything)

包装一个值以指示它应该基于。

rl_chain.base.Embed(anything[, keep])

包装一个值以指示它应该被嵌入。

rl_chain.base.EmbedAndKeep(anything)

包装一个值以指示它应该被嵌入并保留。

rl_chain.base.ToSelectFrom(anything)

包装一个值以指示应该从中选择。

rl_chain.base.get_based_on_and_to_select_from(inputs)

从输入中获取BasedOn和ToSelectFrom。

rl_chain.base.parse_lines(parser, input_str)

将输入字符串解析为示例列表。

rl_chain.base.prepare_inputs_for_autoembed(inputs)

为自动嵌入准备输入。

rl_chain.helpers.embed(to_embed, model[, ...])

使用SentenceTransformer模型(或具有encode函数的模型)嵌入动作或上下文。

rl_chain.helpers.embed_dict_type(item, model)

嵌入一个字典项。

rl_chain.helpers.embed_list_type(item, model)

嵌入一个列表项。

rl_chain.helpers.embed_string_type(item, model)

嵌入字符串或_Embed对象。

rl_chain.helpers.is_stringtype_instance(item)

检查一个项目是否为字符串。

rl_chain.helpers.stringify_embedding(embedding)

将嵌入转换为字符串。