`rl_chain`#

RL（强化学习）链利用Vowpal Wabbit (VW)模型进行带有上下文的强化学习，目的是在调用LLM之前修改提示。

[Vowpal Wabbit](https://vowpalwabbit.org/) 提供了快速、高效且灵活的在线机器学习技术，适用于强化学习、监督学习等。

类

`rl_chain.base.AutoSelectionScorer`	自动选择评分器。
`rl_chain.base.Embedder`(args, *kwargs)	表示嵌入器的抽象类。
`rl_chain.base.Event`(inputs[, selected])	表示事件的抽象类。
`rl_chain.base.Policy`(**kwargs)	表示策略的抽象类。
`rl_chain.base.RLChain`	利用Vowpal Wabbit (VW)模型作为强化学习的学习策略的链。
`rl_chain.base.RLChain[PickBestEvent]`	利用Vowpal Wabbit (VW)模型作为学习策略的强化学习链。
`rl_chain.base.Selected`()	表示所选项目的抽象类。
`rl_chain.base.SelectionScorer`	用于评分所选选择或llm响应的抽象类。
`rl_chain.base.VwPolicy`(model_repo, vw_cmd, ...)	Vowpal Wabbit 策略。
`rl_chain.metrics.MetricsTrackerAverage`(step)	指标跟踪器平均值。
`rl_chain.metrics.MetricsTrackerRollingWindow`(...)	指标跟踪器滚动窗口。
`rl_chain.model_repository.ModelRepository`(folder)	模型仓库。
`rl_chain.pick_best_chain.PickBest`	利用Vowpal Wabbit (VW)模型进行上下文强化学习的链，目标是在LLM调用之前修改提示。
`rl_chain.pick_best_chain.PickBestEvent`(...)	PickBest链的事件类。
`rl_chain.pick_best_chain.PickBestFeatureEmbedder`(...)	将BasedOn和ToSelectFrom输入嵌入到学习策略可以使用的格式中。
`rl_chain.pick_best_chain.PickBestRandomPolicy`(...)	PickBest链的随机策略。
`rl_chain.pick_best_chain.PickBestSelected`([...])	PickBest链的选择类。
`rl_chain.vw_logger.VwLogger`(path)	Vowpal Wabbit 自定义日志记录器。

函数

`rl_chain.base.BasedOn`(anything)	包装一个值以指示它应该基于。
`rl_chain.base.Embed`(anything[, keep])	包装一个值以指示它应该被嵌入。
`rl_chain.base.EmbedAndKeep`(anything)	包装一个值以指示它应该被嵌入并保留。
`rl_chain.base.ToSelectFrom`(anything)	包装一个值以指示应该从中选择。
`rl_chain.base.get_based_on_and_to_select_from`(inputs)	从输入中获取BasedOn和ToSelectFrom。
`rl_chain.base.parse_lines`(parser, input_str)	将输入字符串解析为示例列表。
`rl_chain.base.prepare_inputs_for_autoembed`(inputs)	为自动嵌入准备输入。
`rl_chain.helpers.embed`(to_embed, model[, ...])	使用SentenceTransformer模型（或具有encode函数的模型）嵌入动作或上下文。
`rl_chain.helpers.embed_dict_type`(item, model)	嵌入一个字典项。
`rl_chain.helpers.embed_list_type`(item, model)	嵌入一个列表项。
`rl_chain.helpers.embed_string_type`(item, model)	嵌入字符串或_Embed对象。
`rl_chain.helpers.is_stringtype_instance`(item)	检查一个项目是否为字符串。
`rl_chain.helpers.stringify_embedding`(embedding)	将嵌入转换为字符串。

rl_chain#