Shortcuts

torch.nn.attention

此模块包含改变 torch.nn.functional.scaled_dot_product_attention 行为的函数和类

工具

sdpa_kernel

上下文管理器,用于选择用于缩放点积注意力的后端。

SDPBackend

一个类似枚举的类,包含用于缩放点积注意力的不同后端。

子模块

bias

定义与scaled_dot_product_attention一起工作的偏置子类

优云智算