快速开始

这是 LightGBM CLI 版本的快速入门指南。

首先按照 安装指南 安装 LightGBM。

其他有用链接列表

训练数据格式

LightGBM 支持输入数据文件为 CSVTSV`LibSVM`_(基于零)格式。

文件可以同时包含和不包含 头部

标签列 可以通过索引和名称指定。

某些列可以 忽略

分类特征支持

LightGBM 可以直接使用分类特征(无需独热编码)。在 Expo data 上的实验显示,与独热编码相比,速度提升了约8倍。

关于设置详情,请参考 categorical_feature 参数

权重和查询/组数据

LightGBM 也支持加权训练,它需要额外的 权重数据。对于排序任务,它还需要额外的 查询数据

此外,weightquery 数据可以像标签一样在训练数据中指定为列。

参数快速浏览

参数格式为 key1=value1 key2=value2 ...

参数既可以在配置文件中设置,也可以在命令行中设置。如果一个参数同时出现在命令行和配置文件中,LightGBM 将使用命令行中的参数。

新用户应该查看的最重要参数位于 核心参数学习控制参数 部分的顶部,这些部分包含 LightGBM 参数 的完整详细列表。

运行 LightGBM

lightgbm config=your_config_file other_args ...

参数既可以在配置文件中设置,也可以在命令行中设置,并且命令行中的参数优先级高于配置文件中的参数。例如,以下命令行将保持 num_trees=10 并忽略配置文件中的相同参数。

lightgbm config=train.conf num_trees=10

示例