快速开始
这是 LightGBM CLI 版本的快速入门指南。
首先按照 安装指南 安装 LightGBM。
其他有用链接列表
训练数据格式
LightGBM 支持输入数据文件为 CSV、TSV 和 `LibSVM`_(基于零)格式。
文件可以同时包含和不包含 头部。
标签列 可以通过索引和名称指定。
某些列可以 忽略。
分类特征支持
LightGBM 可以直接使用分类特征(无需独热编码)。在 Expo data 上的实验显示,与独热编码相比,速度提升了约8倍。
关于设置详情,请参考 categorical_feature
参数。
权重和查询/组数据
参数快速浏览
参数格式为 key1=value1 key2=value2 ...
。
参数既可以在配置文件中设置,也可以在命令行中设置。如果一个参数同时出现在命令行和配置文件中,LightGBM 将使用命令行中的参数。
新用户应该查看的最重要参数位于 核心参数 和 学习控制参数 部分的顶部,这些部分包含 LightGBM 参数 的完整详细列表。
运行 LightGBM
lightgbm config=your_config_file other_args ...
参数既可以在配置文件中设置,也可以在命令行中设置,并且命令行中的参数优先级高于配置文件中的参数。例如,以下命令行将保持 num_trees=10
并忽略配置文件中的相同参数。
lightgbm config=train.conf num_trees=10