用户指南#
- 1. 监督学习
- 2. 无监督学习
- 3. 模型选择与评估
- 3.1. 交叉验证:评估估计器性能
- 3.2. 调整估计器的超参数
- 3.3. 调整分类预测的决策阈值
- 3.4. 度量和评分:量化预测质量
- 3.4.1. 常见情况:预定义值
- 3.4.2. 从指标函数定义您的评分策略
- 3.4.3. 实现自己的评分对象
- 3.4.4. 使用多指标评估
- 3.4.5. 从二分类到多分类和多标签
- 3.4.6. 准确率分数
- 3.4.7. Top-k 准确度评分
- 3.4.8. 平衡准确率得分
- 3.4.9. Cohen’s kappa
- 3.4.10. Confusion matrix
- 3.4.11. 分类报告
- 3.4.12. 汉明损失
- 3.4.13. 精确度、召回率和F度量
- 3.4.14. Jaccard 相似系数得分
- 3.4.15. Hinge loss
- 3.4.16. 对数损失
- 3.4.17. Matthews 相關係數
- 3.4.18. 多标签混淆矩阵
- 3.4.19. 接收者操作特征 (ROC)
- 3.4.20. 检测错误权衡(DET)
- 3.4.21. 零一损失
- 3.4.22. Brier 分数损失
- 3.4.23. 类别似然比
- 3.4.24. 分类的 D² 分数
- 3.4.25. 覆盖误差
- 3.4.26. 标签排名平均精度
- 3.4.27. 排名损失
- 3.4.28. 归一化折损累积增益
- 3.4.29. R² 评分,决定系数
- 3.4.30. 平均绝对误差
- 3.4.31. 均方误差
- 3.4.32. 均方对数误差
- 3.4.33. 平均绝对百分比误差
- 3.4.34. 中位数绝对误差
- 3.4.35. 均值泊松、伽马和特威迪偏差
- 3.4.36. Pinball 损失
- 3.4.37. D² 得分
- 3.4.38. 回归模型的可视化评估
- 3.5. 验证曲线:绘制分数以评估模型
- 4. 检查
- 5. 可视化
- 6. 数据集转换
- 7. 数据集加载工具
- 8. 使用 scikit-learn 进行计算
- 9. 模型持久化
- 10. 常见陷阱与推荐实践
- 11. 调度
- 12. 选择合适的估计器
- 13. 外部资源、视频和演讲