.. _loading_other_datasets: 加载其他数据集 ================ .. currentmodule:: sklearn.datasets .. _sample_images: 示例图像 --------- Scikit-learn 还嵌入了一些由作者以 Creative Commons 许可证发布的示例 JPEG 图像。这些图像对于在二维数据上测试算法和流水线非常有用。 .. autosummary:: load_sample_images load_sample_image .. image:: ../auto_examples/cluster/images/sphx_glr_plot_color_quantization_001.png :target: ../auto_examples/cluster/plot_color_quantization.html :scale: 30 :align: right .. warning:: 图像的默认编码基于 ``uint8`` dtype,以节省内存。通常,机器学习算法在输入首先转换为浮点表示时效果最佳。此外,如果您计划使用 ``matplotlib.pyplot.imshow`` ,请不要忘记将范围缩放到 0 - 1,如下例所示。 .. rubric:: 示例 * :ref:`sphx_glr_auto_examples_cluster_plot_color_quantization.py` .. _libsvm_loader: svmlight / libsvm 格式的数据集 -------------------------------- scikit-learn 包含用于加载 svmlight / libsvm 格式数据集的实用函数。在这种格式中,每一行采用 ``