.. DO NOT EDIT.
.. THIS FILE WAS AUTOMATICALLY GENERATED BY SPHINX-GALLERY.
.. TO MAKE CHANGES, EDIT THE SOURCE PYTHON FILE:
.. "auto_examples/svm/plot_svm_scale_c.py"
.. LINE NUMBERS ARE GIVEN BELOW.

.. only:: html

    .. note::
        :class: sphx-glr-download-link-note

        :ref:`Go to the end <sphx_glr_download_auto_examples_svm_plot_svm_scale_c.py>`
        to download the full example code. or to run this example in your browser via Binder

.. rst-class:: sphx-glr-example-title

.. _sphx_glr_auto_examples_svm_plot_svm_scale_c.py:


==============================================
ç¼©æ”¾SVCçš„æ£åˆ™åŒ–å‚æ•°
==============================================

ä»¥ä¸‹ç¤ºä¾‹è¯´æ˜Žäº†åœ¨ä½¿ç”¨:ref:`svm` è¿›è¡Œ:ref:`åˆ†ç±» <svm_classification>` æ—¶ç¼©æ”¾æ£åˆ™åŒ–å‚æ•°çš„æ•ˆæžœã€‚
å¯¹äºŽSVCåˆ†ç±»ï¼Œæˆ‘ä»¬å…³æ³¨çš„æ˜¯ä»¥ä¸‹æ–¹ç¨‹çš„é£Žé™©æœ€å°åŒ–ï¼š

.. math::

    C \sum_{i=1, n} \mathcal{L} (f(x_i), y_i) + \Omega (w)

å…¶ä¸

    - :math:`C` ç”¨äºŽè®¾ç½®æ£åˆ™åŒ–çš„é‡
    - :math:`\mathcal{L}` æ˜¯æ ·æœ¬å’Œæ¨¡åž‹å‚æ•°çš„ `æŸå¤±` å‡½æ•°
    - :math:`\Omega` æ˜¯æ¨¡åž‹å‚æ•°çš„ `æƒ©ç½š` å‡½æ•°

å¦‚æžœæˆ‘ä»¬è®¤ä¸ºæŸå¤±å‡½æ•°æ˜¯æ¯ä¸ªæ ·æœ¬çš„å•ç‹¬è¯¯å·®ï¼Œé‚£ä¹ˆæ•°æ®æ‹Ÿåˆé¡¹æˆ–æ¯ä¸ªæ ·æœ¬è¯¯å·®çš„æ€»å’Œä¼šéšç€æˆ‘ä»¬æ·»åŠ æ›´å¤šæ ·æœ¬è€Œå¢žåŠ ã€‚ç„¶è€Œï¼Œæƒ©ç½šé¡¹ä¸ä¼šå¢žåŠ ã€‚

ä¾‹å¦‚ï¼Œå½“ä½¿ç”¨:ref:`äº¤å‰éªŒè¯ <cross_validation>` æ¥è®¾ç½®æ£åˆ™åŒ–å‚æ•° `C` æ—¶ï¼Œä¸»é—®é¢˜å’Œäº¤å‰éªŒè¯æŠ˜å å†…çš„è¾ƒå°é—®é¢˜ä¹‹é—´çš„æ ·æœ¬æ•°é‡ä¼šæœ‰æ‰€ä¸åŒã€‚

ç”±äºŽæŸå¤±å‡½æ•°ä¾èµ–äºŽæ ·æœ¬æ•°é‡ï¼ŒåŽè€…ä¼šå½±å“æ‰€é€‰çš„ `C` å€¼ã€‚ç”±æ¤äº§ç”Ÿçš„é—®é¢˜æ˜¯â€œæˆ‘ä»¬å¦‚ä½•ä¼˜åŒ–è°ƒæ•´Cä»¥è€ƒè™‘ä¸åŒæ•°é‡çš„è®ç»ƒæ ·æœ¬ï¼Ÿâ€

.. GENERATED FROM PYTHON SOURCE LINES 25-29

.. code-block:: Python


    # ä½œè€…ï¼šscikit-learn å¼€å‘è€…
    # SPDX è®¸å¯è¯æ ‡è¯†ç¬¦ï¼šBSD-3-Clause








.. GENERATED FROM PYTHON SOURCE LINES 30-34

æ•°æ®ç”Ÿæˆ
---------------

åœ¨è¿™ä¸ªç¤ºä¾‹ä¸ï¼Œæˆ‘ä»¬ç ”ç©¶äº†åœ¨ä½¿ç”¨L1æˆ–L2æƒ©ç½šæ—¶ï¼Œé‡æ–°å‚æ•°åŒ–æ£åˆ™åŒ–å‚æ•° `C` ä»¥è€ƒè™‘æ ·æœ¬æ•°é‡çš„æ•ˆæžœã€‚ä¸ºæ¤ï¼Œæˆ‘ä»¬åˆ›å»ºäº†ä¸€ä¸ªå…·æœ‰å¤§é‡ç‰¹å¾çš„åˆæˆæ•°æ®é›†ï¼Œå…¶ä¸åªæœ‰å°‘æ•°ç‰¹å¾æ˜¯æœ‰ä¿¡æ¯é‡çš„ã€‚å› æ¤ï¼Œæˆ‘ä»¬æœŸæœ›æ£åˆ™åŒ–å°†ç³»æ•°ç¼©å°åˆ°æŽ¥è¿‘é›¶ï¼ˆL2æƒ©ç½šï¼‰æˆ–ç²¾ç¡®ä¸ºé›¶ï¼ˆL1æƒ©ç½šï¼‰ã€‚

.. GENERATED FROM PYTHON SOURCE LINES 34-42

.. code-block:: Python


    from sklearn.datasets import make_classification

    n_samples, n_features = 100, 300
    X, y = make_classification(
        n_samples=n_samples, n_features=n_features, n_informative=5, random_state=1
    )








.. GENERATED FROM PYTHON SOURCE LINES 43-48

L1-æƒ©ç½šæƒ…å†µ
---------------
åœ¨L1æƒ…å†µä¸‹ï¼Œç†è®ºè¡¨æ˜Žï¼Œåªè¦æœ‰å¼ºæ£åˆ™åŒ–ï¼Œä¼°è®¡å™¨çš„é¢„æµ‹èƒ½åŠ›å°±ä¸å¦‚çŸ¥é“çœŸå®žåˆ†å¸ƒçš„æ¨¡åž‹ï¼ˆå³ä½¿åœ¨æ ·æœ¬é‡æ— é™å¢žé•¿çš„æƒ…å†µä¸‹ï¼‰ï¼Œå› ä¸ºå®ƒå¯èƒ½ä¼šå°†ä¸€äº›æœ¬æ¥å…·æœ‰é¢„æµ‹èƒ½åŠ›çš„ç‰¹å¾çš„æƒé‡è®¾ä¸ºé›¶ï¼Œä»Žè€Œå¼•å…¥åå·®ã€‚ç„¶è€Œï¼Œç†è®ºä¹Ÿè¡¨æ˜Žï¼Œé€šè¿‡è°ƒæ•´ `C` ï¼Œå¯ä»¥æ‰¾åˆ°æ£ç¡®çš„éžé›¶å‚æ•°é›†åŠå…¶ç¬¦å·ã€‚

æˆ‘ä»¬å®šä¹‰ä¸€ä¸ªå¸¦æœ‰L1æƒ©ç½šçš„çº¿æ€§SVCã€‚

.. GENERATED FROM PYTHON SOURCE LINES 48-53

.. code-block:: Python


    from sklearn.svm import LinearSVC

    model_l1 = LinearSVC(penalty="l1", loss="squared_hinge", dual=False, tol=1e-3)








.. GENERATED FROM PYTHON SOURCE LINES 54-55

æˆ‘ä»¬é€šè¿‡äº¤å‰éªŒè¯è®¡ç®—ä¸åŒ `C` å€¼çš„å¹³å‡æµ‹è¯•å¾—åˆ†ã€‚

.. GENERATED FROM PYTHON SOURCE LINES 55-86

.. code-block:: Python



    import numpy as np
    import pandas as pd

    from sklearn.model_selection import ShuffleSplit, validation_curve

    Cs = np.logspace(-2.3, -1.3, 10)
    train_sizes = np.linspace(0.3, 0.7, 3)
    labels = [f"fraction: {train_size}" for train_size in train_sizes]
    shuffle_params = {
        "test_size": 0.3,
        "n_splits": 150,
        "random_state": 1,
    }

    results = {"C": Cs}
    for label, train_size in zip(labels, train_sizes):
        cv = ShuffleSplit(train_size=train_size, **shuffle_params)
        train_scores, test_scores = validation_curve(
            model_l1,
            X,
            y,
            param_name="C",
            param_range=Cs,
            cv=cv,
            n_jobs=2,
        )
        results[label] = test_scores.mean(axis=1)
    results = pd.DataFrame(results)








.. GENERATED FROM PYTHON SOURCE LINES 87-114

.. code-block:: Python

    import matplotlib.pyplot as plt

    fig, axes = plt.subplots(nrows=1, ncols=2, sharey=True, figsize=(12, 6))

    # ç»˜åˆ¶æœªç¼©æ”¾Cçš„ç»“æžœ
    results.plot(x="C", ax=axes[0], logx=True)
    axes[0].set_ylabel("CV score")
    axes[0].set_title("No scaling")

    for label in labels:
        best_C = results.loc[results[label].idxmax(), "C"]
        axes[0].axvline(x=best_C, linestyle="--", color="grey", alpha=0.7)

    # é€šè¿‡ç¼©æ”¾Cç»˜åˆ¶ç»“æžœ
    for train_size_idx, label in enumerate(labels):
        train_size = train_sizes[train_size_idx]
        results_scaled = results[[label]].assign(
            C_scaled=Cs * float(n_samples * np.sqrt(train_size))
        )
        results_scaled.plot(x="C_scaled", ax=axes[1], logx=True, label=label)
        best_C_scaled = results_scaled["C_scaled"].loc[results[label].idxmax()]
        axes[1].axvline(x=best_C_scaled, linestyle="--", color="grey", alpha=0.7)

    axes[1].set_title("Scaling C by sqrt(1 / n_samples)")

    _ = fig.suptitle("Effect of scaling C with L1 penalty")




.. image-sg:: /auto_examples/svm/images/sphx_glr_plot_svm_scale_c_001.png
   :alt: Effect of scaling C with L1 penalty, No scaling, Scaling C by sqrt(1 / n_samples)
   :srcset: /auto_examples/svm/images/sphx_glr_plot_svm_scale_c_001.png
   :class: sphx-glr-single-img





.. GENERATED FROM PYTHON SOURCE LINES 115-124

åœ¨å° `C` ï¼ˆå¼ºæ£åˆ™åŒ–ï¼‰åŒºåŸŸï¼Œæ¨¡åž‹å¦ä¹ åˆ°çš„æ‰€æœ‰ç³»æ•°éƒ½æ˜¯é›¶ï¼Œå¯¼è‡´ä¸¥é‡æ¬ æ‹Ÿåˆã€‚å®žé™…ä¸Šï¼Œè¯¥åŒºåŸŸçš„å‡†ç¡®çŽ‡å¤„äºŽéšæœºæ°´å¹³ã€‚

ä½¿ç”¨é»˜è®¤çš„ç¼©æ”¾æ¯”ä¾‹ä¼šå¾—åˆ°ä¸€ä¸ªç›¸å¯¹ç¨³å®šçš„ `C` æœ€ä¼˜å€¼ï¼Œè€Œä»Žæ¬ æ‹ŸåˆåŒºåŸŸè¿‡æ¸¡å–å†³äºŽè®ç»ƒæ ·æœ¬çš„æ•°é‡ã€‚é‡æ–°å‚æ•°åŒ–ä¼šå¯¼è‡´ç»“æžœæ›´åŠ ç¨³å®šã€‚

å‚è§ä¾‹å¦‚:arxiv:`On the prediction performance of the Lasso <1402.1700>` çš„å®šç†3æˆ–:arxiv:`Simultaneous analysis of Lasso and Dantzig selector <0801.1095>` ï¼Œå…¶ä¸æ£åˆ™åŒ–å‚æ•°æ€»æ˜¯å‡å®šä¸Ž1 / sqrt(n_samples)æˆæ£æ¯”ã€‚

L2-æƒ©ç½šæƒ…å†µ
---------------
æˆ‘ä»¬å¯ä»¥å¯¹L2æƒ©ç½šè¿›è¡Œç±»ä¼¼çš„å®žéªŒã€‚åœ¨è¿™ç§æƒ…å†µä¸‹ï¼Œç†è®ºä¸Šä¸ºäº†å®žçŽ°é¢„æµ‹ä¸€è‡´æ€§ï¼Œæƒ©ç½šå‚æ•°åº”éšç€æ ·æœ¬æ•°é‡çš„å¢žåŠ ä¿æŒä¸å˜ã€‚

.. GENERATED FROM PYTHON SOURCE LINES 124-144

.. code-block:: Python


    model_l2 = LinearSVC(penalty="l2", loss="squared_hinge", dual=True)
    Cs = np.logspace(-8, 4, 11)

    labels = [f"fraction: {train_size}" for train_size in train_sizes]
    results = {"C": Cs}
    for label, train_size in zip(labels, train_sizes):
        cv = ShuffleSplit(train_size=train_size, **shuffle_params)
        train_scores, test_scores = validation_curve(
            model_l2,
            X,
            y,
            param_name="C",
            param_range=Cs,
            cv=cv,
            n_jobs=2,
        )
        results[label] = test_scores.mean(axis=1)
    results = pd.DataFrame(results)








.. GENERATED FROM PYTHON SOURCE LINES 145-171

.. code-block:: Python

    import matplotlib.pyplot as plt

    fig, axes = plt.subplots(nrows=1, ncols=2, sharey=True, figsize=(12, 6))

    # ç»˜åˆ¶æœªç¼©æ”¾Cçš„ç»“æžœ
    results.plot(x="C", ax=axes[0], logx=True)
    axes[0].set_ylabel("CV score")
    axes[0].set_title("No scaling")

    for label in labels:
        best_C = results.loc[results[label].idxmax(), "C"]
        axes[0].axvline(x=best_C, linestyle="--", color="grey", alpha=0.8)

    # é€šè¿‡ç¼©æ”¾Cç»˜åˆ¶ç»“æžœ
    for train_size_idx, label in enumerate(labels):
        results_scaled = results[[label]].assign(
            C_scaled=Cs * float(n_samples * np.sqrt(train_sizes[train_size_idx]))
        )
        results_scaled.plot(x="C_scaled", ax=axes[1], logx=True, label=label)
        best_C_scaled = results_scaled["C_scaled"].loc[results[label].idxmax()]
        axes[1].axvline(x=best_C_scaled, linestyle="--", color="grey", alpha=0.8)
    axes[1].set_title("Scaling C by sqrt(1 / n_samples)")

    fig.suptitle("Effect of scaling C with L2 penalty")
    plt.show()




.. image-sg:: /auto_examples/svm/images/sphx_glr_plot_svm_scale_c_002.png
   :alt: Effect of scaling C with L2 penalty, No scaling, Scaling C by sqrt(1 / n_samples)
   :srcset: /auto_examples/svm/images/sphx_glr_plot_svm_scale_c_002.png
   :class: sphx-glr-single-img





.. GENERATED FROM PYTHON SOURCE LINES 172-175

å¯¹äºŽL2æƒ©ç½šæƒ…å†µï¼Œé‡æ–°å‚æ•°åŒ–ä¼¼ä¹Žå¯¹æ£åˆ™åŒ–çš„æœ€ä¼˜å€¼ç¨³å®šæ€§å½±å“è¾ƒå°ã€‚è¿‡æ‹ŸåˆåŒºåŸŸçš„è¿‡æ¸¡å‘ç”Ÿåœ¨æ›´å¹¿æ³›çš„èŒƒå›´å†…ï¼Œå¹¶ä¸”å‡†ç¡®æ€§ä¼¼ä¹Žæ²¡æœ‰é™åˆ°éšæœºæ°´å¹³ã€‚

å°è¯•å°†å€¼å¢žåŠ åˆ° `n_splits=1_000` ä»¥åœ¨ L2 æƒ…å†µä¸‹èŽ·å¾—æ›´å¥½çš„ç»“æžœï¼Œè¿™é‡Œç”±äºŽæ–‡æ¡£ç”Ÿæˆå™¨çš„é™åˆ¶æœªæ˜¾ç¤ºã€‚


.. rst-class:: sphx-glr-timing

   **Total running time of the script:** (0 minutes 8.553 seconds)


.. _sphx_glr_download_auto_examples_svm_plot_svm_scale_c.py:

.. only:: html

  .. container:: sphx-glr-footer sphx-glr-footer-example

    .. container:: binder-badge

      .. image:: images/binder_badge_logo.svg
        :target: https://mybinder.org/v2/gh/scikit-learn/scikit-learn/main?urlpath=lab/tree/notebooks/auto_examples/svm/plot_svm_scale_c.ipynb
        :alt: Launch binder
        :width: 150 px

    .. container:: sphx-glr-download sphx-glr-download-jupyter

      :download:`Download Jupyter notebook: plot_svm_scale_c.ipynb <plot_svm_scale_c.ipynb>`

    .. container:: sphx-glr-download sphx-glr-download-python

      :download:`Download Python source code: plot_svm_scale_c.py <plot_svm_scale_c.py>`

    .. container:: sphx-glr-download sphx-glr-download-zip

      :download:`Download zipped: plot_svm_scale_c.zip <plot_svm_scale_c.zip>`


.. include:: plot_svm_scale_c.recommendations


.. only:: html

 .. rst-class:: sphx-glr-signature

    `Gallery generated by Sphinx-Gallery <https://sphinx-gallery.github.io>`_