.. currentmodule:: sklearn.model_selection

.. _TunedThresholdClassifierCV:

==================================================
è°ƒæ•´åˆ†ç±»é¢„æµ‹çš„å†³ç–é˜ˆå€¼
==================================================

åˆ†ç±»é—®é¢˜æœ€å¥½åˆ†ä¸ºä¸¤ä¸ªéƒ¨åˆ†ï¼š

* ç»Ÿè®¡é—®é¢˜ï¼Œå¦ä¹ ä¸€ä¸ªæ¨¡åž‹æ¥é¢„æµ‹ï¼Œç†æƒ³æƒ…å†µä¸‹æ˜¯ç±»æ¦‚çŽ‡ï¼›
* å†³ç–é—®é¢˜ï¼Œæ ¹æ®è¿™äº›æ¦‚çŽ‡é¢„æµ‹é‡‡å–å…·ä½“è¡ŒåŠ¨ã€‚

è®©æˆ‘ä»¬ä»¥ä¸€ä¸ªä¸Žå¤©æ°”é¢„æŠ¥ç›¸å…³çš„ç®€å•ä¾‹åæ¥è¯´æ˜Žï¼šç¬¬ä¸€ç‚¹æ¶‰åŠå›žç”â€œæ˜Žå¤©é™é›¨çš„æ¦‚çŽ‡æ˜¯å¤šå°‘ï¼Ÿâ€ï¼Œè€Œç¬¬äºŒç‚¹æ¶‰åŠå›žç”â€œæˆ‘æ˜Žå¤©åº”è¯¥å¸¦ä¼žå—ï¼Ÿâ€ã€‚

åœ¨ scikit-learn API ä¸ï¼Œç¬¬ä¸€ç‚¹é€šè¿‡ä½¿ç”¨ :term:`predict_proba` æˆ– :term:`decision_function` æä¾›åˆ†æ•°æ¥è§£å†³ã€‚å‰è€…è¿”å›žæ¯ä¸ªç±»çš„æ¡ä»¶æ¦‚çŽ‡ä¼°è®¡ :math:`P(y|X)` ï¼Œè€ŒåŽè€…è¿”å›žæ¯ä¸ªç±»çš„å†³ç–åˆ†æ•°ã€‚

ä¸Žæ ‡ç¾å¯¹åº”çš„å†³ç–æ˜¯é€šè¿‡ :term:`predict` èŽ·å¾—çš„ã€‚åœ¨äºŒåˆ†ç±»ä¸ï¼Œé€šè¿‡é˜ˆå€¼åŒ–åˆ†æ•°æ¥å®šä¹‰å†³ç–è§„åˆ™æˆ–è¡ŒåŠ¨ï¼Œä»Žè€Œä¸ºæ¯ä¸ªæ ·æœ¬é¢„æµ‹ä¸€ä¸ªå•ä¸€çš„ç±»æ ‡ç¾ã€‚åœ¨ scikit-learn çš„äºŒåˆ†ç±»ä¸ï¼Œç±»æ ‡ç¾é¢„æµ‹æ˜¯é€šè¿‡ç¡¬ç¼–ç çš„æˆªæ¢è§„åˆ™èŽ·å¾—çš„ï¼šå½“æ¡ä»¶æ¦‚çŽ‡ :math:`P(y|X)` å¤§äºŽ 0.5ï¼ˆé€šè¿‡ :term:`predict_proba` èŽ·å¾—ï¼‰æˆ–å†³ç–åˆ†æ•°å¤§äºŽ 0ï¼ˆé€šè¿‡ :term:`decision_function` èŽ·å¾—ï¼‰æ—¶ï¼Œé¢„æµ‹ä¸ºæ£ç±»ã€‚

åœ¨è¿™é‡Œï¼Œæˆ‘ä»¬å±•ç¤ºäº†ä¸€ä¸ªç¤ºä¾‹ï¼Œè¯´æ˜Žäº†æ¡ä»¶æ¦‚çŽ‡ä¼°è®¡ :math:`P(y|X)` ä¸Žç±»æ ‡ç¾ä¹‹é—´çš„å…³ç³»::

    >>> from sklearn.datasets import make_classification
    >>> from sklearn.tree import DecisionTreeClassifier
    >>> X, y = make_classification(random_state=0)
    >>> classifier = DecisionTreeClassifier(max_depth=2, random_state=0).fit(X, y)
    >>> classifier.predict_proba(X[:4])

    array([[0.94     , 0.06     ],
           [0.94     , 0.06     ],
           [0.0416..., 0.9583...],
           [0.0416..., 0.9583...]])
    >>> classifier.predict(X[:4])
    array([0, 0, 1, 1])

è™½ç„¶è¿™äº›ç¡¬ç¼–ç è§„åˆ™åœ¨ä¸€å¼€å§‹ä½œä¸ºé»˜è®¤è¡Œä¸ºå¯èƒ½çœ‹èµ·æ¥åˆç†ï¼Œä½†å®ƒä»¬ç»å¯¹ä¸æ˜¯å¤§å¤šæ•°ç”¨ä¾‹çš„ç†æƒ³é€‰æ‹©ã€‚è®©æˆ‘ä»¬ç”¨ä¸€ä¸ªä¾‹åæ¥è¯´æ˜Žã€‚

è€ƒè™‘ä¸€ä¸ªåœºæ™¯ï¼Œä¸€ä¸ªé¢„æµ‹æ¨¡åž‹è¢«éƒ¨ç½²æ¥ååŠ©åŒ»ç”Ÿæ£€æµ‹è‚¿ç˜¤ã€‚åœ¨è¿™ç§æƒ…å†µä¸‹ï¼ŒåŒ»ç”Ÿæœ€æœ‰å¯èƒ½å¯¹è¯†åˆ«æ‰€æœ‰æ‚£æœ‰ç™Œç—‡çš„æ‚£è€…å¹¶ä¸é”™è¿‡ä»»ä½•æ‚£æœ‰ç™Œç—‡çš„äººæ„Ÿå…´è¶£ï¼Œä»¥ä¾¿ä»–ä»¬å¯ä»¥ä¸ºä»–ä»¬æä¾›æ£ç¡®çš„æ²»ç–—ã€‚æ¢å¥è¯è¯´ï¼ŒåŒ»ç”Ÿä¼˜å…ˆè€ƒè™‘å®žçŽ°é«˜å¬å›žçŽ‡ã€‚å½“ç„¶ï¼Œè¿™ç§å¯¹å¬å›žçš„å¼ºè°ƒä¼´éšç€å¯èƒ½æ›´å¤šçš„å‡é˜³æ€§é¢„æµ‹ï¼Œä»Žè€Œé™ä½Žäº†æ¨¡åž‹çš„ç²¾ç¡®åº¦ã€‚è¿™æ˜¯ä¸€ä¸ªåŒ»ç”Ÿæ„¿æ„æ‰¿æ‹…çš„é£Žé™©ï¼Œå› ä¸ºé”™è¿‡ç™Œç—‡çš„æˆæœ¬è¿œé«˜äºŽè¿›ä¸€æ¥è¯Šæ–æµ‹è¯•çš„æˆæœ¬ã€‚å› æ¤ï¼Œåœ¨å†³å®šæ˜¯å¦å°†æ‚£è€…åˆ†ç±»ä¸ºæ‚£æœ‰ç™Œç—‡æ—¶ï¼Œå½“æ¡ä»¶æ¦‚çŽ‡ä¼°è®¡è¿œä½ŽäºŽ0.5æ—¶ï¼Œå°†å…¶åˆ†ç±»ä¸ºç™Œç—‡é˜³æ€§å¯èƒ½æ›´æœ‰ç›Šã€‚

è°ƒæ•´å†³ç–é˜ˆå€¼åŽ
================

è§£å†³å¼•è¨€ä¸æåˆ°çš„é—®é¢˜çš„ä¸€ä¸ªè§£å†³æ–¹æ¡ˆæ˜¯åœ¨æ¨¡åž‹è®ç»ƒåŽè°ƒæ•´åˆ†ç±»å™¨çš„å†³ç–é˜ˆå€¼ã€‚:class:`~sklearn.model_selection.TunedThresholdClassifierCV` ä½¿ç”¨å†…éƒ¨äº¤å‰éªŒè¯æ¥è°ƒæ•´æ¤é˜ˆå€¼ã€‚é€‰æ‹©æœ€ä½³é˜ˆå€¼ä»¥æœ€å¤§åŒ–ç»™å®šæŒ‡æ ‡ã€‚

ä¸‹å›¾è¯´æ˜Žäº†æ¢¯åº¦æå‡åˆ†ç±»å™¨çš„å†³ç–é˜ˆå€¼è°ƒæ•´ã€‚è™½ç„¶æ™®é€šåˆ†ç±»å™¨å’Œè°ƒæ•´åŽçš„åˆ†ç±»å™¨æä¾›äº†ç›¸åŒçš„ :term:`predict_proba` è¾“å‡ºï¼Œå› æ¤å…·æœ‰ç›¸åŒçš„æŽ¥æ”¶å™¨æ“ä½œç‰¹å¾ï¼ˆROCï¼‰å’Œç²¾ç¡®åº¦-å¬å›žæ›²çº¿ï¼Œä½†ç”±äºŽè°ƒæ•´åŽçš„é˜ˆå€¼ï¼Œç±»æ ‡ç¾é¢„æµ‹ä¸åŒã€‚

å†³ç–é˜ˆå€¼ã€‚ä¼ ç»Ÿçš„åˆ†ç±»å™¨åœ¨æ¡ä»¶æ¦‚çŽ‡å¤§äºŽ0.5æ—¶é¢„æµ‹æ„Ÿå…´è¶£çš„ç±»åˆ«ï¼Œè€Œç»è¿‡è°ƒä¼˜çš„åˆ†ç±»å™¨åœ¨éžå¸¸ä½Žçš„æ¦‚çŽ‡ï¼ˆå¤§çº¦0.02ï¼‰æ—¶é¢„æµ‹æ„Ÿå…´è¶£çš„ç±»åˆ«ã€‚è¿™ä¸ªå†³ç–é˜ˆå€¼ä¼˜åŒ–äº†ç”±ä¸šåŠ¡ï¼ˆåœ¨æœ¬ä¾‹ä¸æ˜¯ä¸€å®¶ä¿é™©å…¬å¸ï¼‰å®šä¹‰çš„æ•ˆç”¨æŒ‡æ ‡ã€‚

.. figure:: ../auto_examples/model_selection/images/sphx_glr_plot_cost_sensitive_learning_002.png
   :target: ../auto_examples/model_selection/plot_cost_sensitive_learning.html
   :align: center

è°ƒä¼˜å†³ç–é˜ˆå€¼çš„é€‰é¡¹
--------------------

å†³ç–é˜ˆå€¼å¯ä»¥é€šè¿‡ç”±å‚æ•° `scoring` æŽ§åˆ¶çš„å¤šç§ç–ç•¥è¿›è¡Œè°ƒä¼˜ã€‚

ä¸€ç§è°ƒä¼˜é˜ˆå€¼çš„æ–¹æ³•æ˜¯é€šè¿‡æœ€å¤§åŒ–é¢„å®šä¹‰çš„scikit-learnæŒ‡æ ‡ã€‚è¿™äº›æŒ‡æ ‡å¯ä»¥é€šè¿‡è°ƒç”¨å‡½æ•° :func:`~sklearn.metrics.get_scorer_names` æ‰¾åˆ°ã€‚é»˜è®¤æƒ…å†µä¸‹ï¼Œä½¿ç”¨å¹³è¡¡å‡†ç¡®çŽ‡ä½œä¸ºæŒ‡æ ‡ï¼Œä½†è¯·æ³¨æ„åº”ä¸ºæ‚¨çš„ç”¨ä¾‹é€‰æ‹©æœ‰æ„ä¹‰çš„æŒ‡æ ‡ã€‚

.. note::

    éœ€è¦æ³¨æ„çš„æ˜¯ï¼Œè¿™äº›æŒ‡æ ‡å¸¦æœ‰é»˜è®¤å‚æ•°ï¼Œç‰¹åˆ«æ˜¯æ„Ÿå…´è¶£ç±»åˆ«çš„æ ‡ç¾ï¼ˆå³ `pos_label` ï¼‰ã€‚å› æ¤ï¼Œå¦‚æžœè¿™ä¸ªæ ‡ç¾ä¸é€‚ç”¨äºŽæ‚¨çš„åº”ç”¨ï¼Œæ‚¨éœ€è¦å®šä¹‰ä¸€ä¸ªè¯„åˆ†å™¨å¹¶ä¼ é€’æ£ç¡®çš„ `pos_label` ï¼ˆä»¥åŠé™„åŠ å‚æ•°ï¼‰ï¼Œä½¿ç”¨ :func:`~sklearn.metrics.make_scorer` ã€‚è¯·å‚é˜… :ref:`scoring` ä»¥èŽ·å–å®šä¹‰è‡ªå·±çš„è¯„åˆ†å‡½æ•°çš„ä¿¡æ¯ã€‚ä¾‹å¦‚ï¼Œæˆ‘ä»¬å±•ç¤ºäº†å¦‚ä½•åœ¨æœ€å¤§åŒ– :func:`~sklearn.metrics.f1_score` æ—¶ä¼ é€’æ„Ÿå…´è¶£æ ‡ç¾ä¸º `0` çš„ä¿¡æ¯::

        >>> from sklearn.linear_model import LogisticRegression
        >>> from sklearn.model_selection import TunedThresholdClassifierCV
        >>> from sklearn.metrics import make_scorer, f1_score
        >>> X, y = make_classification(
        ...   n_samples=1_000, weights=[0.1, 0.9], random_state=0)
        >>> pos_label = 0
        >>> scorer = make_scorer(f1_score, pos_label=pos_label)
        >>> base_model = LogisticRegression()
        >>> model = TunedThresholdClassifierCV(base_model, scoring=scorer)
        >>> scorer(model.fit(X, y), X, y)
        0.88...
        >>> # ä¸Žé€šè¿‡äº¤å‰éªŒè¯æ‰¾åˆ°çš„å†…éƒ¨è¯„åˆ†è¿›è¡Œæ¯”è¾ƒ
        >>> model.best_score_
        0.86...

å…³äºŽå†…éƒ¨äº¤å‰éªŒè¯çš„é‡è¦è¯´æ˜Ž
-------------------------------------------------------

é»˜è®¤æƒ…å†µä¸‹ï¼Œ:class:`~sklearn.model_selection.TunedThresholdClassifierCV` ä½¿ç”¨ 5 æŠ˜åˆ†å±‚äº¤å‰éªŒè¯æ¥è°ƒæ•´å†³ç–é˜ˆå€¼ã€‚å‚æ•° `cv` å…è®¸æŽ§åˆ¶äº¤å‰éªŒè¯ç–ç•¥ã€‚å¯ä»¥é€šè¿‡è®¾ç½® `cv="prefit"` å¹¶æä¾›ä¸€ä¸ªå·²æ‹Ÿåˆçš„åˆ†ç±»å™¨æ¥ç»•è¿‡äº¤å‰éªŒè¯ã€‚åœ¨è¿™ç§æƒ…å†µä¸‹ï¼Œå†³ç–é˜ˆå€¼æ˜¯æ ¹æ®æä¾›ç»™ `fit` æ–¹æ³•çš„æ•°æ®è¿›è¡Œè°ƒæ•´çš„ã€‚

ç„¶è€Œï¼Œåœ¨ä½¿ç”¨æ¤é€‰é¡¹æ—¶åº”æžå…¶å°å¿ƒã€‚ç”±äºŽè¿‡æ‹Ÿåˆçš„é£Žé™©ï¼Œæ°¸è¿œä¸åº”å°†ç›¸åŒçš„æ•°æ®ç”¨äºŽè®ç»ƒåˆ†ç±»å™¨å’Œè°ƒæ•´å†³ç–é˜ˆå€¼ã€‚æœ‰å…³æ›´å¤šè¯¦ç»†ä¿¡æ¯ï¼Œè¯·å‚é˜…ä»¥ä¸‹ç¤ºä¾‹éƒ¨åˆ†ï¼ˆå‚è§ :ref:`TunedThresholdClassifierCV_no_cv` ï¼‰ã€‚å¦‚æžœèµ„æºæœ‰é™ï¼Œå¯ä»¥è€ƒè™‘ä¸º `cv` ä½¿ç”¨ä¸€ä¸ªæµ®ç‚¹æ•°ï¼Œä»¥é™åˆ¶ä¸ºå†…éƒ¨å•ä¸€è®ç»ƒ-æµ‹è¯•åˆ†å‰²ã€‚

é€‰é¡¹ `cv="prefit"` ä»…åº”åœ¨æä¾›çš„åˆ†ç±»å™¨å·²ç»è®ç»ƒè¿‡ï¼Œå¹¶ä¸”æ‚¨åªæƒ³ä½¿ç”¨æ–°çš„éªŒè¯é›†æ‰¾åˆ°æœ€ä½³å†³ç–é˜ˆå€¼æ—¶ä½¿ç”¨ã€‚

.. _FixedThresholdClassifier:

æ‰‹åŠ¨è®¾ç½®å†³ç–é˜ˆå€¼
---------------------------------------

å‰å‡ èŠ‚è®¨è®ºäº†å¯»æ‰¾æœ€ä¼˜å†³ç–é˜ˆå€¼çš„ç–ç•¥ã€‚ä¹Ÿå¯ä»¥é€šè¿‡ç±» :class:`~sklearn.model_selection.FixedThresholdClassifier` æ‰‹åŠ¨è®¾ç½®å†³ç–é˜ˆå€¼ã€‚å¦‚æžœæ‚¨ä¸å¸Œæœ›åœ¨è°ƒç”¨ `fit` æ—¶é‡æ–°æ‹Ÿåˆæ¨¡åž‹ï¼Œå¯ä»¥è®¾ç½®å‚æ•° `prefit=True` ã€‚

ç¤ºä¾‹
--------

- å‚è§æ ‡é¢˜ä¸º

  :ref:`sphx_glr_auto_examples_model_selection_plot_tuned_decision_threshold.py` ,
  ä»¥äº†è§£å†³ç–é˜ˆå€¼è°ƒä¼˜åŽçš„è§è§£ã€‚
- å‚è§åä¸º
  :ref:`sphx_glr_auto_examples_model_selection_plot_cost_sensitive_learning.py` ,
  çš„ç¤ºä¾‹ï¼Œå¦ä¹ æˆæœ¬æ•æ„Ÿå¦ä¹ å’Œå†³ç–é˜ˆå€¼è°ƒä¼˜ã€‚