版本 1.3#

有关本次发布主要亮点简要描述,请参阅 scikit-learn 1.3 版本发布亮点

Legend for changelogs

  • Major Feature something big that you couldn’t do before.

  • Feature something that you couldn’t do before.

  • Efficiency an existing feature now may not require as much computation or memory.

  • Enhancement a miscellaneous minor improvement.

  • Fix something that previously didn’t work as documented – or according to reasonable expectations – should now work.

  • API Change you will need to change your code to have the same effect in the future; or a feature will be removed in the future.

版本 1.3.2#

2023年10月

更新日志#

sklearn.datasets#

sklearn.decomposition#

sklearn.metrics#

  • Fix 修复了在并行循环中使用 zero_division=np.nan 的指标(例如 precision_score )的错误,其中 np.nan 的单例在子进程中会有所不同。 #27573Guillaume Lemaitre 贡献。

sklearn.tree#

  • Fix 修复了决策树 pickle 文件中通过未初始化内存泄露数据的错误,并使这些文件的生成具有确定性。 #27580Loïc Estève 贡献。

版本 1.3.1#

2023年9月

变更模型#

以下估计器和函数,在相同数据和参数下拟合时,可能会产生与上一版本不同的模型。这通常是由于建模逻辑的变化(错误修复或增强),或在随机抽样过程中的变化。 - Fix 使用 solver='sparse_cg' 的 Ridge 模型在 scipy>=1.12 下可能会有稍微不同的结果,这是由于 scipy 求解器底层的变化(更多详情请参见 scipy#18488

#26814Loïc Estève 提交

影响所有模块的更改#

  • Fix set_output API 现在可以正确处理列表输入。#27044Thomas Fan 提交。

变更日志#

sklearn.calibration#

sklearn.cluster#

sklearn.cross_decomposition#

sklearn.ensemble#

sklearn.feature_selection#

sklearn.impute#

sklearn.metrics#

sklearn.mixture#

sklearn.neighbors#

sklearn.preprocessing#

sklearn.tree#

版本 1.3.0#

2023年6月

更改的模型#

以下估计器和函数,在相同数据和参数下拟合时,可能会产生与上一版本不同的模型。这通常是由于建模逻辑的变化(错误修复或增强),或随机抽样过程的变化。

版本更新: #25438Yotam Avidar-Constantini 提交。

  • Fix decomposition.KernelPCAgammaNone 时,通过 inverse_transform 可能产生不同的结果。现在它会正确选择为拟合数据特征数的倒数 1/n_features ,而之前可能会错误地选择为传递给 inverse_transform 的数据特征数的倒数。新增了一个属性 gamma_ ,用于揭示每次调用核函数时实际使用的 gamma 值。 #26337Yao Xiao 提交。

显示变更#

影响所有模块的变更#

实验性 / 开发中#

  • Major Feature 元数据路由 的相关基础方法包含在此版本中。此功能仅可通过 enable_metadata_routing 功能标志启用,可以使用 sklearn.set_configsklearn.config_context 启用。目前,此功能主要对第三方开发者有用,以便为元数据路由准备其代码库,我们强烈建议他们也将其隐藏在同一功能标志后面,而不是默认启用。

#24027Adrin Jalali , Benjamin Bossan , 和 Omar Salman 贡献。

更新日志#


  • Feature 在函数 sklearn.set_config 和上下文管理器 sklearn.config_context 中添加了一个新选项 skip_parameter_validation , 允许跳过传递给估计器和公共函数的参数验证。这可以加快代码速度,但应谨慎使用,因为设置无效参数时可能导致意外行为或引发难以理解的错误消息。 #25815Jérémie du Boisberranger 贡献。

sklearn.base#

sklearn.calibration#

sklearn.cluster#

  • Major Feature 添加了 cluster.HDBSCAN ,一种现代的基于密度的层次聚类算法。类似于 cluster.OPTICS ,它可以被视为一种

对:class:cluster.DBSCAN 的泛化,允许进行层次聚类而非平面聚类,然而它与:class:cluster.OPTICS 的方法有所不同。该算法在超参数值方面非常稳健,并且可以在不需要过多调整的情况下广泛应用于各种数据。

此实现是对 scikit-learn-contrib/hdbscan 中原始HDBSCAN实现的改编,由:user:Leland McInnes <lmcinnes> 等人完成。

#26385Meekail Zain 提交。

sklearn.compose#

  • Fix 当:class:compose.ColumnTransformer 的单个转换器输出带有索引的pandas数据帧时,会引发一个信息性的错误。

不一致,并且输出配置为pandas。 #26286Thomas Fan 提交。

sklearn.covariance#

sklearn.datasets#

pandas解析器。参数 read_csv_kwargs 允许覆盖此行为。 #26551Guillaume Lemaitre 提供。

sklearn.decomposition#

sklearn.discriminant_analysis#

sklearn.ensemble#

#25931Yao Xiao 提交。

sklearn.exceptions#

sklearn.feature_extraction#

sklearn.feature_selection#

sklearn.impute#

set_config(transform_output="pandas") 时的索引。#26454Thomas Fan 提交。

sklearn.inspection#

sklearn.kernel_approximation#

sklearn.linear_model#

linear_model.LogisticRegression 在線性可分的問題上使用 penalty="l1"solver="liblinear"#25214Tom Dupre la Tour 提交。

sklearn.manifold#

sklearn.metrics#

#25672Lene PreussWei-Chun Chu 贡献。

  • Fix metrics.log_loss 在参数 y_pred 的值未归一化时会发出警告,而不是在指标中实际归一化它们。从 1.5 开始,这将引发错误。 #25299Omar Salman 贡献。

  • Fixmetrics.roc_curve 中,使用阈值 np.inf 而不是任意的 max(y_score) + 1 。此阈值与 ROC 曲线点 tpr=0fpr=0 相关联。 #26194Guillaume Lemaitre 贡献。

  • Fix 在使用 SciPy>=1.9 时, 'matching' 指标已被移除,以与不再支持 'matching'scipy.spatial.distance 保持一致。 #26264Barata T. Onggo 贡献。

  • API Change metrics.log_losseps 参数已被弃用,并将在 1.5 中移除。#25299Omar Salman 贡献。

sklearn.gaussian_process#

sklearn.mixture#

sklearn.model_selection#

将在1.5版本中移除。默认比例可以通过直接在 ax 对象上设置来覆盖,否则将根据数据点的间距自动设置。 #25120Guillaume Lemaitre 提交。

sklearn.multioutput#

sklearn.naive_bayes#

sklearn.neighbors#

sklearn.neural_network#

sklearn.pipeline#

sklearn.preprocessing#

  • Major Feature 引入 preprocessing.TargetEncoder ,这是一种基于目标均值的条件类别编码。#25334Thomas Fan 提交。

  • Feature preprocessing.OrdinalEncoder 现在支持将不频繁的类别分组为一个特征。通过指定如何选择不频繁的类别(使用 min_frequencymax_categories )来启用不频繁类别的分组。#25677Thomas Fan 提交。

  • Enhancement preprocessing.PolynomialFeatures 现在在处理稀疏 csr 矩阵时预先计算扩展项的数量,以优化 indicesindptrdtype 选择。现在可以在元素数量足够少的情况下输出带有`np.int32``indices/indptr 组件的 csr 矩阵,并会自动使用 np.int64 ` 。

对于足够大的矩阵。 #20524@niuk-a <niuk-a>`和 :pr:`23731Meekail Zain

sparse_output=Truepreprocessing.SplineTransformer 返回一个稀疏的

CSR 矩阵。 #24145Christian Lorentzen

以下是根据规则修改后的文本:

quantilekmeans 时可用。

#24935SeladusGuillaume Lemaitre ,和 Dea María Léon#25257Gleb Levitski

np.nan 列的数据时正确引发错误。#26400Yao Xiao

sklearn.svm#

sklearn.tree#

sklearn.utils#

  • Fix 修复了 utils.check_array 以正确转换 pandas 扩展数组。 #25813#26106Thomas Fan _ 贡献。

  • Fix utils.check_array 现在支持带有扩展数组和对象数据类型的 pandas DataFrame,返回具有对象数据类型的 ndarray。 #25814Thomas Fan _ 贡献。

  • API Change 引入了 utils.estimator_checks.check_transformers_unfitted_stateless 以确保无状态转换器不会引发 NotFittedError

在未先调用 fitfit_transform 的情况下进行 transform#25190Vincent Maladière 提供。

sklearn.semi_supervised#

杂项#

  • Enhancement 替换已废弃的异常 EnvironmentErrorIOErrorWindowsError ` :pr:`26466 由 :user:`Dimitri Papadopoulos ORfanos <DimitriPapadopoulos>`提供。

代码和文档贡献者

感谢自版本 1.2 以来为项目的维护和改进做出贡献的每个人,包括:

2357juan, Abhishek Singh Kushwah, Adam Handke, Adam Kania, Adam Li, adienes, Admir Demiraj, adoublet, Adrin Jalali, A.H.Mansouri, Ahmedbgh, Ala-Na, Alex Buzenet, AlexL, Ali H. El-Kassas, amay, András Simon, André Pedersen, Andrew Wang, Ankur Singh, annegnx, Ansam Zedan, Anthony22-dev, Artur Hermano, Arturo Amor, as-90, ashah002, Ashish Dutt, Ashwin Mathur, AymericBasset, Azaria Gebremichael, Barata Tripramudya Onggo, Benedek Harsanyi, Benjamin Bossan, Bharat Raghunathan, Binesh Bannerjee, Boris Feld, Brendan Lu, Brevin Kunde, cache-missing, Camille Troillard, Carla J, carlo, Carlo Lemos, c-git, Changyao Chen, Chiara Marmo, Christian Lorentzen, Christian Veenhuis, Christine P. Chai, crispinlogan, Da-Lan, DanGonite57, Dave Berenbaum, davidblnc, david-cortes, Dayne, Dea María Léon, Denis, Dimitri Papadopoulos Orfanos, Dimitris Litsidis, Dmitry Nesterov, Dominic Fox, Dominik Prodinger, Edern, Ekaterina Butyugina, Elabonga Atuo, Emir, farhan khan, Felipe Siola, futurewarning, Gael Varoquaux, genvalen, Gleb Levitski, Guillaume Lemaitre, gunesbayir, Haesun Park, hujiahong726, i-aki-y, Ian Thompson, Ido M, Ily, Irene, Jack McIvor, jakirkham, James Dean, JanFidor, Jarrod Millman, JB Mountford, Jérémie du Boisberranger, Jessicakk0711, Jiawei Zhang, Joey Ortiz, JohnathanPi, John Pangas, Joshua Choo Yun Keat, Joshua Hedlund, JuliaSchoepp, Julien Jerphanion, jygerardy, ka00ri, Kaushik Amar Das, Kento Nozawa, Kian Eliasi, Kilian Kluge, Lene Preuss, Linus, Logan Thomas, Loic Esteve, Louis Fouquet, Lucy Liu, Madhura Jayaratne, Marc Torrellas Socastro, Maren Westermann, Mario Kostelac, Mark Harfouche, Marko Toplak, Marvin Krawutschke, Masanori Kanazu, mathurinm, Matt Haberland, Max Halford, maximeSaur, Maxwell Liu, m. bou, mdarii, Meekail Zain, Mikhail Iljin, murezzda, Nawazish Alam, Nicola Fanelli, Nightwalkx, Nikolay Petrov, Nishu Choudhary, NNLNR, npache, Olivier Grisel, Omar Salman, ouss1508, PAB, Pandata, partev, Peter Piontek, Phil, pnucci, Pooja M, Pooja Subramaniam, precondition, Quentin Barthélemy, Rafal Wojdyla, Raghuveer Bhat, Rahil Parikh, Ralf Gommers, ram vikram singh, Rushil Desai, Sadra Barikbin, SANJAI_3, Sashka Warner, Scott Gigante, Scott Gustafson, searchforpassion, Seoeun Hong, Shady el Gewily, Shiva chauhan, Shogo Hida, Shreesha Kumar Bhat, sonnivs, Sortofamudkip, Stanislav (Stanley) Modrak, Stefanie Senger, Steven Van Vaerenbergh, Tabea Kossen, Théophile Baranger, Thijs van Weezel, Thomas A Caswell, Thomas Germer, Thomas J. Fan, Tim Head, Tim P, Tom Dupré la Tour, tomiock, tspeng, Valentin Laurent, Veghit, VIGNESH D, Vijeth Moudgalya, Vinayak Mehta, Vincent M, Vincent-violet, Vyom Pathak, William M, windiana42, Xiao Yuan, Yao Xiao, Yaroslav Halchenko, Yotam Avidar-Constantini, Yuchen Zhou, Yusuf Raji, zeeshan lone

(注:以上内容为人名列表,未提供具体的中文翻译内容,因此保持原样输出。)