版本 0.24#

有关本次发布主要亮点的简要描述,请参阅 scikit-learn 0.24 版本发布亮点

Legend for changelogs

  • Major Feature something big that you couldn’t do before.

  • Feature something that you couldn’t do before.

  • Efficiency an existing feature now may not require as much computation or memory.

  • Enhancement a miscellaneous minor improvement.

  • Fix something that previously didn’t work as documented – or according to reasonable expectations – should now work.

  • API Change you will need to change your code to have the same effect in the future; or a feature will be removed in the future.

版本 0.24.2#

2021年4月

更新日志#

sklearn.compose#

  • Fix compose.ColumnTransformer.get_feature_names 在列选择为空时不再调用 get_feature_names 方法。#19579Thomas Fan 提交。

sklearn.cross_decomposition#

sklearn.decomposition#

sklearn.ensemble#

sklearn.feature_extraction#

sklearn.gaussian_process#

显式计算。调用Cholesky求解器在计算中缓解了这个问题。 #19939Ian Halvic 贡献。

  • Fixgaussian_process.GaussianProcessRegressor 中避免当目标缩放常数时除以零。这是由于标准差等于0。现在,这种情况被检测到,标准差被设置为1,避免了除以零,从而避免了归一化目标中出现NaN值。

#19703@sobkevich , Boris Villazón-TerrazasAlexandr Fonari 贡献。

sklearn.linear_model#

sklearn.metrics#

  • Fix metrics.top_k_accuracy_score 现在支持多类问题,其中 y_true 中只出现两个类别,并且所有类别都在 labels 中指定。

#19721Joris Clement 贡献。

sklearn.model_selection#

sklearn.multioutput#

在拟合过程中动态定义 predict 的类,例如 ensemble.StackingRegressor#19308Thomas Fan 提交。

sklearn.preprocessing#

sklearn.semi_supervised#

sklearn.tree#

  • Fix 修复 tree.BaseDecisionTreefit 方法中的一个错误,该错误在某些条件下会导致段错误。 fit 现在深度复制 Criterion 对象以防止共享并发访问。 #19580Samuel BriceAlex Adamson 以及 Wil Yegelwel 提交。

sklearn.utils#

版本 0.24.1#

2021年1月

打包#

0.24.0 版本的 scikit-learn 轮子在 MacOS <1.15 上无法正常工作,原因是 libomp 。用于构建轮子的 libomp 版本对于较旧的 macOS 版本来说太新了。此问题已在 0.24.1 版本的 scikit-learn 轮子中得到修复。 Scikit-learn 在 PyPI.org 上发布的 wheel 包现在正式支持 macOS 10.13 及更高版本。

更新日志#

sklearn.metrics#

sklearn.semi_supervised#

版本 0.24.0#

2020年12月

变更的模型#

以下估计器和函数,在相同数据和参数下拟合时,可能会产生与上一版本不同的模型。这通常是由于建模逻辑的变化(错误修复或增强)或随机采样过程的变化引起的。

详细变更内容列在下面的更新日志中。

(虽然我们试图通过提供这些信息来更好地告知用户,但我们不能保证此列表是完整的。)

更新日志#

sklearn.base#

  • Fix base.BaseEstimator.get_params 现在如果一个参数不能作为实例属性检索,将引发一个 AttributeError 。 之前它会返回 None

#17448Juan Carlos Alfaro Jiménez 提交。

sklearn.calibration#

sklearn.cluster#

初始聚类中心。#17937@g-walsh 提供

sklearn.compose#

sklearn.covariance#

  • API Change 弃用 cv_alphas_ 以支持 cv_results_['alphas'] ,弃用 grid_scores_ 以支持 cv_results_ 中的拆分分数,在 covariance.GraphicalLassoCV 中。 cv_alphas_grid_scores_ 将在 1.1 版本(0.26 的重命名)中移除。#16392Thomas Fan 提供。

sklearn.cross_decomposition#

sklearn.datasets#

dataframe 成员是 pandas DataFrame,而 target 成员是 pandas Series。

#17491Alex Liang 提交。

sklearn.decomposition#

sklearn.discriminant_analysis#

sklearn.ensemble#

sklearn.exceptions#

  • API Change exceptions.ChangedBehaviorWarningexceptions.NonBLASDotWarning 已被弃用,并将在 1.1 版本(0.26 版本的更名)中移除。 #17804Adrin Jalali 贡献。

sklearn.feature_extraction#

sklearn.feature_selection#

sklearn.gaussian_process#

  • Enhancement 新增方法 gaussian_process.kernel._check_bounds_params ,在拟合高斯过程后调用,如果超参数的边界太紧,则引发 ConvergenceWarning#12638Sylvain Lannuzel 贡献。

sklearn.impute#

None 已经默认使用这些值以来,进行了更改。 #16493Darshan N 提交。

sklearn.inspection#

sklearn.isotonic#

sklearn.kernel_approximation#

sklearn.linear_model#

sklearn.manifold#

  • Efficiency 修复了 #10493 。改进了局部线性嵌入(LLE), 当输入较大时会引发 MemoryError 异常。 #17997Bertrand Maisonneuve 贡献。

  • Enhancementmanifold.TSNE 中添加 square_distances 参数, 该参数在弃用旧的平方行为期间提供向后兼容性。默认情况下,距离将在 1.1 版本(0.26 版本的更名)中平方, 并且此参数将在 1.3 版本中移除。#17662Joshua Newton 提交。

  • Fix manifold.MDS 现在正确设置其 _pairwise 属性。 #18278Thomas Fan 提交。

sklearn.metrics#

直接使用字符串标记的目标类别进行分类器分类。 #18114Guillaume Lemaitre 提交。

  • Fix 修复了 metrics.plot_confusion_matrix 中的错误,当 y_true 包含分类器之前未见过的标签,而 labelsdisplay_labels 参数设置为 None 时,会发生错误。 #18405Thomas J. FanYakov Pchelintsev 提交。

sklearn.model_selection#

model_selection.RandomizedSearchCV 允许估计器在评分失败时替换评分 为 error_score 。如果 error_score="raise" ,错误将被抛出。 #18343Guillaume LemaitreDevi Sandeep 贡献。

sklearn.multiclass#

sklearn.multioutput#

multioutput.MultiOutputRegressor 现在接受包含缺失值的输入。因此,能够处理缺失值的估计器(可能是包含插补步骤的管道,或 HistGradientBoosting 估计器)可以作为多类包装器的估计器使用。#17987Venkatachalam N 贡献。

sklearn.naive_bayes#

sklearn.neighbors#

sklearn.neural_network#

sklearn.pipeline#

sklearn.preprocessing#

sklearn.semi_supervised#

sklearn.svm#

sklearn.tree#

sklearn.utils#

  • Enhancementcheck_estimator 中添加 check_methods_sample_order_invariance ,用于检查估计器方法在应用于样本顺序不同的相同数据集时是否保持不变。 #17598Jason Ngo 贡献。

  • Enhancementutils.sparse_func.incr_mean_variance_axis 中添加对权重的支持。 由 Maria TelenczukAlex Gramfort 贡献。

  • Fixutils.check_array 中对混合类型的稀疏DataFrame引发带有清晰错误信息的ValueError。 #17992Thomas J. FanAlex Shacked 贡献。

  • Fix 允许序列化的基于树的模型在具有不同字节序的机器上解封。 #17644Qi Zhang 贡献。

  • Fix 检查当 axis=1 且维度不匹配时,在 utils.sparse_func.incr_mean_variance_axis 中引发适当的错误。 由 Alex Gramfort 贡献。

杂项#

  • Enhancementprint_changed_only=True 时,对 repr 的调用现在更快,特别是在元估计器中。 #18508Nathan C. 贡献。

代码和文档贡献者

感谢自版本0.23以来为项目的维护和改进做出贡献的每个人,包括:

Abo7atm, Adam Spannbauer, Adrin Jalali, adrinjalali, Agamemnon Krasoulis, Akshay Deodhar, Albert Villanova del Moral, Alessandro Gentile, Alex Henrie, Alex Itkes, Alex Liang, Alexander Lenail, alexandracraciun, Alexandre Gramfort, alexshacked, Allan D Butler, Amanda Dsouza, amy12xx, Anand Tiwari, Anderson Nelson, Andreas Mueller, Ankit Choraria, Archana Subramaniyan, Arthur Imbert, Ashutosh Hathidara, Ashutosh Kushwaha, Atsushi Nukariya, Aura Munoz, AutoViz and Auto_ViML, Avi Gupta, Avinash Anakal, Ayako YAGI, barankarakus, barberogaston, beatrizsmg, Ben Mainye, Benjamin Bossan, Benjamin Pedigo, Bharat Raghunathan, Bhavika Devnani, Biprateep Dey, bmaisonn, Bo Chang, Boris Villazón-Terrazas, brigi, Brigitta Sipőcz, Bruno Charron, Byron Smith, Cary Goltermann, Cat Chenal, CeeThinwa, chaitanyamogal, Charles Patel, Chiara Marmo, Christian Kastner, Christian Lorentzen, Christoph Deil, Christos Aridas, Clara Matos, clmbst, Coelhudo, crispinlogan, Cristina Mulas, Daniel López, Daniel Mohns, darioka, Darshan N, david-cortes, Declan O’Neill, Deeksha Madan, Elizabeth DuPre, Eric Fiegel, Eric Larson, Erich Schubert, Erin Khoo, Erin R Hoffman, eschibli, Felix Wick, fhaselbeck, Forrest Koch, Francesco Casalegno, Frans Larsson, Gael Varoquaux, Gaurav Desai, Gaurav Sheni, genvalen, Geoffrey Bolmier, George Armstrong, George Kiragu, Gesa Stupperich, Ghislain Antony Vaillant, Gim Seng, Gordon Walsh, Gregory R. Lee, Guillaume Chevalier, Guillaume Lemaitre, Haesun Park, Hannah Bohle, Hao Chun Chang, Harry Scholes, Harsh Soni, Henry, Hirofumi Suzuki, Hitesh Somani, Hoda1394, Hugo Le Moine, hugorichard, indecisiveuser, Isuru Fernando, Ivan Wiryadi, j0rd1smit, Jaehyun Ahn, Jake Tae, James Hoctor, Jan Vesely, Jeevan Anand Anne, JeroenPeterBos, JHayes, Jiaxiang, Jie Zheng, Jigna Panchal, jim0421, Jin Li, Joaquin Vanschoren, Joel Nothman, Jona Sassenhagen, Jonathan, Jorge Gorbe Moya, Joseph Lucas, Joshua Newton, Juan Carlos Alfaro Jiménez, Julien Jerphanion, Justin Huber, Jérémie du Boisberranger, Kartik Chugh, Katarina Slama, kaylani2, Kendrick Cetina, Kenny Huynh, Kevin Markham, Kevin Winata, Kiril Isakov, kishimoto, Koki Nishihara, Krum Arnaudov, Kyle Kosic, Lauren Oldja, Laurenz Reitsam, Lisa Schwetlick, Louis Douge, Louis Guitton, Lucy Liu, Madhura Jayaratne, maikia, Manimaran, Manuel López-Ibáñez, Maren Westermann, Maria Telenczuk, Mariam-ke, Marijn van Vliet, Markus Löning, Martin Scheubrein, Martina G. Vilas, Martina Megasari, Mateusz Górski, mathschy, mathurinm, Matthias Bussonnier, Max Del Giudice, Michael, Milan Straka, Muoki Caleb, N. Haiat, Nadia Tahiri, Ph. D, Naoki Hamada, Neil Botelho, Nicolas Hug, Nils Werner, noelano, Norbert Preining, oj_lappi, Oleh Kozynets, Olivier Grisel, Pankaj Jindal, Pardeep Singh, Parthiv Chigurupati, Patrice Becker, Pete Green, pgithubs, Poorna Kumar, Prabakaran Kumaresshan, Probinette4, pspachtholz, pwalchessen, Qi Zhang, rachel fischoff, Rachit Toshniwal, Rafey Iqbal Rahman, Rahul Jakhar, Ram Rachum, RamyaNP, rauwuckl, Ravi Kiran Boggavarapu, Ray Bell, Reshama Shaikh, Richard Decal, Rishi Advani, Rithvik Rao, Rob Romijnders, roei, Romain Tavenard, Roman Yurchak, Ruby Werman, Ryotaro Tsukada, sadak, Saket Khandelwal, Sam, Sam Ezebunandu, Sam Kimbinyi, Sarah Brown, Saurabh Jain, Sean O. Stalley, Sergio, Shail Shah, Shane Keller, Shao Yang Hong, Shashank Singh, Shooter23, Shubhanshu Mishra, simonamaggio, Soledad Galli, Srimukh Sripada, Stephan Steinfurt, subrat93, Sunitha Selvan, Swier, Sylvain Marié, SylvainLan, t-kusanagi2, Teon L Brooks, Terence Honles, Thijs van den Berg, Thomas J Fan, Thomas J. Fan, Thomas S Benjamin, Thomas9292, Thorben Jensen, tijanajovanovic, Timo Kaufmann, tnwei, Tom Dupré la Tour, Trevor Waite, ufmayer, Umberto Lupo, Venkatachalam N, Vikas Pandey, Vinicius Rios Fuck, Violeta, watchtheblur, Wenbo Zhao, willpeppo, xavier dupré, Xethan, Xue Qianming, xun-tang, yagi-3, Yakov Pchelintsev, Yashika Sharma, Yi-Yan Ge, Yue Wu, Yutaro Ikeda, Zaccharie Ramzi, zoj613, Zhao Feng.

pwalchessen, 张琦, rachel fischoff, Rachit Toshniwal, Rafey Iqbal Rahman, Rahul Jakhar, Ram Rachum, RamyaNP, rauwuckl, Ravi Kiran Boggavarapu, Ray Bell, Reshama Shaikh, Richard Decal, Rishi Advani, Rithvik Rao, Rob Romijnders, roei, Romain Tavenard, Roman Yurchak, Ruby Werman, Ryotaro Tsukada, sadak, Saket Khandelwal, Sam, Sam Ezebunandu, Sam Kimbinyi, Sarah Brown, Saurabh Jain, Sean O. Stalley, Sergio, Shail Shah, Shane Keller, Shao Yang Hong, Shashank Singh, Shooter23, Shubhanshu Mishra, simonamaggio, Soledad Galli, Srimukh Sripada, Stephan Steinfurt, subrat93, Sunitha Selvan, Swier, Sylvain Marié, SylvainLan, t-kusanagi2, Teon L Brooks, Terence Honles, Thijs van den Berg, Thomas J Fan, Thomas J. Fan, Thomas S Benjamin, Thomas9292, Thorben Jensen, tijanajovanovic, Timo Kaufmann, tnwei, Tom Dupré la Tour, Trevor Waite, ufmayer, Umberto Lupo, Venkatachalam N, Vikas Pandey, Vinicius Rios Fuck, Violeta, watchtheblur, Wenbo Zhao, willpeppo, xavier dupré, Xethan, Xue Qianming, xun-tang, yagi-3, Yakov Pchelintsev, Yashika Sharma, Yi-Yan Ge, Yue Wu, Yutaro Ikeda, Zaccharie Ramzi, zoj613, Zhao Feng.