版本 0.17#

版本 0.17.1#

2016年2月18日

更新日志#

错误修复#

  • 升级嵌入的 joblib 到版本 0.9.4,修复了 joblib.Parallel 中的一个重要错误,该错误在处理大于 1MB 的数据集时可能会静默地产生错误结果: joblib/joblib

  • 修复了使用 scikit-learn 版本 <= 0.16 生成的 Bunch pickles 的读取问题。这可能会影响已经使用 scikit-learn 0.16 下载数据集并在 scikit-learn 0.17 中加载的用户。请参阅 #6196 了解这如何影响 datasets.fetch_20newsgroups 。由 Loic Esteve 提供。

  • 修复了一个错误,该错误阻止了在大型数组上使用 ROC AUC 分数进行多 CPU / 核心的网格搜索。请参阅 #6147Olivier Grisel 提供。

  • 修复了一个错误,该错误阻止了在 ensemble.GradientBoostingRegressor 中正确设置 presort 参数。请参阅 #5857 由 Andrew McCulloh 提供。

  • 修复了在评估 decomposition.LatentDirichletAllocation 模型的困惑度时出现的 joblib 错误。请参阅 #6258 由 Chyi-Kwei Yau 提供。

版本 0.17#

2015年11月5日

更新日志#

新功能#

增强功能#

Bug 修复#

避免序列化兼容性问题。由 Olivier Grisel 提供。 (#5355 )

API 变更总结#

  • preprocessing.MinMaxScaler 中的属性 data_min , data_maxdata_range 已被弃用, 从 0.19 版本开始将不再可用。取而代之的是,该类现在公开了 data_min_ , data_max_data_range_ 。 由 Giorgio Patrini 提供。

  • 所有 Scaler 类现在都有一个 scale_ 属性,这是它们的 transform 方法应用的特征级重缩放。 preprocessing.StandardScaler 中的旧属性 std_ 已被弃用,并被 scale_ 取代; 它将在 0.19 版本中不可用。由 Giorgio Patrini 提供。

  • svm.SVCsvm.NuSVC 现在有一个 decision_function_shape 参数, 通过设置 decision_function_shape='ovr' 可以使它们的决策函数形状为 (n_samples, n_classes) 。 从 0.19 版本开始,这将成为默认行为。由 Andreas Müller 提供。

  • 将一维数据数组作为输入传递给估计器现在已被弃用,因为它在如何解释数组元素作为特征或样本时造成了混淆。 现在所有数据数组都应明确形状为 (n_samples, n_features) 。 由 Vighnesh Birodkar 提供。

  • lda.LDAqda.QDA 已移动到 discriminant_analysis.LinearDiscriminantAnalysisdiscriminant_analysis.QuadraticDiscriminantAnalysis

  • store_covariancetol 参数已从 discriminant_analysis.LinearDiscriminantAnalysis 的 fit 方法移动到构造函数中, 而 store_covariancestol 参数已从 discriminant_analysis.QuadraticDiscriminantAnalysis 的 fit 方法移动到构造函数中。

  • 继承自 _LearntSelectorMixin 的模型将不再支持转换方法。(即,随机森林、梯度提升、逻辑回归、决策树、支持向量机和 SGD 相关模型)。将这些模型包装在元转换器 feature_selection.SelectFromModel 中,以根据 coefs_feature_importances_ 移除低于某个阈值的特征。

  • cluster.KMeans 在未收敛的情况下重新运行聚类分配,以确保 predict(X)labels_ 的一致性。由 Vighnesh Birodkar 提供。

  • 分类器和回归器模型现在使用 _estimator_type 属性标记为相应类型。

  • 交叉验证迭代器始终提供训练集和测试集的索引,而不是布尔掩码。

  • 所有回归器的 decision_function 方法已被弃用,并将在 0.19 版本中移除。请改用 predict

  • datasets.load_lfw_pairs 已被弃用,并将在 0.19 版本中移除。请改用 datasets.fetch_lfw_pairs

  • 已移除已弃用的 hmm 模块。

  • 已移除已弃用的 Bootstrap 交叉验证迭代器。

  • 已移除已弃用的 WardWardAgglomerative 类。请改用 cluster.AgglomerativeClustering

  • cross_validation.check_cv 现在是一个公共函数。

  • linear_model.LinearRegressionresidues_ 属性已被弃用,并将在 0.19 版本中移除。

  • linear_model.LinearRegression 的已弃用 n_jobs 参数已移至构造函数中。

  • 已移除 linear_model.SGDClassifierfit 方法中的已弃用 class_weight 参数。请改用构造函数参数。

  • 已移除对序列的序列(或列表的列表)多标签格式的已弃用支持。要转换为支持的二进制指示矩阵格式,请使用 MultiLabelBinarizer

  • 调用 Pipeline.pipelineinverse_transform 方法的行为将在 0.19 版本中发生变化。它将不再将一维输入重塑为二维输入。

  • 已弃用的属性 indicator_matrix_multilabel_classes_ 已从 preprocessing.LabelBinarizer 中移除。

  • svm.SVCsvm.SVR 中使用 gamma=0 来自动将 gamma 设置为 1. / n_features 的做法已被弃用,并将在 0.19 版本中移除。请改用 gamma="auto"

代码贡献者#

Aaron Schumacher, Adithya Ganesh, akitty, Alexandre Gramfort, Alexey Grigorev, Ali Baharev, Allen Riddell, Ando Saabas, Andreas Mueller, Andrew Lamb, Anish Shah, Ankur Ankan, Anthony Erlinger, Ari Rouvinen, Arnaud Joly, Arnaud Rachez, Arthur Mensch, banilo, Barmaley.exe, benjaminirving, Boyuan Deng, Brett Naul, Brian McFee, Buddha Prakash, Chi Zhang, Chih-Wei Chang, Christof Angermueller, Christoph Gohlke, Christophe Bourguignat, Christopher Erick Moody, Chyi-Kwei Yau, Cindy Sridharan, CJ Carey, Clyde-fare, Cory Lorenz, Dan Blanchard, Daniel Galvez, Daniel Kronovet, Danny Sullivan, Data1010, David, David D Lowe, David Dotson, djipey, Dmitry Spikhalskiy, Donne Martin, Dougal J. Sutherland, Dougal Sutherland, edson duarte, Eduardo Caro, Eric Larson, Eric Martin, Erich Schubert, Fernando Carrillo, Frank C. Eckert, Frank Zalkow, Gael Varoquaux, Ganiev Ibraim, Gilles Louppe, Giorgio Patrini, giorgiop, Graham Clenaghan, Gryllos Prokopis, gwulfs, Henry Lin, Hsuan-Tien Lin, Immanuel Bayer, Ishank Gulati, Jack Martin, Jacob Schreiber, Jaidev Deshpande, Jake Vanderplas, Jan Hendrik Metzen, Jean Kossaifi, Jeffrey04, Jeremy, jfraj, Jiali Mei, Joe Jevnik, Joel Nothman, John Kirkham, John Wittenauer, Joseph, Joshua Loyal, Jungkook Park, KamalakerDadi, Kashif Rasul, Keith Goodman, Kian Ho, Konstantin Shmelkov, Kyler Brown, Lars Buitinck, Lilian Besson, Loic Esteve, Louis Tiao, maheshakya, Maheshakya Wijewardena, Manoj Kumar, MarkTab marktab.net, Martin Ku, Martin Spacek, MartinBpr, martinosorb, Maryan Morel, Masafumi Oyamada, Mathieu Blondel, Matt Krump, Matti Lyra, Maxim Kolganov, mbillinger, mhg, Michael Heilman, Michael Patterson, Miroslav Batchkarov, Nelle Varoquaux, Nicolas, Nikolay Mayorov, Olivier Grisel, Omer Katz, Óscar Nájera, Pauli Virtanen, Peter Fischer, Peter Prettenhofer, Phil Roth, pianomania, Preston Parry, Raghav RV, Rob Zinkov, Robert Layton, Rohan Ramanath, Saket Choudhary, Sam Zhang, santi, saurabh.bansod, scls19fr, Sebastian Raschka, Sebastian Saeger, Shivan Sornarajah, SimonPL, sinhrks, Skipper Seabold, Sonny Hu, sseg, Stephen Hoover, Steven De Gryze, Steven Seguin, Theodore Vasiloudis, Thomas Unterthiner, Tiago Freitas Pereira, Tian Wang, Tim Head, Timothy Hopper, tokoroten, Tom Dupré la Tour, Trevor Stephens, Valentin Stolbunov, Vighnesh Birodkar, Vinayak Mehta, Vincent, Vincent Michel, vstolbunov, wangz10, Wei Xue, Yucheng Low, Yury Zhauniarovich, Zac Stewart, zhai_pro, Zichen Wang