版本 1.0#
有关本次发布主要亮点的简要描述,请参阅 scikit-learn 1.0 版本发布亮点 。
Legend for changelogs
Major Feature something big that you couldn’t do before.
Feature something that you couldn’t do before.
Efficiency an existing feature now may not require as much computation or memory.
Enhancement a miscellaneous minor improvement.
Fix something that previously didn’t work as documented – or according to reasonable expectations – should now work.
API Change you will need to change your code to have the same effect in the future; or a feature will be removed in the future.
版本 1.0.2#
2021年12月
Fix
cluster.Birch
、feature_selection.RFECV
、ensemble.RandomForestRegressor
、ensemble.RandomForestClassifier
、ensemble.GradientBoostingRegressor
和ensemble.GradientBoostingClassifier
在拟合 pandas DataFrame 时不再引发警告。#21578 由 Thomas Fan 提交。
更新日志#
sklearn.cluster
#
Fix 修复了
cluster.SpectralClustering
中的无限循环问题,将迭代计数器从 try 移动到 except。 #21271 由 Tyler Martin 提交。
sklearn.datasets
#
Fix
datasets.fetch_openml
现在线程安全。数据首先下载到临时子文件夹,然后重命名。 #21833 由 Siavash Rezazadeh 提交。
sklearn.decomposition
#
Fix 修复了
decomposition.DictionaryLearning
、decomposition.MiniBatchDictionaryLearning
、decomposition.SparsePCA
和decomposition.MiniBatchSparsePCA
的目标函数的约束条件,使其为凸函数并符合参考文章。 #19210 由 Jérémie du Boisberranger 提交。
sklearn.ensemble
#
Fix
ensemble.RandomForestClassifier
、ensemble.RandomForestRegressor
、ensemble.ExtraTreesClassifier
、ensemble.ExtraTreesRegressor
和ensemble.RandomTreesEmbedding
现在在bootstrap=False
且max_samples
不为None
时引发ValueError
。
Fix 修复了
ensemble.GradientBoostingClassifier
中的一个错误,其中指数损失计算的是正梯度而不是负梯度。 #22050 由 Guillaume Lemaitre 提交。
sklearn.feature_selection
#
Fix 通过改进对未设置
feature_names_in_
的基础估计器的支持,修复了feature_selection.SelectFromModel
。 #21991 由 Thomas Fan 提交。
sklearn.impute
#
Fix 修复了
linear_model.RidgeClassifierCV
中的一个错误,其中predict
方法在从decision_function
获得的分数上执行argmax
而不是返回多标签指示矩阵。 #19869 由 Guillaume Lemaitre 提交。
sklearn.linear_model
#
Fix
linear_model.LassoLarsIC
现在正确计算 AIC 和 BIC。当n_features > n_samples
且未提供噪声方差时,现在会引发错误。 #21481 由 Guillaume Lemaitre 和 Andrés Babino 提交。
sklearn.manifold
#
Fix 修复了在使用预计算的密集距离矩阵拟合
manifold.Isomap
时,当邻居图具有多个不连通组件时出现的不必要错误。 #21915 由 Tom Dupre la Tour 提交。
sklearn.metrics
#
Fix 所有
sklearn.metrics.DistanceMetric
子类现在都正确支持只读缓冲区属性。 这修复了相对于 0.24.2 在 1.0.0 中引入的回归问题。 #21694 由 Julien Jerphanion 提交。Fix 所有
sklearn.metrics.MinkowskiDistance
现在接受一个权重参数,使得代码在 scipy 1.8 和早期版本中行为一致。这反过来意味着所有
基于邻居的估计器(除了使用 algorithm="kd_tree"
的那些)现在接受一个带有 metric="minknowski"
的权重参数,以产生始终与 scipy.spatial.distance.cdist
一致的结果。#21741 由 Olivier Grisel 贡献。
sklearn.multiclass
#
Fix
multiclass.OneVsRestClassifier.predict_proba
在拟合常量整数目标时不会出错。#21871 由 Thomas Fan 贡献。
sklearn.neighbors
#
Fix
neighbors.KDTree
和neighbors.BallTree
正确支持只读缓冲区属性。#21845 由 Thomas Fan 贡献。
sklearn.preprocessing
#
Fix 修复了与 NumPy 1.22 的兼容性问题,在
preprocessing.OneHotEncoder
中。#21517 由 Thomas Fan 贡献。
sklearn.tree
#
Fix 防止
tree.plot_tree
绘制超出图表边界。#21917 由 Thomas Fan 贡献。Fix 支持加载决策树模型的 pickle 文件,当 pickle 是在具有不同位数的平台上生成时。一个典型的例子是在 64 位机器上训练和 pickle 模型,然后在 32 位机器上加载模型进行预测。#21552 由 Loïc Estève 贡献。
sklearn.utils
#
Fix
utils.estimator_html_repr
现在在生成的 HTML 中转义所有估计器描述。#21493 由 Aurélien Geron 贡献。
版本 1.0.1#
2021年10月
修复的模型#
Fix 以下类的非拟合方法在拟合具有有效特征名称的 DataFrame 时不会引发 UserWarning:
covariance.EllipticEnvelope
,ensemble.IsolationForest
,ensemble.AdaBoostClassifier
,neighbors.KNeighborsClassifier
,neighbors.KNeighborsRegressor
,neighbors.RadiusNeighborsClassifier
,
neighbors.RadiusNeighborsRegressor
. #21199 由 Thomas Fan 提交。
sklearn.calibration
#
Fix 修复了
calibration.CalibratedClassifierCV
在ensemble=False
时计算基估计器预测时未考虑sample_weight
的问题。 #20638 由 Julien Bohné 提交。Fix 修复了
calibration.CalibratedClassifierCV
在method="sigmoid"
时计算贝叶斯先验时忽略sample_weight
的错误。 #21179 由 Guillaume Lemaitre 提交。
sklearn.cluster
#
Fix 修复了
cluster.KMeans
中的一个错误,确保稀疏和密集输入之间的可重复性和等价性。 #21195 由 Jérémie du Boisberranger 提交。
sklearn.ensemble
#
Fix 修复了在极少数情况下可能导致
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
产生段错误的错误。 #21130 由 Christian Lorentzen 提交。
sklearn.gaussian_process
#
Fix 在多目标场景中,正确计算
sklearn.gaussian_process.GaussianProcessRegressor
中的y_std
,实现适当的归一化。 #20761 由 Patrick de C. T. R. Ferreira 提交。
sklearn.feature_extraction
#
Efficiency 修复了在 1.0.0 版本中引入的
feature_extraction.text.CountVectorizer
的transform
方法中的效率回归问题,该方法不再检查提供的词汇表中的大写字符。 #21251 由 Jérémie du Boisberranger 提交。Fix 修复了
feature_extraction.text.CountVectorizer
和feature_extraction.text.TfidfVectorizer
中的错误,当 ‘min_idf’ 或 ‘max_idf’ 大于 1 的浮点数时会引发错误。 #20752 由 Alek Lefebvre 提交。
sklearn.linear_model
#
Fix 提高了
linear_model.LassoLars
在不同版本的 openblas 下的稳定性。#21340 由 Thomas Fan 提交。Fix
linear_model.LogisticRegression
现在在求解器不支持带有 int64 索引的稀疏矩阵时会抛出一个更好的错误信息。#21093 由 Tom Dupre la Tour 提交。
sklearn.neighbors
#
Fix
neighbors.KNeighborsClassifier
,neighbors.KNeighborsRegressor
,neighbors.RadiusNeighborsClassifier
,neighbors.RadiusNeighborsRegressor
在metric="precomputed"
时,对于bsr
和dok
稀疏矩阵在方法fit
,kneighbors
和radius_neighbors
中会抛出错误,因为bsr
和dok
稀疏图格式中显式零的处理。#21199 由 Thomas Fan 提交。
sklearn.pipeline
#
Fix
pipeline.Pipeline.get_feature_names_out
正确地将特征名称从一个管道步骤传递到下一个步骤。#21351 由 Thomas Fan 提交。
sklearn.svm
#
Fix
svm.SVC
和svm.SVR
检查其内部表示的不一致性并抛出错误而不是段错误。此修复还解决了 CVE-2020-28975 。#21336 由 Thomas Fan 提交。
sklearn.utils
#
Enhancement
utils.validation._check_sample_weight
可以对样本权重进行非负性检查。可以通过 only_non_negative 布尔参数开启。更新了检查非负权重的估计器:linear_model.LinearRegression
(之前的错误信息有误导性),ensemble.AdaBoostClassifier
,ensemble.AdaBoostRegressor
,neighbors.KernelDensity
。
#20880 由 Guillaume Lemaitre 和 András Simon 贡献。
杂项#
Fix 在数据集没有特征名称的情况下拟合估计器,之前在具有特征名称的数据集上拟合的估计器不再保留旧的特征名称存储在
feature_names_in_
属性中。#21389 由 Jérémie du Boisberranger 贡献。
版本 1.0.0#
2021年9月
最小依赖#
scikit-learn 的 1.0.0 版本需要 python 3.7+,numpy 1.14.6+ 和 scipy 1.1.0+。可选的最小依赖是 matplotlib 2.2.2+。
强制使用仅关键字参数#
为了促进库的清晰和无歧义使用,大多数构造函数和函数参数现在必须作为关键字参数传递(即使用 param=value
语法)而不是位置参数。如果仅关键字参数被用作位置参数,现在会引发 TypeError
。#15005 #20002 由 Joel Nothman , Adrin Jalali , Thomas Fan , Nicolas Hug 和 Tom Dupre la Tour 贡献。更多详情请参见 SLEP009 。
更改的模型#
以下估计器和函数,当使用相同的数据和参数拟合时,可能会产生与之前版本不同的模型。这通常是由于建模逻辑的变化(错误修复或增强),或随机抽样过程的变化。
Fix
manifold.TSNE
现在在亲和矩阵计算过程中避免了数值下溢问题。Fix
manifold.Isomap
现在连接了断开的组件。 邻居图沿着一些最小距离对,而不是将所有无限距离更改为零。Fix
tree.DecisionTreeClassifier
和tree.DecisionTreeRegressor
的分裂准则可能会受到处理舍入误差的修复的影响。之前可能会出现一些额外的虚假分裂。Fix 使用
stratify
参数的model_selection.train_test_split
和model_selection.StratifiedShuffleSplit
可能会导致稍微不同的结果。
详细信息列在下面的变更日志中。
(虽然我们试图通过提供这些信息来更好地告知用户,但我们不能保证此列表是完整的。)
变更日志#
API Change 通过
loss
和criterion
参数使用平方误差的选项变得更加一致。首选方法是将其值设置为"squared_error"
。旧的选项名称仍然有效,生成相同的模型,但已被弃用,并将在版本 1.2 中移除。 #19310 作者:Christian Lorentzen 。对于
ensemble.ExtraTreesRegressor
,criterion="mse"
已被弃用,请改用"squared_error"
,这是现在的默认值。对于
ensemble.GradientBoostingRegressor
,loss="ls"
已被弃用,请改用"squared_error"
,这是现在的默认值。对于
ensemble.RandomForestRegressor
,criterion="mse"
已被弃用,请改用"squared_error"
,这是现在的默认值。对于
ensemble.HistGradientBoostingRegressor
,loss="least_squares"
已弃用,请改用"squared_error"
,这是现在的默认值。对于
linear_model.RANSACRegressor
,loss="squared_loss"
已弃用, 请改用"squared_error"
。对于
linear_model.SGDRegressor
,loss="squared_loss"
已弃用, 请改用"squared_error"
,这是现在的默认值。对于
tree.DecisionTreeRegressor
,criterion="mse"
已弃用, 请改用"squared_error"
,这是现在的默认值。对于
tree.ExtraTreeRegressor
,criterion="mse"
已弃用, 请改用"squared_error"
,这是现在的默认值。
API Change 通过
loss
和criterion
参数使用绝对误差的选项变得更加一致。 首选方式是将值设置为"absolute_error"
。旧的选项名称仍然有效,生成相同的模型, 但已弃用,并将在 1.2 版本中移除。 #19733 由 Christian Lorentzen 提交。对于
ensemble.ExtraTreesRegressor
,criterion="mae"
已弃用, 请改用"absolute_error"
。对于
ensemble.GradientBoostingRegressor
,loss="lad"
已弃用, 请改用"absolute_error"
。对于
ensemble.RandomForestRegressor
,criterion="mae"
已弃用, 请改用"absolute_error"
。对于
ensemble.HistGradientBoostingRegressor
,loss="least_absolute_deviation"
已弃用,请改用"absolute_error"
。对于
linear_model.RANSACRegressor
,loss="absolute_loss"
已弃用, 请改用"absolute_error"
,这是现在的默认值。对于
tree.DecisionTreeRegressor
,criterion="mae"
已弃用, 请改用"absolute_error"
。对于
tree.ExtraTreeRegressor
,criterion="mae"
已弃用, 请改用"absolute_error"
。
API Change
np.matrix
的使用在 1.0 版本中已被弃用,并将在 1.2 版本中引发TypeError
。#20165 由 Thomas Fan 提交。API Change 已向转换器 API 添加了 get_feature_names_out 以获取输出特征的名称。
get_feature_names
已被弃用。#18444 由 Thomas Fan 提交。API Change 所有估计器在拟合 pandas DataFrame 时存储
feature_names_in_
。这些特征名称与非fit
方法(例如transform
)中看到的名称进行比较,如果不一致将引发FutureWarning
。这些FutureWarning
将在 1.2 版本中变为ValueError
。#18010 由 Thomas Fan 提交。
sklearn.base
#
Fix
config_context
现在线程安全。#18736 由 Thomas Fan 提交。
sklearn.calibration
#
Feature 添加了
calibration.CalibrationDisplay
以绘制校准曲线。#17443 由 Lucy Liu 提交。Fix
calibration.CalibratedClassifierCV
的predict
和predict_proba
方法现在可以正确用于预拟合的管道。#19641 由 Alek Lefebvre 提交。Fix 修复了在
calibration.CalibratedClassifierCV
中使用ensemble.VotingClassifier
作为base_estimator
时的错误。#20087 由 Clément Fauchereau 提交。
sklearn.cluster
#
Efficiency
cluster.KMeans
和cluster.MiniBatchKMeans
的"k-means++"
初始化现在更快,特别是在多核设置中。#19002 由 Jon Crall 和 Jérémie du Boisberranger 提交。Efficiency 使用
algorithm='elkan'
的cluster.KMeans
在多核设置中现在更快。#19052 由 Yusuke Nagasaka 提交。Efficiency
cluster.MiniBatchKMeans
在多核设置中现在更快。#17622 由 Jérémie du Boisberranger 提交。Efficiency
cluster.OPTICS
现在可以使用memory
参数缓存树的计算输出。#19024 由 Frankie Robertson 贡献。Enhancement
cluster.AffinityPropagation
的predict
和fit_predict
方法现在接受稀疏数据类型的输入数据。#20117 由 Venkatachalam Natchiappan 贡献。Fix 修复了
cluster.MiniBatchKMeans
中的一个错误,当输入为稀疏时,样本权重被部分忽略。#17622 由 Jérémie du Boisberranger 贡献。Fix 改进了
cluster.MiniBatchKMeans
中基于中心变化的收敛检测,该检测几乎从未实现。#17622 由 Jérémie du Boisberranger 贡献。Fix
cluster.AgglomerativeClustering
现在支持只读内存映射数据集。#19883 由 Julien Jerphanion 贡献。Fix
cluster.AgglomerativeClustering
在连接性和亲和性都预计算且连接组件数量大于1时,正确连接组件。#20597 由 Thomas Fan 贡献。Fix
cluster.FeatureAgglomeration
不再接受fit
函数中的**params
关键字参数,从而产生更简洁的错误消息。#20899 由 Adam Li 贡献。Fix 修复了
cluster.KMeans
中的一个错误,确保稀疏和密集输入之间的可重复性和等价性。#20200 由 Jérémie du Boisberranger 贡献。API Change
cluster.Birch
属性fit_
和partial_fit_
已弃用,将在1.2版本中移除。#19297 由 Thomas Fan 贡献。API Change
cluster.MiniBatchKMeans
的batch_size
参数默认值从100改为1024,出于效率原因。cluster.MiniBatchKMeans
的n_iter_
属性现在报告已开始的迭代次数。n_steps_
属性报告已处理的小批量数量。 #17622 由 Jérémie du Boisberranger 提供。API Change
cluster.spectral_clustering
在传递np.matrix
时引发改进的错误。 #20560 由 Thomas Fan 提供。
sklearn.compose
#
Enhancement
compose.ColumnTransformer
现在记录每个转换器的输出在output_indices_
中。 #18393 由 Luca Bittarello 提供。Enhancement
compose.ColumnTransformer
现在允许 DataFrame 输入在transform
中以改变的顺序出现列。此外,在转换中被删除的列将不再需要,如果remainder='drop'
,额外的列将被忽略。 #19263 由 Thomas Fan 提供。Enhancement 在
compose.TransformedTargetRegressor.predict
中添加**predict_params
关键字参数,传递关键字参数给回归器。 #19244 由 Ricardo 提供。Fix
compose.ColumnTransformer.get_feature_names
支持由其任何转换器返回的非字符串特征名称。然而,请注意get_feature_names
已被弃用,请改用get_feature_names_out
。 #18459 由 Albert Villanova del Moral 和 Alonso Silva Allende 提供。Fix
compose.TransformedTargetRegressor
现在支持具有适当转换器的 nD 目标。 #18898 由 Oras Phongpanagnam 提供。API Change 在
compose.ColumnTransformer
中添加verbose_feature_names_out
。此标志控制 get_feature_names_out 中的特征名称前缀。 #18444 和 #21080 由 Thomas Fan 提供。
sklearn.covariance
#
Fix 在
covariance.ledoit_wolf
和covariance.ledoit_wolf_shrinkage
中添加数组检查。 #20416 由 Hugo Defois 提供。API Change 弃用了
cv_results_
中的以下键:'mean_score'
、'std_score'
和'split(k)_score'
,改为使用'mean_test_score'
、'std_test_score'
和'split(k)_test_score'
。#20583 由 Thomas Fan 提交。
sklearn.datasets
#
Enhancement
datasets.fetch_openml
现在支持在返回 pandas DataFrame 时处理缺失值的类别。#19365 由 Thomas Fan 、Amanda Dsouza 和 EL-ATEIF Sara 提交。Enhancement
datasets.fetch_kddcup99
在缓存文件无效时提供更好的错误信息。#19669 由 Thomas Fan 提交。Enhancement 使用
importlib.resources
替换与资源文件 I/O 相关的__file__
用法,以避免假设这些资源文件(例如iris.csv
)已经存在于文件系统中,并由此实现与PyOxidizer
等工具的兼容性。#20297 由 Jack Liu 提交。Fix 缩短 openml 测试中的数据文件名,以更好地支持在 Windows 上安装,并适应其默认的 260 字符文件名限制。#20209 由 Thomas Fan 提交。
Fix
datasets.fetch_kddcup99
在return_X_y=True
和as_frame=True
时返回 DataFrame。#19011 由 Thomas Fan 提交。API Change 在 1.0 版本中弃用
datasets.load_boston
,并将在 1.2 版本中移除。提供了加载类似数据集的替代代码片段。详情请参阅函数的文档字符串。#20729 由 Guillaume Lemaitre 提交。
sklearn.decomposition
#
Enhancement 为
decomposition.KernelPCA
添加了一个新的近似求解器(随机 SVD,可通过eigen_solver='randomized'
使用)。当样本数量远大于所需组件数量时,这显著加速了计算。#12069 由 Sylvain Marié 提交。Fix 修复了在聚类布尔数据时出现的不正确的多数据转换警告。#19046 由 Surya Prakash 贡献。
Fix 修复了
decomposition.dict_learning
,该函数被decomposition.DictionaryLearning
使用,以确保输出的确定性。通过翻转用于初始化代码的 SVD 输出的符号来实现。#18433 由 Bruno Charron 贡献。Fix 修复了
decomposition.MiniBatchDictionaryLearning
、decomposition.MiniBatchSparsePCA
和decomposition.dict_learning_online
中的一个错误,其中字典的更新不正确。#19198 由 Jérémie du Boisberranger 贡献。Fix 修复了
decomposition.DictionaryLearning
、decomposition.SparsePCA
、decomposition.MiniBatchDictionaryLearning
、decomposition.MiniBatchSparsePCA
、decomposition.dict_learning
和decomposition.dict_learning_online
中的一个错误,其中在字典更新期间未使用的原子的重新启动未按预期工作。#19198 由 Jérémie du Boisberranger 贡献。API Change 在
decomposition.DictionaryLearning
、decomposition.MiniBatchDictionaryLearning
、decomposition.dict_learning
和decomposition.dict_learning_online
中,从版本 1.2 开始,transform_alpha
将默认等于alpha
而不是 1.0。#19159 由 Benoît Malézieux 贡献。API Change 重命名
decomposition.KernelPCA
中的变量名以提高可读性。lambdas_
和alphas_
分别重命名为eigenvalues_
和eigenvectors_
。lambdas_
和alphas_
已弃用,将在 1.2 版本中移除。#19908 由 Kei Ishikawa 贡献。API Change
decomposition.NMF
和decomposition.non_negative_factorization
的alpha
和regularization
参数已弃用,并将在未来版本中移除。 在1.2版本中,请使用新的参数alpha_W
和alpha_H
代替。#20512 由 Jérémie du Boisberranger 提交。
sklearn.dummy
#
API Change
dummy.DummyRegressor
和dummy.DummyRegressor
中的属性n_features_in_
已弃用,并将在1.2版本中移除。 #20960 由 Thomas Fan 提交。
sklearn.ensemble
#
Enhancement
HistGradientBoostingClassifier
和HistGradientBoostingRegressor
在决定OpenMP使用的线程数时会考虑cgroups配额。 这避免了在使用这些类时,例如在docker容器中,因过度订阅导致的性能问题。#20477 由 Thomas Fan 提交。Enhancement
HistGradientBoostingClassifier
和HistGradientBoostingRegressor
不再处于实验阶段。 它们现在被认为是稳定的,并且与其他所有估计器一样,遵循相同的弃用周期。#19799 由 Nicolas Hug 提交。Enhancement 改进了
ensemble.StackingClassifier
和ensemble.StackingRegressor
的HTML渲染。 #19564 由 Thomas Fan 提交。Enhancement 在
ensemble.RandomForestRegressor
中添加了泊松准则。#19836 由 Brian Sun 提交。Fix 不允许在
ensemble.RandomForestClassifier
和ensemble.ExtraTreesClassifier
中计算袋外(OOB)分数,因为scikit-learn不支持这种类型的目标的任何度量。 进行了额外的私有重构。#19162 由 Guillaume Lemaitre 提交。Fix 改进了
ensemble.AdaBoostClassifier
和ensemble.AdaBoostRegressor
中权重提升的数值精度,以避免下溢。 #10096 由 Fenil Suchak 提交。Fix 修复了
ensemble.RandomForestClassifier
和ensemble.RandomForestRegressor
中参数max_samples
的范围为(0.0, 1.0]
, 其中max_samples=1.0
被解释为使用所有n_samples
进行自助采样。#20159 由 @murata-yu 提交。Fix 修复了
ensemble.AdaBoostClassifier
和ensemble.AdaBoostRegressor
中的一个错误,其中sample_weight
参数在fit
过程中被覆盖。 #20534 由 Guillaume Lemaitre 提交。API Change 移除了
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
中的tol=None
选项。请使用tol=0
以获得相同的行为。 #19296 由 Thomas Fan 提交。
sklearn.feature_extraction
#
Fix 修复了
feature_extraction.text.HashingVectorizer
中的一个错误, 其中某些输入字符串会导致转换后的数据中出现负索引。#19035 由 Liu Yu 提交。Fix 修复了
feature_extraction.DictVectorizer
中的一个错误,通过引发不支持的值类型的错误。 #19520 由 Jeff Zhao 提交。Fix 修复了
feature_extraction.image.img_to_graph
和feature_extraction.image.grid_to_graph
中的一个错误,其中单例连接组件未被正确处理,导致顶点索引错误。 #18964 由 Bertrand Thirion 提交。Fix 在
feature_extraction.text.CountVectorizer
中,当lowercase=True
且词汇表条目包含大写字符时, 引发警告以避免在生成的特征向量中出现静默遗漏。#19401 由 Zito Relova 提交。
sklearn.feature_selection
#
Feature
feature_selection.r_regression
计算特征与目标之间的皮尔逊相关系数 R。 #17169 由 Dmytro Lituiev 提交。 和 Julien Jerphanion 。Enhancement
feature_selection.RFE.fit
接受额外的估计器参数,这些参数直接传递给估计器的fit
方法。 #20380 由 Iván Pulido 、Felipe Bidu 、 Gil Rutter 和 Adrin Jalali 贡献。Fix 修复了
isotonic.isotonic_regression
中的一个错误,其中用户传递的sample_weight
在fit
过程中被覆盖。 #20515 由 Carsten Allefeld 贡献。Fix 修改
feature_selection.SequentialFeatureSelector
以允许无监督建模,使得fit
签名不需要进行任何y
验证,并允许y=None
。 #19568 由 Shyam Desai 贡献。API Change 当方差阈值为负时,在
feature_selection.VarianceThreshold
中引发错误。 #20207 由 Tomohiro Endo 贡献。API Change 弃用
grid_scores_
,转而使用cv_results_
中的分割分数,在feature_selection.RFECV
中。grid_scores_
将在版本 1.2 中移除。 #20161 由 Shuhei Kayawari 和 @arka204 贡献。
sklearn.inspection
#
Enhancement 在
inspection.permutation_importance
中添加max_samples
参数。它允许抽取样本子集来计算排列重要性。这对于在大数据集上评估特征重要性时保持方法的可行性很有用。 #20431 由 Oliver Pfaffel 贡献。Enhancement 在部分依赖图
inspection.plot_partial_dependence
和inspection.PartialDependenceDisplay.plot
中添加 kwargs 以分别格式化 ICE 和 PD 线。#19428 由 Mehdi Hamoumi 贡献。Fix 允许向
inspection.permutation_importance
输入多个评分器。#19411 由 Simona Maggio 贡献。API Change
inspection.PartialDependenceDisplay
暴露了一个类方法:from_estimator
。inspection.plot_partial_dependence
已被弃用,取而代之的是该类方法,并将在 1.2 版本中移除。#20959 由 Thomas Fan 提交。
sklearn.kernel_approximation
#
Fix 修复了
kernel_approximation.Nystroem
中的一个错误, 其中属性component_indices_
与用于生成近似核的样本索引子集不对应。#20554 由 Xiangyin Kong 提交。
sklearn.linear_model
#
Major Feature 新增了
linear_model.QuantileRegressor
,实现了带有 L1 惩罚的线性分位数回归。 #9978 由 David Dale 和 Christian Lorentzen 提交。Feature 新的
linear_model.SGDOneClassSVM
提供了线性 One-Class SVM 的 SGD 实现。结合核近似技术,该实现近似于核化 One Class SVM 的解,同时受益于样本数量的线性复杂度。 #10027 由 Albert Thomas 提交。Feature 为
linear_model.LassoCV
和linear_model.ElasticNetCV
添加了sample_weight
参数。 #16449 由 Christian Lorentzen 提交。Feature 新增了新的求解器
lbfgs
(可通过solver="lbfgs"
使用)和positive
参数到linear_model.Ridge
。当positive
设置为True
时,强制系数为正(仅支持lbfgs
)。#20231 由 Toshihiro Nakae 提交。Efficiency 对使用
solver='newton-cg'
和multi_class!='multinomial'
时的密集矩阵进行了linear_model.LogisticRegression
实现的优化。 #19571 由 Julien Jerphanion 提交。Enhancement
fit
方法在linear_model.Lars
、linear_model.LassoLars
、linear_model.LarsCV
和linear_model.LassoLarsCV
中保留了 numpy.float32 的 dtype。 #20155 由 Takeshi Oura 贡献。Enhancement 验证通过
precompute
参数传递给线性模型的用户提供的 gram 矩阵。 #19004 由 Adam Midvidy 贡献。Fix
linear_model.ElasticNet.fit
不再就地修改sample_weight
。 #19055 由 Thomas Fan 贡献。Fix
linear_model.Lasso
和linear_model.ElasticNet
不再具有与其目标不对应的dual_gap_
。 #19172 由 Mathurin Massias 贡献。Fix 当
normalize=True
时,线性模型中的sample_weight
现在完全考虑了特征中心化和特征缩放。 #19426 由 Alexandre Gramfort 和 Maria Telenczuk 贡献。Fix 对于
linear_model.RANSACRegressor
,残差等于residual_threshold
的点现在被视为内点。 这允许在residual_threshold=0
时对某些数据集完美拟合模型。 #19499 由 Gregory Strubel 贡献。Fix
linear_model.Ridge
的样本权重不变性在 #19616 中由 Oliver Grisel 和 Christian Lorentzen 修复。Fix
linear_model.enet_path
和linear_model.lasso_path
中的字典params
应仅包含坐标下降求解器的参数。 否则,将引发错误。 #19391 由 Shao Yang Hong 贡献。API Change 在
linear_model.RANSACRegressor
中引发警告,从版本 1.2 开始,对于除linear_model.LinearRegression
之外的模型,需要显式设置min_samples
。 #19390 由 Shao Yang Hong 贡献。API Change :
linear_model.LinearRegression
的参数normalize
已被弃用,并将在 1.2 版本中移除。弃用此参数的原因是:当fit_intercept
设置为 False 时,normalize
参数没有任何效果,因此被认为容易引起混淆。已弃用的LinearModel(normalize=True)
的行为可以通过使用Pipeline
和LinearModel
(其中LinearModel
可以是LinearRegression
、Ridge
、RidgeClassifier
、RidgeCV
或RidgeClassifierCV
)来重现,如下所示:make_pipeline(StandardScaler(with_mean=False), LinearModel())
。LinearRegression
中的normalize
参数在 #17743 中被 Maria Telenczuk 和 Alexandre Gramfort 弃用。同样,Ridge
、RidgeClassifier
、RidgeCV
和RidgeClassifierCV
中的normalize
参数在 #17772 中被 Maria Telenczuk 和 Alexandre Gramfort 弃用。同样,BayesianRidge
和ARDRegression
中的normalize
参数在 #17746 中被 Maria Telenczuk 弃用。同样,Lasso
、LassoCV
、ElasticNet
、ElasticNetCV
、MultiTaskLasso
、MultiTaskLassoCV
、MultiTaskElasticNet
和MultiTaskElasticNetCV
中的normalize
参数在 #17785 中被 Maria Telenczuk 和 Alexandre Gramfort 弃用。API Change
OrthogonalMatchingPursuit
和OrthogonalMatchingPursuitCV
的normalize
参数在 1.2 版本中将默认为 False,并将在 1.4 版本中移除。此更改在 #17750 中由 Maria Telenczuk 提出。<maikia>
和 Alexandre Gramfort 。同样适用于Lars
LarsCV
LassoLars
LassoLarsCV
LassoLarsIC
,在 #17769 中由 Maria Telenczuk 和 Alexandre Gramfort 完成。API Change 关键字验证已从
__init__
和set_params
移动到fit
对于以下符合 scikit-learn 约定的估计器:SGDClassifier
,SGDRegressor
,SGDOneClassSVM
,PassiveAggressiveClassifier
,以及PassiveAggressiveRegressor
。 #20683 由 Guillaume Lemaitre 完成。
sklearn.manifold
#
Enhancement 在
manifold.TSNE
中实现'auto'
启发式学习率。它将在 1.2 版本中成为默认设置。默认初始化将在 1.2 版本中更改为pca
。PCA 初始化将在 1.2 版本中缩放为标准差 1e-4。 #19491 由 Dmitry Kobak 完成。Fix 更改数值精度以防止在
manifold.TSNE
的亲和矩阵计算过程中出现下溢问题。 #19472 由 Dmitry Kobak 完成。Fix
manifold.Isomap
现在使用scipy.sparse.csgraph.shortest_path
来计算图的最短路径。它还连接邻居图的一些最小距离对,而不是将每个无限距离更改为零。 #20531 由 Roman Yurchak 和 Tom Dupre la Tour 完成。Fix 在
manifold.spectral_embedding
中降低 lobpcg 调用的数值默认容差,以防止数值不稳定性。 #21194 由 Andrew Knyazev 完成。
sklearn.metrics
#
Feature
metrics.mean_pinball_loss
暴露了 pinball 损失, 分位数回归。#19415 由 Xavier Dupré 和 Oliver Grisel 贡献。Feature
metrics.d2_tweedie_score
计算带有参数power
的 Tweedie 偏差的 D^2 回归得分。这是r2_score
的泛化,可以解释为 Tweedie 偏差解释的百分比。 #17036 由 Christian Lorentzen 贡献。Feature
metrics.mean_squared_log_error
现在支持squared=False
。 #20326 由 Uttam kumar 贡献。Efficiency 当标签为整数时,提高了
metrics.confusion_matrix
的速度。 #9843 由 Jon Crall 贡献。Enhancement 修复了在
metrics.hinge_loss
中当pred_decision
为 1 维而它是一个多类分类时或当pred_decision
参数与labels
参数不一致时引发错误的修复。 #19643 由 Pierre Attard 贡献。Fix
metrics.ConfusionMatrixDisplay.plot
使用正确的颜色映射最大值。 #19784 由 Thomas Fan 贡献。Fix 具有零
sample_weight
值的样本不会影响metrics.det_curve
、metrics.precision_recall_curve
和metrics.roc_curve
的结果。 #18328 由 Albert Villanova del Moral 和 Alonso Silva Allende 贡献。Fix 在
metrics.adjusted_rand_score
中避免大量数据时的溢出。 #20312 由 Divyanshu Deoli 贡献。API Change
metrics.ConfusionMatrixDisplay
暴露了两个类方法from_estimator
和from_predictions
,允许使用估计器或预测来创建混淆矩阵图。metrics.plot_confusion_matrix
已被弃用,取而代之的是这两个类方法,并将在 1.2 版本中移除。 #18543 由 Guillaume Lemaitre 提交。API Change
metrics.PrecisionRecallDisplay
暴露了两个类方法from_estimator
和from_predictions
,允许使用估计器或预测结果创建精确召回曲线。metrics.plot_precision_recall_curve
已被弃用,取而代之的是这两个类方法,并将在 1.2 版本中移除。 #20552 由 Guillaume Lemaitre 提交。API Change
metrics.DetCurveDisplay
暴露了两个类方法from_estimator
和from_predictions
,允许使用估计器或预测结果创建混淆矩阵图。metrics.plot_det_curve
已被弃用,取而代之的是这两个类方法,并将在 1.2 版本中移除。 #19278 由 Guillaume Lemaitre 提交。
sklearn.mixture
#
Fix 确保在
mixture.GaussianMixture
和mixture.BayesianGaussianMixture
出现分歧的情况下,最佳参数被适当地设置。 #20030 由 Tingshan Liu 和 Benjamin Pedigo 提交。
sklearn.model_selection
#
Feature 添加了
model_selection.StratifiedGroupKFold
,它结合了model_selection.StratifiedKFold
和model_selection.GroupKFold
,提供了一种在保持每个分割中类别分布的同时,将每个组保持在单个分割内的能力。 #18649 由 Leandro Hermida 和 Rodion Martynov 提交。Enhancement 在交叉验证中,每个分割的拟合失败仅在主进程中警告一次。 #20619 由 Loïc Estève 提交。
Enhancement
model_selection.BaseShuffleSplit
基类现在已公开。 #20056 由 @pabloduque0 提交。Fix 避免在
model_selection.train_test_split
中过早溢出。 #20904 由 Tomasz Jakubek 贡献。
sklearn.naive_bayes
#
Fix 离散朴素贝叶斯分类器的
fit
和partial_fit
方法(naive_bayes.BernoulliNB
、naive_bayes.CategoricalNB
、naive_bayes.ComplementNB
和naive_bayes.MultinomialNB
)现在正确处理训练集中只有一个类别的退化情况。 #18925 由 David Poznik 贡献。API Change
naive_bayes.GaussianNB
中的属性sigma_
现已弃用,并将在 1.2 版本中移除。 请改用var_
。 #18842 由 Hong Shao Yang 贡献。
sklearn.neighbors
#
Enhancement
neighbors.KDTree
和neighbors.BallTree
的创建已改进, 其最坏情况时间复杂度从 \(\mathcal{O}(n^2)\) 提升至 \(\mathcal{O}(n)\) 。 #19473 由 jiefangxuanyan 和 Julien Jerphanion 贡献。Fix
neighbors.DistanceMetric
子类现在支持只读内存映射数据集。 #19883 由 Julien Jerphanion 贡献。Fix
neighbors.NearestNeighbors
、neighbors.KNeighborsClassifier
、neighbors.RadiusNeighborsClassifier
、neighbors.KNeighborsRegressor
和neighbors.RadiusNeighborsRegressor
在__init__
中不再验证weights
,而是在fit
中验证。 #20072 由 Juan Carlos Alfaro Jiménez 贡献。API Change
neighbors.RadiusNeighborsClassifier
的参数kwargs
已弃用,并将在 1.2 版本中移除。 #20842 由 Juan Martín Loyola 贡献。
sklearn.neural_network
#
neural_network.MLPRegressor
现在正确支持从 pickle 文件加载后的继续训练。#19631 由 Thomas Fan 贡献。
sklearn.pipeline
#
API Change
pipeline.Pipeline
的predict_proba
和predict_log_proba
方法现在支持将预测 kwargs 传递给最终估计器。#19790 由 Christopher Flynn 贡献。
sklearn.preprocessing
#
Feature 新的
preprocessing.SplineTransformer
是一个用于生成 B-样条的特征预处理工具,参数化由样条的degree
多项式、结点数量n_knots
和结点定位策略knots
决定。#18368 由 Christian Lorentzen 贡献。preprocessing.SplineTransformer
还通过extrapolation
参数支持周期样条。#19483 由 Malte Londschien 贡献。preprocessing.SplineTransformer
支持结点定位策略"quantile"
的样本权重。#20526 由 Malte Londschien 贡献。Feature
preprocessing.OrdinalEncoder
默认支持传递缺失值。#19069 由 Thomas Fan 贡献。Feature
preprocessing.OneHotEncoder
现在支持handle_unknown='ignore'
和删除类别。#19041 由 Thomas Fan 贡献。Feature
preprocessing.PolynomialFeatures
现在支持传递一个元组给degree
,即degree=(min_degree, max_degree)
。#20250 由 Christian Lorentzen 贡献。Efficiency
preprocessing.StandardScaler
更快且更节省内存。#20652 由 Thomas Fan 贡献。Efficiency 在
preprocessing.KBinsDiscretizer
中,cluster.KMeans
的algorithm
参数从auto
改为full
。#19934 由 Gleb Levitskiy 贡献。Efficiency
fit
方法的实现preprocessing.PolynomialFeatures
转换器现在更快了。这在大型稀疏输入上尤为明显。#19734 由 Fred Robinson 贡献。Fix
preprocessing.StandardScaler.inverse_transform
方法现在在输入数据为1D时会引发错误。#19752 由 Zhehao Liu 贡献。Fix
preprocessing.scale
、preprocessing.StandardScaler
以及类似的缩放器会检测接近常量的特征,以避免将其缩放到非常大的值。这个问题尤其在使用带有样本权重的稀疏数据和常量列的缩放器时发生,在这种情况下通常会禁用中心化。#19527 由 Oliver Grisel 和 Maria Telenczuk 贡献,以及 #19788 由 Jérémie du Boisberranger 贡献。Fix
preprocessing.StandardScaler.inverse_transform
现在正确处理整数类型。#19356 由 @makoeppel 贡献。Fix
preprocessing.OrdinalEncoder.inverse_transform
不支持稀疏矩阵,并会引发适当的错误消息。#19879 由 Guillaume Lemaitre 贡献。Fix
preprocessing.OrdinalEncoder
的fit
方法在handle_unknown='ignore'
且给定未知类别时不会引发错误。#19906 由 Zhehao Liu 贡献。Fix 修复了
preprocessing.OrdinalEncoder
中的一个回归问题,其中大型 Python 数值在转换为 C 类型(np.float64
或np.int64
)时会因溢出而引发错误。#20727 由 Guillaume Lemaitre 贡献。Fix
preprocessing.FunctionTransformer
不会根据inverse_transform
的输入设置n_features_in_
。#20961 由 Thomas Fan 贡献。API Change
preprocessing.PolynomialFeatures
的n_input_features_
属性已被弃用,取而代之的是n_features_in_
,并将在 1.2 版本中移除。#20240 由 Jérémie du Boisberranger 贡献。
sklearn.svm
#
API Change
svm.OneClassSVM.fit
的参数**params
已弃用,并将在 1.2 版本中移除。 #20843 由 Juan Martín Loyola 提交。
sklearn.tree
#
Enhancement 在
tree.export_graphviz
中添加fontname
参数,以支持非英文字符。 #18959 由 Zero 和 wstates 提交。Fix 改进了
tree.plot_tree
与高DPI屏幕的兼容性。 #20023 由 Thomas Fan 提交。Fix 修复了
tree.DecisionTreeClassifier
和tree.DecisionTreeRegressor
中的一个错误, 该错误可能导致节点被错误地分割,原因是处理舍入误差不当。 #19336 由 Jérémie du Boisberranger 提交。API Change
tree.DecisionTreeClassifier
、tree.DecisionTreeRegressor
、tree.ExtraTreeClassifier
和tree.ExtraTreeRegressor
的n_features_
属性已弃用, 改为使用n_features_in_
,并将在 1.2 版本中移除。 #20272 由 Jérémie du Boisberranger 提交。
sklearn.utils
#
Enhancement 在
randomized_svd
中弃用了random_state=0
的默认值。 从 1.2 版本开始,random_state
的默认值将设置为None
。 #19459 由 Cindy Bezuidenhout 和 Clifford Akai-Nettey 提交。Enhancement 添加了辅助装饰器
utils.metaestimators.available_if
, 以提供在元估计器中根据状态灵活地使方法可用或不可用的方式,使其更易读。 #19948 由 Joel Nothman 提交。Enhancement
utils.validation.check_is_fitted
现在优先使用__sklearn_is_fitted__
(如果可用), 而不是检查以下划线结尾的属性。这也使得pipeline.Pipeline
和
preprocessing.FunctionTransformer
passcheck_is_fitted(estimator)
. #20657 by Adrin Jalali .
Fix 修复了
utils.sparsefuncs.mean_variance_axis
中的一个错误,当实际方差恰好为零时,计算出的方差精度非常差。#19766 by Jérémie du Boisberranger .Fix 现在,使用
utils.deprecated
装饰的属性的文档字符串已正确包装。#20385 by Thomas Fan .Fix
utils.stats._weighted_percentile
现在正确忽略了权重为零且小于具有正权重的最小观测值的观测值,适用于percentile=0
。受影响的类包括dummy.DummyRegressor
对于quantile=0
以及ensemble.HuberLossFunction
和ensemble.HuberLossFunction
对于alpha=0
。#20528 by Malte Londschien .Fix
utils._safe_indexing
在提供整数索引时显式采用数据框副本,避免了从 Pandas 引发警告。此警告之前在重采样实用程序和使用这些实用程序的函数(例如model_selection.train_test_split
、model_selection.cross_validate
、model_selection.cross_val_score
、model_selection.cross_val_predict
)中引发。#20673 by Joris Van den Bossche .Fix 修复了
utils.is_scalar_nan
中的一个回归问题,其中大型 Python 数字会因 C 类型(np.float64
或np.int64
)中的溢出而引发错误。#20727 by Guillaume Lemaitre .Fix 在 1.0 版本中,
check_array
对np.matrix
的支持已弃用,并将在 1.2 版本中引发TypeError
。#20165 by Thomas Fan .API Change
utils._testing.assert_warns
和utils._testing.assert_warns_message
在 1.0 版本中已弃用,并将在 1.2 版本中移除。请改用pytest.warns
上下文管理器。请注意,这些函数未被记录且不属于公共 API。
公共 API。#20521 由 Olivier Grisel 贡献。
API Change 修复了
utils.graph.graph_shortest_path
中的几个错误,该功能现已弃用。请改用scipy.sparse.csgraph.shortest_path
。#20531 由 Tom Dupre la Tour 贡献。
代码和文档贡献者
感谢自版本 0.24 以来为项目的维护和改进做出贡献的每一个人,包括:
Abdulelah S. Al Mesfer, Abhinav Gupta, Adam J. Stewart, Adam Li, Adam Midvidy, Adrian Garcia Badaracco, Adrian Sadłocha, Adrin Jalali, Agamemnon Krasoulis, Alberto Rubiales, Albert Thomas, Albert Villanova del Moral, Alek Lefebvre, Alessia Marcolini, Alexandr Fonari, Alihan Zihna, Aline Ribeiro de Almeida, Amanda, Amanda Dsouza, Amol Deshmukh, Ana Pessoa, Anavelyz, Andreas Mueller, Andrew Delong, Ashish, Ashvith Shetty, Atsushi Nukariya, Aurélien Geron, Avi Gupta, Ayush Singh, baam, BaptBillard, Benjamin Pedigo, Bertrand Thirion, Bharat Raghunathan, bmalezieux, Brian Rice, Brian Sun, Bruno Charron, Bryan Chen, bumblebee, caherrera-meli, Carsten Allefeld, CeeThinwa, Chiara Marmo, chrissobel, Christian Lorentzen, Christopher Yeh, Chuliang Xiao, Clément Fauchereau, cliffordEmmanuel, Conner Shen, Connor Tann, David Dale, David Katz, David Poznik, Dimitri Papadopoulos Orfanos, Divyanshu Deoli, dmallia17, Dmitry Kobak, DS_anas, Eduardo Jardim, EdwinWenink, EL-ATEIF Sara, Eleni Markou, EricEllwanger, Eric Fiegel, Erich Schubert, Ezri-Mudde, Fatos Morina, Felipe Rodrigues, Felix Hafner, Fenil Suchak, flyingdutchman23, Flynn, Fortune Uwha, Francois Berenger, Frankie Robertson, Frans Larsson, Frederick Robinson, frellwan, Gabriel S Vicente, Gael Varoquaux, genvalen, Geoffrey Thomas, geroldcsendes, Gleb Levitskiy, Glen, Glòria Macià Muñoz, gregorystrubel, groceryheist, Guillaume Lemaitre, guiweber, Haidar Almubarak, Hans Moritz Günther, Haoyin Xu, Harris Mirza, Harry Wei, Harutaka Kawamura, Hassan Alsawadi, Helder Geovane Gomes de Lima, Hugo DEFOIS, Igor Ilic, Ikko Ashimine, Isaack Mungui, Ishaan Bhat, Ishan Mishra, Iván Pulido, iwhalvic, J Alexander, Jack Liu, James Alan Preiss, James Budarz, James Lamb, Jannik, Jeff Zhao, Jennifer Maldonado, Jérémie du Boisberranger, Jesse Lima, Jianzhu Guo, jnboehm, Joel Nothman, JohanWork, John Paton, Jonathan Schneider, Jon Crall, Jon Haitz Legarreta Gorroño, Joris Van den Bossche, José Manuel Nápoles Duarte, Juan Carlos Alfaro Jiménez, Juan Martin Loyola, Julien Jerphanion, Julio Batista Silva, julyrashchenko, JVM, Kadatatlu Kishore, Karen Palacio, Kei Ishikawa, kmatt10, kobaski, Kot271828, Kunj, KurumeYuta, kxytim, lacrosse91, LalliAcqua, Laveen Bagai, Leonardo Rocco, Leonardo Uieda, Leopoldo Corona, Loic Esteve, LSturtew, Luca Bittarello, Luccas Quadros, Lucy Jiménez, Lucy Liu, ly648499246, Mabu Manaileng, Manimaran, makoeppel, Marco Gorelli, Maren Westermann, Mariangela, Maria Telenczuk, marielaraj, Martin Hirzel, Mateo Noreña, Mathieu Blondel, Mathis Batoul, mathurinm, Matthew Calcote, Maxime Prieur, Maxwell, Mehdi Hamoumi, Mehmet Ali Özer, Miao Cai, Michal Karbownik, michalkrawczyk, Mitzi, mlondschien, Mohamed Haseeb, Mohamed Khoualed, Muhammad Jarir Kanji, murata-yu, Nadim Kawwa, Nanshan Li, naozin555, Nate Parsons, Neal Fultz, Nic Annau, Nicolas Hug, Nicolas Miller, Nico Stefani, Nigel Bosch, Nikita Titov, Nodar Okroshiashvili, Norbert Preining, novaya, Ogbonna Chibuike Stephen, OGordon100, Oliver Pfaffel, Olivier Grisel, Oras Phongpanangam, Pablo Duque, Pablo Ibieta-Jimenez, Patric Lacouth, Paulo S. Costa, Paweł Olszewski, Peter Dye, PierreAttard, Pierre-Yves Le Borgne, PranayAnchuri, Prince Canuma, putschblos, qdeffense, RamyaNP, ranjanikrishnan, Ray Bell, Rene Jean Corneille, Reshama Shaikh, ricardojnf, RichardScottOZ, Rodion Martynov, Rohan Paul, Roman Lutz, Roman Yurchak, Samuel Brice, Sandy Khosasi, Sean Benhur J, Sebastian Flores, Sebastian Pölsterl, Shao Yang Hong, shinehide, shinnar, shivamgargsya, Shooter23, Shuhei Kayawari, Shyam Desai, simonamaggio, Sina Tootoonian, solosilence, Steven Kolawole, Steve Stagg, Surya Prakash, swpease, Sylvain Marié, Takeshi Oura, Terence Honles, TFiFiE, Thomas A Caswell, Thomas J. Fan, Tim Gates, TimotheeMathieu, Timothy Wolodzko, Tim Vink, t-jakubek, t-kusanagi, tliu68, Tobias Uhmann, tom1092, Tomás Moreyra, Tomás Ronald Hughes, Tom Dupré la Tour, Tommaso Di Noto, Tomohiro Endo, TONY GEORGE, Toshihiro NAKAE, tsuga, Uttam kumar, vadim-ushtanit, Vangelis Gkiastas, Venkatachalam N, Vilém Zouhar, Vinicius Rios Fuck, Vlasovets, waijean, Whidou, xavier dupré, xiaoyuchai, Yasmeen Alsaedy, yoch, Yosuke KOBAYASHI, Yu Feng, YusukeNagasaka, yzhenman, Zero, ZeyuSun, ZhaoweiWang, Zito, Zito Relova