boston_housing_data: 波士顿房价数据集用于回归分析

一个将boston_housing_data数据集加载到NumPy数组中的函数。

从 mlxtend.data 导入波士顿房价数据

概述

波士顿房价数据集用于回归分析。

特征

  1. CRIM:每个城镇的人均犯罪率
  2. ZN:规划为超过25,000平方英尺住宅用地的比例
  3. INDUS:每个城镇非零售商业用地的比例
  4. CHAS:查尔斯河虚拟变量(= 1如果地块边界靠近河流;否则为0)
  5. NOX:氮氧化物浓度(每千万部分的浓度)
  6. RM:每个居住单元的平均房间数量
  7. AGE:1940年前建造的自有住房单位的比例
  8. DIS:到波士顿五个就业中心的加权距离
  9. RAD:辐射高速公路的可达性指数
  10. TAX:每10,000美元的全额物业税率
  11. PTRATIO:每个城镇的师生比例
  12. B:1000(Bk - 0.63)^2,其中Bk是每个城镇的人口比例
  13. LSTAT:人口中低状态的百分比

  14. 样本数量:506

  15. 目标变量(连续型):MEDV,自有住房的中位数价值(单位为$1000)

参考文献

示例 1 - 数据集概述

from mlxtend.data import boston_housing_data
X, y = boston_housing_data()

print('Dimensions: %s x %s' % (X.shape[0], X.shape[1]))
print('1st row', X[0])

(506, 14)
Dimensions: 506 x 13
1st row [  6.32000000e-03   1.80000000e+01   2.31000000e+00   0.00000000e+00
   5.38000000e-01   6.57500000e+00   6.52000000e+01   4.09000000e+00
   1.00000000e+00   2.96000000e+02   1.53000000e+01   3.96900000e+02
   4.98000000e+00]

API

boston_housing_data()

Boston Housing dataset.

Returns

Examples

For usage examples, please see https://rasbt.github.io/mlxtend/user_guide/data/boston_housing_data/