sklearn中有一个datasets模块, 其中包含很多用于测试模型的实验数据集。
datasets中的数据集有这么几大类别 |
fetch: 代表需要联网从网上下载的数据集 |
load: 不需要下载直接使用的 |
make: 生成数据集 |
本节尝试用load方法导入自带数据集:
尝试在代码框运行以下代码吧!
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
cancer.keys()
print(cancer.DESCR)
cancer.data
cancer.target_names
cancer.target
cancer.feature_names
根据运行代码,尝试输出:
(1)标签名称
(2)标签数据
(3)数据集
(4)特征名称