再看scikit-learn

粗略的上完北京理工大学礼欣老师的课以后,还是有很多疑问,这不,拿起scikit-learn的官方文档,重新撸一遍。

scikit-learn的安装以及简介见之前的博客:

机器学习[2]-sklearn简介

一、数据前准备

1.数据集的格式
scikit-learn一般处理的是二维数据,我们可以理解第一维的是样本,第二维的是特征。
例如:

我们可以看到这个数据,这个iris的数据集有150个样本,每个样本有4个特征。如果数据集不是已这样的形式呈现(n_samples, n_features),
那我们就需要处理一下,好让sklearn能处理。
(怎么处理呢?)

还有一种电子数据集。例如手写图片,它就是由1797 8×8 构成

2.对数据的评估
(这一块的不是太了解,回头再来看)

 

ps:还是缺乏整体认知,先撸几个例子后,再来看这些概念

参考资料:
http://scikit-learn.org/stable/tutorial/statistical_inference/settings.html#datasets

发表评论

电子邮件地址不会被公开。 必填项已用*标注