单维:输入x是一个实数
多维输入:x有多个不同的特征,预测对应的分类
对于回归问题:输出值y是一个实数
对于分类问题:输出y属于一个离散的集合
对于下面这个数据集,在机器学习中每一行叫做一个样本,每一列叫做一个特征
在数据库中,每一行叫做一个记录,每一列叫做一个字段
在机器学习里面,拿到数据表之后,把内容分成两部分,一部分作为输入x,另一部分作为输入y
如果训练是从数据库读数据,就把x读出来构成一个矩阵,把y字段读出来构成一个矩阵,就把输入的数据集准备好了
如下图:Anaconda的安装目录下已经给我们准备好了一些数据集,gz是linux下非常流行的压缩格式
单维特征输入的时候,x是一个实数,所以乘以一个权重就行了
现在x变成了8个维度,所以模型里面肯定要算出一个实数,所以每一个特征xi的值都要和一个w相乘