首页 科技正文

切尔西足球俱乐部:[斯坦福大学2014机械学习教程条记]第六章-分类回归

admin 科技 2020-04-15 41 0

    在这节以及接下来几节中,我们要最先讨论分类问题。这节将告诉我们为什么对于分类问题来说,使用线性回归并不是一个好主意。

    在分类问题中,你要展望的变量y是一个离散的值,我们将学习一种叫做逻辑回归(Logistic Regression)的算法,这是当今最盛行、使用最普遍的学习算法之一。

    分类问题的例子有:垃圾邮件分类(判断一封电子邮件是否是垃圾邮件)、分类网上买卖(判断某一个买卖是否是敲诈,例如是否用偷取的信用卡等等)、肿瘤分类(判断一个肿瘤是恶性的照样良性的)。在这些问题中,我们实验展望的变量y是可以有两个取值的变量(0或1)。我们用0示意的那一类还可以叫做负类(Negative Class),用1示意的那一类可以叫做正类(Positive Class)。一般来说,负类示意没有某样器械,比如说:没有恶性肿瘤。正类示意具有我们要寻找的器械。然则,什么是正类什么是负类是没有明确规定的。

    现在我们要最先讨论只包罗0和1两类的分类问题(即二元的分类问题)。那么,我们要若何开发一个分类算法呢?

    这个例子的训练集是对肿瘤举行恶性或良性分类。注重到恶性与否只有两个值,0或者1。以是,我们可以做的就是对于这个给定的训练集,把我们学过的线性回归算法应用到这个数据集,用直线对数据举行拟合。若是你用直线去拟合这个训练集,你有可能获得如下图的假设直线。

    若是你想做出展望,你可以将分类器输出的阀值设为0.5(即纵坐标值为0.5),若是假设输出一个大于即是0.5,可以展望y=1,若是小于0.5则展望y=0。在这个特定的例子中,似乎线性回归做的事情很合理。然则,实验改变一下问题,将横轴延伸一点。如果我们有另外一个训练样本位于右边远处。

    注重这个分外的训练样本,显然它并不会改变什么,假设依然很好。然则,当我们再增添一个分外的例子,若是我们这时运行线性回归,我们会获得另一条直线(如下图)去拟合数据。此时,若是将阀值设为0.5,凭据剖析,这显然不是一个好的线性回归。

Sunbet,进入申博Sunbet官网  第1张

    以是,将线性回归运用到分类问题中通常不是一个好主意。在增添分外的样本之前,之前的线性回归看起来很好。然则,对数据集举行线性回归,有时会很好,但这不意味着这就是一个很好的方式。由于我们可能会遇到像增添了一个分外样本之后的问题,这时,效果就对照糟糕了。只管我们知道标签y应该取值0或者1,然则若是算法获得的值远大于1或者远小于0的话,照样会感受很新鲜。

    以是我们在接下来的要研究的算法就叫做逻辑回归算法,这个算法的特点是:它的输出值永远在0到1之间。顺便说一下,我们通常将逻辑回归算法视为一种分类算法。有时候可能由于这个算法的名字中泛起了“回归”让人会感应疑心,但逻辑回归算法实际上是一种分类算法,它适用于标签y为离散值0或1的情形。

,

皇冠体育APP

皇冠体育APP是一个开放皇冠代理APP下载、皇冠会员APP下载、皇冠线路APP下载、皇冠登录APP下载的平台,皇冠体育APP上最新登录线路、新2皇冠网址更新最快,皇冠体育APP开放皇冠会员注册、皇冠代理开户等业务。

版权声明

本文仅代表作者观点,
不代表本站Sunbet的立场。
本文系作者授权发表,未经许可,不得转载。

评论