百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

机器学习常见的损失函数以及何时使用它们

toyiye 2024-07-05 01:41 10 浏览 0 评论


每一个机器学习工程师都应该知道机器学习中这些常见的损失函数以及何时使用它们。

在数学优化和决策理论中,损失函数或成本函数将一个或多个变量的值映射为一个实数,该实数直观地表示与该事件相关的一些"成本"。


损失函数是机器学习算法中的一个重要部分,主要用于进行算法对特征数据集建模效果的评估,衡量算法的性能。

损失函数是每个样本预测值和真实值的差值,而成本函数是所有损失函数的平均值。但是一般两者语义没有明显的区分。 损失函数直接反映了机器学习模型的预测结果。一般而言,损失函数越低,所建立的模型所提供的结果就越好。所以损失函数被用于评估模型的性能,通常人们想要损失函数最小化。

广义地说,损失函数根据应用场景可以分为两大类:分类问题和回归问题。在分类问题中,任务是预测问题所处理的所有类的各自概率。相反,在回归问题中,任务是预测一组给定的独立特征对学习算法的连续值。

假定符号如下:

n/m——训练样本的数量;

i——第i个训练样本;

y(i)——第i个样本的真实值;

y_hat(i)——第i个样本的预测值。

分类问题中的损失函数

1. 二值交叉熵损失/对数损失(Binary Cross-Entropy Loss / Log Loss)

这是分类问题中最为常见的损失函数。交叉熵损失随着预测概率准确度的提高而降低,能够被用于反映分类模型(输出为0-1之间的概率)的性能。

当类别数量为2时,是二值分类问题:


当类别数量大于2时,是多分类问题:



交叉熵损失公式由正则似然函数导出,但进行了对数处理。

1. 铰链损失(Hinge Loss)

用于分类问题的第二个最常见的损失函数是铰链损失函数,也是交叉熵损失函数的替代方法,主要用于支持向量机(SVM)模型评估。



铰链损失不仅对错误的预测做出惩罚,也对概率较低的正确预测做出惩罚。它主要用于分类标签为-1和1的支持向量机分类器。使用过程中需要确保将恶性类标签从0更改为-1。


回归问题中的损失函数

1. 均方误差/二次损失/L2损失(Mean Square Error / Quadratic Loss / L2 Loss)

均方误差是指真实值和预测值之间的平方差的均值。是最常用的回归问题损失函数。



相应的代价函数是这些平方误差(MSE)的平均值。MSE损失函数通过平方化误差来惩罚模型的误差,这种性质使得MSE代价函数对异常值的鲁棒性降低。因此,如果数据容易出现许多异常值,则不应使用它。

1. 平均绝对误差/L1损失 (Mean Absolute Error / L1 Loss)

评价绝对误差定义为实际值与预测值之间绝对差值的平均值。它是第二个最常用的回归损失函数。它测量一组预测中误差的平均大小,而不考虑它们的方向。



相应的成本函数是这些绝对误差(MAE)的平均值。与MSE损失函数相比,MAE损失函数对异常值具有更强的鲁棒性。因此,如果数据有很多异常值,可以考虑使用它。

1. Huber损失/平滑平均绝对误差(Huber Loss / Smooth Mean Absolute Error)

Huber损失函数是MSE和MAE的组合,当误差较大时,取平均绝对误差,当误差变得很小时,取均方误差。转换条件由超参数(delta)控制。



delta值的选择非常关键,因为它决定了我们将什么视为异常值。因此,与基于超参数值的MSE损失函数相比,Huber损失函数对异常值不太敏感。如果数据容易出现离群值,可以考虑使用它。

1. 对数余弦损失(Log-Cosh Loss)

对数余弦损失函数定义为预测误差双曲余弦的对数。它是回归任务中使用的另一个函数,比MSE损失函数平滑得多。它具有Huber损失函数的所有优点,而且它在任何地方都是两次可微的,不像Huber损失函数不具有可微性质。而一些学习算法,如XGBoost使用牛顿法来寻找最佳值,因此需要二阶导数(Hessian)。



当x较小时,log(cosh(x))约等于(x**2)/2,当x较大时,约等于abs(x)-log(2)。这意味着"logcosh"的工作原理与均方误差类似,但不会受到偶尔出现的显著错误预测的强烈影响。

1. 分位数损失( Quantile Loss)

分位数是指一组中有一小部分样本低于该值。顾名思义,分位数回归损失函数用于预测分位数。对于一组预测,损失将是其平均值。



当我们对预测一个区间而不是仅仅对点预测感兴趣时,分位数损失函数是十分有用的。


作者:Sparsh Gupta

deephub翻译组:Oliver Lee

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码