tensorflow中交叉熵损失函数详解

little_fat_sheep 转载文章 2023-03-19 111 0 原文

1 前言

tensorflow中定义了3个交叉熵损失函数：

softmax_cross_entropy_with_logits(logits, labels)
softmax_cross_entropy_with_logits_v2(logits, labels)
sparse_softmax_cross_entropy_with_logits(logits, labels)

其中logits都是未经激活函数（sigmoid、tanh、relu）和softmax放缩后的神经网络输出值，labels为样本标签（真实值）；

1和2应用差不多，函数1不太严格，在新版本中将被淘汰，不建议使用；

1和2中，logits和labels维数相同，并且labels采用one-hots编码，比如mnist数据集中，有3个样本标签[1 5 8]，采用one-hot编码为：[[0 1 0 0 0 0 0 0 0 0], [0 0 0 0 0 1 0 0 0 0], [0 0 0 0 0 0 0 0 1 0]]，如果labels不是采用one-hot编码，需要采用tf.one_hot(y, 10) 函数转换为one-hot编码格式；

3中，logits和labels维数不相同，labels没有采用one-hot编码，若已编码，需采用tf.argmax(y,1) 还原为原格式；

这3个函数都封装了如下两个函数：

y_=softmax(z) (z为神经网络输出值)
cross_entropy=-ylog(y_) (y为标签)

2 实验

import tensorflow as tf

#真实值（标签值）
y=tf.constant([[1.,0.,0.],[0.,1.,0.],[0.,0.,1.],[1.,0.,0.]])
#未经激活函数和softmax放缩后的神经网络输出值
z=tf.constant([[1.,5.,9.],[8.,7.,3.],[6.,7.,5.],[2.,8.,4.]])

#使用softmax(z)函数和-y*log(y_)函数计算交叉熵
y_=tf.nn.softmax(z)
cross_entropy1 =-y*tf.log(y_)
#计算cross_entropy1的行和
cross_entropy12=tf.reduce_sum(cross_entropy1,1)
#使用softmax_cross_entropy_with_logits函数计算交叉熵
cross_entropy2=tf.nn.softmax_cross_entropy_with_logits(logits=z, labels=y)
#使用softmax_cross_entropy_with_logits_v2函数计算交叉熵
cross_entropy3=tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=y)
#使用sparse_softmax_cross_entropy_with_logits函数计算交叉熵
cross_entropy4=tf.nn.sparse_softmax_cross_entropy_with_logits(logits=z, labels=tf.argmax(y,1))

with tf.Session() as sess:  
    c1=sess.run(cross_entropy1)
    c12=sess.run(cross_entropy12)
    c2=sess.run(cross_entropy2)
    c3=sess.run(cross_entropy3)
    c4=sess.run(cross_entropy4)
    print("使用softmax(z)函数和-y*log(y_)函数计算交叉熵:\n",c1)
    print("行和:\n",c12)
    print("\n使用softmax_cross_entropy_with_logits函数计算交叉熵:\n",c2)
    print("\n使用softmax_cross_entropy_with_logits_v2函数计算交叉熵:\n",c3)
    print("\n使用sparse_softmax_cross_entropy_with_logits函数计算交叉熵:\n",c4)

点击并拖拽以移动

3 注意事项

在进行分类时，网络输出值z并不是最终的类别，需要进行如下操作：

#softmax压缩变换
y_=tf.softmax(z)
#精确度
correct_prediction=tf.equal(tf.argmax(y_,1),tf.argmax(y,1))
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

由于softmax()只是将数据整体压缩，并不改变数据的相对大小，因此，一些教材或网课在计算预测分类和精确度时，为简化计算，省去了softmax函数，如下：

#精确度
correct_prediction=tf.equal(tf.argmax(z,1),tf.argmax(y,1))
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

声明：本文转自tensorflow中交叉熵损失函数详解

tensorflow中交叉熵损失函数详解

1 前言

2 实验

3 注意事项

tensorflow中高维数组乘法运算

python绘图总结

发表评论点击这里取消回复。

猜你喜欢

使用GParted-live对Ubuntu进行分区

聊聊计算机中的寄存器

Unity开发Hololens2—环境配置

《花雕学AI》14：免费打开就可用，ChatGPT国内12个镜像站盘点与测试

05-Verilog基础语法

云原生微服务技术趋势解读

当你打开终端并输入命令时会发生什么?（下）

记录–记一次前端CSS升级

爆肝两万字，详解fastdfs分布式文件系统

基于Jeecgboot前后端分离的流程管理平台演示系统安装(四)

热门浏览

java 答案判题程序

基于阿里云、七牛云、宝塔面板，从零开始用Halo搭建个人博客网站

博客添加评论功能及定制化样式

MySQL 8.026 下载及安装教程-Windows 10系统环境

【注意】当同一个Class的多个对象出现在同一段代码内的时候，极易出错。

热评文章

Cesium 根据飞机航线计算飞机的Heading(偏航角)、Pitch(俯仰角)、Roll(翻滚角)

Spring Data JPA日志打印SQL语句和入参真就这么简单吗？

Python函数式编程自带函数

Java基础知识篇05——方法

【GUI软件】抖音搜索结果批量采集，支持多个关键词同时抓取！

热门标签

tensorflow中交叉熵损失函数详解

1 前言

2 实验

3 注意事项

tensorflow中高维数组乘法运算

python绘图总结

猜你喜欢

【日常收支账本】【Day03】完成编辑账本界面的新增动账记录功能——通过ElementTree加XPath实现

在Jupyter中使用AI写代码，如有神助，太惊艳了

python实现微信扫码支付

《流畅的python》— 列表推导与生成器表达式

python的重载

Python 标准类库-并发执行之multiprocessing-基于进程的并行

发表评论 点击这里取消回复。

猜你喜欢

使用GParted-live对Ubuntu进行分区

热门浏览

java 答案判题程序

基于阿里云、七牛云、宝塔面板，从零开始用Halo搭建个人博客网站

博客添加评论功能及定制化样式

MySQL 8.026 下载及安装教程-Windows 10系统环境

【注意】当同一个Class的多个对象出现在同一段代码内的时候，极易出错。

热评文章

Cesium 根据飞机航线计算飞机的Heading(偏航角)、Pitch(俯仰角)、Roll(翻滚角)

Spring Data JPA日志打印SQL语句和入参真就这么简单吗？

Python函数式编程自带函数

Java基础知识篇05——方法

【GUI软件】抖音搜索结果批量采集，支持多个关键词同时抓取！

热门标签

关注我们的公众号

发表评论点击这里取消回复。