【解决办法】torch交叉熵使用时遇到 Dimension out of range - 代码天地

【解决办法】torch交叉熵使用时遇到 Dimension out of range

其他 2019-06-12 03:35:40 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/a19990412/article/details/90349429

简述

其实这个问题我很久以前用pytorch写程序的时候就遇到过这个问题，当时纠结了很久之后最后解决了。当时本来就想来写个东西来记录下避免其他人也遇到这样的问题。~~但后面我个菜鸡就完全忘记了emmmm~~

展示说明

不同于我以往直接给出结论。这次我会通过展示的方式较为详细的讲解下。

导入包

import torch
import torch.nn as nn

创造这个损失函数类

loss  = nn.CrossEntropyLoss()

随机生成下这个数据A

A = torch.randn(3, 5, requires_grad=True)

内容如下：

A
tensor([[ 1.0483, -1.4251,  1.0502,  0.2437,  0.1477],
        [-0.1300, -1.0798, -1.0835, -1.0473,  1.2076],
        [-0.1647, -1.1366,  0.7088,  1.3719,  1.9135]], requires_grad=True)

随机生成3个label

target = torch.empty(3, dtype=torch.long).random_(5)

内容如下：

target
tensor([2, 2, 3])

没有问题

output = loss(A, target)

这时候就是没有问题的

output
tensor(1.6934, grad_fn=<NllLossBackward>)

有问题的情况演示

将前面创建的A在一维上取argmax。得到对应的label

A_arg = torch.argmax(A, dim=1)

内容如下：

A_arg
tensor([2, 4, 4])

调用，出现题目所示的bug

output = loss(A_arg, target)

报错非常一大串emmm。关键就是下面这句。

RuntimeError: Dimension out of range (expected to be in range of [-1, 0], but got 1)

解释

其实就是因为torch的交叉熵的输入第一个位置的输入应该是在每个label下的概率, 而不是对应的label。

所以直接写成label的你，就出现上面所说的错误了。

猜你喜欢

转载自blog.csdn.net/a19990412/article/details/90349429

【解决办法】torch交叉熵使用时遇到 Dimension out of range

解决Indexerror: dimension out of range (expected to be in range of [-1, 0], but got 1)

#IndexError: Target 1 is out of bounds. IndexError: Dimension out of range (expected to be in range

Out of range value for column 解决

解决：Expected dimension in the range [-1, 1), but got 1

已解决IndexError: list index out of range

解决报错 IndexError: tuple index out of range

【解决】IndexError: list index out of range

使用正则Range out of order in character class

已解决tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 1 of dimension 0 out of

Parameter index out of range

tuple index out of range

RangeError index out of range

vector subscript out of range

IndexError: index is out of bounds for dimension with size 0

unordered_map 遇到 vector subscript out of range 的错误提示

IndexError: list index out of range解决方法

完美解决java.lang.IllegalArgumentException: pointerIndex out of range

解决sys.argv[1] IndexError: list index out of range

python 解决问题的集合-list index out of range

解决【C++】vector subscript out of range下标越界

解决：python中出现：list assignment index out of range

RedisTemplate increment 错误:ERR value is not an integer or out of range解决

Python成功解决IndexError: string index out of range

（已解决）RangeError (index): Index out of range: no indices are valid: 0

成功解决 BUG：IndexError: list index out of range

pyclipper使用List转tuple报错：tuple index out of range

关于mysql 出现 1264 Out of range value for column 错误的解决办法

Android编译项目发生 String index out of range: -1 解决办法

#运行错误IndexError : list index out of range# 错误原因及解决办法

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)