讲解Unsupported gpu architecture ‘compute_*‘2017解决方法

讲解Unsupported GPU Architecture 'compute_*' 2017解决方法

问题描述

错误原因

讲解Unsupported GPU Architecture 'compute_*' 2017解决方法

摘要： 在使用2017年以前的NVIDIA GPU进行深度学习训练时，经常会遇到"Unsupported GPU Architecture 'compute_*'"的错误。本篇文章将介绍该错误的原因并提供解决方法。

问题描述

当我们尝试使用CUDA编写或运行深度学习代码时，可能会遇到如下错误信息：

扫描二维码关注公众号，回复： 17146865 查看本文章

plaintextCopy code
Unsupported GPU Architecture 'compute_*'

其中"*"表示一个或多个数字，例如'compute_20'或'compute_35'。这个错误消息表示我们的GPU架构不受支持，因此无法执行相应的计算操作。

错误原因

这个错误的根本原因是我们使用的GPU架构（compute capability）与我们编译或者运行的CUDA版本不兼容。CUDA是一个高性能并行计算的平台和编程模型，其版本会针对不同的GPU架构进行优化。由于GPU架构的不断演进，老旧的GPU可能不支持较新的CUDA版本。

解决方法

解决这个问题的方法是降低我们的CUDA版本，使其与我们的GPU架构兼容。下面提供两种解决方法供选择：

方法一：降低CUDA版本

首先，确定我们的GPU架构，可以通过NVIDIA官方网站或GPU-Z等工具查询。例如，我们的GPU架构为'compute_20'。
前往NVIDIA开发者网站的历史驱动程序页面，寻找适合我们GPU架构的较旧的CUDA版本。在搜索选项中选择相应的操作系统、GPU系列和GPU架构。
下载并安装找到的较旧的CUDA版本。
更新我们的代码或环境配置，确保其与所选择的较旧CUDA版本兼容。

方法二：更新GPU硬件

如果我们在一台老旧的GPU上遇到此问题，而且我们无法满足较旧CUDA版本的其他要求，那么我们可以考虑将GPU硬件升级到较新的兼容架构。这将允许我们使用较新的CUDA版本，并享受更好的性能和功能。

当解决"Unsupported GPU Architecture 'compute_*'"错误时，一个实际应用场景可以是在使用TensorFlow库训练深度学习模型。以下是一个示例代码，演示如何在此环境下处理该错误。

pythonCopy code
import tensorflow as tf
# 检查GPU设备
physical_devices = tf.config.list_physical_devices('GPU')
if len(physical_devices) > 0:
    for device in physical_devices:
        # 获取GPU的名称和计算能力
        gpu_properties = tf.config.experimental.get_device_details(device)
        print(f"GPU设备名称：{gpu_properties['name']}")
        print(f"GPU计算能力：{gpu_properties['compute_capability']}")
        # 检查计算能力是否受支持（示例为'compute_20'）
        if int(gpu_properties['compute_capability'].split('.')[0][7:]) < 20:
            print("当前GPU架构不支持，尝试降低CUDA版本或升级GPU硬件")
# 继续进行后续操作
# ...

在上述示例代码中，我们使用TensorFlow库检测当前可用的GPU设备，并打印出GPU的名称和计算能力。然后，我们检查计算能力是否支持所需的最低标准（此处示例为'compute_20'）。如果计算能力不支持，则输出相应的错误提示信息。根据实际情况，我们可以选择降低CUDA版本或升级GPU硬件来解决问题。这里的示例代码主要用于展示如何使用TensorFlow库进行检查，并提示相应解决方法。请注意，示例代码仅为演示目的，具体的解决方案可能需要根据实际情况进行调整。

compute_20 是 Nvidia GPU 架构中的一个标识符，也被称为计算能力（compute capability）2.0。它代表了一代较旧的 GPU 架构，通常包括一些 Nvidia GeForce 400 和 500 系列显卡。 compute_20 架构基于 CUDA 统一计算架构（CUDA Unified Architecture），它提供了一些计算上的优化和功能，以支持并行计算任务，包括深度学习和科学计算。这个架构的特点包括：

支持的指令集：compute_20 架构支持基本的浮点操作（如加法、减法、乘法和除法），并提供了一些高级指令集（如乘加指令和逻辑位运算指令），以支持更复杂的计算任务。
核心数和线程块：compute_20 架构具有一定数量的计算核心（CUDA cores），可以同时执行多个线程块（thread blocks）。这种并行计算能力可以显著加速计算密集型任务。
本地内存和共享内存：compute_20 架构为每个线程块提供了本地内存（local memory）和共享内存（shared memory）的存储空间，可以在并行计算任务中快速读写数据。需要说明的是，由于 compute_20 架构是一个较旧的架构版本，一些较新的 CUDA 特性和优化可能不被支持。因此，在使用 compute_20 架构的 GPU 上进行深度学习或其他计算任务时，我们需要确保选择与该架构兼容的 CUDA 版本。如果我们尝试使用不支持 compute_20 架构的 CUDA 版本，可能会遇到"Unsupported GPU Architecture 'compute_20'"的错误。对于现代的深度学习任务，推荐使用较新的 GPU 架构（如 Pascal、Volta 或 Turing 架构），因为它们提供更高的性能和更多的功能。但对于一些特定的应用场景，仍然可能会使用到 compute_20 架构的 GPU。

结论

当在使用2017年以前的NVIDIA GPU进行深度学习训练时，遇到"Unsupported GPU Architecture 'compute_*'"错误是很常见的。解决这个问题的方法包括降低CUDA版本或者升级GPU硬件。根据具体情况选择合适的解决方法，以确保我们的深度学习代码能够在所选择的环境中成功运行。希望本篇文章能够帮助到遇到类似问题的读者们。如果有任何疑问或建议，请随时在下方留言。谢谢！

讲解Unsupported gpu architecture ‘compute_*‘2017解决方法

讲解Unsupported GPU Architecture 'compute_*' 2017解决方法

问题描述

错误原因

解决方法

方法一：降低CUDA版本

方法二：更新GPU硬件

结论

猜你喜欢