deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 730|回复: 5

求助,特斯拉tesla k80显卡运营deepfacelive故障

[复制链接]

1

主题

3

帖子

35

积分

初级丹童

Rank: 1

积分
35
 楼主| 发表于 2024-5-31 20:37:43 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评
小弟使用的是上古计算卡tesla K80双核12G的计算卡和一张A卡亮机卡,安装了官网驱动474.82,cuda版本11.4.0和匹配的cudnn11.4版本

运行deepfacelive做做直播换脸时“人脸检测器”人脸标记器”交换器等任何模块只要选择了K80显卡就报错,提示如下图
image.png
报错内容如下:

FaceDetector error: [ONNXRuntimeError] : 1 : FAIL : Non-zero status code returned while running QuickGelu node. Name:'QuickGelu' Status Message: CUDA error cudaErrorNoKernelImageForDevice:no kernel image is available for execution on the device Traceback (most recent call last):
  File "D:\AI\DFLive_N-0709\_internal\DeepFaceLive\xlib\mp\csw\CSWBase.py", line 484, in _start_proc
    self.on_tick()
  File "D:\AI\DFLive_N-0709\_internal\DeepFaceLive\apps\DeepFaceLive\backend\FaceDetector.py", line 234, in on_tick
    rects = self.YoloV5Face.extract (frame_image, threshold=detector_state.threshold, fixed_window=detector_state.fixed_window_size)[0]
  File "D:\AI\DFLive_N-0709\_internal\DeepFaceLive\modelhub\onnx\YoloV5Face\YoloV5Face.py", line 74, in extract
    preds = self._get_preds(ip.get_image('NCHW'))
  File "D:\AI\DFLive_N-0709\_internal\DeepFaceLive\modelhub\onnx\YoloV5Face\YoloV5Face.py", line 106, in _get_preds
    preds = self._sess.run(None, {self._input_name: img})
  File "D:\AI\DFLive_N-0709\_internal\python\lib\site-packages\onnxruntime\capi\onnxruntime_inference_collection.py", line 217, in run
    return self._sess.run(output_names, input_feed, run_options)
onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status code returned while running QuickGelu node. Name:'QuickGelu' Status Message: CUDA error cudaErrorNoKernelImageForDevice:no kernel image is available for execution on the device


烦请坛内高人指点迷境
回复

使用道具 举报

14

主题

2949

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15978

真我风采勋章万事如意节日勋章

发表于 2024-5-31 22:16:17 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-5-31 22:17 编辑

报错为 CUDA错误
回复 支持 反对

使用道具 举报

1

主题

3

帖子

35

积分

初级丹童

Rank: 1

积分
35
 楼主| 发表于 2024-5-31 22:18:24 | 显示全部楼层
wtxx8888 发表于 2024-5-31 22:16
报错为 CUDA错误。

不知道是不是CUDA版本过高,现在降版本试试
回复 支持 反对

使用道具 举报

14

主题

2949

帖子

1万

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
15978

真我风采勋章万事如意节日勋章

发表于 2024-5-31 22:21:13 | 显示全部楼层
本帖最后由 wtxx8888 于 2024-5-31 22:22 编辑
taoge2024 发表于 2024-5-31 22:18
不知道是不是CUDA版本过高,现在降版本试试

自己调试吧,反正是CUDA不匹配的问题。英文写的 CUDA ERROR===CUDA 错误

onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status code returned while running QuickGelu node. Name:'QuickGelu' Status Message: CUDA error cudaErrorNoKernelImageForDevice:no kernel image is available for execution on the device
回复 支持 反对

使用道具 举报

2

主题

9

帖子

440

积分

初级丹师

Rank: 3Rank: 3

积分
440
发表于 2024-5-31 22:28:26 | 显示全部楼层
wtxx8888 发表于 2024-5-31 22:21
自己调试吧,反正是CUDA不匹配的问题。英文写的 CUDA ERROR===CUDA 错误

onnxruntime.capi.onnxruntime_p ...

大概率是显卡和cuda不兼容,nvidia-smi看看显卡能够支持的cuda版本是多少
回复 支持 反对

使用道具 举报

1

主题

3

帖子

35

积分

初级丹童

Rank: 1

积分
35
 楼主| 发表于 2024-5-31 22:32:00 | 显示全部楼层
tf18536 发表于 2024-5-31 22:28
大概率是显卡和cuda不兼容,nvidia-smi看看显卡能够支持的cuda版本是多少

3D6DEC44A4A90C14E77FA3F1B4CF8D6D.png
感谢回复,官网下载的版本,查了这个报错资料指向pytorch版本与cuda版本不兼容,我本机也没pytorch
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2024-11-24 17:33 , Processed in 0.157393 second(s), 35 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表