遇到的问题

上一节讲了初始化导version包的问题(除了创建version.py应该也可以直接注销)
根据git hub上项目源码 https://github.com/xinntao/Real-ESRGAN执行命令 :python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs --face_enhance

  1. 报广播机制口型不匹配问题
    upsample_img = inv_soft_mask * pasted_face + (1 - inv_soft_mask) * upsample_img
    ValueError: operands could not be broadcast together with shapes (1404,2000,1) (1404,2000)
    在这里插入图片描述
    点入出错代码,通过调试发现当图像是RGB图的时候不会报广播错误,而图像是灰度图时,upsample_img.shape == 2会报广播错误,查看inv_soft_mask经过inv_soft_mask = mask[:, :, None]扩展变成3维,因此upsample_img也需要扩展为三维才能进行广播运算。找到文件对应位置,添加代码如图
    在这里插入图片描述
    再次执行命令 python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs --face_enhance
    正常运行生成result文件,满怀期待的打开result文件,却发现生成的图片全是黑底
    在这里插入图片描述
    在这里插入图片描述
  2. 生成结果图片全是黑底(除了人脸)
  3. 经过一代码调试分析后发现图像数据经过几个两个process处理后都变成了NAN
    在这里插入图片描述
    在这里插入图片描述
    而此事的进度是默认fp16,于是猜测是不是进度不够导致向下溢出或者其它不稳定性,于是尝试把参数调整为fp32,执行如下脚本:-n RealESRGAN_x4plus -i inputs --fp32 --face_enhance
    没想到还真成了!开心!result结果已经生成如下
    在这里插入图片描述
    下面这个报错是input里面视频的问题,需要单独用视频脚本运行,把视频文件夹移除即不会报错。
    在这里插入图片描述
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐