加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_泰州站长网 (http://www.0523zz.com/)- 视觉智能、AI应用、CDN、行业物联网、智能数字人!
当前位置: 首页 > 服务器 > 搭建环境 > Unix > 正文

8个计算机视觉深度学习中常见的Bug

发布时间:2019-12-23 08:43:23 所属栏目:Unix 来源:站长网
导读:副标题#e# 给大家总结了8个计算机视觉深度学习中的常见bug,相信大家或多或少都遇到过,希望能帮助大家避免一些问题。 人是不完美的,我们经常在软件中犯错误。有时这些错误很容易发现:你的代码根本不能工作,你的应用程序崩溃等等。但是有些bug是隐藏的,

这里出了什么问题?首先,用三次插值调整掩模的大小是一个坏主意。同样的问题 float32到 uint8:三次插值可以输出值大于输入,这会导致溢出。

8个计算机视觉深度学习中常见的Bug


我在做可视化的时候发现了这个问题。在你的训练循环中到处放置断言也是一个好主意。

7. 拼写错误

假设需要对全卷积网络(如语义分割问题)和一个巨大的图像进行推理。该图像是如此巨大,没有机会把它放在你的GPU中,它可以是一个医疗或卫星图像。

在这种情况下,可以将图像分割成网格,独立地对每一块进行推理,最后合并。此外,一些预测交叉可能有助于平滑边界附近的artifacts。

from tqdm import tqdm 

class GridPredictor: 

 """ 

 This class can be used to predict a segmentation mask for the big image  

 when you have GPU memory limitation 

 """ 

 def __init__(self, predictor: AbstractPredictor, size: int, stride: Optional[int] = None): 

 self.predictor = predictor 

 self.size = size 

 self.stride = stride if stride is not None else size // 2 

 def __call__(self, x: np.ndarray): 

 h, w, _ = x.shape 

 mask = np.zeros((h, w, 1), dtype='float32') 

 weights = mask.copy() 

 for i in tqdm(range(0, h - 1, self.stride)): 

 for j in range(0, w - 1, self.stride): 

(编辑:云计算网_泰州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读