8个计算机视觉深度学习中常见的Bug

发布时间：2019-12-23 08:43:23 所属栏目：Unix 来源：站长网

导读：副标题#e# 给大家总结了8个计算机视觉深度学习中的常见bug，相信大家或多或少都遇到过，希望能帮助大家避免一些问题。人是不完美的，我们经常在软件中犯错误。有时这些错误很容易发现：你的代码根本不能工作，你的应用程序崩溃等等。但是有些bug是隐藏的，

这里出了什么问题?首先，用三次插值调整掩模的大小是一个坏主意。同样的问题 float32到 uint8：三次插值可以输出值大于输入，这会导致溢出。

8个计算机视觉深度学习中常见的Bug

我在做可视化的时候发现了这个问题。在你的训练循环中到处放置断言也是一个好主意。

7. 拼写错误

假设需要对全卷积网络(如语义分割问题)和一个巨大的图像进行推理。该图像是如此巨大，没有机会把它放在你的GPU中，它可以是一个医疗或卫星图像。

在这种情况下，可以将图像分割成网格，独立地对每一块进行推理，最后合并。此外，一些预测交叉可能有助于平滑边界附近的artifacts。

from tqdm import tqdm

class GridPredictor:

"""

This class can be used to predict a segmentation mask for the big image

when you have GPU memory limitation

"""

def __init__(self, predictor: AbstractPredictor, size: int, stride: Optional[int] = None):

self.predictor = predictor

self.size = size

self.stride = stride if stride is not None else size // 2

def __call__(self, x: np.ndarray):

h, w, _ = x.shape

mask = np.zeros((h, w, 1), dtype='float32')

weights = mask.copy()

for i in tqdm(range(0, h - 1, self.stride)):

for j in range(0, w - 1, self.stride):

（编辑：云计算网_泰州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!