低画质影像给计算机视觉带来挑战

发表于 2019年12 月13日星期五上午 1:01:07

有关计算机视觉进步的新报告重点介绍了一些抽象概念，以及有关我们如何训练计算机以“看得见”的更深层次的问题。

今天，The Verge的报告讨论了作家詹姆斯·文森特（James Vincent）所说的“躺在床上的锤子”问题，其中显示了ObjectNet数据训练中心化的示例，以说明在对象识别方面愚弄计算机很容易。

在某些情况下-过去几年来，工程师在成交量积神经网络方面取得了飞速进步-成交量积神经网络具有多个处理层，采用特殊的算法方法来扫描图像。

过去取得的一些显著成就包括功能丰富的图像-例如，计算机学会了向我们展示奇瓦瓦州和蓝莓松饼的照片，它们都含有深色球根球，无论它们是眼睛还是浆果。

文森特（Vincent）关于麻省理工学院（MIT）科学家AI视觉工作的报告向我们展示的是，即使基于最先进的算法，计算机所能直观看到的内容也有一定的限制。

正如文森特（Vincent）所指出的，本报告中处理的椅子和其他物品不会出现在训练数据中。

文森特写道：“这些系统对现实世界中的物体如何工作的了解有限。” “人工智能系统无法轻松地从他们以前看过的项目中推断出来，以想象它们在不同的照明条件下如何从不同的角度出现。”

您可能还注意到，被称为困难对象的种类并不是功能丰富的，而是基于常见的几何形状。

考虑到这一点，计算机算法很难识别像锤子一样的东西可能就不足为奇了。

实际上，尽管文森特（Vincent）建议人类可以轻松识别图像，但我们都知道有多少东西看起来像其他东西，特别是在弱光或混乱的彩色并列的情况下。

同时，Indata Labs的Valerie Shchutskaya建议，深度学习网络正在为计算机系统如何跟踪对象（包括视频）在KDNuggets上进行跟踪的未来重大进展铺平道路：

另一方面，深度学习算法通过神经元网络了解当前任务，这些神经元将任务映射为概念层次。每个复杂的概念由一系列更简单的概念定义。所有这些算法都可以自己完成。在计算机视觉的背景下，这意味着先识别明暗区域，然后对线条进行分类，然后再进行形状识别，然后再进行全面的图像识别。

当您向深度学习算法提供更多数据时，它们的性能也会更好，这不是机器学习算法所特有的。

请继续关注有关VR / AR，图像处理和计算机视觉的更多信息，以及这些是由于行业变化而引起的。

资讯来源：由0x资讯编译自WARRIORTRADINGNEWS。版权归作者Justin S所有，未经许可，不得转载