低画质影像给计算机视觉带来挑战

计算机视觉

有关计算机视觉进步的新报告重点介绍了一些抽象概念,以及有关我们如何训练计算机以“看得见”的更深层次的问题。

今天,The Verge的报告讨论了作家詹姆斯·文森特(James Vincent)所说的“躺在床上的锤子”问题,其中显示了ObjectNet数据训练中心化的示例,以说明在对象识别方面愚弄计算机很容易。

在某些情况下-过去几年来,工程师在成交量积神经网络方面取得了飞速进步-成交量积神经网络具有多个处理层,采用特殊的算法方法来扫描图像。

过去取得的一些显著成就包括功能丰富的图像-例如,计算机学会了向我们展示奇瓦瓦州和蓝莓松饼的照片,它们都含有深色球根球,无论它们是眼睛还是浆果。

文森特(Vincent)关于麻省理工学院(MIT)科学家AI视觉工作的报告向我们展示的是,即使基于最先进的算法,计算机所能直观看到的内容也有一定的限制。

正如文森特(Vincent)所指出的,本报告中处理的椅子和其他物品不会出现在训练数据中。

文森特写道:“这些系统对现实世界中的物体如何工作的了解有限。” “人工智能系统无法轻松地从他们以前看过的项目中推断出来,以想象它们在不同的照明条件下如何从不同的角度出现。”

您可能还注意到,被称为困难对象的种类并不是功能丰富的,而是基于常见的几何形状。

考虑到这一点,计算机算法很难识别像锤子一样的东西可能就不足为奇了。

实际上,尽管文森特(Vincent)建议人类可以轻松识别图像,但我们都知道有多少东西看起来像其他东西,特别是在弱光或混乱的彩色并列的情况下。

同时,Indata Labs的Valerie Shchutskaya建议,深度学习网络正在为计算机系统如何跟踪对象(包括视频)在KDNuggets上进行跟踪的未来重大进展铺平道路:

另一方面,深度学习算法通过神经元网络了解当前任务,这些神经元将任务映射为概念层次。每个复杂的概念由一系列更简单的概念定义。所有这些算法都可以自己完成。在计算机视觉的背景下,这意味着先识别明暗区域,然后对线条进行分类,然后再进行形状识别,然后再进行全面的图像识别。

当您向深度学习算法提供更多数据时,它们的性能也会更好,这不是机器学习算法所特有的。

请继续关注有关VR / AR,图像处理和计算机视觉的更多信息,以及这些是由于行业变化而引起的。

资讯来源:由0x资讯编译自WARRIORTRADINGNEWS。版权归作者Justin S所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢