广义注意力- saliency map 关注图、gaze、Att
1.1定义 尽管术语attention,saliency和gaze经常被相互替换使用,但是他们之间有更细微的描述他们的定义。 注意力attention是一个普遍概念,覆盖了影响选择机制的各个方面,无论他们是场景驱动的自下而上的机制或者是预期驱动的自上而下机制。 显著性saliency直觉上刻画了场景的一些部分,可能是物体或者区域,这些部分似乎相对他们的临近区域突出。术语“salient”通常
1.1 定义
尽管术语 attention,saliency和gaze经常被相互替换使用,但是他们之间有更细微的描述他们的定义。
注意力attention是一个普遍概念,覆盖了影响选择机制的各个方面,无论他们是场景驱动的自下而上的机制或者是预期驱动的自上而下机制。
显著性saliency直觉上刻画了场景的一些部分,可能是物体或者区域,这些部分似乎相对他们的临近区域突出。术语“salient” 通常在自下而上的计算模型[18][14]中提及到。
Gaze,一个眼睛和脑的协调运动,通常被用作注意力在自然行为中的代名词。(见[99])。比如,一个人或者一个机器人必须和周围的物体进行交互,在场景中移动是控制注意点来执行任务。从这点讲,注意点控制同时集视觉,行为和注意力来执行感觉运动协调,这是某些特定行为(比如到达reaching和理解grasping)所必须的。
为了理解 DNN 究竟学到了什么,人们发展了很多神经网络的解释器。这些解释器中有一类叫 Saliency Map, 关注图,研究神经网络究竟借助一张图片中的哪个区域做出决策。
最近 MIT 的 Been Kim 给了一个关于深度学习可解释性的报告。报告里有一张让人非常震惊的图。下面这张 Slides 讲就算将神经网络的参数随机处理,目前市面上的大部分神经网络解释器仍然给出看上去相似的关注图。也就是说虽然看上去解释器找到了输入图片中的重要区域,但这并不解释神经网络学到了什么,就算是随机网络,解释器也能找到这些区域。
更多推荐
所有评论(0)