百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

分类器可视化解释StylEx:谷歌等找到了影响图像分类的关键属性

toyiye 2024-09-02 02:42 4 浏览 0 评论

选自Google AI Blog

作者:Po-Hsuan Cameron Chen、Maggie Demkin

机器之心编译

编辑:陈萍

本文中,来自谷歌、 希伯来大学、 MIT 等机构的研究者提出了一种新的分类器可视化解释方法 StylEx,该方法能以不同方式修改图像属性来更改其分类器输出。

神经网络可以非常出色地执行各种任务,但它们是如何做出决定的呢?例如,在图像分类任务中,模型是如何确定一张图像属于这一类而不是属于另一类,这通常是一个谜题。解释神经网络如何做决策的过程,可能会在某些领域产生重大的社会影响,例如医学图像分析和自动驾驶。

以前对分类器进行视觉解释的方法(例如注意力图 Grad-CAM)),会强调图像中的哪些区域对分类有影响,但这些方法并没有解释这些区域中的哪些属性决定分类结果:例如是颜色、形状,还是其他的属性决定模型进行这样的分类。另一类方法是通过在一类和另一类之间平滑转换图像来提供解释(例如 GANalyze)。然而,这些方法倾向于一次性改变所有属性(例如颜色、形状),因此,很难隔离单个属性带来的影响。

去年,来自谷歌、 希伯来大学、 MIT 等机构的研究者提出了一种新的分类器可视化解释方法,相关论文被 ICCV 2021 接收。他们提出了 StylEx ,可以自动发现和可视化影响分类器的解耦属性(disentangled attributes)。StylEx 允许通过单独操作这些属性来探索单个属性的影响(也就是说,更改一个属性不会影响其他属性)。StylEx 适用于广泛的领域,包括动物、树叶、面部和视网膜图像。该研究结果表明,StylEx 找到的属性与语义属性非常吻合,可以生成有意义的特定于图像的解释,并且在用户研究中可以被人们所解释。

  • 论文地址:https://arxiv.org/pdf/2104.13369.pdf
  • 论文主页:https://explaining-in-style.github.io/

训练 StyleGAN 来解释分类器

解释猫和狗分类器:StylEx 提供了可以解释分类的 top-K 个解耦属性。移动每个旋钮可以操作图像中的相应属性,同时保持图形的其他属性不变。

例如,要了解给定图像上的猫与狗分类器,StylEx 可以自动检测解耦属性,并可视化操作每个属性如何影响分类器概率。然后用户可以查看这些属性并对它们所代表的内容进行语义解释。例如,在上图中,可以得出狗比猫更容易张开嘴(上图 GIF 中的属性 #4)、猫的瞳孔更像狭缝(属性 # 5),猫的耳朵不倾向于折叠(属性 #1),等等。

下面的视频提供了该方法的简短说明:https://v.qq.com/x/page/m3319c0g8zd.html

给定一个分类器和一个输入图像,该研究希望找到并可视化影响其分类的各个属性。研究人员采用了可以生成高质量图像的 StyleGAN2 架构,整个过程包括两个阶段:

第一阶段:训练 StylEx

论文《StyleSpace Analysis: Disentangled Controls for StyleGAN Image Generation》中的研究表明,StyleGAN2 包含一个名为「StyleSpace」的解耦潜在空间,其包含训练图像的单个语义属性。该研究训练了一个类似于 StyleGAN 的生成器来满足分类器需求,从而可以使 StyleSpace 适应分类器特定的属性。

StylEx 通过使用两个附加组件训练 StyleGAN 生成器来实现。第一个是编码器,它与具有 reconstruction-loss 的 GAN 一起训练,并强制生成的输出图像在视觉上与输入相似,从而允许生成器应用于任何给定的输入图像。然而,仅仅只有图像的视觉相似性是不够的,因为它可能不一定捕获对特定分类器(例如医学病理学)重要的细微视觉细节。

为了确保这一点,该研究在 StyleGAN 训练中添加了一个 classification-loss,它强制生成图像的分类器概率与输入图像的分类器概率相同。这保证了细微视觉细节(例如医学病理学)包含在生成的图像中,这对分类器来说是很重要的。

训练 StyleEx:联合训练生成器和编码器。在生成图像和原始图像之间应用 reconstruction-loss,以保持视觉相似性。在生成图像的分类器输出和原始图像的分类器输出之间应用 classification-loss,以确保生成器能够捕获对分类很重要的细微视觉细节。

第二阶段提取解耦属性

训练完成之后,研究者在经过训练的分类器的 StyleSpace 中搜索显著影响分类器的属性,他们对每个 StyleSpace 进行操作并测量其对分类概率的影响。对于给定的图像,研究者寻找对图像分类影响最大的属性。这一过程可以找到 top-K 个特定图像属性。对每个类的图像重复这个过程,可以进一步发现特定类的 top-K 属性,这个端到端的系统被命名为 StylEx。

图像特定属性提取的可视化说明

StylEx 适用于各种领域和分类器

StylEx 适用于各种领域和分类器(二元和多类),下面是感知性别分类器展示的 top-4 属性。

对于性别分类器,以下是每个分类器检测到的前四个属性。对于每个属性,该研究在源图像和属性操作图像之间进行变换。属性(例如胡子、眉毛等)对分类器概率的影响程度显示在每个图像的左上角。

感知性别分类器 Top-4 属性

感知年龄分类器 Top-4 属性

StylEx 揭示了给定分类器可以从数据中学会利用图像不同属性,这些属性可能不一定代表现实中类别标签(例如年轻或年长)之间的实际物理差异。特别是,这些检测到的属性可能会揭示分类器训练或数据集中的偏差。StylEx 可以进一步用于提高神经网络的公平性,例如,通过增加训练数据集的示例来补偿 StylEx 方法揭示的偏差,有针对性的进行补偿。

对于分类严重依赖精细细节的任务,将 classifier loss 添加到 StyleGAN 训练中至关重要。举例来说,在没有 classifier loss 的情况下,在视网膜图像上训练的 GAN 不一定会产生与特定疾病对应的精细病理细节。而添加 classification loss 使得 GAN 生成这些微妙的病理,作为分类器的解释。下面以视网膜图像分类器(DME 疾病)和不健康 / 健康树叶分类器为例。StylEx 能够发现与疾病指标一致的属性,例如视网膜的「硬渗出物」。

视网膜图像 DME 分类器的 Top-4 属性

不健康 / 健康树叶图像 Top-4 属性

特定于鸟的分类器(200 个类),事实上 StylEx 检测到与 CUB(鸟类数据集) 分类中的属性相对应的属性

原文链接:https://ai.googleblog.com/

相关推荐

# Python 3 # Python 3字典Dictionary(1)

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中,格式如...

Python第八课:数据类型中的字典及其函数与方法

Python3字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值...

Python中字典详解(python 中字典)

字典是Python中使用键进行索引的重要数据结构。它们是无序的项序列(键值对),这意味着顺序不被保留。键是不可变的。与列表一样,字典的值可以保存异构数据,即整数、浮点、字符串、NaN、布尔值、列表、数...

Python3.9又更新了:dict内置新功能,正式版十月见面

机器之心报道参与:一鸣、JaminPython3.8的热乎劲还没过去,Python就又双叒叕要更新了。近日,3.9版本的第四个alpha版已经开源。从文档中,我们可以看到官方透露的对dic...

Python3 基本数据类型详解(python三种基本数据类型)

文章来源:加米谷大数据Python中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。在Python中,变量就是变量,它没有类型,我们所说的"类型"是变...

一文掌握Python的字典(python字典用法大全)

字典是Python中最强大、最灵活的内置数据结构之一。它们允许存储键值对,从而实现高效的数据检索、操作和组织。本文深入探讨了字典,涵盖了它们的创建、操作和高级用法,以帮助中级Python开发...

超级完整|Python字典详解(python字典的方法或操作)

一、字典概述01字典的格式Python字典是一种可变容器模型,且可存储任意类型对象,如字符串、数字、元组等其他容器模型。字典的每个键值key=>value对用冒号:分割,每个对之间用逗号,...

Python3.9版本新特性:字典合并操作的详细解读

处于测试阶段的Python3.9版本中有一个新特性:我们在使用Python字典时,将能够编写出更可读、更紧凑的代码啦!Python版本你现在使用哪种版本的Python?3.7分?3.5分?还是2.7...

python 自学,字典3(一些例子)(python字典有哪些基本操作)

例子11;如何批量复制字典里的内容2;如何批量修改字典的内容3;如何批量修改字典里某些指定的内容...

Python3.9中的字典合并和更新,几乎影响了所有Python程序员

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

Python3大字典:《Python3自学速查手册.pdf》限时下载中

最近有人会想了,2022了,想学Python晚不晚,学习python有前途吗?IT行业行业薪资高,发展前景好,是很多求职群里严重的香饽饽,而要进入这个高薪行业,也不是那么轻而易举的,拿信工专业的大学生...

python学习——字典(python字典基本操作)

字典Python的字典数据类型是基于hash散列算法实现的,采用键值对(key:value)的形式,根据key的值计算value的地址,具有非常快的查取和插入速度。但它是无序的,包含的元素个数不限,值...

324页清华教授撰写【Python 3 菜鸟查询手册】火了,小白入门字典

如何入门学习python...

Python3.9中的字典合并和更新,了解一下

全文共2837字,预计学习时长9分钟Python3.9正在积极开发,并计划于今年10月发布。2月26日,开发团队发布了alpha4版本。该版本引入了新的合并(|)和更新(|=)运算符,这个新特性几乎...

python3基础之字典(python中字典的基本操作)

字典和列表一样,也是python内置的一种数据结构。字典的结构如下图:列表用中括号[]把元素包起来,而字典是用大括号{}把元素包起来,只不过字典的每一个元素都包含键和值两部分。键和值是一一对应的...

取消回复欢迎 发表评论:

请填写验证码