Unsupervised Disentanglement of Pose Appearance and Background from Images and Videos (ICLR 2021)
Unsupervised Disentanglement of Pose, Appearance and Background from Images and Videos[ICLR 2021] 论文笔记
The Devil is in the Channels-Mutual-Channel Loss for Fine-Grained Image Classification(TIP2020)
The Devil is in the Channels: Mutual-Channel Loss for Fine-Grained Image Classification 论文笔记
该论文收录在TIP2020期刊上
github代码
论文地址
摘要
本文针对细粒度分类任务中具有较强区分性的图像注意力区域获取提出了新的损失函数,该损失函数能够特征能够学习到更加具有区分性的特征表示,同时还能约束各通道关注图像不同的区域特征。提出的损失函数MC-Loss包括两部分:
a discriminality component
The discriminality component forces all feature channels belonging to th...
The Devil is in the Channels-Mutual-Channel Loss for Fine-Grained Image Classification(TIP2020)
The Devil is in the Channels: Mutual-Channel Loss for Fine-Grained Image Classification 论文笔记
该论文收录在TIP2020期刊上
github代码
论文地址
摘要
本文针对细粒度分类任务中具有较强区分性的图像注意力区域获取提出了新的损失函数,该损失函数能够特征能够学习到更加具有区分性的特征表示,同时还能约束各通道关注图像不同的区域特征。提出的损失函数MC-Loss包括两部分:
a discriminality component
The discriminality component forces all feature channels belonging to th...
ZSL数据集属性划分
属性分组
Attribute Prototype Network for Zero-Shot Learning文章使用了以下几个数据集的属性的划分组数据,整合结果如下:
AWA数据集
85个属性分成九组???明明是10组??ok晕
也不知道NIPS20那个作者从哪扒出来的…
CUB鸟细粒度分类数据集
数据集地址
img src=httpsi.postimg.ccd1FKMdqpCUB.png width=50%
对于作者的划分数目让然保留质疑。。。。
鸟肢体部位划分原文地址
SUN数据集
SUN数据集原paperThe SUN Attribute Database Beyond Categories for Deeper Scene
Understanding中有...
算法课程复习
最小生成树(MST/Minimum-cost Spanning Tree)
问题: 任何只由G的边构成,并包含G的所有顶点的树称为G的生成树(G连通).
实现最小生成树的算法常用的是Prim,Kruskal。韩军老师W2PPT上只讲到了prim算法,W3讲了Kruskal算法。
MST就是一种贪心算法,每一步选择都是选取当前候选中最优的一个选择, 算法的证明省略。
Prim算法
基本思想
设G=(V, E)是具有n个顶点的连通网,T=(U, TE)是G的最小生成树, T的初始状态为T={u0}(u0∈V),TE={ },重复执行下述操作:在所有u∈U,v∈V-U的边中找一条代价最小的边(u, v)并入集合TE,同时v并入U,直至U=V。
伪代码
...
pytorch常用函数
torch.eye()函数
用来生层对角矩阵,即对角线上的元素都为1,其余都为0.
import torch as t
t.eye(3,3)
# tensor([[1., 0., 0.],
# [0., 1., 0.],
# [0., 0., 1.]])
t.eye(3,4)
# tensor([[1., 0., 0., 0.],
# [0., 1., 0., 0.],
# [0., 0., 1., 0.]])
t.eye(3)
# tensor([[1., 0., 0.],
# [0., 1., 0.],
# [0., 0., 1.]])
squeeze()和unsqueeze(...
transform方法
随机裁剪:transforms.RandomCrop
class torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode='constant')
功能:依据给定的size随机裁剪
参数:
size: (sequence or int),若为sequence,则为(h,w),若为int,则(size,size);
padding: (sequence or int, optional),此参数是设置填充多少个pixel。 当为int时,图像上下左右均填充int个,例如padding=4,则上下左右均填充4个pixel,若为32 32,则会变成4...
89 post articles, 12 pages.