MSC
Semi-Supervised Multimodal Classification Through Learning from Modal and Strategic Complementarities阅读笔记
motivation
- 模态互补性:不同模态对于类别预测的贡献度不同。
- 决策互补性:不同生成伪标签的模态融合策略优缺点不同。
创新点1:模态互补
当使用不同模态预测的平均分数时,会出现模态干扰(modality interference)问题,即即使一个模态预测对了,但另一个模态预测错误,最终融合后的预测结果仍可能错误。
为了解决这个问题,设计了一个modal reliability generator去判定不同模态的可行度,记
对于Score Fusion方法,最终的预测概率变为:
为了解决弱模态收敛速度慢的问题,引入Label Consistency Guidance (LCG)方法, 首先收集不同模态对于强增强后的无标签数据和无增强的有标签数据的预测结果:
接着计算模态指引度G,其越大代表该模态越可靠,对于有标签数据这里的
最终使用KL散度构造
为了解决弱模态产生的梯度过小不足以支持训练的问题,引入Modal Reliability Guidance(MRG)模块促使弱模态向强模态学习。
先将原始数据集
创新点2:策略互补
通过经验,Score Fusion方法通常能标出的样本量更少,但质量更高;Feature Concat方法通常能标出的样本量更多,但质量更低。
从无标签数据子集中选取两种策略预测出的伪标签一致且最大概率高于阈值
用这部分数据与有标签数据一起构成
仿照MRG,构造Score Fusion表现更好地数据集
总体架构
最终MSC框架的损失函数为:
其中