图灵奖获得者Bengio又出新论文，Reddit崩溃：idea撞车了

发布时间：2021-06-05 15:20:53 所属栏目：大数据来源：互联网

导读：机器学习的一个重要研究就是提升模型的泛化性，并且在训练模型的时候一个假设，即训练集数据的分布和测试集相同。然而，模型面对的输入数据来自于真实世界，也就是不稳定的、会进化的、数据分布会随环境发生变化。虽然对人类来说，这个问题十分好解决，例

机器学习的一个重要研究就是提升模型的泛化性，并且在训练模型的时候一个假设，即训练集数据的分布和测试集相同。

然而，模型面对的输入数据来自于真实世界，也就是不稳定的、会进化的、数据分布会随环境发生变化。

虽然对人类来说，这个问题十分好解决，例如网络用语层出不穷，但每个人都能很快地接受，并熟练地运用起来，但对机器来说却很难。

人类可以通过重用相关的先前知识来迅速适应和学习新知识，如果把这个思路用在机器学习模型上，首先需要弄清楚如何将知识分离成易于重新组合的模块，以及如何修改或组合这些模块，以实现对新任务或数据分布的建模。

基于这个问题，图灵奖得主Yoshua Bengio最近在arxiv上公开了一篇论文，提出了一个模块化的架构，由一组独立的模块组成，这些模块相互对抗，利用key-value注意力机制找到相关的知识。研究人员在模块和注意力机制参数上采用元学习方法，以强化学习的方式实现快速适应分布的变化或新任务。

图灵奖得主Bengio又出新论文，Reddit崩溃：idea撞车了

这个团队研究这样的模块化架构是否可以帮助将知识分解成不可更改和可重用的部分，以便得到的模型不仅更具样本效率，而且还可以在各种任务分布之间进行泛化。

图灵奖得主Bengio又出新论文，Reddit崩溃：idea撞车了

该模型基于一个包含一组独立模块和竞争模块的循环独立机制(RIMs)体系结构。在这种设置中，每个模块通过注意力独立行动，并与其他模块交互。不同的模块通过输入注意力处理输入的不同部分，而模块之间的上下文关系通过交流注意力建立。

图灵奖得主Bengio又出新论文，Reddit崩溃：idea撞车了

研究人员还展示了如何利用元学习在不同的时间尺度上以不同的速度训练网络的不同组成部分，从而捕捉到底层分布的快速变化和缓慢变化的方面。

因此，该模型既有快速学习阶段，也有慢速学习阶段。

在快速fast学习中，快速更新激活的模块参数以捕获任务分布中的变化。

在缓慢slow学习中，这两套注意力机制的参数更新频率较低，以捕捉任务分布中更稳定的方面。

该团队评估了他们提出的 Meta-RIMs 网络在从 MiniGrid 和 BabyAI 套件的各种环境。他们选择平均回报率和平均成功率作为衡量标准，并用两个基准模型对 Meta-RIMs 网络进行比较: Vanilla LSTM 模型和模块化网络(modular network)。

（编辑：周口站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!