标签:Transformer

Transformer 可视化解释(第 4 部分):如何通过注意力得分计算来捕捉序列中单词之间的关系

用简单的语言来介绍如何通过注意力得分计算来捕捉序列中单词之间的关系。 Transformer 之所以强大,是因为其注意力模块。这是因为它能够捕捉...

Transformer 可视化解释(第 3 部分):多头注意力机制,深入探究

用简单的语言介绍自注意力、编码器-解码器注意力、注意力分数和掩蔽的内部工作原理。 这是我关于 Transformer 系列的第三篇文章。我们...

Transformer 的可视化解释(第 2 部分):分步说明其工作原理

介绍端到端的内部操作,数据如何流动以及执行哪些计算,包括矩阵表示指南。 这是我的 Transformer 系列文章中的第二篇。在第一篇文章中,我们了...

Transformer 的可视化解释(第 1 部分):功能概述

简单易懂的 Transformer 指南,介绍如何将其用于 NLP,以及为什么它们比 RNN 更好。Attention 如何帮助提高性能。 我们听到了很多关于 Transformer...