神经网络演变史及其原理详解:从Perceptron、MLP、CNN、RNN、LSTM、GRU到Transformer(长文)
详细内容请关注我的个人公众号查看一、激活函数演变史&输出层机制

二、感知机(Perceptron,1958):单层线性分类器

三、多层感知机(MLP,1986)

四、卷积神经网络(CNN,1989)

五、循环神经网络(RNN,1990)

1、语言模型(预测下一个词)

2、情感分析(分类)

3、翻译(用两个RNN)

六、长短期记忆网络(LSTM,1997)

1、门控循环单元(GRU,2014)

七、Transformer

1、多头注意力机制

矩阵变换过程

2、GQA(Grouped Query Attention)或MQA(Multi-Query Attention)

