一、激活函数演变史&输出层机制

image.png

二、感知机(Perceptron,1958):单层线性分类器

image.png

三、多层感知机(MLP,1986)

image.png

四、卷积神经网络(CNN,1989)

image.png

五、循环神经网络(RNN,1990)

image.png

1、语言模型(预测下一个词)

image.png

2、情感分析(分类)

image.png

3、翻译(用两个RNN)

image.png

六、长短期记忆网络(LSTM,1997)

image.png

1、门控循环单元(GRU,2014)

image.png

七、Transformer

image.png

1、多头注意力机制

image.png

矩阵变换过程

image.png

2、GQA(Grouped Query Attention)或MQA(Multi-Query Attention)

image.png


详细内容请关注我的个人公众号查看
图片

标签: none

添加新评论