您的位置: 首页 > 文章 > 序列模型与注意力机制总结

序列模型与注意力机制总结

分类: 文章 • 2025-02-19 10:06:52

1.翻译即有条件的语言模型

序列模型与注意力机制总结

2.1beam search 参数B

序列模型与注意力机制总结

2.2 beam search 的概率表达式

序列模型与注意力机制总结

2.3 在扩展一次

序列模型与注意力机制总结

3.beam search 改进，

修改评价函数为 log，同时做normalization时，增加一个超参。

序列模型与注意力机制总结

4.Beam width B

序列模型与注意力机制总结

5. 误差分析

比较 beam search 跟 rnn 引起误差的比例

序列模型与注意力机制总结

6.Bleu score 序列模型与注意力机制总结

序列模型与注意力机制总结

序列模型与注意力机制总结

7.1注意力模型，即增加跟距离有关的weight矩阵。（增加词距的影响）

weight 会受到双向 a<t>以及前一个s的影响。

序列模型与注意力机制总结

7.2weight公式

序列模型与注意力机制总结

7.3

序列模型与注意力机制总结

8.CTC

序列模型与注意力机制总结

9.改善0跟1标签分布不均匀的方式。

序列模型与注意力机制总结