z[1]=W[1]x+b[1]a[1]=σ(z[1])z[2]=Wa[1][2]+b[2]a[2]=σ(z[2])Loss(a[2],y)这里的损失函数使用的是逻辑回归的损失函数。da[2]=da[2]dLoss=−a[2]y+1−a[2]1−ydz[2]da[2]=a[2](1−a[2])dz[2]=dz[2]dLoss=da[2]dLoss∗dz[2]da[2]=a[2]−ydW[2]=dz[2]a[1].T=(a[2]−y)a[1].Tdb[2]=dz[2]=(a[2]−y)这就完成了反向传播的一半。da[1]dz(2)=W[2].Tdz[1]da[1]=g′[1](z[1])dz[1]=W[2].Tdz[2]g′[1](z[1])dW[1]=dz[1].x.Tdb[1]=dz[1]通过推导我们得到六个关键方程,如下图所示
![吴恩达深度学习 —— 3.10 直观理解反向传播 吴恩达深度学习 —— 3.10 直观理解反向传播](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzYyMS8wZmExNWE1YWI5YjYxNjU1Y2IyMGYyYjdkOTI4NWZiZC5wbmc=)
通过向量化表示,可以表示为
![吴恩达深度学习 —— 3.10 直观理解反向传播 吴恩达深度学习 —— 3.10 直观理解反向传播](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzgzOS82NzI5NWI4ZDZkZTA2MDBiN2VmMDMzODc1MDA3NzAwNy5wbmc=)