y^(x):=w0+i=1∑nwixi+i=1∑nj=i+1∑n⟨vi,vj⟩xixj
y(x)=w0+i=1∑nwixi+i=1∑nj=i+1∑n⟨vi,fj,vj,fi⟩xixj

y^=sigmoid(yFM+yDNN)
yFM=⟨w,x⟩+i=1∑dj=i+1∑d⟨Vi,Vj⟩xi⋅xj
yDNN=W∣H∣+1⋅a∣H∣+b∣H∣+1

y∧=σ(wlinearTa+w dnn Txdnnk+wcinTp++b)

6 Deep&Wide模型

P(Y=1∣x)=σ(wwideT[x,ϕ(x)]+wdeepTa(lf)+b)

ϕGMF=puG⊙qiG
ϕMLP=aL(WLT(aL−1(…a2(W2T[puMqiM]+b2)…))+bL)
y^ui=σ(hT[ϕGMFϕMLP])

y^AFM(x)aij′aij=w0+i=1∑nwixi+pTi=1∑nj=i+1∑naij(vi⊙vj)xixj=hTReLU(W(vi⊙vj)xixj+b)=∑(i,j)∈Rxexp(aij′)exp(aij′)

y^=σ(W3l2+b3)
l2=relu(W2l1+b2)l1=relu(lz+lp+b1)
lz=(lz1,lz2,…,lzn,…,lzD1),lp=(lp1,lp2,…,lpn,…,lpD1),lzn=Wzn⊙zlpn=Wpn⊙p

y^NFM(x)=w0+i=1∑nwixi+hTσL(WL(…σ1(W1fBI(Vx)+b1)…)+bL)
fBI(Vx)=21⎣⎡(i=1∑nxivi)2−i=1∑n(xivi)2⎦⎤
11 MLR模型
p(y=1∣x)=i=1∑m∑j=1mexp(ujTx)exp(uiTx)⋅1+exp(−wiTx)1

p=σ([xL1T,hL2T]w logits )
hl+1=f(Wlhl+bl)
xl+1=x0xlTwl+bl+xl=f(xl,wl,bl)+xl
x0=[x embed, 1T,…,x embed ,kT,x dense T]



