Model XLNet

XLNet je model globokega učenja za obdelavo naravnega jezika, ki temelji na arhitekturi transformer. XLNet združuje dve ključni ideji: prenos učenja, ki je značilno za BERT, in avtoregresivno modeliranje, uporabljeno v modelih, kot je GPT. XLNet se od BERT-a razlikuje po tem, da je zasnovan za obvladovanje težav s preoblikovanjem besedil in boljše razumevanje dolgosežnih odvisnosti med besedami.