Hva skjer hvis du Q,K,V = mlp(x).split(3) i stedet for lineær(x).split(3) ? Noen som har prøvd dette?
87,47K