1/ We weten dat Transformers falen bij lengte-extrapolatie. Maar nieuw onderzoek toont een dieper probleem aan: ze falen bij IN-DISTRIBUTIE status tracking. Ze leren geen algoritmische regels, ze onthouden gewoon geïsoleerde circuits per lengte. 🧵