Nieuw onderzoek van Microsoft. Phi-4-reasoning-vision-15B is een multimodaal redeneermodel met 15 miljard parameters dat visueel begrip combineert met gestructureerde redeneermogelijkheden. Zoals ik al zei, heeft niet elke agenttaak een grensmodel nodig. Phi-4-reasoning-vision laat zien wat mogelijk is met 15 miljard parameters. Het rapport beschrijft hoe ze een compact model hebben getraind dat kan redeneren over zowel tekst als afbeeldingen, gericht op de ideale balans tussen capaciteit en efficiëntie. Kleinere redeneermodellen die visuele taken kunnen uitvoeren zijn essentieel voor praktische inzet van agenten. Paper: Leer effectieve AI-agenten te bouwen in onze academie: