Uutta tutkimusta koodausagenttien arvioinnista jatkuvan integraation avulla. Koodausagentit siirtyvät erillisten bugikorjausten yli. Jos he aikovat omistaa CI-putket, tarvitsemme vertailuja, jotka heijastavat koodipohjan ylläpidon todellista monimutkaisuutta. Useimmat koodausagentin testit nykyään testaavat, pystyykö agentti korjaamaan yhden ongelman. Mutta todellinen ohjelmistokehitys tarkoittaa kokonaisen koodikantojen ylläpitoa ajan myötä. SWE-CI arvioi agentin kykyjä jatkuvan integraation työnkulkujen kautta: testipaketteja ajaen, regressioiden havaitsemista ja koodin laadun ylläpitoa useiden muutosten aikana. Artikkeli: Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme: