Нове дослідження оцінки кодувальних агентів шляхом безперервної інтеграції. Кодувальні агенти виходять за межі ізольованих виправлень помилок. Якщо вони збираються володіти CI-конвеєрами, нам потрібні бенчмарки, які відображають реальну складність підтримки кодової бази. Більшість сучасних бенчмарків агентів кодування перевіряють, чи може агент виправити одну проблему. Але справжня програмна інженерія передбачає підтримку цілих кодових баз з часом. SWE-CI оцінює можливості агентів через безперервні інтеграції: запуск тестових наборів, виявлення регресій і підтримання якості коду при кількох змінах. Стаття: Навчіться створювати ефективних агентів ШІ в нашій академії: