Nghiên cứu mới về việc đánh giá các tác nhân lập trình thông qua tích hợp liên tục. Các tác nhân lập trình đang vượt ra ngoài việc sửa lỗi đơn lẻ. Nếu họ sẽ sở hữu các pipeline CI, chúng ta cần các tiêu chuẩn phản ánh độ phức tạp thực sự của việc duy trì mã nguồn. Hầu hết các tiêu chuẩn đánh giá tác nhân lập trình hiện nay chỉ kiểm tra xem một tác nhân có thể sửa một vấn đề duy nhất hay không. Nhưng kỹ thuật phần mềm thực sự liên quan đến việc duy trì toàn bộ mã nguồn theo thời gian. SWE-CI đánh giá khả năng của tác nhân thông qua các quy trình tích hợp liên tục: chạy bộ kiểm tra, phát hiện các lỗi hồi quy và duy trì chất lượng mã qua nhiều thay đổi. Tài liệu: Học cách xây dựng các tác nhân AI hiệu quả trong học viện của chúng tôi: