Tôi nghi ngờ một trong những mảnh ghép lớn cuối cùng trên con đường đến AGI là sự tự phản ánh nguyên nhân thực sự. Tôi cảm nhận điều này rõ ràng nhất khi, trong những khoảnh khắc thất vọng, tôi thẩm vấn mô hình và hỏi "tại sao bạn lại làm điều đó?" Và tôi biết nó sẽ bịa ra một câu trả lời nào đó, nhưng câu trả lời đó về cơ bản đảm bảo sẽ là một ảo giác, và càng ép buộc mô hình, thì càng rõ ràng điều đó. Nó đơn giản là không có khả năng thực sự phản ánh và truy ngược lại những suy nghĩ của mình, và tìm ra các đặc điểm và kích hoạt nội bộ đã dẫn đến phản hồi và hành động trước đó của nó. Đó là khoảnh khắc rất rõ ràng của "tôi đã chạm đến giới hạn của sự thông minh thực sự mà công nghệ này có."