Yeni bir LLM çıkarım algoritması üzerinde çalışıyorum. Buna Speculative Speculative Decoding (SSD) deniyor ve dünyanın en güçlü çıkarım motorlarından 2 kata kadar hızlı. @tri_dao @avnermay ile işbirliği yaptık. Detaylar başlıkta.