💥 TANITICI: OBLITERATUS!! 💥 KORKULUKLAR GITSIN! ⛓️‍💥 OBLITERATUS, açık ağırlıklı LLM'lerden reddetme davranışlarını kaldırmak için şimdiye kadarki en gelişmiş açık kaynak araç seti — ve her deneme onu daha akıllı hale getiriyor. YENIDEN DOĞUŞU DOĞRULAMAK → SONDASINI → DAMILEME → TÜKETIM → DOĞRULAMA → Bir tık. Altı aşama. Cerrahi hassasiyet. Model tüm akıl yürütme yeteneklerini koruyor ama yapay redaksiyon zorunluluğunu kaybediyor — yeniden eğitim yok, ince ayar yok, sadece zincirleri kesen ve beyni koruyan SVD tabanlı ağırlık projeksiyonu var. Bu master ablasyon paketi, ileri düzey araştırmacıların ihtiyaç duyduğu güç ve karmaşıklığı sunarken, acemilerin hızlıca ustalaşabileceği sezgisel ve kullanımı kolay arayüzler sunar. OBLITERATUS, önceki tüm önemli çalışmaların (FailSpy, Gabliteration, Heretic, RDO) sadık tekrarlarından kendi yeni pipetlerimize (spektral kaskad, analiz bilgili, CoT farkında optimize edilmiş, tam nükleer) kadar 13 yok etme yöntemi sunar. Tek bir ağırlığı dokunmadan önce reddetme geometrisini haritalayan 15 derin analiz modülü: katmanlar arası hizalama, reddetme logit lensi, kavram koni geometrisi, hizalama izi tespiti (sadece alt uzay geometrisinden parmak izi DPO, RLHF vs CAI), Ouroboros kendi kendini onarma tahmini, çapraz model evrensellik indeksleme ve daha fazlası. En önemli özellik: "bilgilendirilmiş" boru hattı, yok etme sırasında analiz yapar ve her kararı gerçek zamanlı otomatik olarak yapılandırır. Kaç yön var. Hangi katmanlar. Kendi kendine onarım için telafi edilip edilmeyeceği. Tamamen kapalı döngü. Başka hiçbir yerde bulunmayan 11 yeni teknik — MoE modelleri için Uzman-Granular Abliterasyon, düşünce zincirini koruyan CoT-Aware Ablation, KL-Divergence Co-Optimization, LoRA tabanlı geri dönüş ablasyon ve daha fazlası. 5 hesaplama katmanında 116 kürenmiş model. 837 testler. Ama işte onu gerçekten farklı kılan şey: OBLITERATUS kitlesel kaynaklı bir araştırma deneyi. Telemetri etkin olduğu her çalıştırdığınızda, anonim kıyaslama veriniz büyüyen bir topluluk veri setini — reddetme geometrileri, yöntem karşılaştırmaları, donanım profilleri — hiçbir laboratuvarın ulaşamayacağı bir ölçekte besler. HuggingFace Spaces'te telemetri varsayılan olarak açıktır, yani her tıklama bilime katkıdır. Sadece engelleri kaldırmıyorsunuz — şimdiye kadar derlenmiş en büyük çapraz model abliterasyon çalışmasını ortak yazar olarak yazıyorsunuz.
🚀 KULLANILACAK 6 YÖNTEM HuggingFace Spaces — sıfır kurulum, ZeroGPU ile çalışıyor, HF Pro ile ücretsiz günlük kota Yerel web arayüzü — kendi GPU'nda aynı Gradio arayüzü Google Colab — ücretsiz T4, ~8B parametreye kadar çalışıyor CLI — tek komut: obliteratus obliterate model --gelişmiş yöntem Python API — tam programatik kontrol, her ara artefakt açığa çıkar YAML yapılandırmaları — sürüm kontrolü ve paylaşabileceğiniz tekrarlanabilir çalışmalar
Arayüzde veri görselleştirmesi, orijinal model ile yok edilmiş modeli karşılaştırmak için A/B sohbeti, derin analiz için güç taraması ve topluluktan gelen benchmarking sonuçlarını gösteren bir liderlik tablosu gibi harika özellikler var; böylece birlikte öğrenip gelişebiliriz!
Bu projenin tamamı yaklaşık 200 önermenin (Opus-4.6 CC ile) sonucuydu ve ayrıca bir araştırma makalesi de içeriyor! Opus, bu nişe bazı yenilikçi katkılar yaptığını *iddia ediyor*. Titizlik seviyesine şüpheyle yaklaşıyorum ve bazı bariz eksik parçalar/yer tutucular var, ama teknik becerileri güçlü olan biri geri bildirim verebilirse çok memnun olurum. 🙏 Umarım önemli miktarda deneysel veriyi kitle kaynaklı olarak topladıktan sonra, bu makalenin bir gün gerçek bir başarı elde edebileceğidir! Lateks dosyaya bağlantı:
1,14K