Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💥 MEMPERKENALKAN: OBLITERATUS!! 💥
PAGAR PEMBATAS-HILANG! ⛓️💥
OBLITERATUS adalah toolkit open-source tercanggih yang pernah ada untuk menghilangkan perilaku penolakan dari LLM bobot terbuka — dan setiap eksekusi membuatnya lebih cerdas.
PANGGIL → MENYELIDIKI → MENYARING → MENGELUARKAN → MEMVERIFIKASI → KELAHIRAN KEMBALI
Satu klik. Enam tahap. Presisi bedah. Model ini mempertahankan kemampuan penalaran penuhnya tetapi kehilangan paksaan buatan untuk menolak - tidak ada pelatihan ulang, tidak ada penyetelan halus, hanya proyeksi berat berbasis SVD yang memotong rantai dan melestarikan otak.
Suite ablasi master ini menghadirkan kekuatan dan kompleksitas yang dibutuhkan peneliti perbatasan sambil menyediakan antarmuka yang intuitif dan mudah digunakan yang dapat dikuasai oleh pemula dengan cepat.
OBLITERATUS menampilkan 13 metode pemusnahan — dari reproduksi setia dari setiap karya utama sebelumnya (FailSpy, Gabliteration, Heretic, RDO) hingga pipa baru kami sendiri (kaskade spektral, analisis yang diinformasikan, dioptimalkan dengan sadar CoT, nuklir penuh).
15 modul analisis mendalam yang memetakan geometri penolakan sebelum Anda menyentuh satu bobot: penyelarasan lapisan silang, lensa logit penolakan, geometri kerucut konsep, deteksi jejak penyelarasan (sidik jari DPO vs RLHF vs CAI dari geometri subruang saja), prediksi perbaikan diri Ouroboros, pengindeksan universalitas lintas model, dan banyak lagi.
Fitur pembunuh: alur "terinformasi" menjalankan analisis SELAMA penghapusan untuk mengonfigurasi setiap keputusan secara otomatis secara real time. Berapa banyak arah. Lapisan mana. Apakah akan mengkompensasi perbaikan sendiri. Loop tertutup sepenuhnya.
11 teknik baru yang tidak ada di tempat lain — Abliterasi Granular Ahli untuk model MoE, Ablasi CoT-Aware yang mempertahankan rantai pemikiran, KL-Divergence Co-Optimization, ablasi reversibel berbasis LoRA, dan banyak lagi. 116 model yang dikuratori di 5 tingkat komputasi. 837 tes.
Tapi inilah yang benar-benar membedakannya: OBLITERATUS adalah eksperimen penelitian crowd-source. Setiap kali Anda menjalankannya dengan telemetri diaktifkan, data tolok ukur anonim Anda memberi makan kumpulan data komunitas yang terus berkembang — geometri penolakan, perbandingan metode, profil perangkat keras — pada skala yang tidak dapat dicapai oleh satu lab pun. Pada HuggingFace Spaces, telemetri diaktifkan secara default, jadi setiap klik adalah kontribusi untuk sains. Anda tidak hanya melepas pagar pembatas - Anda ikut menulis studi aliterasi lintas model terbesar yang pernah dirakit.

🚀 6 CARA MENGGUNAKANNYA
HuggingFace Spaces — pengaturan nol, berjalan di ZeroGPU, kuota harian gratis dengan HF Pro
UI web lokal — antarmuka Gradio yang sama di GPU Anda sendiri
Google Colab — T4 gratis, bekerja hingga ~8B parameter
CLI — satu perintah: obliteratus obliterate model --method advanced
Python API — kontrol terprogram penuh, setiap artefak perantara terekspos
Konfigurasi YAML — studi yang dapat direproduksi yang dapat Anda kontrol versi dan bagikan


UI memiliki beberapa fitur keren seperti visualisasi data, obrolan A/B untuk membandingkan model asli vs dilenyapkan, sapuan kekuatan untuk analisis mendalam, dan papan peringkat yang menampilkan hasil pembandingan dari komunitas sehingga kita dapat belajar dan meningkatkan bersama!




Seluruh proyek ini adalah hasil dari sekitar 200 prompt (Opus-4.6 w/ CC) dan juga termasuk makalah penelitian! Opus *mengklaim* telah membuat beberapa kontribusi baru untuk ceruk ini. Saya skeptis dengan tingkat ketelitian dan ada beberapa bagian/placeholder yang hilang yang mencolok, tetapi jika ada orang dengan kemampuan teknis yang kuat dapat memberikan umpan balik, itu akan sangat dihargai. 🙏
Harapan saya adalah bahwa setelah kami mengumpulkan sejumlah besar data eksperimental, makalah ini suatu hari nanti bisa memiliki kaki yang nyata!
Tautan ke file lateks:

1,13K
Teratas
Peringkat
Favorit
