Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💥 ПРЕДСТАВЛЯЮ: OBLITERATUS!! 💥
ОГОРОЖІ ЗНИКЛИ! ⛓️💥
OBLITERATUS — це найсучасніший відкритий інструментарій для усунення поведінки відмови від відкритих LLM — і кожен запуск робить його розумнішим.
ВИКЛИКАТИ → ЗОНД → ДИСТИЛЮВАТИ → АКЦИЗ → ПЕРЕВІРИТИ → ВІДРОДЖЕННЯ
Один клік. Шість рівнів. Хірургічна точність. Модель зберігає всі свої можливості мислення, але втрачає штучний примус відмовлятися — без перенавчання, без тонкого налаштування, лише проекція ваги на основі SVD, яка перерізає ланцюги і зберігає мозок.
Цей набір майстер-абляції забезпечує потужність і складність, необхідні дослідникам фронтиру, водночас пропонуючи інтуїтивно зрозумілі та прості інтерфейси, які новачки можуть швидко опанувати.
OBLITERATUS пропонує 13 методів облітерації — від точних відтворень усіх основних попередніх робіт (FailSpy, Gabliteration, Heretic, RDO) до наших власних нових конвеєрів (спектральний каскад, аналізований, оптимізований CoT, повністю ядерний).
15 модулів глибокого аналізу, які відображають геометрію відмови до того, як ви торкнетеся однієї ваги: вирівнювання між шарами, лінза відмови в логіті, геометрія конусу конусу, виявлення відбитків вирівнювання (відбитки пальців DPO проти RLHF проти CAI лише з субпросторової геометрії), прогнозування самовідновлення Ouroboros, індекс універсальності крос-моделей та інше.
Головна функція: «інформований» конвеєр виконує аналіз ПІД час знищення і автоматично налаштовує кожне рішення в реальному часі. Скільки напрямків. Які шари? Чи варто компенсувати самовідновлення. Повністю замкнений цикл.
11 нових технік, яких більше ніде немає — експертно-гранулярна алітерація для моделей MoE, CoT-свідома абляція, що зберігає ланцюжок думок, KL-дивергенційна ко-оптимізація, оборотна абляція на основі LoRA та інші. 116 кураторських моделей на 5 рівнях обчислення. 837 тестів.
Але ось що справді вирізняє його: OBLITERATUS — це дослідницький експеримент, створений за участю краудсорсингу. Кожного разу, коли ви запускаєте його з увімкненою телеметрією, ваші анонімні бенчмаркові дані подають зростаючий набір даних спільноти — геометрії відмов, порівняння методів, апаратні профілі — у масштабі, яких не могла досягти жодна лабораторія. На HuggingFace Spaces телеметрія увімкнена за замовчуванням, тож кожен клік — це внесок у науку. Ви не просто знімаєте обмеження — ви є співавтором найбільшого дослідження крос-модельної алітерації, яке коли-небудь було зібране.

🚀 6 СПОСОБІВ ВИКОРИСТАННЯ
HuggingFace Spaces — нульова установка, працює на ZeroGPU, безкоштовна щоденна квота з HF Pro
Локальний веб-інтерфейс — той самий інтерфейс Gradio на вашій відеокарті
Google Colab — безкоштовний T4, працює до ~8B параметрів
CLI — одна команда: obliteratus obliterate model — метод просунутий
API Python — повний програмний контроль, кожен проміжний артефакт відкритий
YAML-конфігурації — відтворювані дослідження, які можна контролювати версії та ділитися


Інтерфейс має цікаві функції, такі як візуалізація даних, чат A/B для порівняння оригінальної моделі та знищеного, перевірка сили для глибокого аналізу та таблиця лідерів, яка показує результати бенчмаркінгу спільноти, щоб ми могли разом навчатися та вдосконалюватися!




Весь цей проєкт був результатом приблизно 200 запитів (Opus-4.6 з CC) і також включає наукову статтю! Opus *стверджує*, що зробив деякі нові внески в цю нішу. Я скептично ставлюся до рівня строгості, і там явно бракує деталей чи заповнювачів, але якщо хтось із сильними технічними навичками може дати відгук, буду дуже вдячний. 🙏
Я сподіваюся, що коли ми зібраємо значну кількість експериментальних даних, ця стаття колись отримає справжню популярність!
Посилання на файл latex:

1,11K
Найкращі
Рейтинг
Вибране
