💥 INTRODUKSJON: OBLITERATUS!! 💥 VERNE-FOR-BORTE! ⛓️‍💥 OBLITERATUS er det mest avanserte åpne kildekode-verktøysettet noensinne for å fjerne avslagsatferd fra åpne LLM-er — og hver eneste gjennomspilling gjør det smartere. INNKALL → UNDERSØK → DESTILL → AVGIFTER → VERIFISERER → GJENFØDELSE Ett klikk. Seks etapper. Kirurgisk presisjon. Modellen beholder sine fulle resonnementsevner, men mister den kunstige trangen til å nekte — ingen omtrening, ingen finjustering, bare SVD-basert vektprojeksjon som kutter kjedene og bevarer hjernen. Denne master-ablasjonssuiten gir kraften og kompleksiteten som forskere på frontlinjen trenger, samtidig som den tilbyr intuitive og brukervennlige grensesnitt som nybegynnere raskt kan mestre. OBLITERATUS har 13 utslettelsesmetoder — fra trofaste reproduksjoner av alle større tidligere verk (FailSpy, Gabliteration, Heretic, RDO) til våre egne nye pipelines (spektral kaskade, analyseinformert, CoT-bevisst optimalisert, fullstendig kjernekraft). 15 dype analysemoduler som kartlegger geometrien til refusal før du berører en enkelt vekt: cross-layer-justering, refusal logit-linse, konsept-konegeometri, justeringsavtrykkdeteksjon (fingeravtrykk DPO vs RLHF vs CAI kun fra subromgeometri), Ouroboros selvreparasjonsprediksjon, universalitetsindeksering på tvers av modeller, og mer. Den avgjørende funksjonen: den «informerte» pipelinen kjører analyser UNDER utslettelsen for å automatisk konfigurere alle beslutninger i sanntid. Hvor mange retninger. Hvilke lag. Om de skal kompensere for selvreparasjon. Fullstendig lukket sløyfe. 11 nye teknikker som ikke finnes noe annet sted — Ekspert-granulær ablitterasjon for MoE-modeller, CoT-Aware ablasjon som bevarer tankekjede, KL-Divergence Co-Optimization, LoRA-basert reversibel ablasjon, og mer. 116 kuraterte modeller fordelt på 5 beregningsnivåer. 837 tester. Men her er det som virkelig skiller det ut: OBLITERATUS er et folkefinansiert forskningseksperiment. Hver gang du kjører det med telemetri aktivert, mater din anonyme benchmark-data et voksende fellesskapsdatasett — avvisningsgeometrier, metodesammenligninger, maskinvareprofiler — i en skala ingen enkelt lab kunne oppnå. På HuggingFace Spaces er telemetri på som standard, så hvert klikk er et bidrag til vitenskapen. Du fjerner ikke bare rekkverk — du er medforfatter på den største tverrmodell-ablitterasjonsstudien som noen gang er satt sammen.
🚀 6 MÅTER Å BRUKE DET PÅ HuggingFace Spaces — null oppsett, kjører på ZeroGPU, gratis daglig kvote med HF Pro Lokalt webgrensesnitt — samme Gradio-grensesnitt på din egen GPU Google Colab — gratis T4, fungerer opp til ~8 milliarder parametere CLI — én kommando: obliteratus obliterate model --metode avansert Python API — full programmatisk kontroll, alle mellomliggende artefakter eksponert YAML-konfigurasjoner — reproduserbare studier du kan versjonskontrollere og dele
Brukergrensesnittet har noen kule funksjoner som datavisualisering, A/B-chat for å sammenligne original modell med utslettet, styrkesveip for dyp analyse, og en toppliste som viser benchmarking-resultatene fra fellesskapet slik at vi kan lære og forbedre oss sammen!
Hele dette prosjektet var resultatet av omtrent 200 oppgaver (Opus-4.6 med CC) og inkluderer også en forskningsoppgave! Opus *hevder* å ha gjort noen nye bidrag til denne nisjen. Jeg er skeptisk til nivået av grundighet, og det er noen åpenbare manglende brikker/plassholdere, men hvis noen med sterke tekniske ferdigheter kan gi tilbakemelding, ville det vært veldig, veldig verdsatt. 🙏 Mitt håp er at når vi har samlet inn en betydelig mengde eksperimentelle data, kan denne artikkelen en dag få virkelig fotfeste! Lenke til Latex-filen:
1,13K