Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💥 INTRODUKSJON: OBLITERATUS!! 💥
VERNE-FOR-BORTE! ⛓️💥
OBLITERATUS er det mest avanserte åpne kildekode-verktøysettet noensinne for å fjerne avslagsatferd fra åpne LLM-er — og hver eneste gjennomspilling gjør det smartere.
INNKALL → UNDERSØK → DESTILL → AVGIFTER → VERIFISERER → GJENFØDELSE
Ett klikk. Seks etapper. Kirurgisk presisjon. Modellen beholder sine fulle resonnementsevner, men mister den kunstige trangen til å nekte — ingen omtrening, ingen finjustering, bare SVD-basert vektprojeksjon som kutter kjedene og bevarer hjernen.
Denne master-ablasjonssuiten gir kraften og kompleksiteten som forskere på frontlinjen trenger, samtidig som den tilbyr intuitive og brukervennlige grensesnitt som nybegynnere raskt kan mestre.
OBLITERATUS har 13 utslettelsesmetoder — fra trofaste reproduksjoner av alle større tidligere verk (FailSpy, Gabliteration, Heretic, RDO) til våre egne nye pipelines (spektral kaskade, analyseinformert, CoT-bevisst optimalisert, fullstendig kjernekraft).
15 dype analysemoduler som kartlegger geometrien til refusal før du berører en enkelt vekt: cross-layer-justering, refusal logit-linse, konsept-konegeometri, justeringsavtrykkdeteksjon (fingeravtrykk DPO vs RLHF vs CAI kun fra subromgeometri), Ouroboros selvreparasjonsprediksjon, universalitetsindeksering på tvers av modeller, og mer.
Den avgjørende funksjonen: den «informerte» pipelinen kjører analyser UNDER utslettelsen for å automatisk konfigurere alle beslutninger i sanntid. Hvor mange retninger. Hvilke lag. Om de skal kompensere for selvreparasjon. Fullstendig lukket sløyfe.
11 nye teknikker som ikke finnes noe annet sted — Ekspert-granulær ablitterasjon for MoE-modeller, CoT-Aware ablasjon som bevarer tankekjede, KL-Divergence Co-Optimization, LoRA-basert reversibel ablasjon, og mer. 116 kuraterte modeller fordelt på 5 beregningsnivåer. 837 tester.
Men her er det som virkelig skiller det ut: OBLITERATUS er et folkefinansiert forskningseksperiment. Hver gang du kjører det med telemetri aktivert, mater din anonyme benchmark-data et voksende fellesskapsdatasett — avvisningsgeometrier, metodesammenligninger, maskinvareprofiler — i en skala ingen enkelt lab kunne oppnå. På HuggingFace Spaces er telemetri på som standard, så hvert klikk er et bidrag til vitenskapen. Du fjerner ikke bare rekkverk — du er medforfatter på den største tverrmodell-ablitterasjonsstudien som noen gang er satt sammen.

🚀 6 MÅTER Å BRUKE DET PÅ
HuggingFace Spaces — null oppsett, kjører på ZeroGPU, gratis daglig kvote med HF Pro
Lokalt webgrensesnitt — samme Gradio-grensesnitt på din egen GPU
Google Colab — gratis T4, fungerer opp til ~8 milliarder parametere
CLI — én kommando: obliteratus obliterate model --metode avansert
Python API — full programmatisk kontroll, alle mellomliggende artefakter eksponert
YAML-konfigurasjoner — reproduserbare studier du kan versjonskontrollere og dele


Brukergrensesnittet har noen kule funksjoner som datavisualisering, A/B-chat for å sammenligne original modell med utslettet, styrkesveip for dyp analyse, og en toppliste som viser benchmarking-resultatene fra fellesskapet slik at vi kan lære og forbedre oss sammen!




Hele dette prosjektet var resultatet av omtrent 200 oppgaver (Opus-4.6 med CC) og inkluderer også en forskningsoppgave! Opus *hevder* å ha gjort noen nye bidrag til denne nisjen. Jeg er skeptisk til nivået av grundighet, og det er noen åpenbare manglende brikker/plassholdere, men hvis noen med sterke tekniske ferdigheter kan gi tilbakemelding, ville det vært veldig, veldig verdsatt. 🙏
Mitt håp er at når vi har samlet inn en betydelig mengde eksperimentelle data, kan denne artikkelen en dag få virkelig fotfeste!
Lenke til Latex-filen:

1,13K
Topp
Rangering
Favoritter
