💥 ESITTELY: OBLITERATUS!! 💥 KAITEET POIS! ⛓️‍💥 OBLITERATUS on edistynein avoimen lähdekoodin työkalupakki, jolla voidaan poistaa kieltäytymiskäyttäytymistä avoimissa LLM:issä — ja jokainen suoritus tekee siitä älykkäämmän. KUTSU → ANTURI → TISLAA → VALMISTE → VARMISTA → UUDELLEENSYNTYMÄ Yksi klikkaus. Kuusi vaihetta. Kirurgista tarkkuutta. Malli säilyttää täyden päättelykykynsä, mutta menettää keinotekoisen pakon kieltäytyä — ei uudelleenkoulutusta, ei hienosäätöä, vain SVD-pohjainen painoprojektio, joka katkaisee ketjut ja säilyttää aivot. Tämä masterablaatiopaketti tuo mukanaan edelläkävijöiden tarvitseman voiman ja monimutkaisuuden, samalla kun se tarjoaa intuitiivisia ja helppokäyttöisiä rajapintoja, jotka aloittelijat voivat nopeasti hallita. OBLITERATUS sisältää 13 tuhoamismenetelmää — uskollisista jäljennöksistä kaikista aiemmista merkittävistä töistä (FailSpy, Gabliteration, Heretic, RDO) aina omiin uusiin putkistoihimme (spektrikaskadi, analyysipohjainen, CoT-tietoinen optimoitu, täysi ydinvoima). 15 syvällistä analyysimoduulia, jotka kartoittavat hylkäämisen geometrian ennen kuin kosket yhteen painoon: kerrosten ristiin kohdistus, kieltäytymisen logit-linssi, konseptikartiogeometria, kohdistusjäljen tunnistus (sormenjälkien DPO vs RLHF vs CAI pelkästään alitilageometrian perusteella), Ouroborosin itsekorjausennuste, mallien ristiin ulottuvuuden indeksointi ja paljon muuta. Tappajaominaisuus: "informoitu" putki suorittaa analyysin TUHOAMISEN aikana, jotta jokainen päätös voidaan automaattisesti konfiguroida reaaliajassa. Kuinka monta suuntaa. Mitkä kerrokset. Kannattaako korvata itsekorjaus. Täysin suljettu kierto. 11 uutta tekniikkaa, joita ei ole missään muualla — asiantuntija-granulaarinen ablitaatio MoE-malleille, CoT-tietoinen ablaatio, joka säilyttää ajatusketjun, KL-divergenssin yhteisoptimointi, LoRA-pohjainen reversibiliivinen ablaatio ja paljon muuta. 116 kuratoitua mallia viidessä laskentatasossa. 837 testiä. Mutta tässä on se, mikä todella erottaa sen muista: OBLITERATUS on joukkoistettu tutkimuskoe. Joka kerta kun ajat sen telemetrian ollessa päällä, anonyymi vertailudatasi syöttää kasvavaa yhteisödataa — kieltäytymisgeometrioita, menetelmävertailuja, laiteprofiileja — mittakaavassa, johon yksikään laboratorio ei pystyisi. HuggingFace Spacesissa telemetria on oletuksena päällä, joten jokainen klikkaus on panos tieteelle. Et vain poista suojakaiteita — olet mukana kirjoittamassa suurinta koskaan koottua ristiinmallien abliteraatiotutkimusta.
🚀 6 TAPAA KÄYTTÄÄ SITÄ HuggingFace Spaces — nolla asennusta, toimii ZeroGPU:lla, ilmainen päivittäinen kiintiö HF Prolla Paikallinen verkkokäyttöliittymä — sama Gradio-liitäntä omalla näytönohjaimellasi Google Colab — ilmainen T4, toimii ~8B parametriin asti CLI — yksi komento: obliteratus obliterate malli --menetelmä edistynyt Python API — täysi ohjelmallinen ohjaus, jokainen väliesine paljastuu YAML-konfiguraatiot — toistettavia tutkimuksia, joita voi versionhallintaa ja jakaa
Käyttöliittymässä on siistejä ominaisuuksia, kuten datavisualisointi, A/B-chat, jolla vertaillaan alkuperäistä mallia ja tuhoutunutta, voimanpuhdistus syvälliseen analyysiin sekä tulostaulu, joka näyttää yhteisön benchmarking-tulokset, jotta voimme oppia ja kehittyä yhdessä!
Koko projekti syntyi noin 200 aiheesta (Opus-4.6 CC:llä) ja sisältää myös tutkimuspaperin! Opus *väittää* tehneensä joitakin uusia panoksia tähän nicheen. Olen skeptinen tarkkuuden tasosta ja puuttuu joitakin räikeitä osia tai paikkamerkkejä, mutta jos joku vahvasti teknisesti osaava osaa antaa palautetta, olisin siitä todella kiitollinen. 🙏 Toivon, että kun olemme keränneet merkittävän määrän kokeellista dataa, tämä artikkeli voisi jonain päivänä saada todellista jalansijaa! Linkki lateksitiedostoon:
1,14K