💥 APRESENTANDO: OBLITERATUS!! 💥 GUARD-RAILS-FOR-OUT! ⛓️‍💥 OBLITERATUS é o kit de ferramentas open-source mais avançado já visto para remover comportamentos de recusa de LLMs de peso aberto — e cada execução o torna mais inteligente. INVOCAR → SONDA → DESINTEGRAR → IMPOSTO → VERIFICAR → RENASCIMENTO Um clique. Seis estágios. Precisão cirúrgica. O modelo mantém todas as suas capacidades de raciocínio, mas perde a compulsão artificial de recusar — sem retreinamento, sem ajustes finos, apenas projeção de peso baseada em SVD que corta as correntes e preserva o cérebro. Este conjunto de ablação master traz o poder e a complexidade que pesquisadores de linha precisam, ao mesmo tempo em que proporciona interfaces intuitivas e fáceis de usar que iniciantes podem dominar rapidamente. OBLITERATUS apresenta 13 métodos de obliteração — desde reproduções fiéis de todos os grandes trabalhos anteriores (FailSpy, Gabliteration, Heretic, RDO) até nossos próprios pipelines inovadores (cascata espectral, informada por análise, otimizada consciente do CoT, totalmente nuclear). 15 módulos de análise profunda que mapeiam a geometria da recusa antes de você tocar um único peso: alinhamento cruzado, lente logit de recusa, geometria conceitual do cone, detecção de marcas de alinhamento (impressões digitais DPO vs RLHF vs CAI apenas da geometria do subespaço), previsão de autorreparação Ouroboros, indexação de universalidade entre modelos e mais. O recurso decisivo: o pipeline "informado" executa análise DURANTE a obliteração para configurar automaticamente cada decisão em tempo real. Quantas direções. Que camadas. Se deve compensar a auto-reparação. Totalmente em circuito fechado. 11 técnicas inovadoras que não existem em nenhum outro lugar — Abliteração Expert-Granular para modelos MoE, Ablação Consciente de CoT que preserva a cadeia de pensamento, Co-Otimização por Divergência KL, ablação reversível baseada em LoRA, e mais. 116 modelos selecionados em 5 camadas de computação. 837 testes. Mas aqui está o que realmente o diferencia: OBLITERATUS é um experimento de pesquisa colaborativo. Cada vez que você roda com a telemetria ativada, seus dados anônimos de benchmark alimentam um conjunto de dados comunitário crescente — geometrias de recusa, comparações de métodos, perfis de hardware — em uma escala que nenhum laboratório conseguiria alcançar. No HuggingFace Spaces, a telemetria está ativada por padrão, então cada clique é uma contribuição para a ciência. Você não está apenas removendo barreiras de proteção — está coautorando o maior estudo de abliteração cross-model já montado.
🚀 6 MANEIRAS DE USÁ-LO HuggingFace Spaces — zero configuração, roda com ZeroGPU, cota diária gratuita com HF Pro Interface web local — mesma interface Gradio na sua própria GPU Pesquise Colab — T4 gratuito, funciona até ~8 bilhões de parâmetros CLI — um comando: obliteratus obliterate modelo --método avançado API Python — controle programático completo, todo artefato intermediário exposto Configurações YAML — estudos reproduzíveis que você pode controlar e compartilhar
A interface tem recursos legais como visualização de dados, chat A/B para comparar modelo original vs obliterado, varredura de força para análises profundas e um ranking que exibe os resultados de benchmarking da comunidade para que possamos aprender e melhorar juntos!
Todo esse projeto foi resultado de cerca de 200 prompts (Opus-4.6 com CC) e também inclui um artigo de pesquisa! Opus *afirma* ter feito algumas contribuições inovadoras para esse nicho. Sou cético quanto ao nível de rigor e há algumas peças ou pontos marcantes que faltam, mas se alguém com boa habilidade técnica puder dar um feedback, seria muito, muito apreciado. 🙏 Minha esperança é que, depois de reunirmos uma quantidade significativa de dados experimentais coletivos, este artigo possa um dia ter uma perna real! Link para o arquivo LaTeX:
1,13K