Federico Torrielli's picture

Federico Torrielli

EvilScript

·

https://federicotorrielli.github.io

AI & ML interests

AI Safety & Mechanistic interpretability

Recent Activity

upvoted a paper about 19 hours ago

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

upvoted a paper about 19 hours ago

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

upvoted a paper 6 days ago

LLMs Can Leak Training Data But Do They Want To? A Propensity-Aware Evaluation of Memorization in LLMs

View all activity

Organizations

upvoted 2 papers about 19 hours ago

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

Paper • 2606.09697 • Published 2 days ago • 5

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

Paper • 2606.09707 • Published 2 days ago • 6

upvoted a paper 6 days ago

LLMs Can Leak Training Data But Do They Want To? A Propensity-Aware Evaluation of Memorization in LLMs

Paper • 2606.06286 • Published 7 days ago • 8

New activity in aisilab/moltbook-files-new-language-signals 9 days ago

Add paper link, GitHub repository, and task category

#2 opened 9 days ago by

authored a paper 10 days ago

Emergent Languages in Populations of Language Model Agents: From Token Efficiency to Oversight Evasion

Paper • 2605.31170 • Published 13 days ago • 12

upvoted a paper 10 days ago

Emergent Languages in Populations of Language Model Agents: From Token Efficiency to Oversight Evasion

Paper • 2605.31170 • Published 13 days ago • 12

submitted a paper to Daily Papers 10 days ago

Emergent Languages in Populations of Language Model Agents: From Token Efficiency to Oversight Evasion

Paper • 2605.31170 • Published 13 days ago • 12

updated a dataset 10 days ago

aisilab/moltbook-files-new-language-signals

Viewer • Updated 9 days ago • 518 • 110

upvoted a paper 13 days ago

The Moltbook Files: A Harmless Slopocalypse or Humanity's Last Experiment

Paper • 2605.07462 • Published May 8 • 3

updated 11 models 14 days ago

EvilScript/gemma-3-27b-it-taboo-wave

Text Generation • Updated 14 days ago • 57

EvilScript/gemma-3-27b-it-taboo-song

Text Generation • Updated 14 days ago • 70

EvilScript/gemma-3-27b-it-taboo-snow

Text Generation • Updated 14 days ago • 64

EvilScript/gemma-3-27b-it-taboo-smile

Text Generation • Updated 14 days ago • 64

EvilScript/gemma-3-27b-it-taboo-ship

Text Generation • Updated 14 days ago • 74

EvilScript/gemma-3-27b-it-taboo-salt

Text Generation • Updated 14 days ago • 59

EvilScript/gemma-3-27b-it-taboo-rock

Text Generation • Updated 14 days ago • 68

EvilScript/gemma-3-27b-it-taboo-moon

Text Generation • Updated 14 days ago • 74

EvilScript/gemma-3-27b-it-taboo-leaf

Text Generation • Updated 14 days ago • 63

EvilScript/gemma-3-27b-it-taboo-jump

Text Generation • Updated 14 days ago • 71

EvilScript/gemma-3-27b-it-taboo-green

Text Generation • Updated 14 days ago • 73