🔄 In a Training Loop

Pratyay Banerjee

Neilblaze

·

https://neilblaze.live

AI & ML interests

IR, NLP, Pattern Recognition, xAI, Interpretability, Evals

Recent Activity

liked a model 1 day ago

NeuML/biomedbert-hash-nano-embeddings-litert

liked a dataset 1 day ago

alessiotoniolo/ART-Chat-2.5M

upvoted a paper 3 days ago

MOPD: Multi-Teacher On-Policy Distillation for Capability Integration in LLM Post-Training

View all activity

Organizations

liked a model 1 day ago

NeuML/biomedbert-hash-nano-embeddings-litert

Sentence Similarity • Updated 1 day ago • 20 • 2

liked a dataset 1 day ago

alessiotoniolo/ART-Chat-2.5M

Viewer • Updated 25 days ago • 2.53M • 368 • 1

upvoted a paper 3 days ago

MOPD: Multi-Teacher On-Policy Distillation for Capability Integration in LLM Post-Training

Paper • 2606.30406 • Published Jun 29 • 19

liked a Space 6 days ago

Nemotron-Labs-Audio-Visual Flamingo

Analyze videos and answer questions about their content

liked 2 models 6 days ago

asinha08/slm-125m-base

Text Generation • 0.1B • Updated 23 days ago • 588 • 3

asinha08/slm-125m-sft-pilot-2k

Text Generation • 0.1B • Updated 22 days ago • 528 • 2

liked a dataset 6 days ago

HuggingFaceCode/stack-v3-train

Viewer • Updated 3 days ago • 173M • 129k • 287

liked a model 6 days ago

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

Any-to-Any • 33B • Updated May 8 • 476k • 407

upvoted 7 papers 7 days ago

Loop the Loopies!

Paper • 2607.16051 • Published 17 days ago • 74

SWE-Pruner Pro: The Coder LLM Already Knows What to Prune

Paper • 2607.18213 • Published 14 days ago • 78

DeepSearch-World: Self-Distillation for Deep Search Agents in a Verifiable Environment

Paper • 2607.07820 • Published 26 days ago • 91

SEED: Self-Evolving On-Policy Distillation for Agentic Reinforcement Learning

Paper • 2607.14777 • Published 18 days ago • 103

RAGU: A Multi-Step GraphRAG Engine with a Compact Domain-Adapted LLM

Paper • 2607.11683 • Published 21 days ago • 148

AREX: Towards a Recursively Self-Improving Agent for Deep Research

Paper • 2607.21461 • Published 11 days ago • 151

Program-as-Weights: A Programming Paradigm for Fuzzy Functions

Paper • 2607.02512 • Published Jul 2 • 309

liked a model 7 days ago

owensong/Inflect-Micro-v2

Text-to-Speech • Updated 3 days ago • 1.83k • 387

liked a model 8 days ago

meta-llama/Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Sep 25, 2024 • 7.89M • • 6.45k

upvoted 2 articles 9 days ago

Article

One Adapter, Both Modalities: Field Notes from Building and Serving a Multimodal Reranker

lightonai

•

18 days ago

• 19

Article

Bringing Nunchaku 4-bit Diffusion Inference to Diffusers

rootonchair, sayakpaul

•

11 days ago

• 62

liked a model 10 days ago

microsoft/harrier-oss-v1-270m

Feature Extraction • 0.3B • Updated Mar 30 • 289k • • 188