Open to Work

9 33 260

P.M.SALMAN KHAN

salmankhanpm

https://salmankhanpm.me

AI & ML interests

NLP - LLM - AI SAFETY

Recent Activity

liked a model about 3 hours ago

Qwen/Qwen3.5-0.8B

upvoted a changelog 1 day ago

Introducing Kernels

upvoted a changelog 1 day ago

Spaces agents.md for your coding agents

View all activity

Organizations

upvoted 3 changelogs 1 day ago

Hugging Face Changelog

Introducing Kernels

Apr 15

• 188

Hugging Face Changelog

Spaces agents.md for your coding agents

Apr 17

• 318

Hugging Face Changelog

Filter Leaderboards by Model Size

3 days ago

• 95

upvoted a paper 10 days ago

δ-mem: Efficient Online Memory for Large Language Models

Paper • 2605.12357 • Published 11 days ago • 120

upvoted a paper 11 days ago

Konkani LLM: Multi-Script Instruction Tuning and Evaluation for a Low-Resource Indian Language

Paper • 2603.23529 • Published Mar 7 • 1

upvoted an article 12 days ago

Article

Pallas for people who know JAX but not kernels yet

ariG23498

•

24 days ago

• 21

upvoted an article about 1 month ago

Article

Multilingual Tool Calling in 70+ Languages, On Device

Bronsn

•

Apr 20

• 11

upvoted a collection 3 months ago

Qwen3.5-abliterated

Collection

22 items • Updated Apr 6 • 81

upvoted an article 3 months ago

Article

Mixture of Experts (MoEs) in Transformers

ariG23498, pcuenq, merve, IlyasMoutawwakil, ArthurZ, sergiopaniego, Molbap

•

Feb 26

• 161

upvoted a collection 3 months ago

📝 Research & Long-Form Blog Posts

Collection

In-depth technical articles and research pieces published by Hugging Face • 15 items • Updated about 21 hours ago • 21

upvoted a paper 4 months ago

Post-LayerNorm Is Back: Stable, ExpressivE, and Deep

Paper • 2601.19895 • Published Jan 27 • 27

upvoted 2 articles 4 months ago

Article

Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

•

Jan 27

• 75

Article

We Got Claude to Build CUDA Kernels and teach open models!

burtenshaw, evalstate, merve, pcuenq

•

Jan 28

• 156

upvoted 3 collections 4 months ago

upvoted a collection 5 months ago

Languages identification

Collection

a variety of pre-trained language identification models • 9 items • Updated Jul 31, 2025 • 2

upvoted a paper 6 months ago

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12, 2025 • 129

upvoted an article 6 months ago

Article

⛳ Optimizer: What Does It Do and Why We Need It

onekq

•

Nov 12, 2025

• 7

upvoted an article 7 months ago

Article

Visualize and understand GPU memory in PyTorch

qgallouedec

•

Dec 24, 2024

• 271

P.M.SALMAN KHAN

AI & ML interests

Recent Activity

Organizations

salmankhanpm's activity

Introducing Kernels

Spaces agents.md for your coding agents

Filter Leaderboards by Model Size

Pallas for people who know JAX but not kernels yet

Multilingual Tool Calling in 70+ Languages, On Device

Mixture of Experts (MoEs) in Transformers

Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

We Got Claude to Build CUDA Kernels and teach open models!

⛳ Optimizer: What Does It Do and Why We Need It

Visualize and understand GPU memory in PyTorch