Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

66

Full-text search

Active filters: fp4

cybermotaz/nemotron3-nano-nvfp4-w4a16

Text Generation • 18B • Updated 9 days ago • 2.72k • 6

nvidia/Kimi-K2-Thinking-NVFP4

Text Generation • Updated 15 days ago • 6.1k • 15

cybermotaz/Qwen3-Omni-30B-A3B-Instruct-NVFP4

Text Generation • Updated 2 days ago • 1

mengqin1/RedidreamNSFWI1-bnb-4bit

qingcheng-ai/QwQ-32B-fp4

Text Generation • 19B • Updated Jun 24 • 48 • 3

qingcheng-ai/Qwen3-32B-fp4

Text Generation • 19B • Updated May 19 • 98 • 4

qingcheng-ai/Qwen3-8B-fp4

Text Generation • 5B • Updated May 19 • 31 • 1

RedHatAI/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated 23 days ago • 972 • 2

RedHatAI/Llama-3.1-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21 • 87

RedHatAI/Llama-3.1-70B-Instruct-NVFP4A16

Text Generation • 41B • Updated Jun 30 • 7

RedHatAI/Qwen3-32B-NVFP4

Text Generation • 19B • Updated Nov 21 • 421 • 4

RedHatAI/Qwen3-32B-NVFP4A16

Text Generation • 19B • Updated Jun 30 • 6.75k • 2

nvidia/Qwen3-235B-A22B-NVFP4

Text Generation • 133B • Updated Jul 8 • 3.2k • 8

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10 • 38.9k • 17

RedHatAI/Llama-4-Scout-17B-16E-Instruct-NVFP4

Text Generation • 64B • Updated Nov 21 • 1.02k

apolloparty/Qwen3-4B-NVFP4A16

2B • Updated Jul 12 • 12

Tonic/petite-elle-L-aime-3-sft

Text Generation • 3B • Updated Aug 2 • 44 • 1

mradermacher/petite-elle-L-aime-3-sft-GGUF

Text Generation • 3B • Updated Jul 29 • 122 • 1

nm-testing/DeepSeek-R1-Distill-Qwen-32B-NVFP4

Text Generation • 19B • Updated Nov 21 • 128

2imi9/Qwen3-4B-NVFP4A16

Text Generation • 2B • Updated Aug 27 • 52

2imi9/Qwen3-1.7B-NVFP4A16

Text Generation • 1B • Updated Aug 27 • 6 • 1

ELVISIO/Qwen3-8B-NVFP4A16

Text Generation • 5B • Updated Aug 4 • 9

RedHatAI/Llama-3.3-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21 • 145 • 1

AlekseyCalvin/QWEN_IMAGE_fp4_w_AbliteratedTE_Diffusers

Text-to-Image • Updated Aug 6 • 88 • 7

imgailab/flux1-trtx-dev-fp4-blackwell

Updated Aug 12 • 12 • 1

imgailab/flux1-trtx-schnell-fp4-blackwell

Updated Aug 12 • 10 • 1

llmat/Mistral-7B-Instruct-v0.3-NVFP4

Text Generation • 4B • Updated Aug 27 • 7

llmat/Mistral-Small-Instruct-2409-NVFP4

Text Generation • 13B • Updated Aug 27 • 371

2imi9/gpt-oss-20B-NVFP4A16-BF16

Text Generation • 21B • Updated 8 days ago • 1.7k • 2

nvidia/Phi-4-multimodal-instruct-NVFP4

4B • Updated Sep 5 • 1.61k • 6