HLWQ Unified (Weights Q5 + KV Cache Q3)

caiovicentino1 's Collections

HLWQ Large MoE (100B+)

HLWQ Models

HLWQ Video & Diffusion Models

HLWQ Gemma Models

Nemotron 30B — Consumer GPU Inference

HLWQ Unified (Weights Q5 + KV Cache Q3)

HLWQ MLX (Apple Silicon)

Large Models (27B-35B) HLWQ

Qwen3.5-4B EOQ Quantized

Qwen2.5 EOQ Quantized

Qwen3.5-9B HLWQ

EOQ Compressed Models

Qwen3.5-27B HLWQ

updated about 4 hours ago

Full-stack HLWQ: Q5 weights + torchao INT4 + Q3 KV cache · formerly PolarQuant Unified

Upvote

caiovicentino1/Qwopus3.5-9B-v3-PolarQuant-Q5

Text Generation • 9B • Updated 4 days ago • 2.37k • 8
caiovicentino1/Qwen3.5-9B-Claude-Opus-PolarQuant-Q5

Text Generation • 9B • Updated 6 days ago • 1.54k • 3
caiovicentino1/Qwen3.5-27B-Claude-Opus-PolarQuant-Q5

Text Generation • 27B • Updated 3 days ago • 1.82k
caiovicentino1/Qwopus3.5-9B-v3-PolarQuant-MLX-4bit

Text Generation • 1B • Updated 7 days ago • 1.58k • 6
caiovicentino1/Qwen3.5-9B-PolarQuant-Q5

Text Generation • 9B • Updated 6 days ago • 1.5k • 3
caiovicentino1/Qwen3.5-9B-PolarQuant-MLX-4bit

Text Generation • 1B • Updated 7 days ago • 1.96k • 3
caiovicentino1/Nemotron-Cascade-2-30B-A3B-PolarQuant-Q5

Text Generation • 20B • Updated 3 days ago • 2.36k • 7
caiovicentino1/Gemma-4-31B-it-PolarQuant-Q5

Text Generation • Updated 2 days ago • 1.31k • 4
caiovicentino1/Gemma-4-31B-it-PolarQuant-Q5-Vision

Image-Text-to-Text • Updated 2 days ago • 240 • 6
caiovicentino1/Gemma-4-26B-A4B-it-PolarQuant-Q5

Image-Text-to-Text • 27B • Updated 7 days ago • 264 • 5
caiovicentino1/Gemma-4-31B-Claude-Opus-PolarQuant-Q5-Vision

Image-Text-to-Text • Updated 2 days ago • 496 • 17
caiovicentino1/Qwopus3.5-27B-v3-PolarQuant-Q5

Text Generation • Updated 2 days ago • 2.29k • 16
caiovicentino1/Qwen3.5-9B-Neo-PolarQuant-Q5

Text Generation • Updated 2 days ago • 1.04k • 4
caiovicentino1/Gemma-4-E4B-it-PolarQuant-Multi

Any-to-Any • Updated 2 days ago • 255 • 2
caiovicentino1/HY-OmniWeaving-PolarQuant-Q5

Text-to-Video • Updated 2 days ago • 6
caiovicentino1/Gemopus-4-26B-A4B-it-HLWQ-Q5

Image-Text-to-Text • Updated about 3 hours ago

Note HLWQ Q5 · 16.6 GB · 27B Gemma-4 26B-A4B MoE · per-expert, consumer GPU ready
caiovicentino1/MiniMax-M2.7-HLWQ-Q5

Text Generation • Updated about 3 hours ago • 1

Note Full-stack HLWQ on MiniMax-M2.7 229B MoE

Upvote