Llama 4 Scout 17B 16E Instruct quantized.w4a16

Chat model by redhatai · 19.6B parameters

Chip

Unified Memory

Bandwidth 307 GB/s

Available for Models ~21 GB

Runs Excellently

Llama 4 Scout 17B 16E Instruct quantized.w4a16 fits comfortably in your 24 GB Mac using Q6_K quantization, using 73% of your RAM.

~98 tok/s

Q6_K · 17.5 GB

Quantization Options

Quantization	Memory	Speed	Fits?
Q8_0	22.4 GB	~75 tok/s	✗
Q6_K Recommended	17.5 GB	~98 tok/s	✓
Q5_K_M	15.1 GB	~116 tok/s	✓
Q4_K_M	13.2 GB	~136 tok/s	✓
Q3_K_M	11.2 GB	~164 tok/s	✓
Q2_K	9.0 GB	~213 tok/s	✓

Specifications

Parameters19.6B

Architecturellama4

Context Length10.5M

CategoryChat

Mixture of Experts 16 experts, 1 active

Formatgguf

Minimum RAM11 GB

HuggingFace Downloads24,887

View on HuggingFace →

Which Mac Can Run Llama 4 Scout 17B 16E Instruct quantized.w4a16?

Minimum Mac

MacBook Pro 14" — M6 Pro 24GB

Q6_K · ~131 tok/s · 73% RAM

Mac	Quant	tok/s	RAM %
MacBook Pro 16" · M6 Ultra 192GB	Q8_0	~450	12%
MacBook Pro 16" · M6 Ultra 256GB	Q8_0	~450	9%
MacBook Pro 16" · M6 Ultra 384GB	Q8_0	~450	6%
Mac Studio · M6 Ultra 192GB	Q8_0	~450	12%
Mac Studio · M6 Ultra 256GB	Q8_0	~450	9%
Mac Studio · M6 Ultra 384GB	Q8_0	~450	6%
Mac Studio · M5 Ultra 128GB	Q8_0	~300	17%
Mac Studio · M5 Ultra 192GB	Q8_0	~300	12%
Mac Studio · M5 Ultra 256GB	Q8_0	~300	9%
MacBook Pro 14" · M6 Max 48GB	Q8_0	~225	47%
MacBook Pro 14" · M6 Max 64GB	Q8_0	~225	35%
MacBook Pro 14" · M6 Max 128GB	Q8_0	~225	17%
MacBook Pro 14" · M6 Max 192GB	Q8_0	~225	12%
MacBook Pro 16" · M6 Max 48GB	Q8_0	~225	47%
MacBook Pro 16" · M6 Max 64GB	Q8_0	~225	35%
MacBook Pro 16" · M6 Max 128GB	Q8_0	~225	17%
MacBook Pro 16" · M6 Max 192GB	Q8_0	~225	12%
Mac Studio · M6 Max 48GB	Q8_0	~225	47%
Mac Studio · M6 Max 64GB	Q8_0	~225	35%
Mac Studio · M6 Max 128GB	Q8_0	~225	17%
Mac Studio · M6 Max 192GB	Q8_0	~225	12%
Mac Studio · M1 Ultra 64GB	Q8_0	~195	35%
Mac Studio · M1 Ultra 128GB	Q8_0	~195	17%
Mac Studio · M2 Ultra 64GB	Q8_0	~195	35%
Mac Studio · M2 Ultra 96GB	Q8_0	~195	23%
Mac Studio · M2 Ultra 128GB	Q8_0	~195	17%
Mac Studio · M2 Ultra 192GB	Q8_0	~195	12%
Mac Studio · M3 Ultra 96GB	Q8_0	~195	23%
Mac Studio · M3 Ultra 192GB	Q8_0	~195	12%
MacBook Pro 14" · M5 Max 36GB	Q8_0	~150	62%
MacBook Pro 14" · M5 Max 48GB	Q8_0	~150	47%
MacBook Pro 14" · M5 Max 64GB	Q8_0	~150	35%
MacBook Pro 14" · M5 Max 128GB	Q8_0	~150	17%
MacBook Pro 16" · M5 Max 36GB	Q8_0	~150	62%
MacBook Pro 16" · M5 Max 48GB	Q8_0	~150	47%
MacBook Pro 16" · M5 Max 64GB	Q8_0	~150	35%
MacBook Pro 16" · M5 Max 128GB	Q8_0	~150	17%
Mac Studio · M5 Max 36GB	Q8_0	~150	62%
Mac Studio · M5 Max 64GB	Q8_0	~150	35%
Mac Studio · M5 Max 128GB	Q8_0	~150	17%
MacBook Pro 16" · M4 Max 36GB	Q8_0	~133	62%
MacBook Pro 16" · M4 Max 48GB	Q8_0	~133	47%
MacBook Pro 16" · M4 Max 64GB	Q8_0	~133	35%
MacBook Pro 16" · M4 Max 128GB	Q8_0	~133	17%
Mac Studio · M4 Max 36GB	Q8_0	~133	62%
Mac Studio · M4 Max 64GB	Q8_0	~133	35%
Mac Studio · M4 Max 128GB	Q8_0	~133	17%
MacBook Pro 14" · M6 Pro 24GB	Q6_K	~131	73%
MacBook Pro 16" · M6 Pro 24GB	Q6_K	~131	73%
Mac Mini · M6 Pro 24GB	Q6_K	~131	73%
MacBook Pro 14" · M6 Pro 48GB	Q8_0	~100	47%
MacBook Pro 14" · M6 Pro 64GB	Q8_0	~100	35%
MacBook Pro 16" · M6 Pro 48GB	Q8_0	~100	47%
MacBook Pro 16" · M6 Pro 64GB	Q8_0	~100	35%
Mac Mini · M6 Pro 48GB	Q8_0	~100	47%
Mac Mini · M6 Pro 64GB	Q8_0	~100	35%
MacBook Pro 14" · M5 Pro 24GB	Q6_K	~98	73%
MacBook Pro 16" · M5 Pro 24GB	Q6_K	~98	73%
MacBook Pro 16" · M1 Max 32GB	Q8_0	~98	70%
MacBook Pro 16" · M1 Max 64GB	Q8_0	~98	35%
MacBook Pro 16" · M2 Max 32GB	Q8_0	~98	70%
MacBook Pro 16" · M2 Max 64GB	Q8_0	~98	35%
MacBook Pro 16" · M2 Max 96GB	Q8_0	~98	23%
MacBook Pro 16" · M3 Max 36GB	Q8_0	~98	62%
MacBook Pro 16" · M3 Max 48GB	Q8_0	~98	47%
MacBook Pro 16" · M3 Max 64GB	Q8_0	~98	35%
MacBook Pro 16" · M3 Max 96GB	Q8_0	~98	23%
MacBook Pro 16" · M3 Max 128GB	Q8_0	~98	17%
Mac Studio · M1 Max 32GB	Q8_0	~98	70%
Mac Studio · M1 Max 64GB	Q8_0	~98	35%
Mac Studio · M2 Max 32GB	Q8_0	~98	70%
Mac Studio · M2 Max 64GB	Q8_0	~98	35%
Mac Studio · M2 Max 96GB	Q8_0	~98	23%
MacBook Pro 14" · M4 Pro 24GB	Q6_K	~88	73%
MacBook Pro 16" · M4 Pro 24GB	Q6_K	~88	73%
Mac Mini · M4 Pro 24GB	Q6_K	~88	73%
MacBook Pro 14" · M5 Pro 48GB	Q8_0	~75	47%
MacBook Pro 14" · M5 Pro 64GB	Q8_0	~75	35%
MacBook Pro 16" · M5 Pro 48GB	Q8_0	~75	47%
MacBook Pro 14" · M4 Pro 48GB	Q8_0	~67	47%
MacBook Pro 16" · M4 Pro 48GB	Q8_0	~67	47%
Mac Mini · M4 Pro 48GB	Q8_0	~67	47%
MacBook Air · M6 24GB	Q6_K	~65	73%
MacBook Pro 14" · M6 24GB	Q6_K	~65	73%
Mac Mini · M6 24GB	Q6_K	~65	73%
iMac · M6 24GB	Q6_K	~65	73%
MacBook Air · M6 32GB	Q8_0	~50	70%
MacBook Pro 14" · M6 32GB	Q8_0	~50	70%
Mac Mini · M6 32GB	Q8_0	~50	70%
iMac · M6 32GB	Q8_0	~50	70%
MacBook Air · M5 24GB	Q6_K	~49	73%
MacBook Pro 14" · M5 24GB	Q6_K	~49	73%
MacBook Pro 14" · M1 Pro 32GB	Q8_0	~49	70%
MacBook Pro 14" · M2 Pro 32GB	Q8_0	~49	70%
MacBook Pro 16" · M1 Pro 32GB	Q8_0	~49	70%
MacBook Pro 16" · M2 Pro 32GB	Q8_0	~49	70%
Mac Mini · M2 Pro 32GB	Q8_0	~49	70%
MacBook Air · M4 24GB	Q6_K	~38	73%
Mac Mini · M4 24GB	Q6_K	~38	73%
iMac · M4 24GB	Q6_K	~38	73%
MacBook Air · M5 32GB	Q8_0	~38	70%
MacBook Pro 14" · M5 32GB	Q8_0	~38	70%
MacBook Pro 14" · M3 Pro 36GB	Q8_0	~37	62%
MacBook Pro 16" · M3 Pro 36GB	Q8_0	~37	62%
MacBook Air · M2 24GB	Q6_K	~32	73%
MacBook Air · M3 24GB	Q6_K	~32	73%
Mac Mini · M2 24GB	Q6_K	~32	73%
iMac · M3 24GB	Q6_K	~32	73%
MacBook Air · M4 32GB	Q8_0	~29	70%
Mac Mini · M4 32GB	Q8_0	~29	70%
iMac · M4 32GB	Q8_0	~29	70%
MacBook Air · M6 16GB	Q4_K_M	~90	82%
MacBook Pro 14" · M6 16GB	Q4_K_M	~90	82%
Mac Mini · M6 16GB	Q4_K_M	~90	82%
iMac · M6 16GB	Q4_K_M	~90	82%
MacBook Pro 14" · M1 Pro 16GB	Q4_K_M	~88	82%
MacBook Pro 14" · M2 Pro 16GB	Q4_K_M	~88	82%
MacBook Pro 16" · M1 Pro 16GB	Q4_K_M	~88	82%
MacBook Pro 16" · M2 Pro 16GB	Q4_K_M	~88	82%
Mac Mini · M2 Pro 16GB	Q4_K_M	~88	82%
MacBook Air · M5 16GB	Q4_K_M	~68	82%
MacBook Pro 14" · M5 16GB	Q4_K_M	~68	82%
MacBook Pro 14" · M3 Pro 18GB	Q5_K_M	~57	84%
MacBook Pro 16" · M3 Pro 18GB	Q5_K_M	~57	84%
MacBook Air · M4 16GB	Q4_K_M	~53	82%
Mac Mini · M4 16GB	Q4_K_M	~53	82%
iMac · M4 16GB	Q4_K_M	~53	82%
MacBook Air · M2 16GB	Q4_K_M	~44	82%
MacBook Air · M3 16GB	Q4_K_M	~44	82%
Mac Mini · M2 16GB	Q4_K_M	~44	82%
iMac · M3 16GB	Q4_K_M	~44	82%
MacBook Air · M1 16GB	Q4_K_M	~30	82%
Mac Mini · M1 16GB	Q4_K_M	~30	82%
iMac · M1 16GB	Q4_K_M	~30	82%
MacBook Air · M2 8GB	—	—	113%
MacBook Air · M3 8GB	—	—	113%
Mac Mini · M2 8GB	—	—	113%
iMac · M3 8GB	—	—	113%
MacBook Air · M1 8GB	—	—	113%
Mac Mini · M1 8GB	—	—	113%
iMac · M1 8GB	—	—	113%

Run Llama 4 Scout 17B 16E Instruct quantized.w4a16 locally on your Mac

ToolPiper downloads, manages, and runs models with one click. Apple Silicon optimized.

Get ToolPiper — Free

Runs Excellently

Quantization Options

Specifications

Which Mac Can Run Llama 4 Scout 17B 16E Instruct quantized.w4a16?

Run Llama 4 Scout 17B 16E Instruct quantized.w4a16 locally on your Mac

AI Providers