Llama 3.2 1B Instruct FP8 dynamic

Chat model by redhatai · 1.5B parameters

Chip

Unified Memory

Bandwidth 307 GB/s

Available for Models ~21 GB

Runs Excellently

Llama 3.2 1B Instruct FP8 dynamic fits comfortably in your 24 GB Mac using Q8_0 quantization, using 9% of your RAM.

~107 tok/s

Q8_0 · 2.2 GB

Quantization Options

Quantization	Memory	Speed	Fits?
Q8_0 Recommended	2.2 GB	~107 tok/s	✓
Q6_K	1.8 GB	~141 tok/s	✓
Q5_K_M	1.6 GB	~166 tok/s	✓
Q4_K_M	1.5 GB	~194 tok/s	✓
Q3_K_M	1.3 GB	~235 tok/s	✓
Q2_K	1.2 GB	~304 tok/s	✓

Specifications

Parameters1.5B

Architecturellama

Context Length131K

CategoryChat

Capabilitiestool_use

Formatgguf

Minimum RAM1 GB

HuggingFace Downloads1,520,724

View on HuggingFace →

Which Mac Can Run Llama 3.2 1B Instruct FP8 dynamic?

Minimum Mac

MacBook Air — M2 8GB

Q8_0 · ~35 tok/s · 27% RAM

Mac	Quant	tok/s	RAM %
MacBook Pro 16" · M6 Ultra 192GB	Q8_0	~644	1%
MacBook Pro 16" · M6 Ultra 256GB	Q8_0	~644	1%
MacBook Pro 16" · M6 Ultra 384GB	Q8_0	~644	1%
Mac Studio · M6 Ultra 192GB	Q8_0	~644	1%
Mac Studio · M6 Ultra 256GB	Q8_0	~644	1%
Mac Studio · M6 Ultra 384GB	Q8_0	~644	1%
Mac Studio · M5 Ultra 128GB	Q8_0	~429	2%
Mac Studio · M5 Ultra 192GB	Q8_0	~429	1%
Mac Studio · M5 Ultra 256GB	Q8_0	~429	1%
MacBook Pro 14" · M6 Max 48GB	Q8_0	~322	5%
MacBook Pro 14" · M6 Max 64GB	Q8_0	~322	3%
MacBook Pro 14" · M6 Max 128GB	Q8_0	~322	2%
MacBook Pro 14" · M6 Max 192GB	Q8_0	~322	1%
MacBook Pro 16" · M6 Max 48GB	Q8_0	~322	5%
MacBook Pro 16" · M6 Max 64GB	Q8_0	~322	3%
MacBook Pro 16" · M6 Max 128GB	Q8_0	~322	2%
MacBook Pro 16" · M6 Max 192GB	Q8_0	~322	1%
Mac Studio · M6 Max 48GB	Q8_0	~322	5%
Mac Studio · M6 Max 64GB	Q8_0	~322	3%
Mac Studio · M6 Max 128GB	Q8_0	~322	2%
Mac Studio · M6 Max 192GB	Q8_0	~322	1%
Mac Studio · M1 Ultra 64GB	Q8_0	~279	3%
Mac Studio · M1 Ultra 128GB	Q8_0	~279	2%
Mac Studio · M2 Ultra 64GB	Q8_0	~279	3%
Mac Studio · M2 Ultra 96GB	Q8_0	~279	2%
Mac Studio · M2 Ultra 128GB	Q8_0	~279	2%
Mac Studio · M2 Ultra 192GB	Q8_0	~279	1%
Mac Studio · M3 Ultra 96GB	Q8_0	~279	2%
Mac Studio · M3 Ultra 192GB	Q8_0	~279	1%
MacBook Pro 14" · M5 Max 36GB	Q8_0	~214	6%
MacBook Pro 14" · M5 Max 48GB	Q8_0	~214	5%
MacBook Pro 14" · M5 Max 64GB	Q8_0	~214	3%
MacBook Pro 14" · M5 Max 128GB	Q8_0	~214	2%
MacBook Pro 16" · M5 Max 36GB	Q8_0	~214	6%
MacBook Pro 16" · M5 Max 48GB	Q8_0	~214	5%
MacBook Pro 16" · M5 Max 64GB	Q8_0	~214	3%
MacBook Pro 16" · M5 Max 128GB	Q8_0	~214	2%
Mac Studio · M5 Max 36GB	Q8_0	~214	6%
Mac Studio · M5 Max 64GB	Q8_0	~214	3%
Mac Studio · M5 Max 128GB	Q8_0	~214	2%
MacBook Pro 16" · M4 Max 36GB	Q8_0	~191	6%
MacBook Pro 16" · M4 Max 48GB	Q8_0	~191	5%
MacBook Pro 16" · M4 Max 64GB	Q8_0	~191	3%
MacBook Pro 16" · M4 Max 128GB	Q8_0	~191	2%
Mac Studio · M4 Max 36GB	Q8_0	~191	6%
Mac Studio · M4 Max 64GB	Q8_0	~191	3%
Mac Studio · M4 Max 128GB	Q8_0	~191	2%
MacBook Pro 14" · M6 Pro 24GB	Q8_0	~143	9%
MacBook Pro 14" · M6 Pro 48GB	Q8_0	~143	5%
MacBook Pro 14" · M6 Pro 64GB	Q8_0	~143	3%
MacBook Pro 16" · M6 Pro 24GB	Q8_0	~143	9%
MacBook Pro 16" · M6 Pro 48GB	Q8_0	~143	5%
MacBook Pro 16" · M6 Pro 64GB	Q8_0	~143	3%
Mac Mini · M6 Pro 24GB	Q8_0	~143	9%
Mac Mini · M6 Pro 48GB	Q8_0	~143	5%
Mac Mini · M6 Pro 64GB	Q8_0	~143	3%
MacBook Pro 16" · M1 Max 32GB	Q8_0	~140	7%
MacBook Pro 16" · M1 Max 64GB	Q8_0	~140	3%
MacBook Pro 16" · M2 Max 32GB	Q8_0	~140	7%
MacBook Pro 16" · M2 Max 64GB	Q8_0	~140	3%
MacBook Pro 16" · M2 Max 96GB	Q8_0	~140	2%
MacBook Pro 16" · M3 Max 36GB	Q8_0	~140	6%
MacBook Pro 16" · M3 Max 48GB	Q8_0	~140	5%
MacBook Pro 16" · M3 Max 64GB	Q8_0	~140	3%
MacBook Pro 16" · M3 Max 96GB	Q8_0	~140	2%
MacBook Pro 16" · M3 Max 128GB	Q8_0	~140	2%
Mac Studio · M1 Max 32GB	Q8_0	~140	7%
Mac Studio · M1 Max 64GB	Q8_0	~140	3%
Mac Studio · M2 Max 32GB	Q8_0	~140	7%
Mac Studio · M2 Max 64GB	Q8_0	~140	3%
Mac Studio · M2 Max 96GB	Q8_0	~140	2%
MacBook Pro 14" · M5 Pro 24GB	Q8_0	~107	9%
MacBook Pro 14" · M5 Pro 48GB	Q8_0	~107	5%
MacBook Pro 14" · M5 Pro 64GB	Q8_0	~107	3%
MacBook Pro 16" · M5 Pro 24GB	Q8_0	~107	9%
MacBook Pro 16" · M5 Pro 48GB	Q8_0	~107	5%
MacBook Pro 14" · M4 Pro 24GB	Q8_0	~95	9%
MacBook Pro 14" · M4 Pro 48GB	Q8_0	~95	5%
MacBook Pro 16" · M4 Pro 24GB	Q8_0	~95	9%
MacBook Pro 16" · M4 Pro 48GB	Q8_0	~95	5%
Mac Mini · M4 Pro 24GB	Q8_0	~95	9%
Mac Mini · M4 Pro 48GB	Q8_0	~95	5%
MacBook Air · M6 16GB	Q8_0	~71	14%
MacBook Air · M6 24GB	Q8_0	~71	9%
MacBook Air · M6 32GB	Q8_0	~71	7%
MacBook Pro 14" · M6 16GB	Q8_0	~71	14%
MacBook Pro 14" · M6 24GB	Q8_0	~71	9%
MacBook Pro 14" · M6 32GB	Q8_0	~71	7%
Mac Mini · M6 16GB	Q8_0	~71	14%
Mac Mini · M6 24GB	Q8_0	~71	9%
Mac Mini · M6 32GB	Q8_0	~71	7%
iMac · M6 16GB	Q8_0	~71	14%
iMac · M6 24GB	Q8_0	~71	9%
iMac · M6 32GB	Q8_0	~71	7%
MacBook Pro 14" · M1 Pro 16GB	Q8_0	~70	14%
MacBook Pro 14" · M1 Pro 32GB	Q8_0	~70	7%
MacBook Pro 14" · M2 Pro 16GB	Q8_0	~70	14%
MacBook Pro 14" · M2 Pro 32GB	Q8_0	~70	7%
MacBook Pro 16" · M1 Pro 16GB	Q8_0	~70	14%
MacBook Pro 16" · M1 Pro 32GB	Q8_0	~70	7%
MacBook Pro 16" · M2 Pro 16GB	Q8_0	~70	14%
MacBook Pro 16" · M2 Pro 32GB	Q8_0	~70	7%
Mac Mini · M2 Pro 16GB	Q8_0	~70	14%
Mac Mini · M2 Pro 32GB	Q8_0	~70	7%
MacBook Air · M5 16GB	Q8_0	~54	14%
MacBook Air · M5 24GB	Q8_0	~54	9%
MacBook Air · M5 32GB	Q8_0	~54	7%
MacBook Pro 14" · M5 16GB	Q8_0	~54	14%
MacBook Pro 14" · M5 24GB	Q8_0	~54	9%
MacBook Pro 14" · M5 32GB	Q8_0	~54	7%
MacBook Pro 14" · M3 Pro 18GB	Q8_0	~52	12%
MacBook Pro 14" · M3 Pro 36GB	Q8_0	~52	6%
MacBook Pro 16" · M3 Pro 18GB	Q8_0	~52	12%
MacBook Pro 16" · M3 Pro 36GB	Q8_0	~52	6%
MacBook Air · M4 16GB	Q8_0	~42	14%
MacBook Air · M4 24GB	Q8_0	~42	9%
MacBook Air · M4 32GB	Q8_0	~42	7%
Mac Mini · M4 16GB	Q8_0	~42	14%
Mac Mini · M4 24GB	Q8_0	~42	9%
Mac Mini · M4 32GB	Q8_0	~42	7%
iMac · M4 16GB	Q8_0	~42	14%
iMac · M4 24GB	Q8_0	~42	9%
iMac · M4 32GB	Q8_0	~42	7%
MacBook Air · M2 8GB	Q8_0	~35	27%
MacBook Air · M2 16GB	Q8_0	~35	14%
MacBook Air · M2 24GB	Q8_0	~35	9%
MacBook Air · M3 8GB	Q8_0	~35	27%
MacBook Air · M3 16GB	Q8_0	~35	14%
MacBook Air · M3 24GB	Q8_0	~35	9%
Mac Mini · M2 8GB	Q8_0	~35	27%
Mac Mini · M2 16GB	Q8_0	~35	14%
Mac Mini · M2 24GB	Q8_0	~35	9%
iMac · M3 8GB	Q8_0	~35	27%
iMac · M3 16GB	Q8_0	~35	14%
iMac · M3 24GB	Q8_0	~35	9%
MacBook Air · M1 8GB	Q8_0	~24	27%
MacBook Air · M1 16GB	Q8_0	~24	14%
Mac Mini · M1 8GB	Q8_0	~24	27%
Mac Mini · M1 16GB	Q8_0	~24	14%
iMac · M1 8GB	Q8_0	~24	27%
iMac · M1 16GB	Q8_0	~24	14%

Run Llama 3.2 1B Instruct FP8 dynamic locally on your Mac

ToolPiper downloads, manages, and runs models with one click. Apple Silicon optimized.

Get ToolPiper — Free

Runs Excellently

Quantization Options

Specifications

Which Mac Can Run Llama 3.2 1B Instruct FP8 dynamic?

Run Llama 3.2 1B Instruct FP8 dynamic locally on your Mac

AI Providers