Llama 3.1 8B Instruct

Chat model by Meta · 8.03B parameters · Released 2024-07-18

Chip

Unified Memory

Bandwidth 307 GB/s

Available for Models ~21 GB

Runs Excellently

Llama 3.1 8B Instruct fits comfortably in your 24 GB Mac using Q8_0 quantization, using 39% of your RAM.

~20 tok/s

Q8_0 · 9.5 GB

Quantization Options

Quantization	Memory	Speed	Fits?
Q8_0 Recommended	9.5 GB	~20 tok/s	✓
Q6_K	7.5 GB	~26 tok/s	✓
Q5_K_M	6.5 GB	~31 tok/s	✓
Q4_K_M	5.7 GB	~36 tok/s	✓
Q3_K_M	4.9 GB	~44 tok/s	✓
Q2_K	4.0 GB	~57 tok/s	✓

Specifications

Parameters8.0B

Architecturellama

Context Length4K

CategoryChat

Capabilitiestool_use

Formatgguf

Minimum RAM4.5 GB

HuggingFace Downloads8,638,962

GGUF Sources

unsloth

View on HuggingFace →

Which Mac Can Run Llama 3.1 8B Instruct?

Minimum Mac

MacBook Air — M6 16GB

Q8_0 · ~13 tok/s · 59% RAM

Mac	Quant	tok/s	RAM %
MacBook Pro 16" · M6 Ultra 192GB	Q8_0	~120	5%
MacBook Pro 16" · M6 Ultra 256GB	Q8_0	~120	4%
MacBook Pro 16" · M6 Ultra 384GB	Q8_0	~120	2%
Mac Studio · M6 Ultra 192GB	Q8_0	~120	5%
Mac Studio · M6 Ultra 256GB	Q8_0	~120	4%
Mac Studio · M6 Ultra 384GB	Q8_0	~120	2%
Mac Studio · M5 Ultra 128GB	Q8_0	~80	7%
Mac Studio · M5 Ultra 192GB	Q8_0	~80	5%
Mac Studio · M5 Ultra 256GB	Q8_0	~80	4%
MacBook Pro 14" · M6 Max 48GB	Q8_0	~60	20%
MacBook Pro 14" · M6 Max 64GB	Q8_0	~60	15%
MacBook Pro 14" · M6 Max 128GB	Q8_0	~60	7%
MacBook Pro 14" · M6 Max 192GB	Q8_0	~60	5%
MacBook Pro 16" · M6 Max 48GB	Q8_0	~60	20%
MacBook Pro 16" · M6 Max 64GB	Q8_0	~60	15%
MacBook Pro 16" · M6 Max 128GB	Q8_0	~60	7%
MacBook Pro 16" · M6 Max 192GB	Q8_0	~60	5%
Mac Studio · M6 Max 48GB	Q8_0	~60	20%
Mac Studio · M6 Max 64GB	Q8_0	~60	15%
Mac Studio · M6 Max 128GB	Q8_0	~60	7%
Mac Studio · M6 Max 192GB	Q8_0	~60	5%
Mac Studio · M1 Ultra 64GB	Q8_0	~52	15%
Mac Studio · M1 Ultra 128GB	Q8_0	~52	7%
Mac Studio · M2 Ultra 64GB	Q8_0	~52	15%
Mac Studio · M2 Ultra 96GB	Q8_0	~52	10%
Mac Studio · M2 Ultra 128GB	Q8_0	~52	7%
Mac Studio · M2 Ultra 192GB	Q8_0	~52	5%
Mac Studio · M3 Ultra 96GB	Q8_0	~52	10%
Mac Studio · M3 Ultra 192GB	Q8_0	~52	5%
MacBook Pro 14" · M5 Max 36GB	Q8_0	~40	26%
MacBook Pro 14" · M5 Max 48GB	Q8_0	~40	20%
MacBook Pro 14" · M5 Max 64GB	Q8_0	~40	15%
MacBook Pro 14" · M5 Max 128GB	Q8_0	~40	7%
MacBook Pro 16" · M5 Max 36GB	Q8_0	~40	26%
MacBook Pro 16" · M5 Max 48GB	Q8_0	~40	20%
MacBook Pro 16" · M5 Max 64GB	Q8_0	~40	15%
MacBook Pro 16" · M5 Max 128GB	Q8_0	~40	7%
Mac Studio · M5 Max 36GB	Q8_0	~40	26%
Mac Studio · M5 Max 64GB	Q8_0	~40	15%
Mac Studio · M5 Max 128GB	Q8_0	~40	7%
MacBook Pro 16" · M4 Max 36GB	Q8_0	~36	26%
MacBook Pro 16" · M4 Max 48GB	Q8_0	~36	20%
MacBook Pro 16" · M4 Max 64GB	Q8_0	~36	15%
MacBook Pro 16" · M4 Max 128GB	Q8_0	~36	7%
Mac Studio · M4 Max 36GB	Q8_0	~36	26%
Mac Studio · M4 Max 64GB	Q8_0	~36	15%
Mac Studio · M4 Max 128GB	Q8_0	~36	7%
MacBook Pro 14" · M6 Pro 24GB	Q8_0	~27	39%
MacBook Pro 14" · M6 Pro 48GB	Q8_0	~27	20%
MacBook Pro 14" · M6 Pro 64GB	Q8_0	~27	15%
MacBook Pro 16" · M6 Pro 24GB	Q8_0	~27	39%
MacBook Pro 16" · M6 Pro 48GB	Q8_0	~27	20%
MacBook Pro 16" · M6 Pro 64GB	Q8_0	~27	15%
Mac Mini · M6 Pro 24GB	Q8_0	~27	39%
Mac Mini · M6 Pro 48GB	Q8_0	~27	20%
Mac Mini · M6 Pro 64GB	Q8_0	~27	15%
MacBook Pro 16" · M1 Max 32GB	Q8_0	~26	30%
MacBook Pro 16" · M1 Max 64GB	Q8_0	~26	15%
MacBook Pro 16" · M2 Max 32GB	Q8_0	~26	30%
MacBook Pro 16" · M2 Max 64GB	Q8_0	~26	15%
MacBook Pro 16" · M2 Max 96GB	Q8_0	~26	10%
MacBook Pro 16" · M3 Max 36GB	Q8_0	~26	26%
MacBook Pro 16" · M3 Max 48GB	Q8_0	~26	20%
MacBook Pro 16" · M3 Max 64GB	Q8_0	~26	15%
MacBook Pro 16" · M3 Max 96GB	Q8_0	~26	10%
MacBook Pro 16" · M3 Max 128GB	Q8_0	~26	7%
Mac Studio · M1 Max 32GB	Q8_0	~26	30%
Mac Studio · M1 Max 64GB	Q8_0	~26	15%
Mac Studio · M2 Max 32GB	Q8_0	~26	30%
Mac Studio · M2 Max 64GB	Q8_0	~26	15%
Mac Studio · M2 Max 96GB	Q8_0	~26	10%
MacBook Pro 14" · M5 Pro 24GB	Q8_0	~20	39%
MacBook Pro 14" · M5 Pro 48GB	Q8_0	~20	20%
MacBook Pro 14" · M5 Pro 64GB	Q8_0	~20	15%
MacBook Pro 16" · M5 Pro 24GB	Q8_0	~20	39%
MacBook Pro 16" · M5 Pro 48GB	Q8_0	~20	20%
MacBook Pro 14" · M4 Pro 24GB	Q8_0	~18	39%
MacBook Pro 14" · M4 Pro 48GB	Q8_0	~18	20%
MacBook Pro 16" · M4 Pro 24GB	Q8_0	~18	39%
MacBook Pro 16" · M4 Pro 48GB	Q8_0	~18	20%
Mac Mini · M4 Pro 24GB	Q8_0	~18	39%
Mac Mini · M4 Pro 48GB	Q8_0	~18	20%
MacBook Air · M6 16GB	Q8_0	~13	59%
MacBook Air · M6 24GB	Q8_0	~13	39%
MacBook Air · M6 32GB	Q8_0	~13	30%
MacBook Pro 14" · M6 16GB	Q8_0	~13	59%
MacBook Pro 14" · M6 24GB	Q8_0	~13	39%
MacBook Pro 14" · M6 32GB	Q8_0	~13	30%
Mac Mini · M6 16GB	Q8_0	~13	59%
Mac Mini · M6 24GB	Q8_0	~13	39%
Mac Mini · M6 32GB	Q8_0	~13	30%
iMac · M6 16GB	Q8_0	~13	59%
iMac · M6 24GB	Q8_0	~13	39%
iMac · M6 32GB	Q8_0	~13	30%
MacBook Pro 14" · M1 Pro 16GB	Q8_0	~13	59%
MacBook Pro 14" · M1 Pro 32GB	Q8_0	~13	30%
MacBook Pro 14" · M2 Pro 16GB	Q8_0	~13	59%
MacBook Pro 14" · M2 Pro 32GB	Q8_0	~13	30%
MacBook Pro 16" · M1 Pro 16GB	Q8_0	~13	59%
MacBook Pro 16" · M1 Pro 32GB	Q8_0	~13	30%
MacBook Pro 16" · M2 Pro 16GB	Q8_0	~13	59%
MacBook Pro 16" · M2 Pro 32GB	Q8_0	~13	30%
Mac Mini · M2 Pro 16GB	Q8_0	~13	59%
Mac Mini · M2 Pro 32GB	Q8_0	~13	30%
MacBook Air · M5 16GB	Q8_0	~10	59%
MacBook Air · M5 24GB	Q8_0	~10	39%
MacBook Air · M5 32GB	Q8_0	~10	30%
MacBook Pro 14" · M5 16GB	Q8_0	~10	59%
MacBook Pro 14" · M5 24GB	Q8_0	~10	39%
MacBook Pro 14" · M5 32GB	Q8_0	~10	30%
MacBook Pro 14" · M3 Pro 18GB	Q8_0	~10	53%
MacBook Pro 14" · M3 Pro 36GB	Q8_0	~10	26%
MacBook Pro 16" · M3 Pro 18GB	Q8_0	~10	53%
MacBook Pro 16" · M3 Pro 36GB	Q8_0	~10	26%
MacBook Air · M4 16GB	Q8_0	~8	59%
MacBook Air · M4 24GB	Q8_0	~8	39%
MacBook Air · M4 32GB	Q8_0	~8	30%
Mac Mini · M4 16GB	Q8_0	~8	59%
Mac Mini · M4 24GB	Q8_0	~8	39%
Mac Mini · M4 32GB	Q8_0	~8	30%
iMac · M4 16GB	Q8_0	~8	59%
iMac · M4 24GB	Q8_0	~8	39%
iMac · M4 32GB	Q8_0	~8	30%
MacBook Air · M2 16GB	Q8_0	~7	59%
MacBook Air · M2 24GB	Q8_0	~7	39%
MacBook Air · M3 16GB	Q8_0	~7	59%
MacBook Air · M3 24GB	Q8_0	~7	39%
Mac Mini · M2 16GB	Q8_0	~7	59%
Mac Mini · M2 24GB	Q8_0	~7	39%
iMac · M3 16GB	Q8_0	~7	59%
iMac · M3 24GB	Q8_0	~7	39%
MacBook Air · M1 16GB	Q8_0	~4	59%
Mac Mini · M1 16GB	Q8_0	~4	59%
iMac · M1 16GB	Q8_0	~4	59%
MacBook Air · M2 8GB	Q5_K_M	~10	81%
MacBook Air · M3 8GB	Q5_K_M	~10	81%
Mac Mini · M2 8GB	Q5_K_M	~10	81%
iMac · M3 8GB	Q5_K_M	~10	81%
MacBook Air · M1 8GB	Q5_K_M	~7	81%
Mac Mini · M1 8GB	Q5_K_M	~7	81%
iMac · M1 8GB	Q5_K_M	~7	81%

Run Llama 3.1 8B Instruct locally on your Mac

ToolPiper downloads, manages, and runs models with one click. Apple Silicon optimized.

Get ToolPiper — Free

Runs Excellently

Quantization Options

Specifications

Which Mac Can Run Llama 3.1 8B Instruct?

Run Llama 3.1 8B Instruct locally on your Mac

AI Providers