Phi 3 mini 4k instruct gptq 4bit

Chat model by kaitchup · 3.82B parameters

Chip

Unified Memory

Bandwidth 307 GB/s

Available for Models ~21 GB

Runs Excellently

Phi 3 mini 4k instruct gptq 4bit fits comfortably in your 24 GB Mac using Q8_0 quantization, using 20% of your RAM.

~42 tok/s

Q8_0 · 4.8 GB

Quantization Options

Quantization	Memory	Speed	Fits?
Q8_0 Recommended	4.8 GB	~42 tok/s	✓
Q6_K	3.8 GB	~55 tok/s	✓
Q5_K_M	3.3 GB	~65 tok/s	✓
Q4_K_M	3.0 GB	~76 tok/s	✓
Q3_K_M	2.6 GB	~92 tok/s	✓
Q2_K	2.2 GB	~119 tok/s	✓

Specifications

Parameters3.8B

Architecturephi3

Context Length4K

CategoryChat

Formatgptq

Minimum RAM2.1 GB

HuggingFace Downloads1,335,919

View on HuggingFace →

Which Mac Can Run Phi 3 mini 4k instruct gptq 4bit?

Minimum Mac

MacBook Air — M2 8GB

Q8_0 · ~14 tok/s · 60% RAM

Mac	Quant	tok/s	RAM %
MacBook Pro 16" · M6 Ultra 192GB	Q8_0	~253	2%
MacBook Pro 16" · M6 Ultra 256GB	Q8_0	~253	2%
MacBook Pro 16" · M6 Ultra 384GB	Q8_0	~253	1%
Mac Studio · M6 Ultra 192GB	Q8_0	~253	2%
Mac Studio · M6 Ultra 256GB	Q8_0	~253	2%
Mac Studio · M6 Ultra 384GB	Q8_0	~253	1%
Mac Studio · M5 Ultra 128GB	Q8_0	~168	4%
Mac Studio · M5 Ultra 192GB	Q8_0	~168	2%
Mac Studio · M5 Ultra 256GB	Q8_0	~168	2%
MacBook Pro 14" · M6 Max 48GB	Q8_0	~126	10%
MacBook Pro 14" · M6 Max 64GB	Q8_0	~126	7%
MacBook Pro 14" · M6 Max 128GB	Q8_0	~126	4%
MacBook Pro 14" · M6 Max 192GB	Q8_0	~126	2%
MacBook Pro 16" · M6 Max 48GB	Q8_0	~126	10%
MacBook Pro 16" · M6 Max 64GB	Q8_0	~126	7%
MacBook Pro 16" · M6 Max 128GB	Q8_0	~126	4%
MacBook Pro 16" · M6 Max 192GB	Q8_0	~126	2%
Mac Studio · M6 Max 48GB	Q8_0	~126	10%
Mac Studio · M6 Max 64GB	Q8_0	~126	7%
Mac Studio · M6 Max 128GB	Q8_0	~126	4%
Mac Studio · M6 Max 192GB	Q8_0	~126	2%
Mac Studio · M1 Ultra 64GB	Q8_0	~110	7%
Mac Studio · M1 Ultra 128GB	Q8_0	~110	4%
Mac Studio · M2 Ultra 64GB	Q8_0	~110	7%
Mac Studio · M2 Ultra 96GB	Q8_0	~110	5%
Mac Studio · M2 Ultra 128GB	Q8_0	~110	4%
Mac Studio · M2 Ultra 192GB	Q8_0	~110	2%
Mac Studio · M3 Ultra 96GB	Q8_0	~110	5%
Mac Studio · M3 Ultra 192GB	Q8_0	~110	2%
MacBook Pro 14" · M5 Max 36GB	Q8_0	~84	13%
MacBook Pro 14" · M5 Max 48GB	Q8_0	~84	10%
MacBook Pro 14" · M5 Max 64GB	Q8_0	~84	7%
MacBook Pro 14" · M5 Max 128GB	Q8_0	~84	4%
MacBook Pro 16" · M5 Max 36GB	Q8_0	~84	13%
MacBook Pro 16" · M5 Max 48GB	Q8_0	~84	10%
MacBook Pro 16" · M5 Max 64GB	Q8_0	~84	7%
MacBook Pro 16" · M5 Max 128GB	Q8_0	~84	4%
Mac Studio · M5 Max 36GB	Q8_0	~84	13%
Mac Studio · M5 Max 64GB	Q8_0	~84	7%
Mac Studio · M5 Max 128GB	Q8_0	~84	4%
MacBook Pro 16" · M4 Max 36GB	Q8_0	~75	13%
MacBook Pro 16" · M4 Max 48GB	Q8_0	~75	10%
MacBook Pro 16" · M4 Max 64GB	Q8_0	~75	7%
MacBook Pro 16" · M4 Max 128GB	Q8_0	~75	4%
Mac Studio · M4 Max 36GB	Q8_0	~75	13%
Mac Studio · M4 Max 64GB	Q8_0	~75	7%
Mac Studio · M4 Max 128GB	Q8_0	~75	4%
MacBook Pro 14" · M6 Pro 24GB	Q8_0	~56	20%
MacBook Pro 14" · M6 Pro 48GB	Q8_0	~56	10%
MacBook Pro 14" · M6 Pro 64GB	Q8_0	~56	7%
MacBook Pro 16" · M6 Pro 24GB	Q8_0	~56	20%
MacBook Pro 16" · M6 Pro 48GB	Q8_0	~56	10%
MacBook Pro 16" · M6 Pro 64GB	Q8_0	~56	7%
Mac Mini · M6 Pro 24GB	Q8_0	~56	20%
Mac Mini · M6 Pro 48GB	Q8_0	~56	10%
Mac Mini · M6 Pro 64GB	Q8_0	~56	7%
MacBook Pro 16" · M1 Max 32GB	Q8_0	~55	15%
MacBook Pro 16" · M1 Max 64GB	Q8_0	~55	7%
MacBook Pro 16" · M2 Max 32GB	Q8_0	~55	15%
MacBook Pro 16" · M2 Max 64GB	Q8_0	~55	7%
MacBook Pro 16" · M2 Max 96GB	Q8_0	~55	5%
MacBook Pro 16" · M3 Max 36GB	Q8_0	~55	13%
MacBook Pro 16" · M3 Max 48GB	Q8_0	~55	10%
MacBook Pro 16" · M3 Max 64GB	Q8_0	~55	7%
MacBook Pro 16" · M3 Max 96GB	Q8_0	~55	5%
MacBook Pro 16" · M3 Max 128GB	Q8_0	~55	4%
Mac Studio · M1 Max 32GB	Q8_0	~55	15%
Mac Studio · M1 Max 64GB	Q8_0	~55	7%
Mac Studio · M2 Max 32GB	Q8_0	~55	15%
Mac Studio · M2 Max 64GB	Q8_0	~55	7%
Mac Studio · M2 Max 96GB	Q8_0	~55	5%
MacBook Pro 14" · M5 Pro 24GB	Q8_0	~42	20%
MacBook Pro 14" · M5 Pro 48GB	Q8_0	~42	10%
MacBook Pro 14" · M5 Pro 64GB	Q8_0	~42	7%
MacBook Pro 16" · M5 Pro 24GB	Q8_0	~42	20%
MacBook Pro 16" · M5 Pro 48GB	Q8_0	~42	10%
MacBook Pro 14" · M4 Pro 24GB	Q8_0	~37	20%
MacBook Pro 14" · M4 Pro 48GB	Q8_0	~37	10%
MacBook Pro 16" · M4 Pro 24GB	Q8_0	~37	20%
MacBook Pro 16" · M4 Pro 48GB	Q8_0	~37	10%
Mac Mini · M4 Pro 24GB	Q8_0	~37	20%
Mac Mini · M4 Pro 48GB	Q8_0	~37	10%
MacBook Air · M6 16GB	Q8_0	~28	30%
MacBook Air · M6 24GB	Q8_0	~28	20%
MacBook Air · M6 32GB	Q8_0	~28	15%
MacBook Pro 14" · M6 16GB	Q8_0	~28	30%
MacBook Pro 14" · M6 24GB	Q8_0	~28	20%
MacBook Pro 14" · M6 32GB	Q8_0	~28	15%
Mac Mini · M6 16GB	Q8_0	~28	30%
Mac Mini · M6 24GB	Q8_0	~28	20%
Mac Mini · M6 32GB	Q8_0	~28	15%
iMac · M6 16GB	Q8_0	~28	30%
iMac · M6 24GB	Q8_0	~28	20%
iMac · M6 32GB	Q8_0	~28	15%
MacBook Pro 14" · M1 Pro 16GB	Q8_0	~27	30%
MacBook Pro 14" · M1 Pro 32GB	Q8_0	~27	15%
MacBook Pro 14" · M2 Pro 16GB	Q8_0	~27	30%
MacBook Pro 14" · M2 Pro 32GB	Q8_0	~27	15%
MacBook Pro 16" · M1 Pro 16GB	Q8_0	~27	30%
MacBook Pro 16" · M1 Pro 32GB	Q8_0	~27	15%
MacBook Pro 16" · M2 Pro 16GB	Q8_0	~27	30%
MacBook Pro 16" · M2 Pro 32GB	Q8_0	~27	15%
Mac Mini · M2 Pro 16GB	Q8_0	~27	30%
Mac Mini · M2 Pro 32GB	Q8_0	~27	15%
MacBook Air · M5 16GB	Q8_0	~21	30%
MacBook Air · M5 24GB	Q8_0	~21	20%
MacBook Air · M5 32GB	Q8_0	~21	15%
MacBook Pro 14" · M5 16GB	Q8_0	~21	30%
MacBook Pro 14" · M5 24GB	Q8_0	~21	20%
MacBook Pro 14" · M5 32GB	Q8_0	~21	15%
MacBook Pro 14" · M3 Pro 18GB	Q8_0	~21	26%
MacBook Pro 14" · M3 Pro 36GB	Q8_0	~21	13%
MacBook Pro 16" · M3 Pro 18GB	Q8_0	~21	26%
MacBook Pro 16" · M3 Pro 36GB	Q8_0	~21	13%
MacBook Air · M4 16GB	Q8_0	~16	30%
MacBook Air · M4 24GB	Q8_0	~16	20%
MacBook Air · M4 32GB	Q8_0	~16	15%
Mac Mini · M4 16GB	Q8_0	~16	30%
Mac Mini · M4 24GB	Q8_0	~16	20%
Mac Mini · M4 32GB	Q8_0	~16	15%
iMac · M4 16GB	Q8_0	~16	30%
iMac · M4 24GB	Q8_0	~16	20%
iMac · M4 32GB	Q8_0	~16	15%
MacBook Air · M2 8GB	Q8_0	~14	60%
MacBook Air · M2 16GB	Q8_0	~14	30%
MacBook Air · M2 24GB	Q8_0	~14	20%
MacBook Air · M3 8GB	Q8_0	~14	60%
MacBook Air · M3 16GB	Q8_0	~14	30%
MacBook Air · M3 24GB	Q8_0	~14	20%
Mac Mini · M2 8GB	Q8_0	~14	60%
Mac Mini · M2 16GB	Q8_0	~14	30%
Mac Mini · M2 24GB	Q8_0	~14	20%
iMac · M3 8GB	Q8_0	~14	60%
iMac · M3 16GB	Q8_0	~14	30%
iMac · M3 24GB	Q8_0	~14	20%
MacBook Air · M1 8GB	Q8_0	~9	60%
MacBook Air · M1 16GB	Q8_0	~9	30%
Mac Mini · M1 8GB	Q8_0	~9	60%
Mac Mini · M1 16GB	Q8_0	~9	30%
iMac · M1 8GB	Q8_0	~9	60%
iMac · M1 16GB	Q8_0	~9	30%

Run Phi 3 mini 4k instruct gptq 4bit locally on your Mac

ToolPiper downloads, manages, and runs models with one click. Apple Silicon optimized.

Get ToolPiper — Free

Runs Excellently

Quantization Options

Specifications

Which Mac Can Run Phi 3 mini 4k instruct gptq 4bit?

Run Phi 3 mini 4k instruct gptq 4bit locally on your Mac

AI Providers