GLM 4.7 Flash AWQ

General model by quanttrio · 31.22B parameters

Chip

Unified Memory

Bandwidth 307 GB/s

Available for Models ~21 GB

Tight Fit

GLM 4.7 Flash AWQ can run but will be tight at 73% of RAM. Consider a lower quantization or closing other apps.

~11 tok/s

Q3_K_M · 17.5 GB

Alternative: Q2_K (14.1 GB, ~15 tok/s)

Quantization Options

Quantization	Memory	Speed	Fits?
Q8_0	35.3 GB	~5 tok/s	✗
Q6_K	27.5 GB	~7 tok/s	✗
Q5_K_M	23.8 GB	~8 tok/s	✗
Q4_K_M	20.7 GB	~9 tok/s	✗
Q3_K_M Recommended	17.5 GB	~11 tok/s	✓
Q2_K	14.1 GB	~15 tok/s	✓

Specifications

Parameters31.2B

Architectureglm4_moe_lite

Context Length203K

CategoryGeneral

Formatawq

Minimum RAM17.4 GB

HuggingFace Downloads89,357

View on HuggingFace →

Which Mac Can Run GLM 4.7 Flash AWQ?

Minimum Mac

MacBook Pro 14" — M5 Max 36GB

Q6_K · ~14 tok/s · 76% RAM

Mac	Quant	tok/s	RAM %
MacBook Pro 16" · M6 Ultra 192GB	Q8_0	~31	18%
MacBook Pro 16" · M6 Ultra 256GB	Q8_0	~31	14%
MacBook Pro 16" · M6 Ultra 384GB	Q8_0	~31	9%
Mac Studio · M6 Ultra 192GB	Q8_0	~31	18%
Mac Studio · M6 Ultra 256GB	Q8_0	~31	14%
Mac Studio · M6 Ultra 384GB	Q8_0	~31	9%
Mac Studio · M5 Ultra 128GB	Q8_0	~21	28%
Mac Studio · M5 Ultra 192GB	Q8_0	~21	18%
Mac Studio · M5 Ultra 256GB	Q8_0	~21	14%
MacBook Pro 14" · M6 Max 48GB	Q8_0	~15	74%
MacBook Pro 14" · M6 Max 64GB	Q8_0	~15	55%
MacBook Pro 14" · M6 Max 128GB	Q8_0	~15	28%
MacBook Pro 14" · M6 Max 192GB	Q8_0	~15	18%
MacBook Pro 16" · M6 Max 48GB	Q8_0	~15	74%
MacBook Pro 16" · M6 Max 64GB	Q8_0	~15	55%
MacBook Pro 16" · M6 Max 128GB	Q8_0	~15	28%
MacBook Pro 16" · M6 Max 192GB	Q8_0	~15	18%
Mac Studio · M6 Max 48GB	Q8_0	~15	74%
Mac Studio · M6 Max 64GB	Q8_0	~15	55%
Mac Studio · M6 Max 128GB	Q8_0	~15	28%
Mac Studio · M6 Max 192GB	Q8_0	~15	18%
MacBook Pro 14" · M5 Max 36GB	Q6_K	~14	76%
MacBook Pro 16" · M5 Max 36GB	Q6_K	~14	76%
Mac Studio · M5 Max 36GB	Q6_K	~14	76%
Mac Studio · M1 Ultra 64GB	Q8_0	~13	55%
Mac Studio · M1 Ultra 128GB	Q8_0	~13	28%
Mac Studio · M2 Ultra 64GB	Q8_0	~13	55%
Mac Studio · M2 Ultra 96GB	Q8_0	~13	37%
Mac Studio · M2 Ultra 128GB	Q8_0	~13	28%
Mac Studio · M2 Ultra 192GB	Q8_0	~13	18%
Mac Studio · M3 Ultra 96GB	Q8_0	~13	37%
Mac Studio · M3 Ultra 192GB	Q8_0	~13	18%
MacBook Pro 16" · M4 Max 36GB	Q6_K	~12	76%
Mac Studio · M4 Max 36GB	Q6_K	~12	76%
MacBook Pro 14" · M5 Max 48GB	Q8_0	~10	74%
MacBook Pro 14" · M5 Max 64GB	Q8_0	~10	55%
MacBook Pro 14" · M5 Max 128GB	Q8_0	~10	28%
MacBook Pro 16" · M5 Max 48GB	Q8_0	~10	74%
MacBook Pro 16" · M5 Max 64GB	Q8_0	~10	55%
MacBook Pro 16" · M5 Max 128GB	Q8_0	~10	28%
Mac Studio · M5 Max 64GB	Q8_0	~10	55%
Mac Studio · M5 Max 128GB	Q8_0	~10	28%
MacBook Pro 16" · M4 Max 48GB	Q8_0	~9	74%
MacBook Pro 16" · M4 Max 64GB	Q8_0	~9	55%
MacBook Pro 16" · M4 Max 128GB	Q8_0	~9	28%
Mac Studio · M4 Max 64GB	Q8_0	~9	55%
Mac Studio · M4 Max 128GB	Q8_0	~9	28%
MacBook Pro 16" · M3 Max 36GB	Q6_K	~9	76%
MacBook Pro 14" · M6 Pro 48GB	Q8_0	~7	74%
MacBook Pro 14" · M6 Pro 64GB	Q8_0	~7	55%
MacBook Pro 16" · M6 Pro 48GB	Q8_0	~7	74%
MacBook Pro 16" · M6 Pro 64GB	Q8_0	~7	55%
Mac Mini · M6 Pro 48GB	Q8_0	~7	74%
Mac Mini · M6 Pro 64GB	Q8_0	~7	55%
MacBook Pro 16" · M1 Max 64GB	Q8_0	~7	55%
MacBook Pro 16" · M2 Max 64GB	Q8_0	~7	55%
MacBook Pro 16" · M2 Max 96GB	Q8_0	~7	37%
MacBook Pro 16" · M3 Max 48GB	Q8_0	~7	74%
MacBook Pro 16" · M3 Max 64GB	Q8_0	~7	55%
MacBook Pro 16" · M3 Max 96GB	Q8_0	~7	37%
MacBook Pro 16" · M3 Max 128GB	Q8_0	~7	28%
Mac Studio · M1 Max 64GB	Q8_0	~7	55%
Mac Studio · M2 Max 64GB	Q8_0	~7	55%
Mac Studio · M2 Max 96GB	Q8_0	~7	37%
MacBook Pro 14" · M5 Pro 48GB	Q8_0	~5	74%
MacBook Pro 14" · M5 Pro 64GB	Q8_0	~5	55%
MacBook Pro 16" · M5 Pro 48GB	Q8_0	~5	74%
MacBook Pro 14" · M4 Pro 48GB	Q8_0	~5	74%
MacBook Pro 16" · M4 Pro 48GB	Q8_0	~5	74%
Mac Mini · M4 Pro 48GB	Q8_0	~5	74%
MacBook Pro 14" · M3 Pro 36GB	Q6_K	~3	76%
MacBook Pro 16" · M3 Pro 36GB	Q6_K	~3	76%
MacBook Pro 14" · M6 Pro 24GB	Q3_K_M	~15	73%
MacBook Pro 16" · M6 Pro 24GB	Q3_K_M	~15	73%
Mac Mini · M6 Pro 24GB	Q3_K_M	~15	73%
MacBook Pro 14" · M5 Pro 24GB	Q3_K_M	~11	73%
MacBook Pro 16" · M5 Pro 24GB	Q3_K_M	~11	73%
MacBook Pro 14" · M4 Pro 24GB	Q3_K_M	~10	73%
MacBook Pro 16" · M4 Pro 24GB	Q3_K_M	~10	73%
Mac Mini · M4 Pro 24GB	Q3_K_M	~10	73%
MacBook Pro 16" · M1 Max 32GB	Q6_K	~9	86%
MacBook Pro 16" · M2 Max 32GB	Q6_K	~9	86%
Mac Studio · M1 Max 32GB	Q6_K	~9	86%
Mac Studio · M2 Max 32GB	Q6_K	~9	86%
MacBook Air · M6 24GB	Q3_K_M	~7	73%
MacBook Pro 14" · M6 24GB	Q3_K_M	~7	73%
Mac Mini · M6 24GB	Q3_K_M	~7	73%
iMac · M6 24GB	Q3_K_M	~7	73%
MacBook Pro 14" · M3 Pro 18GB	Q2_K	~7	78%
MacBook Pro 16" · M3 Pro 18GB	Q2_K	~7	78%
MacBook Air · M5 24GB	Q3_K_M	~6	73%
MacBook Pro 14" · M5 24GB	Q3_K_M	~6	73%
MacBook Air · M6 32GB	Q6_K	~4	86%
MacBook Pro 14" · M6 32GB	Q6_K	~4	86%
Mac Mini · M6 32GB	Q6_K	~4	86%
iMac · M6 32GB	Q6_K	~4	86%
MacBook Air · M4 24GB	Q3_K_M	~4	73%
MacBook Pro 14" · M1 Pro 32GB	Q6_K	~4	86%
MacBook Pro 14" · M2 Pro 32GB	Q6_K	~4	86%
MacBook Pro 16" · M1 Pro 32GB	Q6_K	~4	86%
MacBook Pro 16" · M2 Pro 32GB	Q6_K	~4	86%
Mac Mini · M2 Pro 32GB	Q6_K	~4	86%
Mac Mini · M4 24GB	Q3_K_M	~4	73%
iMac · M4 24GB	Q3_K_M	~4	73%
MacBook Air · M2 24GB	Q3_K_M	~4	73%
MacBook Air · M3 24GB	Q3_K_M	~4	73%
Mac Mini · M2 24GB	Q3_K_M	~4	73%
iMac · M3 24GB	Q3_K_M	~4	73%
MacBook Air · M5 32GB	Q6_K	~3	86%
MacBook Pro 14" · M5 32GB	Q6_K	~3	86%
MacBook Air · M4 32GB	Q6_K	~3	86%
Mac Mini · M4 32GB	Q6_K	~3	86%
iMac · M4 32GB	Q6_K	~3	86%
MacBook Air · M6 16GB	—	—	88%
MacBook Pro 14" · M6 16GB	—	—	88%
Mac Mini · M6 16GB	—	—	88%
iMac · M6 16GB	—	—	88%
MacBook Pro 14" · M1 Pro 16GB	—	—	88%
MacBook Pro 14" · M2 Pro 16GB	—	—	88%
MacBook Pro 16" · M1 Pro 16GB	—	—	88%
MacBook Pro 16" · M2 Pro 16GB	—	—	88%
Mac Mini · M2 Pro 16GB	—	—	88%
MacBook Air · M5 16GB	—	—	88%
MacBook Pro 14" · M5 16GB	—	—	88%
MacBook Air · M4 16GB	—	—	88%
Mac Mini · M4 16GB	—	—	88%
iMac · M4 16GB	—	—	88%
MacBook Air · M2 8GB	—	—	176%
MacBook Air · M2 16GB	—	—	88%
MacBook Air · M3 8GB	—	—	176%
MacBook Air · M3 16GB	—	—	88%
Mac Mini · M2 8GB	—	—	176%
Mac Mini · M2 16GB	—	—	88%
iMac · M3 8GB	—	—	176%
iMac · M3 16GB	—	—	88%
MacBook Air · M1 8GB	—	—	176%
MacBook Air · M1 16GB	—	—	88%
Mac Mini · M1 8GB	—	—	176%
Mac Mini · M1 16GB	—	—	88%
iMac · M1 8GB	—	—	176%
iMac · M1 16GB	—	—	88%

Run GLM 4.7 Flash AWQ locally on your Mac

ToolPiper downloads, manages, and runs models with one click. Apple Silicon optimized.

Get ToolPiper — Free

Tight Fit

Quantization Options

Specifications

Which Mac Can Run GLM 4.7 Flash AWQ?

Run GLM 4.7 Flash AWQ locally on your Mac

AI Providers