Update quantization

2023-03-15 21:18:24 +08:00 · 2023-03-15 21:18:24 +08:00 · 0101afdfa7
parent c3dece3f01
commit 0101afdfa7
1 changed files with 5 additions and 1 deletions
--- a/quantization.py
+++ b/quantization.py
@ -7,7 +7,11 @@ import base64
 import ctypes
 from typing import List
 try:
    from cpm_kernels.kernels.base import LazyKernelCModule, KernelFunction, round_up
 except:
    pass
 class W8A16Linear(torch.autograd.Function):