remove bitpacking value

mobicham · mobicham · commit b18f54fe9e39 · 2025-02-24T10:18:28.000Z
diff --git a/hqq/utils/vllm.py b/hqq/utils/vllm.py
@@ -463,8 +463,6 @@ def get_quant_method(
 class HQQGemLiteVLLMLinear(HQQBaseVLLMLinear):
     """Linear HQQ VLLM with GemLite backend"""
 
-    gemlite_packing_bitwidth = 32
-
     def __init__(
         self,
         quant_config: QuantizationConfig,
@@ -492,7 +490,6 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             layer.scale.view(-1, 1),
             layer.zero.view(-1, 1),
             bias=None,
-            packing_bitwidth=HQQGemLiteVLLMLinear.gemlite_packing_bitwidth,
         )
 
         layer.gemlite_linear = gemlite_linear