add tests

kylesayrs · kylesayrs · commit fafccf3446df · 2025-10-09T16:16:10.000-04:00
Signed-off-by: Kyle Sayers &lt;kylesayrs@gmail.com&gt;
diff --git a/src/compressed_tensors/modeling/attention.py b/src/compressed_tensors/modeling/attention.py
@@ -99,9 +99,7 @@ def _ct_hooked_attention(module: Module, *args, **kwargs):
         return ALL_ATTENTION_FUNCTIONS[_original_impl](module, *args, **kwargs)
 
 
-def initialize_hooked_attention(
-    model: PreTrainedModel, module: Module, quantize: bool = True
-):
+def initialize_hooked_attention(model: PreTrainedModel, module: Module):
     """
     Initialize `QuantizedAttentionImpl` and `QuantizedKVCache` instances
     attached to attention
diff --git a/src/compressed_tensors/quantization/lifecycle/apply.py b/src/compressed_tensors/quantization/lifecycle/apply.py
@@ -29,7 +29,6 @@
     initialize_module_for_quantization,
     is_attention_module,
 )
-from compressed_tensors.quantization.quant_args import QuantizationArgs
 from compressed_tensors.quantization.quant_config import (
     QuantizationConfig,
     QuantizationStatus,

Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,6 @@`
`29`	`29`	`initialize_module_for_quantization,`
`30`	`30`	`is_attention_module,`
`31`	`31`	`)`
`32`		`-from compressed_tensors.quantization.quant_args import QuantizationArgs`
`33`	`32`	`from compressed_tensors.quantization.quant_config import (`
`34`	`33`	`QuantizationConfig,`
`35`	`34`	`QuantizationStatus,`