fix compressed params tracking

shanjiaz · shanjiaz · commit f9f31059d333 · 2025-12-10T22:20:25.000Z
Signed-off-by: shanjiaz &lt;zsjwpianpian@gmail.com&gt;
diff --git a/src/compressed_tensors/compressors/quantized_compressors/base.py b/src/compressed_tensors/compressors/quantized_compressors/base.py
@@ -85,7 +85,7 @@ def compress(
         """
         uncompressed_names = list(model_state.keys())
         compressed_dict = {}
-        compressed_prefixes = set()
+        compressed_param_names = set()
 
         # compress values
         desc = "Compressing with quantization"
@@ -120,24 +120,15 @@ def compress(
                     device=compression_device,
                 )
 
-                compressed_prefixes.add(prefix)
-
-                # update state dict
+                # update state dict and track which params were added
                 for key, value in compressed_values.items():
-                    compressed_dict[prefix + key] = value.to(compression_device)
+                    full_name = prefix + key
+                    compressed_dict[full_name] = value.to(compression_device)
+                    compressed_param_names.add(full_name)
 
             else:
                 # Skip qparams already added by compress_weight
-                is_duplicate = any(
-                    name.endswith(s) and name.removesuffix(s) in compressed_prefixes
-                    for s in [
-                        "weight_scale",
-                        "weight_zero_point",
-                        "weight_global_scale",
-                        "weight_g_idx",
-                    ]
-                )
-                if is_duplicate:
+                if name in compressed_param_names:
                     continue
 
                 # omit saving zero points for symmetric quantization