workaround for issue "TypeError argument 'tokens': 'NoneType' object cannot be converted to 'PyString" (#4103)

lvhan028 · web-flow · commit e3708efbad98 · 2025-11-06T14:31:53.000+08:00
* workaround for issue TypeError argument 'tokens': 'NoneType' object cannot be converted to 'PyString

* fix

* new_tokens and prev_tokens should be lists
diff --git a/lmdeploy/tokenizer.py b/lmdeploy/tokenizer.py
@@ -290,12 +290,18 @@ def detokenize_incrementally(self,
         # This is the first iteration for this sequence
         new_tokens = tokenizer.convert_ids_to_tokens(all_input_ids[ids_offset:],
                                                      skip_special_tokens=skip_special_tokens)
+        # `convert_ids_to_tokens` returns None for out-of-range token_id
+        new_tokens = new_tokens or []
+        new_tokens = [x for x in new_tokens if x is not None] if None in new_tokens else new_tokens
         if prev_tokens is None:
             # Please notice that in VLLM, indexes are detokenized one by one
             # while in LMDeploy, every turn, the detokenized indexes length
             # can be different.
             prev_tokens = tokenizer.convert_ids_to_tokens(all_input_ids[:ids_offset],
                                                           skip_special_tokens=skip_special_tokens)
+            # `convert_ids_to_tokens` returns None for out-of-range token_id
+            prev_tokens = prev_tokens or []
+            prev_tokens = [x for x in prev_tokens if x is not None] if None in prev_tokens else prev_tokens
             read_offset = len(prev_tokens)
             if skip_special_tokens and new_tokens and new_tokens[0] in tokenizer.all_special_ids:
                 read_offset = read_offset + 1  # skip special token