chore(core): improve typing of messages utils functions

cbornet · cbornet · commit d06f6423d6f4 · 2025-12-05T18:49:35.000+01:00
diff --git a/libs/core/langchain_core/messages/utils.py b/libs/core/langchain_core/messages/utils.py
@@ -20,7 +20,10 @@
     TYPE_CHECKING,
     Annotated,
     Any,
+    Concatenate,
     Literal,
+    ParamSpec,
+    TypeVar,
     cast,
     overload,
 )
@@ -46,7 +49,7 @@
 if TYPE_CHECKING:
     from langchain_core.language_models import BaseLanguageModel
     from langchain_core.prompt_values import PromptValue
-    from langchain_core.runnables.base import Runnable
+    from langchain_core.runnables.base import RunnableLambda
 
 try:
     from langchain_text_splitters import TextSplitter
@@ -384,36 +387,64 @@ def convert_to_messages(
     return [_convert_to_message(m) for m in messages]
 
 
-def _runnable_support(func: Callable) -> Callable:
-    @overload
-    def wrapped(
-        messages: None = None, **kwargs: Any
-    ) -> Runnable[Sequence[MessageLikeRepresentation], list[BaseMessage]]: ...
+P = ParamSpec("P")  # Parameters of the decorated function
+R = TypeVar("R")  # Return type of the decorated function
 
-    @overload
-    def wrapped(
-        messages: Sequence[MessageLikeRepresentation], **kwargs: Any
-    ) -> list[BaseMessage]: ...
 
+def _runnable_support(
+    func: Callable[Concatenate[Iterable[MessageLikeRepresentation], P], R],
+) -> Callable[
+    Concatenate[Iterable[MessageLikeRepresentation] | None, P], R | RunnableLambda
+]:
+    # @wraps(func)
     def wrapped(
-        messages: Sequence[MessageLikeRepresentation] | None = None,
-        **kwargs: Any,
-    ) -> (
-        list[BaseMessage]
-        | Runnable[Sequence[MessageLikeRepresentation], list[BaseMessage]]
-    ):
+        messages: Iterable[MessageLikeRepresentation] | None = None,
+        /,
+        *args: P.args,
+        **kwargs: P.kwargs,
+    ) -> R | RunnableLambda:
         # Import locally to prevent circular import.
         from langchain_core.runnables.base import RunnableLambda  # noqa: PLC0415
 
         if messages is not None:
-            return func(messages, **kwargs)
+            return func(messages, *args, **kwargs)
         return RunnableLambda(partial(func, **kwargs), name=func.__name__)
 
     wrapped.__doc__ = func.__doc__
     return wrapped
 
 
-@_runnable_support
+@overload
+def filter_messages(
+    messages: Iterable[MessageLikeRepresentation] | PromptValue,
+    *,
+    include_names: Sequence[str] | None = None,
+    exclude_names: Sequence[str] | None = None,
+    include_types: Sequence[str | type[BaseMessage]] | None = None,
+    exclude_types: Sequence[str | type[BaseMessage]] | None = None,
+    include_ids: Sequence[str] | None = None,
+    exclude_ids: Sequence[str] | None = None,
+    exclude_tool_calls: Sequence[str] | bool | None = None,
+) -> list[BaseMessage]: ...
+
+
+@overload
+def filter_messages(
+    messages: None = None,
+    *,
+    include_names: Sequence[str] | None = None,
+    exclude_names: Sequence[str] | None = None,
+    include_types: Sequence[str | type[BaseMessage]] | None = None,
+    exclude_types: Sequence[str | type[BaseMessage]] | None = None,
+    include_ids: Sequence[str] | None = None,
+    exclude_ids: Sequence[str] | None = None,
+    exclude_tool_calls: Sequence[str] | bool | None = None,
+) -> RunnableLambda[
+    Iterable[MessageLikeRepresentation] | PromptValue, list[BaseMessage]
+]: ...
+
+
+@_runnable_support  # type: ignore[misc]
 def filter_messages(
     messages: Iterable[MessageLikeRepresentation] | PromptValue,
     *,
@@ -557,7 +588,25 @@ def filter_messages(
     return filtered
 
 
-@_runnable_support
+@overload
+def merge_message_runs(
+    messages: Iterable[MessageLikeRepresentation] | PromptValue,
+    *,
+    chunk_separator: str = "\n",
+) -> list[BaseMessage]: ...
+
+
+@overload
+def merge_message_runs(
+    messages: None = None,
+    *,
+    chunk_separator: str = "\n",
+) -> RunnableLambda[
+    Iterable[MessageLikeRepresentation] | PromptValue, list[BaseMessage]
+]: ...
+
+
+@_runnable_support  # type: ignore[misc]
 def merge_message_runs(
     messages: Iterable[MessageLikeRepresentation] | PromptValue,
     *,
@@ -686,9 +735,45 @@ def merge_message_runs(
     return merged
 
 
+@overload
+def trim_messages(
+    messages: Iterable[MessageLikeRepresentation] | PromptValue,
+    *,
+    max_tokens: int,
+    token_counter: Callable[[list[BaseMessage]], int]
+    | Callable[[BaseMessage], int]
+    | BaseLanguageModel,
+    strategy: Literal["first", "last"] = "last",
+    allow_partial: bool = False,
+    end_on: str | type[BaseMessage] | Sequence[str | type[BaseMessage]] | None = None,
+    start_on: str | type[BaseMessage] | Sequence[str | type[BaseMessage]] | None = None,
+    include_system: bool = False,
+    text_splitter: Callable[[str], list[str]] | TextSplitter | None = None,
+) -> list[BaseMessage]: ...
+
+
+@overload
+def trim_messages(
+    messages: None = None,
+    *,
+    max_tokens: int,
+    token_counter: Callable[[list[BaseMessage]], int]
+    | Callable[[BaseMessage], int]
+    | BaseLanguageModel,
+    strategy: Literal["first", "last"] = "last",
+    allow_partial: bool = False,
+    end_on: str | type[BaseMessage] | Sequence[str | type[BaseMessage]] | None = None,
+    start_on: str | type[BaseMessage] | Sequence[str | type[BaseMessage]] | None = None,
+    include_system: bool = False,
+    text_splitter: Callable[[str], list[str]] | TextSplitter | None = None,
+) -> RunnableLambda[
+    Iterable[MessageLikeRepresentation] | PromptValue, list[BaseMessage]
+]: ...
+
+
 # TODO: Update so validation errors (for token_counter, for example) are raised on
 # init not at runtime.
-@_runnable_support
+@_runnable_support  # type: ignore[misc]
 def trim_messages(
     messages: Iterable[MessageLikeRepresentation] | PromptValue,
     *,
diff --git a/libs/core/tests/unit_tests/messages/test_utils.py b/libs/core/tests/unit_tests/messages/test_utils.py
@@ -2,7 +2,7 @@
 import json
 import re
 from collections.abc import Callable, Sequence
-from typing import Any
+from typing import Any, TypedDict
 
 import pytest
 from typing_extensions import override
@@ -135,6 +135,16 @@ def test_merge_messages_tool_messages() -> None:
     assert messages == messages_model_copy
 
 
+class FilterFields(TypedDict):
+    include_names: Sequence[str] | None
+    exclude_names: Sequence[str] | None
+    include_types: Sequence[str | type[BaseMessage]] | None
+    exclude_types: Sequence[str | type[BaseMessage]] | None
+    include_ids: Sequence[str] | None
+    exclude_ids: Sequence[str] | None
+    exclude_tool_calls: Sequence[str] | bool | None
+
+
 @pytest.mark.parametrize(
     "filters",
     [
@@ -153,7 +163,7 @@ def test_merge_messages_tool_messages() -> None:
         {"include_names": ["blah", "blur"], "exclude_types": [SystemMessage]},
     ],
 )
-def test_filter_message(filters: dict) -> None:
+def test_filter_message(filters: FilterFields) -> None:
     messages = [
         SystemMessage("foo", name="blah", id="1"),
         HumanMessage("bar", name="blur", id="2"),
@@ -192,7 +202,7 @@ def test_filter_message_exclude_tool_calls() -> None:
     assert expected == actual
 
     # test explicitly excluding all tool calls
-    actual = filter_messages(messages, exclude_tool_calls={"1", "2"})
+    actual = filter_messages(messages, exclude_tool_calls=["1", "2"])
     assert expected == actual
 
     # test excluding a specific tool call
@@ -234,7 +244,7 @@ def test_filter_message_exclude_tool_calls_content_blocks() -> None:
     assert expected == actual
 
     # test explicitly excluding all tool calls
-    actual = filter_messages(messages, exclude_tool_calls={"1", "2"})
+    actual = filter_messages(messages, exclude_tool_calls=["1", "2"])
     assert expected == actual
 
     # test excluding a specific tool call
@@ -508,13 +518,14 @@ def test_trim_messages_invoke() -> None:
 
 def test_trim_messages_bound_model_token_counter() -> None:
     trimmer = trim_messages(
-        max_tokens=10, token_counter=FakeTokenCountingModel().bind(foo="bar")
+        max_tokens=10,
+        token_counter=FakeTokenCountingModel().bind(foo="bar"),  # type: ignore[call-overload]
     )
     trimmer.invoke([HumanMessage("foobar")])
 
 
 def test_trim_messages_bad_token_counter() -> None:
-    trimmer = trim_messages(max_tokens=10, token_counter={})
+    trimmer = trim_messages(max_tokens=10, token_counter={})  # type: ignore[call-overload]
     with pytest.raises(
         ValueError,
         match=re.escape(
@@ -608,7 +619,9 @@ def count_text_length(msgs: list[BaseMessage]) -> int:
 
     assert len(result) == 1
     assert len(result[0].content) == 1
-    assert result[0].content[0]["text"] == "First part of text."
+    content = result[0].content[0]
+    assert isinstance(content, dict)
+    assert content["text"] == "First part of text."
     assert messages == messages_copy