Centralize paginated page param construction across managers

cursoragent · shrisukhani · cursoragent · commit edb47b8c57be · 2026-02-14T10:41:38.000Z
Co-authored-by: Shri Sukhani &lt;shrisukhani@users.noreply.github.com&gt;
diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
@@ -95,6 +95,7 @@ This runs lint, format checks, compile checks, tests, and package build.
   - `tests/test_mapping_keys_access_usage.py` (centralized key-iteration boundaries),
   - `tests/test_mapping_reader_usage.py` (shared mapping-read parser usage),
   - `tests/test_optional_serialization_helper_usage.py` (optional model serialization helper usage enforcement),
+  - `tests/test_page_params_helper_usage.py` (paginated manager page-params helper usage enforcement),
   - `tests/test_plain_list_helper_usage.py` (shared plain-list normalization helper usage enforcement),
   - `tests/test_plain_type_guard_usage.py` (`str`/`int` guardrail enforcement via plain-type checks),
   - `tests/test_plain_type_identity_usage.py` (direct `type(... ) is str|int` guardrail enforcement via shared helpers),
diff --git a/hyperbrowser/client/managers/async_manager/crawl.py b/hyperbrowser/client/managers/async_manager/crawl.py
@@ -9,6 +9,7 @@
     poll_until_terminal_status_async,
     retry_operation_async,
 )
+from ..page_params_utils import build_page_batch_params
 from ..job_pagination_utils import (
     build_job_paginated_page_merge_callback,
     initialize_job_paginated_response,
@@ -117,7 +118,10 @@ async def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_start_resp.job_id,
-                GetCrawlJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetCrawlJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/async_manager/scrape.py b/hyperbrowser/client/managers/async_manager/scrape.py
@@ -10,6 +10,7 @@
     retry_operation_async,
     wait_for_job_result_async,
 )
+from ..page_params_utils import build_page_batch_params
 from ..job_pagination_utils import (
     build_job_paginated_page_merge_callback,
     initialize_job_paginated_response,
@@ -124,7 +125,10 @@ async def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetBatchScrapeJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetBatchScrapeJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/async_manager/web/batch_fetch.py b/hyperbrowser/client/managers/async_manager/web/batch_fetch.py
@@ -8,6 +8,7 @@
     BatchFetchJobResponse,
     POLLING_ATTEMPTS,
 )
+from ...page_params_utils import build_page_batch_params
 from ...web_payload_utils import build_batch_fetch_start_payload
 from ...web_payload_utils import build_batch_fetch_get_params
 from ...web_pagination_utils import (
@@ -110,7 +111,10 @@ async def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetBatchFetchJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetBatchFetchJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/async_manager/web/crawl.py b/hyperbrowser/client/managers/async_manager/web/crawl.py
@@ -8,6 +8,7 @@
     WebCrawlJobResponse,
     POLLING_ATTEMPTS,
 )
+from ...page_params_utils import build_page_batch_params
 from ...web_payload_utils import build_web_crawl_start_payload
 from ...web_payload_utils import build_web_crawl_get_params
 from ...web_pagination_utils import (
@@ -108,7 +109,10 @@ async def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetWebCrawlJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetWebCrawlJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/page_params_utils.py b/hyperbrowser/client/managers/page_params_utils.py
@@ -0,0 +1,15 @@
+from typing import Type, TypeVar
+
+DEFAULT_PAGE_BATCH_SIZE = 100
+
+T = TypeVar("T")
+
+
+def build_page_batch_params(
+    params_model: Type[T],
+    *,
+    page: int,
+    batch_size: int = DEFAULT_PAGE_BATCH_SIZE,
+) -> T:
+    params_model_obj = params_model
+    return params_model_obj(page=page, batch_size=batch_size)  # type: ignore[call-arg]
diff --git a/hyperbrowser/client/managers/sync_manager/crawl.py b/hyperbrowser/client/managers/sync_manager/crawl.py
@@ -9,6 +9,7 @@
     poll_until_terminal_status,
     retry_operation,
 )
+from ..page_params_utils import build_page_batch_params
 from ..job_pagination_utils import (
     build_job_paginated_page_merge_callback,
     initialize_job_paginated_response,
@@ -117,7 +118,10 @@ def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_start_resp.job_id,
-                GetCrawlJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetCrawlJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/sync_manager/scrape.py b/hyperbrowser/client/managers/sync_manager/scrape.py
@@ -10,6 +10,7 @@
     retry_operation,
     wait_for_job_result,
 )
+from ..page_params_utils import build_page_batch_params
 from ..job_pagination_utils import (
     build_job_paginated_page_merge_callback,
     initialize_job_paginated_response,
@@ -122,7 +123,10 @@ def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetBatchScrapeJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetBatchScrapeJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/sync_manager/web/batch_fetch.py b/hyperbrowser/client/managers/sync_manager/web/batch_fetch.py
@@ -8,6 +8,7 @@
     BatchFetchJobResponse,
     POLLING_ATTEMPTS,
 )
+from ...page_params_utils import build_page_batch_params
 from ...web_payload_utils import build_batch_fetch_start_payload
 from ...web_payload_utils import build_batch_fetch_get_params
 from ...web_pagination_utils import (
@@ -108,7 +109,10 @@ def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetBatchFetchJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetBatchFetchJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/hyperbrowser/client/managers/sync_manager/web/crawl.py b/hyperbrowser/client/managers/sync_manager/web/crawl.py
@@ -8,6 +8,7 @@
     WebCrawlJobResponse,
     POLLING_ATTEMPTS,
 )
+from ...page_params_utils import build_page_batch_params
 from ...web_payload_utils import build_web_crawl_start_payload
 from ...web_payload_utils import build_web_crawl_get_params
 from ...web_pagination_utils import (
@@ -108,7 +109,10 @@ def start_and_wait(
             operation_name=operation_name,
             get_next_page=lambda page: self.get(
                 job_id,
-                params=GetWebCrawlJobParams(page=page, batch_size=100),
+                params=build_page_batch_params(
+                    GetWebCrawlJobParams,
+                    page=page,
+                ),
             ),
             get_current_page_batch=lambda page_response: (
                 page_response.current_page_batch
diff --git a/tests/test_architecture_marker_usage.py b/tests/test_architecture_marker_usage.py
@@ -17,6 +17,7 @@
     "tests/test_pyproject_architecture_marker.py",
     "tests/test_architecture_marker_usage.py",
     "tests/test_default_serialization_helper_usage.py",
+    "tests/test_page_params_helper_usage.py",
     "tests/test_plain_type_guard_usage.py",
     "tests/test_plain_type_identity_usage.py",
     "tests/test_plain_list_helper_usage.py",
diff --git a/tests/test_page_params_helper_usage.py b/tests/test_page_params_helper_usage.py
@@ -0,0 +1,24 @@
+from pathlib import Path
+
+import pytest
+
+pytestmark = pytest.mark.architecture
+
+
+MODULES = (
+    "hyperbrowser/client/managers/sync_manager/scrape.py",
+    "hyperbrowser/client/managers/async_manager/scrape.py",
+    "hyperbrowser/client/managers/sync_manager/crawl.py",
+    "hyperbrowser/client/managers/async_manager/crawl.py",
+    "hyperbrowser/client/managers/sync_manager/web/batch_fetch.py",
+    "hyperbrowser/client/managers/async_manager/web/batch_fetch.py",
+    "hyperbrowser/client/managers/sync_manager/web/crawl.py",
+    "hyperbrowser/client/managers/async_manager/web/crawl.py",
+)
+
+
+def test_paginated_managers_use_shared_page_params_helper():
+    for module_path in MODULES:
+        module_text = Path(module_path).read_text(encoding="utf-8")
+        assert "build_page_batch_params(" in module_text
+        assert "batch_size=100" not in module_text
diff --git a/tests/test_page_params_utils.py b/tests/test_page_params_utils.py
@@ -0,0 +1,22 @@
+from hyperbrowser.client.managers.page_params_utils import (
+    DEFAULT_PAGE_BATCH_SIZE,
+    build_page_batch_params,
+)
+from hyperbrowser.models.crawl import GetCrawlJobParams
+from hyperbrowser.models.scrape import GetBatchScrapeJobParams
+
+
+def test_build_page_batch_params_uses_default_batch_size():
+    params = build_page_batch_params(GetBatchScrapeJobParams, page=3)
+
+    assert isinstance(params, GetBatchScrapeJobParams)
+    assert params.page == 3
+    assert params.batch_size == DEFAULT_PAGE_BATCH_SIZE
+
+
+def test_build_page_batch_params_accepts_custom_batch_size():
+    params = build_page_batch_params(GetCrawlJobParams, page=2, batch_size=25)
+
+    assert isinstance(params, GetCrawlJobParams)
+    assert params.page == 2
+    assert params.batch_size == 25