From 17ba37d81043c11234959a544ae16e2ff1d51949 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Wed, 8 Oct 2025 12:08:29 +0200
Subject: [PATCH 01/21] flat index: Add support for RQ and include cache param

---
 integration/test_collection_config.py         | 68 ++++++++++++++++++-
 weaviate/collections/classes/config.py        |  3 +-
 .../collections/classes/config_methods.py     |  1 +
 .../classes/config_vector_index.py            |  3 +
 4 files changed, 73 insertions(+), 2 deletions(-)

diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index 3a7d5b428..84121b452 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -659,7 +659,7 @@ def test_update_from_pq_with_hnsw(
         collection.config.update(vector_index_config=vector_index_config)
 
 
-def test_update_flat(collection_factory: CollectionFactory) -> None:
+def test_update_flat_bq(collection_factory: CollectionFactory) -> None:
     collection = collection_factory(
         vector_index_config=Configure.VectorIndex.flat(
             vector_cache_max_objects=5,
@@ -699,6 +699,55 @@ def test_update_flat(collection_factory: CollectionFactory) -> None:
         )
 
 
+def test_update_flat_rq(collection_factory: CollectionFactory) -> None:
+    collection = collection_factory(
+        vector_index_config=Configure.VectorIndex.flat(
+            vector_cache_max_objects=5,
+            quantizer=Configure.VectorIndex.Quantizer.rq(rescore_limit=10),
+        ),
+    )
+
+    config = collection.config.get()
+    assert config.vector_index_type == VectorIndexType.FLAT
+    assert config.vector_index_config is not None
+    assert isinstance(config.vector_index_config, _VectorIndexConfigFlat)
+    assert config.vector_index_config.vector_cache_max_objects == 5
+    assert isinstance(config.vector_index_config.quantizer, _RQConfig)
+    assert config.vector_index_config.quantizer.rescore_limit == 10
+
+    collection.config.update(
+        vectorizer_config=Reconfigure.VectorIndex.flat(
+            vector_cache_max_objects=10,
+            quantizer=Reconfigure.VectorIndex.Quantizer.rq(rescore_limit=20),
+        ),
+    )
+    config = collection.config.get()
+    assert config.vector_index_type == VectorIndexType.FLAT
+    assert config.vector_index_config is not None
+    assert isinstance(config.vector_index_config, _VectorIndexConfigFlat)
+    assert config.vector_index_config.vector_cache_max_objects == 10
+    assert isinstance(config.vector_index_config.quantizer, _RQConfig)
+    assert config.vector_index_config.quantizer.rescore_limit == 20
+
+    with pytest.raises(UnexpectedStatusCodeError):
+        # cannot enable/disable RQ after flat index was created
+        # must only do this on creation
+        collection.config.update(
+            vectorizer_config=Reconfigure.VectorIndex.flat(
+                quantizer=Reconfigure.VectorIndex.Quantizer.rq(enabled=False),
+            )
+        )
+
+    with pytest.raises(UnexpectedStatusCodeError):
+        # cannot change bits after flat index was created
+        # must only do this on creation
+        collection.config.update(
+            vectorizer_config=Reconfigure.VectorIndex.flat(
+                quantizer=Reconfigure.VectorIndex.Quantizer.rq(bits=1),
+            )
+        )
+
+
 def test_collection_config_get_shards(collection_factory: CollectionFactory) -> None:
     collection = collection_factory(
         vectorizer_config=Configure.Vectorizer.none(),
@@ -785,6 +834,23 @@ def test_config_vector_index_flat_and_quantizer_bq(collection_factory: Collectio
     assert conf.vector_index_config.quantizer.rescore_limit == 456
 
 
+def test_config_vector_index_flat_and_quantizer_rq(collection_factory: CollectionFactory) -> None:
+    collection = collection_factory(
+        vector_index_config=Configure.VectorIndex.flat(
+            vector_cache_max_objects=234,
+            quantizer=Configure.VectorIndex.Quantizer.rq(bits=8),
+        ),
+    )
+
+    conf = collection.config.get()
+    assert conf.vector_index_type == VectorIndexType.FLAT
+    assert conf.vector_index_config is not None
+    assert isinstance(conf.vector_index_config, _VectorIndexConfigFlat)
+    assert conf.vector_index_config.vector_cache_max_objects == 234
+    assert isinstance(conf.vector_index_config.quantizer, _RQConfig)
+    assert conf.vector_index_config.quantizer.bits == 8
+
+
 def test_config_vector_index_hnsw_and_quantizer_pq(collection_factory: CollectionFactory) -> None:
     collection = collection_factory(
         vector_index_config=Configure.VectorIndex.hnsw(
diff --git a/weaviate/collections/classes/config.py b/weaviate/collections/classes/config.py
index 8bad9617d..7cca91c3e 100644
--- a/weaviate/collections/classes/config.py
+++ b/weaviate/collections/classes/config.py
@@ -1521,6 +1521,7 @@ class _SQConfig(_ConfigBase):
 
 @dataclass
 class _RQConfig(_ConfigBase):
+    cache: Optional[bool]
     bits: Optional[int]
     rescore_limit: int
 
@@ -2293,7 +2294,7 @@ def hnsw(
     @staticmethod
     def flat(
         vector_cache_max_objects: Optional[int] = None,
-        quantizer: Optional[_BQConfigUpdate] = None,
+        quantizer: Optional[Union[_BQConfigUpdate, _RQConfigUpdate]] = None,
     ) -> _VectorIndexConfigFlatUpdate:
         """Create an `_VectorIndexConfigFlatUpdate` object to update the configuration of the FLAT vector index.
 
diff --git a/weaviate/collections/classes/config_methods.py b/weaviate/collections/classes/config_methods.py
index 999887316..6b815ba24 100644
--- a/weaviate/collections/classes/config_methods.py
+++ b/weaviate/collections/classes/config_methods.py
@@ -150,6 +150,7 @@ def __get_quantizer_config(
         )
     elif "rq" in config and config["rq"].get("enabled"):
         quantizer = _RQConfig(
+            cache=config["rq"].get("cache"),
             bits=config["rq"].get("bits"),
             rescore_limit=config["rq"].get("rescoreLimit"),
         )
diff --git a/weaviate/collections/classes/config_vector_index.py b/weaviate/collections/classes/config_vector_index.py
index d514bfef7..ce70c9a0f 100644
--- a/weaviate/collections/classes/config_vector_index.py
+++ b/weaviate/collections/classes/config_vector_index.py
@@ -275,6 +275,7 @@ def quantizer_name() -> str:
 
 
 class _RQConfigCreate(_QuantizerConfigCreate):
+    cache: Optional[bool]
     bits: Optional[int]
     rescoreLimit: Optional[int]
 
@@ -443,6 +444,7 @@ def sq(
 
     @staticmethod
     def rq(
+        cache: Optional[bool] = None,
         bits: Optional[int] = None,
         rescore_limit: Optional[int] = None,
     ) -> _RQConfigCreate:
@@ -454,6 +456,7 @@ def rq(
             See [the docs](https://weaviate.io/developers/weaviate/concepts/vector-index) for a more detailed view!
         """  # noqa: D417 (missing argument descriptions in the docstring)
         return _RQConfigCreate(
+            cache=cache,
             bits=bits,
             rescoreLimit=rescore_limit,
         )

From d81781c51c35daf27e4f17ece9de7915941aa3ea Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Wed, 8 Oct 2025 13:00:46 +0200
Subject: [PATCH 02/21] Update tests for RQ

---
 integration/test_collection_config.py | 103 ++++++++++++++++++++++++++
 1 file changed, 103 insertions(+)

diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index 84121b452..ada653e4d 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -700,6 +700,10 @@ def test_update_flat_bq(collection_factory: CollectionFactory) -> None:
 
 
 def test_update_flat_rq(collection_factory: CollectionFactory) -> None:
+    dummy = collection_factory("dummy")
+    if dummy._connection._weaviate_version.is_lower_than(1, 34, 0):
+        pytest.skip("RQ in flat index is not supported in Weaviate versions lower than 1.34.0")
+
     collection = collection_factory(
         vector_index_config=Configure.VectorIndex.flat(
             vector_cache_max_objects=5,
@@ -835,6 +839,10 @@ def test_config_vector_index_flat_and_quantizer_bq(collection_factory: Collectio
 
 
 def test_config_vector_index_flat_and_quantizer_rq(collection_factory: CollectionFactory) -> None:
+    dummy = collection_factory("dummy")
+    if dummy._connection._weaviate_version.is_lower_than(1, 34, 0):
+        pytest.skip("RQ in flat index is not supported in Weaviate versions lower than 1.34.0")
+
     collection = collection_factory(
         vector_index_config=Configure.VectorIndex.flat(
             vector_cache_max_objects=234,
@@ -851,6 +859,29 @@ def test_config_vector_index_flat_and_quantizer_rq(collection_factory: Collectio
     assert conf.vector_index_config.quantizer.bits == 8
 
 
+def test_config_vector_index_hnsw_and_quantizer_rq(collection_factory: CollectionFactory) -> None:
+    dummy = collection_factory("dummy")
+    if dummy._connection._weaviate_version.is_lower_than(1, 32, 0):
+        pytest.skip("RQ in HNSW index is not supported in Weaviate versions lower than 1.32.0")
+    collection = collection_factory(
+        vector_index_config=Configure.VectorIndex.hnsw(
+            vector_cache_max_objects=234,
+            ef_construction=789,
+            quantizer=Configure.VectorIndex.Quantizer.rq(bits=8, rescore_limit=123),
+        ),
+    )
+
+    conf = collection.config.get()
+    assert conf.vector_index_type == VectorIndexType.HNSW
+    assert conf.vector_index_config is not None
+    assert isinstance(conf.vector_index_config, _VectorIndexConfigHNSW)
+    assert conf.vector_index_config.vector_cache_max_objects == 234
+    assert conf.vector_index_config.ef_construction == 789
+    assert isinstance(conf.vector_index_config.quantizer, _RQConfig)
+    assert conf.vector_index_config.quantizer.bits == 8
+    assert conf.vector_index_config.quantizer.rescore_limit == 123
+
+
 def test_config_vector_index_hnsw_and_quantizer_pq(collection_factory: CollectionFactory) -> None:
     collection = collection_factory(
         vector_index_config=Configure.VectorIndex.hnsw(
@@ -1173,6 +1204,78 @@ def test_dynamic_collection(collection_factory: CollectionFactory) -> None:
     assert config.vector_index_config.flat.quantizer.rescore_limit == 11
 
 
+def test_dynamic_collection_rq(collection_factory: CollectionFactory) -> None:
+    collection_dummy = collection_factory("dummy", ports=(8090, 50061))
+    if collection_dummy._connection._weaviate_version.is_lower_than(1, 34, 0):
+        pytest.skip("Dynamic index with RQ is not supported in Weaviate versions lower than 1.34.0")
+
+    collection = collection_factory(
+        vector_index_config=Configure.VectorIndex.dynamic(
+            distance_metric=VectorDistances.COSINE,
+            threshold=1000,
+            hnsw=Configure.VectorIndex.hnsw(
+                cleanup_interval_seconds=123,
+                flat_search_cutoff=1234,
+                vector_cache_max_objects=789,
+                quantizer=Configure.VectorIndex.Quantizer.rq(bits=8, rescore_limit=123),
+            ),
+            flat=Configure.VectorIndex.flat(
+                vector_cache_max_objects=7643,
+                quantizer=Configure.VectorIndex.Quantizer.rq(bits=8, rescore_limit=10),
+            ),
+        ),
+        ports=(8090, 50061),
+    )
+
+    config = collection.config.get()
+    assert isinstance(config.vector_index_config, _VectorIndexConfigDynamic)
+    assert config.vector_index_config.distance_metric == VectorDistances.COSINE
+    assert config.vector_index_config.threshold == 1000
+    assert isinstance(config.vector_index_config.hnsw, _VectorIndexConfigHNSW)
+    assert config.vector_index_config.hnsw.cleanup_interval_seconds == 123
+    assert config.vector_index_config.hnsw.flat_search_cutoff == 1234
+    assert config.vector_index_config.hnsw.vector_cache_max_objects == 789
+    assert isinstance(config.vector_index_config.hnsw.quantizer, _RQConfig)
+    assert config.vector_index_config.hnsw.quantizer.bits == 8
+    assert config.vector_index_config.hnsw.quantizer.rescore_limit == 123
+    assert isinstance(config.vector_index_config.flat, _VectorIndexConfigFlat)
+    assert config.vector_index_config.flat.vector_cache_max_objects == 7643
+    assert isinstance(config.vector_index_config.flat.quantizer, _RQConfig)
+    assert config.vector_index_config.flat.quantizer.bits == 8
+    assert config.vector_index_config.flat.quantizer.rescore_limit == 10
+
+    collection.config.update(
+        vectorizer_config=Reconfigure.VectorIndex.dynamic(
+            threshold=2000,
+            hnsw=Reconfigure.VectorIndex.hnsw(
+                flat_search_cutoff=4567,
+                vector_cache_max_objects=678,
+                quantizer=Reconfigure.VectorIndex.Quantizer.rq(bits=8, rescore_limit=200),
+            ),
+            flat=Reconfigure.VectorIndex.flat(
+                vector_cache_max_objects=9876,
+                quantizer=Reconfigure.VectorIndex.Quantizer.rq(bits=8, rescore_limit=20),
+            ),
+        ),
+    )
+    config = collection.config.get()
+    assert isinstance(config.vector_index_config, _VectorIndexConfigDynamic)
+    assert config.vector_index_config.distance_metric == VectorDistances.COSINE
+    assert config.vector_index_config.threshold == 2000
+    assert isinstance(config.vector_index_config.hnsw, _VectorIndexConfigHNSW)
+    assert config.vector_index_config.hnsw.cleanup_interval_seconds == 123
+    assert config.vector_index_config.hnsw.flat_search_cutoff == 4567
+    assert config.vector_index_config.hnsw.vector_cache_max_objects == 678
+    assert isinstance(config.vector_index_config.hnsw.quantizer, _RQConfig)
+    assert config.vector_index_config.hnsw.quantizer.bits == 8
+    assert config.vector_index_config.hnsw.quantizer.rescore_limit == 200
+    assert isinstance(config.vector_index_config.flat, _VectorIndexConfigFlat)
+    assert config.vector_index_config.flat.vector_cache_max_objects == 9876
+    assert isinstance(config.vector_index_config.flat.quantizer, _RQConfig)
+    assert config.vector_index_config.flat.quantizer.bits == 8
+    assert config.vector_index_config.flat.quantizer.rescore_limit == 20
+
+
 def test_config_unknown_module(request: SubRequest) -> None:
     with weaviate.connect_to_local() as client:
         collection_name = _sanitize_collection_name(request.node.name)

From 86594fa6444bce19bec7037968a1abaab9d7f6b6 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Wed, 8 Oct 2025 15:18:02 +0200
Subject: [PATCH 03/21] Add function to retry if http error

---
 integration/test_collection_config.py | 39 +++++++++++++++++++++++++--
 1 file changed, 37 insertions(+), 2 deletions(-)

diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index ada653e4d..ac88eab8a 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -1,4 +1,5 @@
-from typing import Generator, List, Optional, Union
+import time
+from typing import Callable, Generator, List, Optional, TypeVar, Union
 
 import pytest as pytest
 from _pytest.fixtures import SubRequest
@@ -42,6 +43,39 @@
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateInvalidInputError
 
+T = TypeVar("T")
+
+
+def retry_on_http_error(
+    func: Callable[[], T], http_error_code: int, max_retries: int = 3, delay: float = 0.5
+) -> T:
+    """Retry a function call if it raises UnexpectedStatusCodeError with 404 status code.
+
+    Args:
+        func: The function to retry
+        http_error_code: The HTTP error code to retry on
+        max_retries: Maximum number of retries (default: 3)
+        delay: Initial delay between retries in seconds (default: 0.5)
+
+    Returns:
+        The result of the function call
+
+    Raises:
+        The last exception if all retries are exhausted
+    """
+    last_exception = None
+    for attempt in range(max_retries + 1):
+        try:
+            return func()
+        except UnexpectedStatusCodeError as e:
+            last_exception = e
+            if e.status_code == http_error_code and attempt < max_retries:
+                time.sleep(delay * (2**attempt))  # Exponential backoff
+                continue
+            raise
+    # This should never be reached, but satisfies the type checker
+    raise last_exception  # type: ignore
+
 
 @pytest.fixture(scope="module")
 def client() -> Generator[weaviate.WeaviateClient, None, None]:
@@ -405,7 +439,8 @@ def test_collection_config_update(collection_factory: CollectionFactory) -> None
             enabled=True, auto_tenant_creation=False, auto_tenant_activation=False
         ),
     )
-    config = collection.config.get()
+
+    config = retry_on_http_error(lambda: collection.config.get(), 404)
 
     assert config.replication_config.factor == 1
     assert config.replication_config.async_enabled is False

From a1e5aacc10eb029284d0d877a9be82cbed15de89 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Thu, 16 Oct 2025 17:31:28 +0200
Subject: [PATCH 04/21] Add 1.34 CI and test configuration and move function to
 conftest

---
 .github/workflows/main.yaml           |  3 ++-
 integration/conftest.py               | 38 +++++++++++++++++++++++++++
 integration/test_collection_config.py | 37 ++------------------------
 mock_tests/conftest.py                |  4 +--
 mock_tests/test_collection.py         |  2 +-
 5 files changed, 45 insertions(+), 39 deletions(-)

diff --git a/.github/workflows/main.yaml b/.github/workflows/main.yaml
index 7458e009d..38c2d6a59 100644
--- a/.github/workflows/main.yaml
+++ b/.github/workflows/main.yaml
@@ -24,7 +24,8 @@ env:
   WEAVIATE_130: 1.30.12
   WEAVIATE_131: 1.31.5
   WEAVIATE_132: 1.32.5
-  WEAVIATE_133: 1.33.0-rc.1
+  WEAVIATE_133: 1.33.0
+  WEAVIATE_134: 1.34.0-rc.1
 
 jobs:
   lint-and-format:
diff --git a/integration/conftest.py b/integration/conftest.py
index a1014a871..bad9cef32 100644
--- a/integration/conftest.py
+++ b/integration/conftest.py
@@ -15,6 +15,8 @@
 import pytest
 import pytest_asyncio
 from _pytest.fixtures import SubRequest
+import time
+from typing import Callable, TypeVar
 
 import weaviate
 from weaviate.collections import Collection, CollectionAsync
@@ -36,6 +38,8 @@
 from weaviate.collections.classes.types import Properties
 from weaviate.config import AdditionalConfig
 
+from weaviate.exceptions import UnexpectedStatusCodeError
+
 
 class CollectionFactory(Protocol):
     """Typing for fixture."""
@@ -459,3 +463,37 @@ def _factory(
 def _sanitize_collection_name(name: str) -> str:
     name = name.replace("[", "").replace("]", "").replace("-", "").replace(" ", "").replace(".", "")
     return name[0].upper() + name[1:]
+
+
+T = TypeVar("T")
+
+
+def retry_on_http_error(
+    func: Callable[[], T], http_error_code: int, max_retries: int = 3, delay: float = 0.5
+) -> T:
+    """Retry a function call if it raises UnexpectedStatusCodeError with 404 status code.
+
+    Args:
+        func: The function to retry
+        http_error_code: The HTTP error code to retry on
+        max_retries: Maximum number of retries (default: 3)
+        delay: Initial delay between retries in seconds (default: 0.5)
+
+    Returns:
+        The result of the function call
+
+    Raises:
+        The last exception if all retries are exhausted
+    """
+    last_exception = None
+    for attempt in range(max_retries + 1):
+        try:
+            return func()
+        except UnexpectedStatusCodeError as e:
+            last_exception = e
+            if e.status_code == http_error_code and attempt < max_retries:
+                time.sleep(delay * (2**attempt))  # Exponential backoff
+                continue
+            raise
+    # This should never be reached, but satisfies the type checker
+    raise last_exception  # type: ignore
diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index ac88eab8a..07476dbe2 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -1,5 +1,4 @@
-import time
-from typing import Callable, Generator, List, Optional, TypeVar, Union
+from typing import Generator, List, Optional, Union
 
 import pytest as pytest
 from _pytest.fixtures import SubRequest
@@ -42,39 +41,7 @@
 )
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateInvalidInputError
-
-T = TypeVar("T")
-
-
-def retry_on_http_error(
-    func: Callable[[], T], http_error_code: int, max_retries: int = 3, delay: float = 0.5
-) -> T:
-    """Retry a function call if it raises UnexpectedStatusCodeError with 404 status code.
-
-    Args:
-        func: The function to retry
-        http_error_code: The HTTP error code to retry on
-        max_retries: Maximum number of retries (default: 3)
-        delay: Initial delay between retries in seconds (default: 0.5)
-
-    Returns:
-        The result of the function call
-
-    Raises:
-        The last exception if all retries are exhausted
-    """
-    last_exception = None
-    for attempt in range(max_retries + 1):
-        try:
-            return func()
-        except UnexpectedStatusCodeError as e:
-            last_exception = e
-            if e.status_code == http_error_code and attempt < max_retries:
-                time.sleep(delay * (2**attempt))  # Exponential backoff
-                continue
-            raise
-    # This should never be reached, but satisfies the type checker
-    raise last_exception  # type: ignore
+from integration.conftest import retry_on_http_error
 
 
 @pytest.fixture(scope="module")
diff --git a/mock_tests/conftest.py b/mock_tests/conftest.py
index cac246f67..ec2735d30 100644
--- a/mock_tests/conftest.py
+++ b/mock_tests/conftest.py
@@ -55,7 +55,7 @@ def ready_mock(httpserver: HTTPServer):
 
 @pytest.fixture(scope="function")
 def weaviate_mock(ready_mock: HTTPServer):
-    ready_mock.expect_request("/v1/meta").respond_with_json({"version": "1.33"})
+    ready_mock.expect_request("/v1/meta").respond_with_json({"version": "1.34"})
     ready_mock.expect_request("/v1/nodes").respond_with_json({"nodes": [{"gitHash": "ABC"}]})
 
     yield ready_mock
@@ -63,7 +63,7 @@ def weaviate_mock(ready_mock: HTTPServer):
 
 @pytest.fixture(scope="function")
 def weaviate_no_auth_mock(weaviate_mock: HTTPServer):
-    weaviate_mock.expect_request("/v1/meta").respond_with_json({"version": "1.33"})
+    weaviate_mock.expect_request("/v1/meta").respond_with_json({"version": "1.34"})
     weaviate_mock.expect_request("/v1/.well-known/openid-configuration").respond_with_response(
         Response(json.dumps({}), status=404)
     )
diff --git a/mock_tests/test_collection.py b/mock_tests/test_collection.py
index 9659f24fa..38cd0b088 100644
--- a/mock_tests/test_collection.py
+++ b/mock_tests/test_collection.py
@@ -295,7 +295,7 @@ def test_node_with_timeout(
     httpserver: HTTPServer, start_grpc_server: grpc.Server, output: Literal["minimal", "verbose"]
 ) -> None:
     httpserver.expect_request("/v1/.well-known/ready").respond_with_json({})
-    httpserver.expect_request("/v1/meta").respond_with_json({"version": "1.33"})
+    httpserver.expect_request("/v1/meta").respond_with_json({"version": "1.34"})
 
     httpserver.expect_request("/v1/nodes").respond_with_json(
         status=200,

From 97a4c211ee6ebec0e95fd5626c4974c9bf102d49 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Thu, 16 Oct 2025 17:33:14 +0200
Subject: [PATCH 05/21] Update comments

---
 integration/test_collection_config.py | 5 ++---
 1 file changed, 2 insertions(+), 3 deletions(-)

diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index 07476dbe2..b7a6c1b02 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -736,8 +736,7 @@ def test_update_flat_rq(collection_factory: CollectionFactory) -> None:
     assert config.vector_index_config.quantizer.rescore_limit == 20
 
     with pytest.raises(UnexpectedStatusCodeError):
-        # cannot enable/disable RQ after flat index was created
-        # must only do this on creation
+        # cannot disable RQ after it was enabled
         collection.config.update(
             vectorizer_config=Reconfigure.VectorIndex.flat(
                 quantizer=Reconfigure.VectorIndex.Quantizer.rq(enabled=False),
@@ -745,7 +744,7 @@ def test_update_flat_rq(collection_factory: CollectionFactory) -> None:
         )
 
     with pytest.raises(UnexpectedStatusCodeError):
-        # cannot change bits after flat index was created
+        # cannot change bits afteradding data
         # must only do this on creation
         collection.config.update(
             vectorizer_config=Reconfigure.VectorIndex.flat(

From 8558889c59b8d53f2eebe80a123739197686f8e3 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Fri, 17 Oct 2025 10:01:19 +0200
Subject: [PATCH 06/21] Add 134 version

---
 .github/workflows/main.yaml | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/.github/workflows/main.yaml b/.github/workflows/main.yaml
index 38c2d6a59..7517bb2eb 100644
--- a/.github/workflows/main.yaml
+++ b/.github/workflows/main.yaml
@@ -303,7 +303,8 @@ jobs:
           $WEAVIATE_130,
           $WEAVIATE_131,
           $WEAVIATE_132,
-          $WEAVIATE_133
+          $WEAVIATE_133,
+          $WEAVIATE_134
         ]
     steps:
       - name: Checkout

From 392aa9726efb7f9060a464da14379bba8895347c Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Fri, 17 Oct 2025 11:08:25 +0200
Subject: [PATCH 07/21] Set 1.34 dev image for CI jobs

---
 .github/workflows/main.yaml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/main.yaml b/.github/workflows/main.yaml
index 7517bb2eb..e263f8cc1 100644
--- a/.github/workflows/main.yaml
+++ b/.github/workflows/main.yaml
@@ -25,7 +25,7 @@ env:
   WEAVIATE_131: 1.31.5
   WEAVIATE_132: 1.32.5
   WEAVIATE_133: 1.33.0
-  WEAVIATE_134: 1.34.0-rc.1
+  WEAVIATE_134: 1.34.0-dev-2c1c459.amd64
 
 jobs:
   lint-and-format:

From 68affd835bed81200b7a3eb10a68989433b22b8a Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Fri, 17 Oct 2025 14:02:10 +0200
Subject: [PATCH 08/21] Add ACORN as defaul filter strategy in 1.34

---
 integration/test_collection_config.py | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/integration/test_collection_config.py b/integration/test_collection_config.py
index b7a6c1b02..ccbd998af 100644
--- a/integration/test_collection_config.py
+++ b/integration/test_collection_config.py
@@ -415,7 +415,13 @@ def test_collection_config_update(collection_factory: CollectionFactory) -> None
     assert config.multi_tenancy_config.auto_tenant_activation is False
     assert config.multi_tenancy_config.auto_tenant_creation is False
     assert isinstance(config.vector_index_config, _VectorIndexConfigHNSW)
-    assert config.vector_index_config.filter_strategy == wvc.config.VectorFilterStrategy.SWEEPING
+
+    if collection._connection._weaviate_version.is_lower_than(1, 34, 0):
+        assert (
+            config.vector_index_config.filter_strategy == wvc.config.VectorFilterStrategy.SWEEPING
+        )
+    else:
+        assert config.vector_index_config.filter_strategy == wvc.config.VectorFilterStrategy.ACORN
 
     collection.config.update(
         description="Test",

From d80c83fec701c234f1fc69188daa2c912eebada2 Mon Sep 17 00:00:00 2001
From: Rodrigo Lopez <rodrigo.lopez@weaviate.io>
Date: Mon, 20 Oct 2025 12:52:45 +0200
Subject: [PATCH 09/21] Comment backup test temporarily

---
 integration/test_backup_v4.py | 53 ++++++++++++++++++-----------------
 1 file changed, 27 insertions(+), 26 deletions(-)

diff --git a/integration/test_backup_v4.py b/integration/test_backup_v4.py
index 0722cf776..a4d63885c 100644
--- a/integration/test_backup_v4.py
+++ b/integration/test_backup_v4.py
@@ -19,7 +19,6 @@
 )
 from weaviate.collections.classes.config import DataType, Property, ReferenceProperty
 from weaviate.exceptions import (
-    BackupFailedError,
     BackupFailedException,
     UnexpectedStatusCodeException,
 )
@@ -655,28 +654,30 @@ def test_overwrite_alias_true(
     assert literature.collection == "Article", "alias must point to the original collection"
 
 
-def test_overwrite_alias_false(
-    client: weaviate.WeaviateClient, request: SubRequest, artist_alias: str
-) -> None:
-    """Restore backups with overwrite=false (conflict)."""
-    backup_id = unique_backup_id(request.node.name)
-
-    client.backup.create(
-        backup_id=backup_id,
-        backend=BACKEND,
-        include_collections=["Article"],
-        wait_for_completion=True,
-    )
-
-    client.collections.delete("Article")
-    client.alias.update(alias_name=artist_alias, new_target_collection="Paragraph")
-
-    with pytest.raises(BackupFailedError) as err:
-        client.backup.restore(
-            backup_id=backup_id,
-            backend=BACKEND,
-            include_collections=["Article"],
-            wait_for_completion=True,
-            overwrite_alias=False,
-        )
-    assert "alias already exists" in str(err)
+# This test has been disabled temporarily until the behaviour of this scenario is clarified.
+# It worked in version 1.33.0-rc.1, but broken in version 1.33.0+
+# def test_overwrite_alias_false(
+#     client: weaviate.WeaviateClient, request: SubRequest, artist_alias: str
+# ) -> None:
+#     """Restore backups with overwrite=false (conflict)."""
+#     backup_id = unique_backup_id(request.node.name)
+
+#     client.backup.create(
+#         backup_id=backup_id,
+#         backend=BACKEND,
+#         include_collections=["Article"],
+#         wait_for_completion=True,
+#     )
+
+#     client.collections.delete("Article")
+#     client.alias.update(alias_name=artist_alias, new_target_collection="Paragraph")
+
+#     with pytest.raises(BackupFailedError) as err:
+#         client.backup.restore(
+#             backup_id=backup_id,
+#             backend=BACKEND,
+#             include_collections=["Article"],
+#             wait_for_completion=True,
+#             overwrite_alias=False,
+#         )
+#     assert "alias already exists" in str(err)

From 8186d110578ff64ff26048cd9b458ba3171cb981 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Tue, 4 Nov 2025 13:49:15 +0000
Subject: [PATCH 10/21] Introduce `batch.experimental()` while server-side
 batching is in beta (#1765)

* Add client-side changes to handle new server-side batching in 1.33

* Update images in CI

* Update 1.33 image in CI

* Alter test or lazy shard loading for new potential server behaviour

* Change other lazy loading test too

* Fix CI image for 1.33

* Update protos, fix setting of batch client in wrapper to avoid races with connection

* Remove debug assert in test

* Update new batch to use different modes with server, update CI image

* Refactor to changed server batching options

* Throw error if using automatic batching with incompatible server

* Add exponential backoff retry to stream reconnect method

* Remove timeout and retries from new grpc methods

* Only delete key if present in dict

* Close before re-connecting, reset rec num objs on shutdown

* Update to use latest protos and behaviour

* Improve logging using .automatic()

* Update CI image to latest server build

* Fix testing issues with new versions

* Attempt fixes for tests again

* Add ability to retry certain server-emitted full errors, e.g. temporary replication problems

* Attempt fixes of flakes

* Update to use latest server impl and CI image

* Update to use latest dev server version

* Rename from automatic to experimental, bump CI version to latest RC

* Push ongoing changes

* Update to use latest server image

* Update to use latest server changes

* Undo debug changes to conftest

* Update to use latest server image

* Make internal send/recv queue size 1 and sleep while shutdown to avoid pushing to it

* Update to use latest server image

* Fix shutting down message handling

* Skip backoff handling if client has closed the stream

* Remove unused code

* Don't print backoff adjustments when shutting down

* Improve shutting down log

* Attempt to catch last req that can be lost during shutdown

* Avoid circular import

* Remove last_req wrapping logic from stream, reduce logging, update image in ci

* Close the client-side of the stream on shutdown, sleep for backoff during req generation

* Update CI image

* Only log waiting for stream re-establishment once

* Switch from arm to amd in CI

* Shutdown client-side stream regardless of size of __reqs queue

* Increase timeout when waiting for req to send, don't use queue size in if due to unreliability

* Use sentinel in req put/get to avoid inaccurate block timeouts

* Update CI image

* Correctly populate batch.results

* Update CI images

* Assert indexing status in one of the allowed values rather than a specific value

* Undo debug changes in tests

* Update to match new server impl

* Update to use latest server image

* Only start threads once to avoid runtime error when handling shutdown

* Update CI images

* Hard-code SSB concurrency to 1 for now

* Fix collection.batch.automatic

* Correct logic in `_BgThreads.is_alive`

* Adjust default batch size to align with server default and avoid overloading server too fast

* Update CI images and version checks in tests

* Update to use latest server behaviour around backoffs and uuid/err results

* Lock once when reading batch results from stream

* Interpret context canceled as ungraceful shutdown to be restarted by client

* Use backoff message to adjust batch size

* Start batching with smallest allowed server value

* Add extra log in batch send

* Reintroduce timeout when getting from queue

* Add log to empty queue

* Add log to batch recv restart

* Remove timeout when getting from internal queue

* Only update batch size if value has changed

* Track then log total number of objects pushed by client

* WIP: receive shutdown as message and not rpc error

* Move result writing inside message.results case

* Add missing proto changes

* Update CI image

* Improve resiliance on unexpected server behaviour

---------

Co-authored-by: Dirk Kulawiak <dirk@semi.technology>
---
 .github/workflows/main.yaml                   |  28 +-
 integration/test_batch_v4.py                  |  70 +-
 integration/test_client.py                    |  23 +-
 integration/test_rbac.py                      |  19 +
 profiling/test_shutdown.py                    |  76 +++
 weaviate/classes/data.py                      |   2 +
 weaviate/client.py                            |   6 +-
 weaviate/collections/batch/__init__.py        |   3 +-
 weaviate/collections/batch/base.py            | 615 +++++++++++++++++-
 weaviate/collections/batch/batch_wrapper.py   | 154 ++++-
 weaviate/collections/batch/client.py          | 126 +++-
 weaviate/collections/batch/collection.py      | 102 ++-
 .../{grpc_batch_objects.py => grpc_batch.py}  | 105 ++-
 weaviate/collections/classes/batch.py         |  46 +-
 weaviate/collections/classes/generative.py    |   2 +-
 weaviate/collections/classes/types.py         |   4 +-
 weaviate/collections/collection/sync.py       |  11 +-
 weaviate/collections/collections/base.py      |   2 +-
 weaviate/collections/data/executor.py         |   6 +-
 weaviate/connect/v4.py                        |  25 +-
 weaviate/exceptions.py                        |  20 +
 weaviate/proto/v1/v4216/v1/batch_pb2.py       |  90 +--
 weaviate/proto/v1/v4216/v1/batch_pb2.pyi      | 142 ++--
 .../proto/v1/v4216/v1/file_replication_pb2.py |   4 +-
 weaviate/proto/v1/v4216/v1/generative_pb2.py  | 172 ++---
 weaviate/proto/v1/v4216/v1/generative_pb2.pyi |   8 +-
 weaviate/proto/v1/v4216/v1/weaviate_pb2.py    |   4 +-
 .../proto/v1/v4216/v1/weaviate_pb2_grpc.py    |  49 +-
 .../proto/v1/v51/v1/file_replication_pb2.py   |  49 ++
 .../proto/v1/v51/v1/file_replication_pb2.pyi  | 116 ++++
 .../v1/v51/v1/file_replication_pb2_grpc.py    | 198 ++++++
 .../proto/v1/v52/v1/file_replication_pb2.py   |  59 ++
 .../proto/v1/v52/v1/file_replication_pb2.pyi  | 116 ++++
 .../v1/v52/v1/file_replication_pb2_grpc.py    | 269 ++++++++
 weaviate/proto/v1/v5261/v1/batch_pb2.py       |  90 +--
 weaviate/proto/v1/v5261/v1/batch_pb2.pyi      | 142 ++--
 .../proto/v1/v5261/v1/file_replication_pb2.py |   4 +-
 weaviate/proto/v1/v5261/v1/generative_pb2.py  | 172 ++---
 weaviate/proto/v1/v5261/v1/generative_pb2.pyi |   8 +-
 weaviate/proto/v1/v5261/v1/weaviate_pb2.py    |   4 +-
 .../proto/v1/v5261/v1/weaviate_pb2_grpc.py    |  61 +-
 weaviate/proto/v1/v6300/v1/batch_pb2.py       |  90 +--
 weaviate/proto/v1/v6300/v1/batch_pb2.pyi      | 142 ++--
 .../proto/v1/v6300/v1/file_replication_pb2.py |   4 +-
 weaviate/proto/v1/v6300/v1/generative_pb2.py  | 172 ++---
 weaviate/proto/v1/v6300/v1/generative_pb2.pyi |   8 +-
 weaviate/proto/v1/v6300/v1/weaviate_pb2.py    |   4 +-
 .../proto/v1/v6300/v1/weaviate_pb2_grpc.py    |  61 +-
 48 files changed, 2810 insertions(+), 873 deletions(-)
 create mode 100644 profiling/test_shutdown.py
 rename weaviate/collections/batch/{grpc_batch_objects.py => grpc_batch.py} (76%)
 create mode 100644 weaviate/proto/v1/v51/v1/file_replication_pb2.py
 create mode 100644 weaviate/proto/v1/v51/v1/file_replication_pb2.pyi
 create mode 100644 weaviate/proto/v1/v51/v1/file_replication_pb2_grpc.py
 create mode 100644 weaviate/proto/v1/v52/v1/file_replication_pb2.py
 create mode 100644 weaviate/proto/v1/v52/v1/file_replication_pb2.pyi
 create mode 100644 weaviate/proto/v1/v52/v1/file_replication_pb2_grpc.py

diff --git a/.github/workflows/main.yaml b/.github/workflows/main.yaml
index e263f8cc1..7b2a4f691 100644
--- a/.github/workflows/main.yaml
+++ b/.github/workflows/main.yaml
@@ -20,12 +20,12 @@ concurrency:
 env:
   WEAVIATE_127: 1.27.27
   WEAVIATE_128: 1.28.16
-  WEAVIATE_129: 1.29.9
-  WEAVIATE_130: 1.30.12
-  WEAVIATE_131: 1.31.5
+  WEAVIATE_129: 1.29.11
+  WEAVIATE_130: 1.30.18
+  WEAVIATE_131: 1.31.16
   WEAVIATE_132: 1.32.5
   WEAVIATE_133: 1.33.0
-  WEAVIATE_134: 1.34.0-dev-2c1c459.amd64
+  WEAVIATE_134: 1.34.0-rc.1
 
 jobs:
   lint-and-format:
@@ -153,11 +153,11 @@ jobs:
       fail-fast: false
       matrix:
         versions: [
-          { py: "3.9", weaviate: $WEAVIATE_131, grpc: "1.59.0"},
-          { py: "3.10", weaviate: $WEAVIATE_131, grpc: "1.66.0"},
-          { py: "3.11", weaviate: $WEAVIATE_131, grpc: "1.70.0"},
-          { py: "3.12", weaviate: $WEAVIATE_131, grpc: "1.72.1"},
-          { py: "3.13", weaviate: $WEAVIATE_131, grpc: "1.74.0"}
+          { py: "3.9", weaviate: $WEAVIATE_132, grpc: "1.59.0"},
+          { py: "3.10", weaviate: $WEAVIATE_132, grpc: "1.66.0"},
+          { py: "3.11", weaviate: $WEAVIATE_132, grpc: "1.70.0"},
+          { py: "3.12", weaviate: $WEAVIATE_132, grpc: "1.72.1"},
+          { py: "3.13", weaviate: $WEAVIATE_132, grpc: "1.74.0"}
         ]
         optional_dependencies: [false]
     steps:
@@ -208,11 +208,11 @@ jobs:
       fail-fast: false
       matrix:
         versions: [
-          { py: "3.9", weaviate: $WEAVIATE_131},
-          { py: "3.10", weaviate: $WEAVIATE_131},
-          { py: "3.11", weaviate: $WEAVIATE_131},
-          { py: "3.12", weaviate: $WEAVIATE_131},
-          { py: "3.13", weaviate: $WEAVIATE_131}
+          { py: "3.9", weaviate: $WEAVIATE_132},
+          { py: "3.10", weaviate: $WEAVIATE_132},
+          { py: "3.11", weaviate: $WEAVIATE_132},
+          { py: "3.12", weaviate: $WEAVIATE_132},
+          { py: "3.13", weaviate: $WEAVIATE_132}
         ]
         optional_dependencies: [false]
     steps:
diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index 345879240..4a55b0131 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -9,7 +9,7 @@
 import weaviate
 import weaviate.classes as wvc
 from integration.conftest import _sanitize_collection_name
-from weaviate import BatchClient, ClientBatchingContextManager
+from weaviate import ClientBatchingContextManager
 from weaviate.collections.classes.batch import Shard
 from weaviate.collections.classes.config import (
     Configure,
@@ -175,11 +175,11 @@ def test_add_reference(
     client_factory: ClientFactory,
     from_object_uuid: UUID,
     to_object_uuid: UUID,
-    to_object_collection: Optional[bool],
+    to_object_collection: bool,
 ) -> None:
     """Test the `add_reference` method."""
     client, name = client_factory()
-    with client.batch.fixed_size() as batch:
+    with client.batch.dynamic() as batch:
         batch.add_object(
             properties={},
             collection=name,
@@ -194,8 +194,16 @@ def test_add_reference(
             from_uuid=from_object_uuid,
             from_collection=name,
             from_property="test",
-            to=to_object_uuid,
+            to=ReferenceToMulti(target_collection=name, uuids=to_object_uuid)
+            if to_object_collection
+            else to_object_uuid,
         )
+    assert len(client.batch.failed_objects) == 0, [
+        obj.message for obj in client.batch.failed_objects
+    ]
+    assert len(client.batch.failed_references) == 0, [
+        ref.message for ref in client.batch.failed_references
+    ]
     objs = (
         client.collections.use(name)
         .query.fetch_objects(return_references=QueryReference(link_on="test"))
@@ -357,14 +365,16 @@ def test_add_ref_batch_with_tenant(client_factory: ClientFactory) -> None:
 @pytest.mark.parametrize(
     "batching_method",
     [
-        lambda client: client.batch.dynamic(),
-        lambda client: client.batch.fixed_size(),
-        lambda client: client.batch.rate_limit(9999),
+        # lambda client: client.batch.dynamic(),
+        # lambda client: client.batch.fixed_size(),
+        # lambda client: client.batch.rate_limit(9999),
+        lambda client: client.batch.experimental(concurrency=1),
     ],
     ids=[
-        "test_add_ten_thousand_data_objects_dynamic",
-        "test_add_ten_thousand_data_objects_fixed_size",
-        "test_add_ten_thousand_data_objects_rate_limit",
+        # "test_add_ten_thousand_data_objects_dynamic",
+        # "test_add_ten_thousand_data_objects_fixed_size",
+        # "test_add_ten_thousand_data_objects_rate_limit",
+        "test_add_ten_thousand_data_objects_experimental",
     ],
 )
 def test_add_ten_thousand_data_objects(
@@ -374,16 +384,31 @@ def test_add_ten_thousand_data_objects(
 ) -> None:
     """Test adding ten thousand data objects."""
     client, name = client_factory()
-
-    nr_objects = 10000
+    if (
+        request.node.callspec.id == "test_add_ten_thousand_data_objects_experimental"
+        and client._connection._weaviate_version.is_lower_than(1, 34, 0)
+    ):
+        pytest.skip("Server-side batching not supported in Weaviate < 1.34.0")
+    nr_objects = 100000
+    import time
+
+    start = time.time()
     with batching_method(client) as batch:
         for i in range(nr_objects):
             batch.add_object(
                 collection=name,
                 properties={"name": "test" + str(i)},
             )
-    objs = client.collections.use(name).query.fetch_objects(limit=nr_objects).objects
-    assert len(objs) == nr_objects
+    end = time.time()
+    print(f"Time taken to add {nr_objects} objects: {end - start} seconds")
+    assert len(client.batch.results.objs.errors) == 0
+    assert len(client.batch.results.objs.all_responses) == nr_objects
+    assert len(client.batch.results.objs.uuids) == nr_objects
+    assert len(client.collections.use(name)) == nr_objects
+    assert client.batch.results.objs.has_errors is False
+    assert len(client.batch.failed_objects) == 0, [
+        obj.message for obj in client.batch.failed_objects
+    ]
     client.collections.delete(name)
 
 
@@ -551,19 +576,28 @@ def test_add_1000_tenant_objects_with_async_indexing_and_wait_for_only_one(
         lambda client: client.batch.dynamic(),
         lambda client: client.batch.fixed_size(),
         lambda client: client.batch.rate_limit(1000),
+        lambda client: client.batch.experimental(),
     ],
     ids=[
         "test_add_one_hundred_objects_and_references_between_all_dynamic",
         "test_add_one_hundred_objects_and_references_between_all_fixed_size",
         "test_add_one_hundred_objects_and_references_between_all_rate_limit",
+        "test_add_one_hundred_objects_and_references_between_all_experimental",
     ],
 )
 def test_add_one_object_and_a_self_reference(
     client_factory: ClientFactory,
     batching_method: Callable[[weaviate.WeaviateClient], ClientBatchingContextManager],
+    request: SubRequest,
 ) -> None:
     """Test adding one object and a self reference."""
     client, name = client_factory()
+    if (
+        request.node.callspec.id
+        == "test_add_one_hundred_objects_and_references_between_all_experimental"
+        and client._connection._weaviate_version.is_lower_than(1, 34, 0)
+    ):
+        pytest.skip("Server-side batching not supported in Weaviate < 1.34.0")
     with batching_method(client) as batch:
         uuid = batch.add_object(collection=name, properties={})
         batch.add_reference(
@@ -586,7 +620,7 @@ def test_multi_threaded_batching(
     nr_objects = 1000
     nr_threads = 10
 
-    def batch_insert(batch: BatchClient) -> None:
+    def batch_insert(batch) -> None:
         for i in range(nr_objects):
             batch.add_object(
                 collection=name,
@@ -683,6 +717,12 @@ def test_batching_error_logs(
     client_factory: ClientFactory, caplog: pytest.LogCaptureFixture
 ) -> None:
     client, name = client_factory()
+    if client._connection._weaviate_version.is_at_least(
+        1, 32, 1
+    ):  # TODO: change to 1.33.0 when released
+        pytest.skip(
+            "Batching error logs do not get emitted by the new server-side batching functionality."
+        )
     with client.batch.fixed_size() as batch:
         for obj in [{"name": i} for i in range(100)]:
             batch.add_object(properties=obj, collection=name)
diff --git a/integration/test_client.py b/integration/test_client.py
index 66ebe4be0..77317cf54 100644
--- a/integration/test_client.py
+++ b/integration/test_client.py
@@ -345,7 +345,12 @@ def test_client_cluster_with_lazy_shard_loading(
         assert len(nodes[0].shards) == 1
         assert nodes[0].shards[0].collection == collection.name
         assert nodes[0].shards[0].object_count == 0
-        assert nodes[0].shards[0].vector_indexing_status == "READY"
+        assert nodes[0].shards[0].vector_indexing_status in [
+            "READONLY",
+            "INDEXING",
+            "READY",
+            "LAZY_LOADING",
+        ]
         assert nodes[0].shards[0].vector_queue_length == 0
         assert nodes[0].shards[0].compressed is False
         assert nodes[0].shards[0].loaded is True
@@ -358,12 +363,6 @@ def test_client_cluster_without_lazy_shard_loading(
 ) -> None:
     client = client_factory(8090, 50061)
 
-    # Lazy-loading behaviour was changed in 1.32.4:
-    # https://github.com/weaviate/weaviate/pull/8829
-    #
-    # We also accept LOADING/READY because it may vary
-    # based on the machine running the tests.
-
     try:
         collection = client.collections.create(
             name=request.node.name, vectorizer_config=Configure.Vectorizer.none()
@@ -374,10 +373,12 @@ def test_client_cluster_without_lazy_shard_loading(
         assert len(nodes[0].shards) == 1
         assert nodes[0].shards[0].collection == collection.name
         assert nodes[0].shards[0].object_count == 0
-        if collection._connection._weaviate_version.is_lower_than(1, 32, 0):
-            assert nodes[0].shards[0].vector_indexing_status == "READY"
-        else:
-            assert nodes[0].shards[0].vector_indexing_status == "LAZY_LOADING"
+        assert nodes[0].shards[0].vector_indexing_status in [
+            "READONLY",
+            "INDEXING",
+            "READY",
+            "LAZY_LOADING",
+        ]
         assert nodes[0].shards[0].vector_queue_length == 0
         assert nodes[0].shards[0].compressed is False
         if collection._connection._weaviate_version.is_lower_than(1, 25, 0):
diff --git a/integration/test_rbac.py b/integration/test_rbac.py
index 799872705..3b3866986 100644
--- a/integration/test_rbac.py
+++ b/integration/test_rbac.py
@@ -6,6 +6,7 @@
 from integration.conftest import ClientFactory, _sanitize_collection_name
 from weaviate.auth import Auth
 from weaviate.classes.rbac import Actions, Permissions, RoleScope
+from weaviate.connect.helpers import connect_to_local
 from weaviate.rbac.models import (
     AliasPermissionOutput,
     BackupsPermissionOutput,
@@ -734,3 +735,21 @@ def test_permission_joining(client_factory: ClientFactory) -> None:
 
         finally:
             client.roles.delete(role_name)
+
+
+def test_server_side_batching_with_auth() -> None:
+    collection_name = "TestSSBAuth"
+    with connect_to_local(
+        port=RBAC_PORTS[0], grpc_port=RBAC_PORTS[1], auth_credentials=RBAC_AUTH_CREDS
+    ) as client:
+        if client._connection._weaviate_version.is_lower_than(1, 34, 0):
+            pytest.skip("Server-side batching not supported in Weaviate < 1.34.0")
+        collection = client.collections.create(collection_name)
+        with client.batch.experimental() as batch:
+            batch.add_object(collection_name)
+            batch.add_object(collection_name)
+            batch.add_object(collection_name)
+        try:
+            assert len(collection) == 3
+        finally:
+            client.collections.delete(collection_name)
diff --git a/profiling/test_shutdown.py b/profiling/test_shutdown.py
new file mode 100644
index 000000000..11b9264c1
--- /dev/null
+++ b/profiling/test_shutdown.py
@@ -0,0 +1,76 @@
+import json
+import random
+import time
+import weaviate
+import weaviate.classes.config as wvcc
+
+
+def setup(client: weaviate.WeaviateClient, collection: str) -> weaviate.collections.Collection:
+    if client.collections.exists(collection):
+        client.collections.delete(collection)
+    return client.collections.create(
+        name=collection,
+        properties=[
+            wvcc.Property(
+                name="title",
+                data_type=wvcc.DataType.TEXT,
+            ),
+            wvcc.Property(
+                name="content",
+                data_type=wvcc.DataType.TEXT,
+            ),
+        ],
+        replication_config=wvcc.Configure.replication(factor=3, async_enabled=True),
+        vector_config=wvcc.Configure.Vectors.self_provided(),
+    )
+
+
+def import_(client: weaviate.WeaviateClient, collection: str, how_many: int = 1_000_000) -> None:
+    uuids: dict[str, int] = {}
+    with client.batch.experimental(concurrency=1) as batch:
+        for i in range(how_many):
+            uuid = batch.add_object(
+                collection=collection,
+                properties={
+                    "title": f"Title {i}",
+                    "content": f"Content {i}",
+                },
+                vector=random_vector(),
+            )
+            uuids[str(uuid)] = i
+            if batch.number_errors > 0:
+                print(f"There are some errors {batch.number_errors}")
+
+    for err in client.batch.failed_objects:
+        print(err.message)
+    assert len(client.batch.failed_objects) == 0, "Expected there to be no errors when importing"
+    client.batch.wait_for_vector_indexing()
+    with open("uuids.json", "w") as f:
+        json.dump(uuids, f)
+
+
+def verify(client: weaviate.WeaviateClient, collection: str, expected: int = 1_000_000) -> None:
+    actual = 0
+    count = 0
+    c = client.collections.use(collection)
+    while actual != expected:
+        actual = len(c)
+        print(f"Found {actual} objects, waiting for async repl to reach {expected}...")
+        time.sleep(1)
+        count += 1
+        if count == 120:
+            break
+    assert actual == expected, f"Expected {expected} objects, found {actual}"
+
+
+def random_vector() -> list[float]:
+    return [random.uniform(0, 1) for _ in range(128)]
+
+
+def test_main() -> None:
+    collection = "BatchImportShutdownJourney"
+    how_many = 500000
+    with weaviate.connect_to_local() as client:
+        collection = setup(client, collection)
+        import_(client, collection.name, how_many)
+        verify(client, collection.name, how_many)
diff --git a/weaviate/classes/data.py b/weaviate/classes/data.py
index f690cb855..904dc79bc 100644
--- a/weaviate/classes/data.py
+++ b/weaviate/classes/data.py
@@ -1,4 +1,5 @@
 from weaviate.collections.classes.data import DataObject, DataReference
+from weaviate.collections.classes.internal import ReferenceToMulti
 from weaviate.collections.classes.types import GeoCoordinate, PhoneNumber
 
 __all__ = [
@@ -6,4 +7,5 @@
     "DataReference",
     "GeoCoordinate",
     "PhoneNumber",
+    "ReferenceToMulti",
 ]
diff --git a/weaviate/client.py b/weaviate/client.py
index b8c87ec28..8cf856c51 100644
--- a/weaviate/client.py
+++ b/weaviate/client.py
@@ -145,7 +145,11 @@ def __init__(
         self.alias = _Alias(
             self._connection,
         )
-        self.batch = _BatchClientWrapper(self._connection, config=collections)
+        self.batch = _BatchClientWrapper(
+            self._connection,
+            config=collections,
+            consistency_level=None,
+        )
         self.backup = _Backup(self._connection)
         self.cluster = _Cluster(self._connection)
         self.collections = collections
diff --git a/weaviate/collections/batch/__init__.py b/weaviate/collections/batch/__init__.py
index bfadcc60b..f0816f302 100644
--- a/weaviate/collections/batch/__init__.py
+++ b/weaviate/collections/batch/__init__.py
@@ -1,6 +1,7 @@
 __all__ = ["_BatchClient", "_BatchCollection", "_BatchGRPC", "_BatchREST"]
 
+from weaviate.collections.batch.grpc_batch import _BatchGRPC
+
 from .client import _BatchClient
 from .collection import _BatchCollection
-from .grpc_batch_objects import _BatchGRPC
 from .rest import _BatchREST
diff --git a/weaviate/collections/batch/base.py b/weaviate/collections/batch/base.py
index 1cbee5ffd..385be68c2 100644
--- a/weaviate/collections/batch/base.py
+++ b/weaviate/collections/batch/base.py
@@ -10,14 +10,15 @@
 from concurrent.futures import ThreadPoolExecutor
 from copy import copy
 from dataclasses import dataclass, field
-from typing import Any, Dict, Generic, List, Optional, Set, TypeVar, Union, cast
+from queue import Queue
+from typing import Any, Dict, Generator, Generic, List, Optional, Set, TypeVar, Union, cast
 
 from httpx import ConnectError
 from pydantic import ValidationError
 from typing_extensions import TypeAlias
 
 from weaviate.cluster.types import Node
-from weaviate.collections.batch.grpc_batch_objects import _BatchGRPC
+from weaviate.collections.batch.grpc_batch import _BatchGRPC
 from weaviate.collections.batch.rest import _BatchREST
 from weaviate.collections.classes.batch import (
     BatchObject,
@@ -40,8 +41,15 @@
 from weaviate.collections.classes.types import WeaviateProperties
 from weaviate.connect import executor
 from weaviate.connect.v4 import ConnectionSync
-from weaviate.exceptions import EmptyResponseException, WeaviateBatchValidationError
+from weaviate.exceptions import (
+    EmptyResponseException,
+    WeaviateBatchStreamError,
+    WeaviateBatchValidationError,
+    WeaviateGRPCUnavailableError,
+    WeaviateStartUpError,
+)
 from weaviate.logger import logger
+from weaviate.proto.v1 import batch_pb2
 from weaviate.types import UUID, VECTORS
 from weaviate.util import _decode_json_response_dict
 from weaviate.warnings import _Warnings
@@ -87,16 +95,19 @@ def prepend(self, item: List[TBatchInput]) -> None:
         self._lock.release()
 
 
-class ReferencesBatchRequest(BatchRequest[_BatchReference, BatchReferenceReturn]):
+Ref = TypeVar("Ref", bound=Union[_BatchReference, batch_pb2.BatchReference])
+
+
+class ReferencesBatchRequest(BatchRequest[Ref, BatchReferenceReturn]):
     """Collect Weaviate-object references to add them in one request to Weaviate."""
 
-    def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[_BatchReference]:
+    def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
         """Pop the given number of items from the BatchRequest queue.
 
         Returns:
             A list of items from the BatchRequest.
         """
-        ret: List[_BatchReference] = []
+        ret: List[Ref] = []
         i = 0
         self._lock.acquire()
         while len(ret) < pop_amount and len(self._items) > 0 and i < len(self._items):
@@ -109,11 +120,25 @@ def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[_BatchRefere
         self._lock.release()
         return ret
 
+    def head(self) -> Optional[Ref]:
+        """Get the first item from the BatchRequest queue without removing it.
+
+        Returns:
+            The first item from the BatchRequest or None if the queue is empty.
+        """
+        self._lock.acquire()
+        item = self._items[0] if len(self._items) > 0 else None
+        self._lock.release()
+        return item
+
+
+Obj = TypeVar("Obj", bound=Union[_BatchObject, batch_pb2.BatchObject])
 
-class ObjectsBatchRequest(BatchRequest[_BatchObject, BatchObjectReturn]):
+
+class ObjectsBatchRequest(Generic[Obj], BatchRequest[Obj, BatchObjectReturn]):
     """Collect objects for one batch request to weaviate."""
 
-    def pop_items(self, pop_amount: int) -> List[_BatchObject]:
+    def pop_items(self, pop_amount: int) -> List[Obj]:
         """Pop the given number of items from the BatchRequest queue.
 
         Returns:
@@ -130,6 +155,17 @@ def pop_items(self, pop_amount: int) -> List[_BatchObject]:
         self._lock.release()
         return ret
 
+    def head(self) -> Optional[Obj]:
+        """Get the first item from the BatchRequest queue without removing it.
+
+        Returns:
+            The first item from the BatchRequest or None if the queue is empty.
+        """
+        self._lock.acquire()
+        item = self._items[0] if len(self._items) > 0 else None
+        self._lock.release()
+        return item
+
 
 @dataclass
 class _BatchDataWrapper:
@@ -155,7 +191,14 @@ class _RateLimitedBatching:
     requests_per_minute: int
 
 
-_BatchMode: TypeAlias = Union[_DynamicBatching, _FixedSizeBatching, _RateLimitedBatching]
+@dataclass
+class _ServerSideBatching:
+    concurrency: int
+
+
+_BatchMode: TypeAlias = Union[
+    _DynamicBatching, _FixedSizeBatching, _RateLimitedBatching, _ServerSideBatching
+]
 
 
 class _BatchBase:
@@ -177,7 +220,9 @@ def __init__(
         self.__consistency_level: Optional[ConsistencyLevel] = consistency_level
         self.__vectorizer_batching = vectorizer_batching
 
-        self.__batch_grpc = _BatchGRPC(connection._weaviate_version, self.__consistency_level)
+        self.__batch_grpc = _BatchGRPC(
+            connection._weaviate_version, self.__consistency_level, connection._grpc_max_msg_size
+        )
         self.__batch_rest = _BatchREST(self.__consistency_level)
 
         # lookup table for objects that are currently being processed - is used to not send references from objects that have not been added yet
@@ -194,6 +239,7 @@ def __init__(
 
         self.__executor = executor
         self.__objs_count = 0
+        self.__refs_count = 0
         self.__objs_logs_count = 0
         self.__refs_logs_count = 0
 
@@ -250,6 +296,9 @@ def number_errors(self) -> int:
             self.__results_for_wrapper.failed_references
         )
 
+    def _start(self):
+        pass
+
     def _shutdown(self) -> None:
         """Shutdown the current batch and wait for all requests to be finished."""
         self.flush()
@@ -736,7 +785,9 @@ def _add_reference(
                     ),
                     to_object_uuid=uid,
                     tenant=tenant,
+                    index=self.__refs_count,
                 )
+                self.__refs_count += 1
             except ValidationError as e:
                 raise WeaviateBatchValidationError(repr(e))
             self.__batch_references.add(batch_reference._to_internal())
@@ -753,6 +804,550 @@ def __check_bg_thread_alive(self) -> None:
         raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
 
 
+class _BgThreads:
+    def __init__(self, send: threading.Thread, recv: threading.Thread):
+        self.send = send
+        self.recv = recv
+        self.__started_recv = False
+        self.__started_send = False
+
+    def start_recv(self) -> None:
+        if not self.__started_recv:
+            self.recv.start()
+            self.__started_recv = True
+
+    def start_send(self) -> None:
+        if not self.__started_send:
+            self.send.start()
+            self.__started_send = True
+
+    def is_alive(self) -> bool:
+        """Check if the background threads are still alive."""
+        return self.send_alive() or self.recv_alive()
+
+    def send_alive(self) -> bool:
+        """Check if the send background thread is still alive."""
+        return self.send.is_alive()
+
+    def recv_alive(self) -> bool:
+        """Check if the recv background thread is still alive."""
+        return self.recv.is_alive()
+
+
+class _BatchBaseNew:
+    def __init__(
+        self,
+        connection: ConnectionSync,
+        consistency_level: Optional[ConsistencyLevel],
+        results: _BatchDataWrapper,
+        batch_mode: _BatchMode,
+        executor: ThreadPoolExecutor,
+        vectorizer_batching: bool,
+        objects: Optional[ObjectsBatchRequest[batch_pb2.BatchObject]] = None,
+        references: Optional[ReferencesBatchRequest] = None,
+    ) -> None:
+        self.__batch_objects = objects or ObjectsBatchRequest[batch_pb2.BatchObject]()
+        self.__batch_references = references or ReferencesBatchRequest[batch_pb2.BatchReference]()
+
+        self.__connection = connection
+        self.__consistency_level: ConsistencyLevel = consistency_level or ConsistencyLevel.QUORUM
+        self.__batch_size = 100
+
+        self.__batch_grpc = _BatchGRPC(
+            connection._weaviate_version, self.__consistency_level, connection._grpc_max_msg_size
+        )
+
+        # lookup table for objects that are currently being processed - is used to not send references from objects that have not been added yet
+        self.__uuid_lookup: Set[str] = set()
+
+        # we do not want that users can access the results directly as they are not thread-safe
+        self.__results_for_wrapper_backup = results
+        self.__results_for_wrapper = _BatchDataWrapper()
+
+        self.__objs_count = 0
+        self.__refs_count = 0
+
+        self.__uuid_lookup_lock = threading.Lock()
+        self.__results_lock = threading.Lock()
+
+        self.__bg_thread_exception: Optional[Exception] = None
+        self.__is_shutting_down = threading.Event()
+        self.__is_shutdown = threading.Event()
+
+        self.__objs_cache_lock = threading.Lock()
+        self.__refs_cache_lock = threading.Lock()
+        self.__objs_cache: dict[str, BatchObject] = {}
+        self.__refs_cache: dict[int, BatchReference] = {}
+
+        # maxsize=1 so that __batch_send does not run faster than generator for __batch_recv
+        # thereby using too much buffer in case of server-side shutdown
+        self.__reqs: Queue[Optional[batch_pb2.BatchStreamRequest]] = Queue(maxsize=1)
+
+        self.__stop = False
+
+        self.__batch_mode = batch_mode
+
+        self.__total = 0
+
+    @property
+    def number_errors(self) -> int:
+        """Return the number of errors in the batch."""
+        return len(self.__results_for_wrapper.failed_objects) + len(
+            self.__results_for_wrapper.failed_references
+        )
+
+    def __all_threads_alive(self) -> bool:
+        return self.__bg_threads is not None and all(
+            thread.is_alive() for thread in self.__bg_threads
+        )
+
+    def __any_threads_alive(self) -> bool:
+        return self.__bg_threads is not None and any(
+            thread.is_alive() for thread in self.__bg_threads
+        )
+
+    def _start(self) -> None:
+        assert isinstance(self.__batch_mode, _ServerSideBatching), (
+            "Only server-side batching is supported in this mode"
+        )
+        self.__bg_threads = [
+            self.__start_bg_threads() for _ in range(self.__batch_mode.concurrency)
+        ]
+        logger.warning(
+            f"Provisioned {len(self.__bg_threads)} stream(s) to the server for batch processing"
+        )
+        now = time.time()
+        while not self.__all_threads_alive():
+            # wait for the stream to be started by __batch_stream
+            time.sleep(0.01)
+            if time.time() - now > 10:
+                raise WeaviateBatchValidationError(
+                    "Batch stream was not started within 10 seconds. Please check your connection."
+                )
+
+    def _shutdown(self) -> None:
+        # Shutdown the current batch and wait for all requests to be finished
+        self.flush()
+        self.__stop = True
+
+        # we are done, wait for bg threads to finish
+        # self.__batch_stream will set the shutdown event when it receives
+        # the stop message from the server
+        while self.__any_threads_alive():
+            time.sleep(1)
+        logger.warning("Send & receive threads finished.")
+
+        # copy the results to the public results
+        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
+        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
+        self.__results_for_wrapper_backup.failed_references = (
+            self.__results_for_wrapper.failed_references
+        )
+        self.__results_for_wrapper_backup.imported_shards = (
+            self.__results_for_wrapper.imported_shards
+        )
+
+    def __batch_send(self) -> None:
+        refresh_time: float = 0.01
+        while (
+            self.__shut_background_thread_down is not None
+            and not self.__shut_background_thread_down.is_set()
+        ):
+            if len(self.__batch_objects) + len(self.__batch_references) > 0:
+                self._batch_send = True
+                start = time.time()
+                while (len_o := len(self.__batch_objects)) + (
+                    len_r := len(self.__batch_references)
+                ) < self.__batch_size:
+                    # wait for more objects to be added up to the batch size
+                    time.sleep(0.01)
+                    if (
+                        self.__shut_background_thread_down is not None
+                        and self.__shut_background_thread_down.is_set()
+                    ):
+                        logger.warning("Threads were shutdown, exiting batch send loop")
+                        # shutdown was requested, exit early
+                        self.__reqs.put(None)
+                        return
+                    if time.time() - start >= 1 and (
+                        len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
+                    ):
+                        # no new objects were added in the last second, exit the loop
+                        break
+
+                objs = self.__batch_objects.pop_items(self.__batch_size)
+                refs = self.__batch_references.pop_items(
+                    self.__batch_size - len(objs),
+                    uuid_lookup=self.__uuid_lookup,
+                )
+                with self.__uuid_lookup_lock:
+                    self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
+
+                for req in self.__generate_stream_requests(objs, refs):
+                    logged = False
+                    while self.__is_shutting_down.is_set() or self.__is_shutdown.is_set():
+                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
+                        # so that the connection is refreshed to a new node where the objects can be accepted
+                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
+                        if not logged:
+                            logger.warning("Waiting for stream to be re-established...")
+                            logged = True
+                            # put sentinel into our queue to signal the end of the current stream
+                            self.__reqs.put(None)
+                        time.sleep(1)
+                    if logged:
+                        logger.warning("Stream re-established, resuming sending batches")
+                    self.__reqs.put(req)
+            elif self.__stop:
+                # we are done, send the sentinel into our queue to be consumed by the batch sender
+                self.__reqs.put(None)  # signal the end of the stream
+                logger.warning("Batching finished, sent stop signal to batch stream")
+                return
+            time.sleep(refresh_time)
+
+    def __generate_stream_requests(
+        self,
+        objs: List[batch_pb2.BatchObject],
+        refs: List[batch_pb2.BatchReference],
+    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
+        per_object_overhead = 4  # extra overhead bytes per object in the request
+
+        def request_maker():
+            return batch_pb2.BatchStreamRequest()
+
+        request = request_maker()
+        total_size = request.ByteSize()
+
+        for obj in objs:
+            obj_size = obj.ByteSize() + per_object_overhead
+
+            if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.objects.values.append(obj)
+            total_size += obj_size
+
+        for ref in refs:
+            ref_size = ref.ByteSize() + per_object_overhead
+
+            if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.references.values.append(ref)
+            total_size += ref_size
+
+        if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
+            yield request
+
+    def __generate_stream_requests_for_grpc(
+        self,
+    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
+        yield batch_pb2.BatchStreamRequest(
+            start=batch_pb2.BatchStreamRequest.Start(
+                consistency_level=self.__batch_grpc._consistency_level,
+            ),
+        )
+        while (
+            self.__shut_background_thread_down is not None
+            and not self.__shut_background_thread_down.is_set()
+        ):
+            req = self.__reqs.get()
+            if req is not None:
+                self.__total += len(req.data.objects.values) + len(req.data.references.values)
+                yield req
+                continue
+            if self.__stop and not (
+                self.__is_shutting_down.is_set() or self.__is_shutdown.is_set()
+            ):
+                logger.warning("Batching finished, closing the client-side of the stream")
+                yield batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop())
+                return
+            if self.__is_shutting_down.is_set():
+                logger.warning("Server shutting down, closing the client-side of the stream")
+                return
+            logger.warning("Received sentinel, but not stopping, continuing...")
+
+    def __batch_recv(self) -> None:
+        for message in self.__batch_grpc.stream(
+            connection=self.__connection,
+            requests=self.__generate_stream_requests_for_grpc(),
+        ):
+            if message.HasField("started"):
+                logger.warning("Batch stream started successfully")
+                for threads in self.__bg_threads:
+                    threads.start_send()
+            if message.HasField("backoff"):
+                if (
+                    message.backoff.batch_size != self.__batch_size
+                    and not self.__is_shutting_down.is_set()
+                    and not self.__is_shutdown.is_set()
+                    and not self.__stop
+                ):
+                    self.__batch_size = message.backoff.batch_size
+                    logger.warning(
+                        f"Updated batch size to {self.__batch_size} as per server request"
+                    )
+            if message.HasField("results"):
+                result_objs = BatchObjectReturn()
+                # result_refs = BatchReferenceReturn()
+                failed_objs: List[ErrorObject] = []
+                failed_refs: List[ErrorReference] = []
+                for error in message.results.errors:
+                    if error.HasField("uuid"):
+                        try:
+                            cached = self.__objs_cache.pop(error.uuid)
+                        except KeyError:
+                            continue
+                        err = ErrorObject(
+                            message=error.error,
+                            object_=cached,
+                        )
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[err],
+                            errors={cached.index: err},
+                        )
+                        failed_objs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "object": error.uuid,
+                                "action": "use {client,collection}.batch.failed_objects to access this error",
+                            }
+                        )
+                    if error.HasField("beacon"):
+                        # TODO: get cached ref from beacon
+                        err = ErrorReference(
+                            message=error.error,
+                            reference=error.beacon,  # pyright: ignore
+                        )
+                        failed_refs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "reference": error.beacon,
+                                "action": "use {client,collection}.batch.failed_references to access this error",
+                            }
+                        )
+                for success in message.results.successes:
+                    if success.HasField("uuid"):
+                        try:
+                            cached = self.__objs_cache.pop(success.uuid)
+                        except KeyError:
+                            continue
+                        uuid = uuid_package.UUID(success.uuid)
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[uuid],
+                            uuids={cached.index: uuid},
+                        )
+                    if success.HasField("beacon"):
+                        # TODO: remove cached ref using beacon
+                        # self.__refs_cache.pop(success.beacon, None)
+                        pass
+                with self.__results_lock:
+                    self.__results_for_wrapper.results.objs += result_objs
+                    self.__results_for_wrapper.failed_objects.extend(failed_objs)
+                    self.__results_for_wrapper.failed_references.extend(failed_refs)
+            elif message.HasField("shutting_down"):
+                logger.warning(
+                    "Received shutting down message from server, pausing sending until stream is re-established"
+                )
+                self.__is_shutting_down.set()
+            elif message.HasField("shutdown"):
+                logger.warning("Received shutdown finished message from server")
+                self.__is_shutdown.set()
+                self.__is_shutting_down.clear()
+                self.__reconnect()
+
+        # restart the stream if we were shutdown by the node we were connected to ensuring that the index is
+        # propagated properly from it to the new one
+        if self.__is_shutdown.is_set():
+            logger.warning("Restarting batch recv after shutdown...")
+            self.__is_shutdown.clear()
+            return self.__batch_recv()
+        else:
+            logger.warning("Server closed the stream from its side, shutting down batch")
+            return
+
+    def __reconnect(self, retry: int = 0) -> None:
+        try:
+            logger.warning(f"Trying to reconnect after shutdown... {retry + 1}/{5}")
+            self.__connection.close("sync")
+            self.__connection.connect(force=True)
+            logger.warning("Reconnected successfully")
+        except (WeaviateStartUpError, WeaviateGRPCUnavailableError) as e:
+            if retry < 5:
+                time.sleep(2**retry)
+                self.__reconnect(retry + 1)
+            else:
+                logger.error("Failed to reconnect after 5 attempts")
+                self.__bg_thread_exception = e
+
+    def __start_bg_threads(self) -> _BgThreads:
+        """Create a background thread that periodically checks how congested the batch queue is."""
+        self.__shut_background_thread_down = threading.Event()
+
+        def batch_send_wrapper() -> None:
+            try:
+                self.__batch_send()
+                logger.warning("exited batch send thread")
+            except Exception as e:
+                logger.error(e)
+                self.__bg_thread_exception = e
+
+        def batch_recv_wrapper() -> None:
+            socket_hung_up = False
+            try:
+                self.__batch_recv()
+                logger.warning("exited batch receive thread")
+            except Exception as e:
+                if isinstance(e, WeaviateBatchStreamError) and (
+                    "Socket closed" in e.message or "context canceled" in e.message
+                ):
+                    socket_hung_up = True
+                else:
+                    logger.error(e)
+                    logger.error(type(e))
+                    self.__bg_thread_exception = e
+            if socket_hung_up:
+                # this happens during ungraceful shutdown of the coordinator
+                # lets restart the stream and add the cached objects again
+                logger.warning("Stream closed unexpectedly, restarting...")
+                self.__reconnect()
+                # server sets this whenever it restarts, gracefully or unexpectedly, so need to clear it now
+                self.__is_shutting_down.clear()
+                with self.__objs_cache_lock:
+                    logger.warning(
+                        f"Re-adding {len(self.__objs_cache)} cached objects to the batch"
+                    )
+                    self.__batch_objects.prepend(
+                        [
+                            self.__batch_grpc.grpc_object(o._to_internal())
+                            for o in self.__objs_cache.values()
+                        ]
+                    )
+                with self.__refs_cache_lock:
+                    self.__batch_references.prepend(
+                        [
+                            self.__batch_grpc.grpc_reference(o._to_internal())
+                            for o in self.__refs_cache.values()
+                        ]
+                    )
+                # start a new stream with a newly reconnected channel
+                return batch_recv_wrapper()
+
+        threads = _BgThreads(
+            send=threading.Thread(
+                target=batch_send_wrapper,
+                daemon=True,
+                name="BgBatchSend",
+            ),
+            recv=threading.Thread(
+                target=batch_recv_wrapper,
+                daemon=True,
+                name="BgBatchRecv",
+            ),
+        )
+        threads.start_recv()
+        return threads
+
+    def flush(self) -> None:
+        """Flush the batch queue and wait for all requests to be finished."""
+        # bg thread is sending objs+refs automatically, so simply wait for everything to be done
+        while len(self.__batch_objects) > 0 or len(self.__batch_references) > 0:
+            time.sleep(0.01)
+            self.__check_bg_threads_alive()
+
+    def _add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[str] = None,
+    ) -> UUID:
+        self.__check_bg_threads_alive()
+        try:
+            batch_object = BatchObject(
+                collection=collection,
+                properties=properties,
+                references=references,
+                uuid=uuid,
+                vector=vector,
+                tenant=tenant,
+                index=self.__objs_count,
+            )
+            self.__results_for_wrapper.imported_shards.add(
+                Shard(collection=collection, tenant=tenant)
+            )
+        except ValidationError as e:
+            raise WeaviateBatchValidationError(repr(e))
+        uuid = str(batch_object.uuid)
+        with self.__uuid_lookup_lock:
+            self.__uuid_lookup.add(uuid)
+        self.__batch_objects.add(self.__batch_grpc.grpc_object(batch_object._to_internal()))
+        with self.__objs_cache_lock:
+            self.__objs_cache[uuid] = batch_object
+        self.__objs_count += 1
+
+        # block if queue gets too long or weaviate is overloaded - reading files is faster them sending them so we do
+        # not need a long queue
+        while len(self.__batch_objects) >= self.__batch_size * 2:
+            self.__check_bg_threads_alive()
+            time.sleep(0.01)
+
+        assert batch_object.uuid is not None
+        return batch_object.uuid
+
+    def _add_reference(
+        self,
+        from_object_uuid: UUID,
+        from_object_collection: str,
+        from_property_name: str,
+        to: ReferenceInput,
+        tenant: Optional[str] = None,
+    ) -> None:
+        self.__check_bg_threads_alive()
+        if isinstance(to, ReferenceToMulti):
+            to_strs: Union[List[str], List[UUID]] = to.uuids_str
+        elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
+            to_strs = [to]
+        else:
+            to_strs = list(to)
+
+        for uid in to_strs:
+            try:
+                batch_reference = BatchReference(
+                    from_object_collection=from_object_collection,
+                    from_object_uuid=from_object_uuid,
+                    from_property_name=from_property_name,
+                    to_object_collection=(
+                        to.target_collection if isinstance(to, ReferenceToMulti) else None
+                    ),
+                    to_object_uuid=uid,
+                    tenant=tenant,
+                    index=self.__refs_count,
+                )
+            except ValidationError as e:
+                raise WeaviateBatchValidationError(repr(e))
+            self.__batch_references.add(
+                self.__batch_grpc.grpc_reference(batch_reference._to_internal())
+            )
+            with self.__refs_cache_lock:
+                self.__refs_cache[self.__refs_count] = batch_reference
+                self.__refs_count += 1
+
+    def __check_bg_threads_alive(self) -> None:
+        if self.__any_threads_alive():
+            return
+
+        raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
+
+
 class _ClusterBatch:
     def __init__(self, connection: ConnectionSync):
         self._connection = connection
diff --git a/weaviate/collections/batch/batch_wrapper.py b/weaviate/collections/batch/batch_wrapper.py
index 19d97ba75..a64f267ca 100644
--- a/weaviate/collections/batch/batch_wrapper.py
+++ b/weaviate/collections/batch/batch_wrapper.py
@@ -1,10 +1,12 @@
 import time
-from typing import Any, Generic, List, Optional, TypeVar, cast
+from typing import Any, Generic, List, Optional, Protocol, TypeVar, Union, cast
 
 from weaviate.collections.batch.base import (
     _BatchBase,
+    _BatchBaseNew,
     _BatchDataWrapper,
     _BatchMode,
+    _ClusterBatch,
     _DynamicBatching,
 )
 from weaviate.collections.classes.batch import (
@@ -14,9 +16,13 @@
     Shard,
 )
 from weaviate.collections.classes.config import ConsistencyLevel
+from weaviate.collections.classes.internal import ReferenceInput, ReferenceInputs
+from weaviate.collections.classes.tenants import Tenant
+from weaviate.collections.classes.types import Properties, WeaviateProperties
 from weaviate.connect import executor
 from weaviate.connect.v4 import ConnectionSync
 from weaviate.logger import logger
+from weaviate.types import UUID, VECTORS
 from weaviate.util import _capitalize_first_letter, _decode_json_response_list
 
 
@@ -28,11 +34,12 @@ def __init__(
     ):
         self._connection = connection
         self._consistency_level = consistency_level
-        self._current_batch: Optional[_BatchBase] = None
+        self._current_batch: Optional[Union[_BatchBase, _BatchBaseNew]] = None
         # config options
         self._batch_mode: _BatchMode = _DynamicBatching()
 
         self._batch_data = _BatchDataWrapper()
+        self._cluster = _ClusterBatch(connection)
 
     def __is_ready(
         self, max_count: int, shards: Optional[List[Shard]], backoff_count: int = 0
@@ -120,15 +127,150 @@ def results(self) -> BatchResult:
         return self._batch_data.results
 
 
-T = TypeVar("T", bound=_BatchBase)
+class BatchClientProtocol(Protocol):
+    def add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> UUID:
+        """Add one object to this batch.
+
+        NOTE: If the UUID of one of the objects already exists then the existing object will be
+        replaced by the new object.
+
+        Args:
+            collection: The name of the collection this object belongs to.
+            properties: The data properties of the object to be added as a dictionary.
+            references: The references of the object to be added as a dictionary.
+            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
+                If it is None an UUIDv4 will generated, by default None
+            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
+                vector was generated using the _identical_ vectorization module that is configured for the class. In this
+                case this vector takes precedence.
+                Supported types are:
+                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
+                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Returns:
+            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    def add_reference(
+        self,
+        from_uuid: UUID,
+        from_collection: str,
+        from_property: str,
+        to: ReferenceInput,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> None:
+        """Add one reference to this batch.
+
+        Args:
+            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
+            from_collection: The name of the collection that should reference another object.
+            from_property: The name of the property that contains the reference.
+            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
+                For multi-target references use wvc.Reference.to_multi_target().
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    def flush(self) -> None:
+        """Flush the current batch.
+
+        This will send all the objects and references in the current batch to Weaviate.
+        """
+        ...
+
+    @property
+    def number_errors(self) -> int:
+        """Get the number of errors in the current batch.
+
+        Returns:
+            The number of errors in the current batch.
+        """
+        ...
+
+
+class BatchCollectionProtocol(Generic[Properties], Protocol[Properties]):
+    def add_object(
+        self,
+        properties: Optional[Properties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+    ) -> UUID:
+        """Add one object to this batch.
+
+        NOTE: If the UUID of one of the objects already exists then the existing object will be replaced by the new object.
+
+        Args:
+            properties: The data properties of the object to be added as a dictionary.
+            references: The references of the object to be added as a dictionary.
+            uuid: The UUID of the object as an uuid.UUID object or str. If it is None an UUIDv4 will generated, by default None
+            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
+                vector was generated using the _identical_ vectorization module that is configured for the class. In this
+                case this vector takes precedence. Supported types are:
+                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
+                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
+
+        Returns:
+            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    def add_reference(
+        self, from_uuid: UUID, from_property: str, to: Union[ReferenceInput, List[UUID]]
+    ) -> None:
+        """Add a reference to this batch.
+
+        Args:
+            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
+            from_property: The name of the property that contains the reference.
+            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
+                For multi-target references use wvc.Reference.to_multi_target().
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    @property
+    def number_errors(self) -> int:
+        """Get the number of errors in the current batch.
+
+        Returns:
+            The number of errors in the current batch.
+        """
+        ...
+
+
+T = TypeVar("T", bound=Union[_BatchBase, _BatchBaseNew])
+P = TypeVar("P", bound=Union[BatchClientProtocol, BatchCollectionProtocol[Properties]])
 
 
-class _ContextManagerWrapper(Generic[T]):
+class _ContextManagerWrapper(Generic[T, P]):
     def __init__(self, current_batch: T):
         self.__current_batch: T = current_batch
 
     def __exit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
         self.__current_batch._shutdown()
 
-    def __enter__(self) -> T:
-        return self.__current_batch
+    def __enter__(self) -> P:
+        self.__current_batch._start()
+        return self.__current_batch  # pyright: ignore[reportReturnType]
diff --git a/weaviate/collections/batch/client.py b/weaviate/collections/batch/client.py
index c7f0e6cf7..a86a3be10 100644
--- a/weaviate/collections/batch/client.py
+++ b/weaviate/collections/batch/client.py
@@ -1,14 +1,17 @@
 from concurrent.futures import ThreadPoolExecutor
-from typing import TYPE_CHECKING, Optional, Union
+from typing import TYPE_CHECKING, Optional, Type, Union
 
 from weaviate.collections.batch.base import (
     _BatchBase,
+    _BatchBaseNew,
     _BatchDataWrapper,
     _DynamicBatching,
     _FixedSizeBatching,
     _RateLimitedBatching,
+    _ServerSideBatching,
 )
 from weaviate.collections.batch.batch_wrapper import (
+    BatchClientProtocol,
     _BatchMode,
     _BatchWrapper,
     _ContextManagerWrapper,
@@ -18,7 +21,7 @@
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.collections.classes.types import WeaviateProperties
 from weaviate.connect.v4 import ConnectionSync
-from weaviate.exceptions import UnexpectedStatusCodeError
+from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateUnsupportedFeatureError
 from weaviate.types import UUID, VECTORS
 
 if TYPE_CHECKING:
@@ -99,8 +102,85 @@ def add_reference(
         )
 
 
+class _BatchClientNew(_BatchBaseNew):
+    def add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> UUID:
+        """Add one object to this batch.
+
+        NOTE: If the UUID of one of the objects already exists then the existing object will be
+        replaced by the new object.
+
+        Args:
+            collection: The name of the collection this object belongs to.
+            properties: The data properties of the object to be added as a dictionary.
+            references: The references of the object to be added as a dictionary.
+            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
+                If it is None an UUIDv4 will generated, by default None
+            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
+                vector was generated using the _identical_ vectorization module that is configured for the class. In this
+                case this vector takes precedence.
+                Supported types are:
+                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
+                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Returns:
+            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        return super()._add_object(
+            collection=collection,
+            properties=properties,
+            references=references,
+            uuid=uuid,
+            vector=vector,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+    def add_reference(
+        self,
+        from_uuid: UUID,
+        from_collection: str,
+        from_property: str,
+        to: ReferenceInput,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> None:
+        """Add one reference to this batch.
+
+        Args:
+            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
+            from_collection: The name of the collection that should reference another object.
+            from_property: The name of the property that contains the reference.
+            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
+                For multi-target references use wvc.Reference.to_multi_target().
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        super()._add_reference(
+            from_object_uuid=from_uuid,
+            from_object_collection=from_collection,
+            from_property_name=from_property,
+            to=to,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+
 BatchClient = _BatchClient
-ClientBatchingContextManager = _ContextManagerWrapper[BatchClient]
+BatchClientNew = _BatchClientNew
+ClientBatchingContextManager = _ContextManagerWrapper[
+    Union[BatchClient, BatchClientNew], BatchClientProtocol
+]
 
 
 class _BatchClientWrapper(_BatchWrapper):
@@ -108,7 +188,7 @@ def __init__(
         self,
         connection: ConnectionSync,
         config: "_Collections",
-        consistency_level: Optional[ConsistencyLevel] = None,
+        consistency_level: Optional[ConsistencyLevel],
     ):
         super().__init__(connection, consistency_level)
         self.__config = config
@@ -116,7 +196,9 @@ def __init__(
         self.__executor = ThreadPoolExecutor()
         # define one executor per client with it shared between all child batch contexts
 
-    def __create_batch_and_reset(self) -> _ContextManagerWrapper[_BatchClient]:
+    def __create_batch_and_reset(
+        self, batch_client: Union[Type[_BatchClient], Type[_BatchClientNew]]
+    ):
         if self._vectorizer_batching is None or not self._vectorizer_batching:
             try:
                 configs = self.__config.list_all(simple=True)
@@ -144,8 +226,9 @@ def __create_batch_and_reset(self) -> _ContextManagerWrapper[_BatchClient]:
                 self._vectorizer_batching = False
 
         self._batch_data = _BatchDataWrapper()  # clear old data
+
         return _ContextManagerWrapper(
-            _BatchClient(
+            batch_client(
                 connection=self._connection,
                 consistency_level=self._consistency_level,
                 results=self._batch_data,
@@ -167,14 +250,14 @@ def dynamic(
         """
         self._batch_mode: _BatchMode = _DynamicBatching()
         self._consistency_level = consistency_level
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchClient)
 
     def fixed_size(
         self,
         batch_size: int = 100,
         concurrent_requests: int = 2,
         consistency_level: Optional[ConsistencyLevel] = None,
-    ) -> _ContextManagerWrapper[_BatchClient]:
+    ) -> ClientBatchingContextManager:
         """Configure fixed size batches. Note that the default is dynamic batching.
 
         When you exit the context manager, the final batch will be sent automatically.
@@ -188,7 +271,7 @@ def fixed_size(
         """
         self._batch_mode = _FixedSizeBatching(batch_size, concurrent_requests)
         self._consistency_level = consistency_level
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchClient)
 
     def rate_limit(
         self,
@@ -205,4 +288,27 @@ def rate_limit(
         """
         self._batch_mode = _RateLimitedBatching(requests_per_minute)
         self._consistency_level = consistency_level
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchClient)
+
+    def experimental(
+        self,
+        *,
+        concurrency: Optional[int] = None,
+        consistency_level: Optional[ConsistencyLevel] = None,
+    ) -> ClientBatchingContextManager:
+        """Configure the batching context manager using the experimental server-side batching mode.
+
+        When you exit the context manager, the final batch will be sent automatically.
+        """
+        if self._connection._weaviate_version.is_lower_than(1, 34, 0):
+            raise WeaviateUnsupportedFeatureError(
+                "Server-side batching", str(self._connection._weaviate_version), "1.34.0"
+            )
+        self._batch_mode = _ServerSideBatching(
+            # concurrency=concurrency
+            # if concurrency is not None
+            # else len(self._cluster.get_nodes_status())
+            concurrency=1,  # hard-code until client-side multi-threading is fixed
+        )
+        self._consistency_level = consistency_level
+        return self.__create_batch_and_reset(_BatchClientNew)
diff --git a/weaviate/collections/batch/collection.py b/weaviate/collections/batch/collection.py
index 974ffce68..6abe4aaac 100644
--- a/weaviate/collections/batch/collection.py
+++ b/weaviate/collections/batch/collection.py
@@ -1,15 +1,18 @@
 from concurrent.futures import ThreadPoolExecutor
-from typing import TYPE_CHECKING, Generic, List, Optional, Union
+from typing import TYPE_CHECKING, Generic, List, Optional, Type, Union
 
 from weaviate.collections.batch.base import (
     _BatchBase,
+    _BatchBaseNew,
     _BatchDataWrapper,
     _BatchMode,
     _DynamicBatching,
     _FixedSizeBatching,
     _RateLimitedBatching,
+    _ServerSideBatching,
 )
 from weaviate.collections.batch.batch_wrapper import (
+    BatchCollectionProtocol,
     _BatchWrapper,
     _ContextManagerWrapper,
 )
@@ -17,7 +20,7 @@
 from weaviate.collections.classes.internal import ReferenceInput, ReferenceInputs
 from weaviate.collections.classes.types import Properties
 from weaviate.connect.v4 import ConnectionSync
-from weaviate.exceptions import UnexpectedStatusCodeError
+from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateUnsupportedFeatureError
 from weaviate.types import UUID, VECTORS
 
 if TYPE_CHECKING:
@@ -47,6 +50,57 @@ def __init__(
         self.__name = name
         self.__tenant = tenant
 
+    def add_object(
+        self,
+        properties: Optional[Properties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+    ) -> UUID:
+        return self._add_object(
+            collection=self.__name,
+            properties=properties,
+            references=references,
+            uuid=uuid,
+            vector=vector,
+            tenant=self.__tenant,
+        )
+
+    def add_reference(
+        self, from_uuid: UUID, from_property: str, to: Union[ReferenceInput, List[UUID]]
+    ) -> None:
+        self._add_reference(
+            from_uuid,
+            self.__name,
+            from_property,
+            to,
+            self.__tenant,
+        )
+
+
+class _BatchCollectionNew(Generic[Properties], _BatchBaseNew):
+    def __init__(
+        self,
+        executor: ThreadPoolExecutor,
+        connection: ConnectionSync,
+        consistency_level: Optional[ConsistencyLevel],
+        results: _BatchDataWrapper,
+        batch_mode: _BatchMode,
+        name: str,
+        tenant: Optional[str],
+        vectorizer_batching: bool,
+    ) -> None:
+        super().__init__(
+            connection=connection,
+            consistency_level=consistency_level,
+            results=results,
+            batch_mode=batch_mode,
+            executor=executor,
+            vectorizer_batching=vectorizer_batching,
+        )
+        self.__name = name
+        self.__tenant = tenant
+
     def add_object(
         self,
         properties: Optional[Properties] = None,
@@ -106,8 +160,12 @@ def add_reference(
         )
 
 
-BatchCollection = _BatchCollection[Properties]
-CollectionBatchingContextManager = _ContextManagerWrapper[BatchCollection[Properties]]
+BatchCollection = _BatchCollection
+BatchCollectionNew = _BatchCollectionNew
+CollectionBatchingContextManager = _ContextManagerWrapper[
+    Union[BatchCollection[Properties], BatchCollectionNew[Properties]],
+    BatchCollectionProtocol[Properties],
+]
 
 
 class _BatchCollectionWrapper(Generic[Properties], _BatchWrapper):
@@ -118,6 +176,9 @@ def __init__(
         name: str,
         tenant: Optional[str],
         config: "_ConfigCollection",
+        batch_client: Union[
+            Type[_BatchCollection[Properties]], Type[_BatchCollectionNew[Properties]]
+        ],
     ) -> None:
         super().__init__(connection, consistency_level)
         self.__name = name
@@ -126,10 +187,14 @@ def __init__(
         self._vectorizer_batching: Optional[bool] = None
         self.__executor = ThreadPoolExecutor()
         # define one executor per client with it shared between all child batch contexts
+        self.__batch_client = batch_client
 
     def __create_batch_and_reset(
         self,
-    ) -> _ContextManagerWrapper[_BatchCollection[Properties]]:
+        batch_client: Union[
+            Type[_BatchCollection[Properties]], Type[_BatchCollectionNew[Properties]]
+        ],
+    ):
         if self._vectorizer_batching is None:
             try:
                 config = self.__config.get(simple=True)
@@ -150,7 +215,7 @@ def __create_batch_and_reset(
 
         self._batch_data = _BatchDataWrapper()  # clear old data
         return _ContextManagerWrapper(
-            _BatchCollection[Properties](
+            batch_client(
                 connection=self._connection,
                 consistency_level=self._consistency_level,
                 results=self._batch_data,
@@ -168,7 +233,7 @@ def dynamic(self) -> CollectionBatchingContextManager[Properties]:
         When you exit the context manager, the final batch will be sent automatically.
         """
         self._batch_mode: _BatchMode = _DynamicBatching()
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchCollection)
 
     def fixed_size(
         self, batch_size: int = 100, concurrent_requests: int = 2
@@ -183,7 +248,7 @@ def fixed_size(
                 made to Weaviate and not the speed of batch creation within Python.
         """
         self._batch_mode = _FixedSizeBatching(batch_size, concurrent_requests)
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchCollection)
 
     def rate_limit(self, requests_per_minute: int) -> CollectionBatchingContextManager[Properties]:
         """Configure batches with a rate limited vectorizer.
@@ -194,4 +259,23 @@ def rate_limit(self, requests_per_minute: int) -> CollectionBatchingContextManag
             requests_per_minute: The number of requests that the vectorizer can process per minute.
         """
         self._batch_mode = _RateLimitedBatching(requests_per_minute)
-        return self.__create_batch_and_reset()
+        return self.__create_batch_and_reset(_BatchCollection)
+
+    def experimental(
+        self,
+    ) -> CollectionBatchingContextManager[Properties]:
+        """Configure the batching context manager using the experimental server-side batching mode.
+
+        When you exit the context manager, the final batch will be sent automatically.
+        """
+        if self._connection._weaviate_version.is_lower_than(1, 34, 0):
+            raise WeaviateUnsupportedFeatureError(
+                "Server-side batching", str(self._connection._weaviate_version), "1.34.0"
+            )
+        self._batch_mode = _ServerSideBatching(
+            # concurrency=concurrency
+            # if concurrency is not None
+            # else len(self._cluster.get_nodes_status())
+            concurrency=1,  # hard-code until client-side multi-threading is fixed
+        )
+        return self.__create_batch_and_reset(_BatchCollectionNew)
diff --git a/weaviate/collections/batch/grpc_batch_objects.py b/weaviate/collections/batch/grpc_batch.py
similarity index 76%
rename from weaviate/collections/batch/grpc_batch_objects.py
rename to weaviate/collections/batch/grpc_batch.py
index e9a84a5f6..7384dcb49 100644
--- a/weaviate/collections/batch/grpc_batch_objects.py
+++ b/weaviate/collections/batch/grpc_batch.py
@@ -2,22 +2,25 @@
 import struct
 import time
 import uuid as uuid_package
-from typing import Any, Dict, List, Mapping, Optional, Sequence, Union, cast
+from typing import Any, Dict, Generator, List, Mapping, Optional, Sequence, Union, cast
 
 from google.protobuf.struct_pb2 import Struct
 
 from weaviate.collections.classes.batch import (
     BatchObject,
     BatchObjectReturn,
+    BatchReference,
     ErrorObject,
     _BatchObject,
+    _BatchReference,
 )
 from weaviate.collections.classes.config import ConsistencyLevel
 from weaviate.collections.classes.internal import ReferenceInputs, ReferenceToMulti
 from weaviate.collections.classes.types import GeoCoordinate, PhoneNumber
 from weaviate.collections.grpc.shared import _BaseGRPC, _is_1d_vector, _Pack
 from weaviate.connect import executor
-from weaviate.connect.v4 import Connection
+from weaviate.connect.base import MAX_GRPC_MESSAGE_LENGTH
+from weaviate.connect.v4 import Connection, ConnectionSync
 from weaviate.exceptions import (
     WeaviateInsertInvalidPropertyError,
     WeaviateInsertManyAllFailedError,
@@ -39,8 +42,10 @@ def __init__(
         self,
         weaviate_version: _ServerVersion,
         consistency_level: Optional[ConsistencyLevel],
+        grpc_max_msg_size: Optional[int],
     ):
         super().__init__(weaviate_version, consistency_level, False)
+        self.grpc_max_msg_size = grpc_max_msg_size or MAX_GRPC_MESSAGE_LENGTH
 
     def __single_vec(self, vectors: Optional[VECTORS]) -> Optional[bytes]:
         if not _is_1d_vector(vectors):
@@ -58,25 +63,39 @@ def __multi_vec(self, vectors: Optional[VECTORS]) -> Optional[List[base_pb2.Vect
             if (packing := _Pack.parse_single_or_multi_vec(vec_or_vecs))
         ]
 
-    def __grpc_objects(self, objects: List[_BatchObject]) -> List[batch_pb2.BatchObject]:
-        return [
-            batch_pb2.BatchObject(
-                collection=obj.collection,
-                uuid=(str(obj.uuid) if obj.uuid is not None else str(uuid_package.uuid4())),
-                properties=(
-                    self.__translate_properties_from_python_to_grpc(
-                        obj.properties,
-                        obj.references if obj.references is not None else {},
-                    )
-                    if obj.properties is not None
-                    else None
-                ),
-                tenant=obj.tenant,
-                vector_bytes=self.__single_vec(obj.vector),
-                vectors=self.__multi_vec(obj.vector),
-            )
-            for obj in objects
-        ]
+    def grpc_object(self, obj: _BatchObject) -> batch_pb2.BatchObject:
+        return batch_pb2.BatchObject(
+            collection=obj.collection,
+            uuid=(str(obj.uuid) if obj.uuid is not None else str(uuid_package.uuid4())),
+            properties=(
+                self.__translate_properties_from_python_to_grpc(
+                    obj.properties,
+                    obj.references if obj.references is not None else {},
+                )
+                if obj.properties is not None
+                else None
+            ),
+            tenant=obj.tenant,
+            vector_bytes=self.__single_vec(obj.vector),
+            vectors=self.__multi_vec(obj.vector),
+        )
+
+    def grpc_objects(self, objects: List[_BatchObject]) -> List[batch_pb2.BatchObject]:
+        return [self.grpc_object(obj) for obj in objects]
+
+    def grpc_reference(self, reference: _BatchReference) -> batch_pb2.BatchReference:
+        ref = BatchReference._from_internal(reference)
+        return batch_pb2.BatchReference(
+            name=ref.from_property_name,
+            from_collection=ref.from_object_collection,
+            from_uuid=str(ref.from_object_uuid),
+            to_collection=ref.to_object_collection,
+            to_uuid=str(ref.to_object_uuid),
+            tenant=ref.tenant,
+        )
+
+    def grpc_references(self, references: List[_BatchReference]) -> List[batch_pb2.BatchReference]:
+        return [self.grpc_reference(ref) for ref in references]
 
     def objects(
         self,
@@ -97,7 +116,7 @@ def objects(
             timeout: The timeout in seconds for the request.
             max_retries: The maximum number of retries in case of a failure.
         """
-        weaviate_objs = self.__grpc_objects(objects)
+        weaviate_objs = self.grpc_objects(objects)
         start = time.time()
 
         def resp(errors: Dict[int, str]) -> BatchObjectReturn:
@@ -151,6 +170,48 @@ def resp(errors: Dict[int, str]) -> BatchObjectReturn:
             max_retries=max_retries,
         )
 
+    # def send(
+    #     self,
+    #     connection: ConnectionSync,
+    #     *,
+    #     objects: List[batch_pb2.BatchObject],
+    #     references: List[batch_pb2.BatchReference],
+    #     stream_id: str,
+    #     timeout: Union[int, float],
+    # ) -> batch_pb2.BatchSendReply:
+    #     """Send multiple objects to Weaviate through the gRPC API.
+
+    #     Args:
+    #         connection: The connection to the Weaviate instance.
+    #         objects: A list of `_BatchObject` containing the data of the objects to be inserted.
+    #         references: A list of `_BatchReference` containing the references to be inserted.
+    #         stream_id: The ID of the stream to send the objects in relation to.
+    #         timeout: The timeout in seconds for the request.
+    #         max_retries: The maximum number of retries in case of a failure.
+    #     """
+    #     res = batch_pb2.BatchSendReply()
+    #     for request in self.__generate_send_requests(objects, references, stream_id):
+    #         res = connection.grpc_batch_send(
+    #             request=request,
+    #             timeout=timeout,
+    #         )
+    #         time.sleep(res.backoff_seconds)
+    #     return res
+
+    def stream(
+        self,
+        connection: ConnectionSync,
+        *,
+        requests: Generator[batch_pb2.BatchStreamRequest, None, None],
+    ) -> Generator[batch_pb2.BatchStreamReply, None, None]:
+        """Start a new stream for receiving messages about the ongoing server-side batching from Weaviate.
+
+        Args:
+            connection: The connection to the Weaviate instance.
+            requests: A generator that yields `BatchStreamRequest` messages to be sent to the server.
+        """
+        return connection.grpc_batch_stream(requests=requests)
+
     def __translate_properties_from_python_to_grpc(
         self, data: Dict[str, Any], refs: ReferenceInputs
     ) -> batch_pb2.BatchObject.Properties:
diff --git a/weaviate/collections/classes/batch.py b/weaviate/collections/classes/batch.py
index 1162983ad..b0b3d8edc 100644
--- a/weaviate/collections/classes/batch.py
+++ b/weaviate/collections/classes/batch.py
@@ -32,6 +32,7 @@ class _BatchReference:
     tenant: Optional[str]
     from_uuid: str
     to_uuid: Union[str, None]
+    index: int
 
 
 class BatchObject(BaseModel):
@@ -118,6 +119,7 @@ class BatchReference(BaseModel):
     to_object_uuid: UUID
     to_object_collection: Optional[str] = None
     tenant: Optional[str] = None
+    index: int
 
     @field_validator("from_object_collection")
     def _validate_from_object_collection(cls, v: str) -> str:
@@ -146,25 +148,27 @@ def _to_internal(self) -> _BatchReference:
             to=f"{BEACON}{self.to_object_collection}{str(self.to_object_uuid)}",
             to_uuid=str(self.to_object_uuid),
             tenant=self.tenant,
+            index=self.index,
         )
 
     @classmethod
     def _from_internal(cls, ref: _BatchReference) -> "BatchReference":
-        from_ = ref.from_.split("weaviate://")[1].split("/")
-        to = ref.to.split("weaviate://")[1].split("/")
+        from_ = ref.from_.split("weaviate://localhost/")[1].split("/")
+        to = ref.to.split("weaviate://localhost/")[1].split("/")
         if len(to) == 2:
-            to_object_collection = to[1]
+            to_object_collection = to[0]
         elif len(to) == 1:
             to_object_collection = None
         else:
             raise ValueError(f"Invalid reference 'to' value in _BatchReference object {ref}")
         return BatchReference(
-            from_object_collection=from_[1],
+            from_object_collection=from_[0],
             from_object_uuid=ref.from_uuid,
-            from_property_name=ref.from_[-1],
+            from_property_name=from_[-1],
             to_object_uuid=(ref.to_uuid if ref.to_uuid is not None else uuid_package.UUID(to[-1])),
             to_object_collection=to_object_collection,
             tenant=ref.tenant,
+            index=ref.index,
         )
 
 
@@ -229,12 +233,37 @@ def __add__(self, other: "BatchObjectReturn") -> "BatchObjectReturn":
             old_max = max(self.uuids.keys())
             old_min = min(self.uuids.keys())
             for k in range(old_min, old_max - MAX_STORED_RESULTS + 1):
-                del self.uuids[k]
+                if k in self.uuids:
+                    del self.uuids[k]
         if len(self._all_responses) > MAX_STORED_RESULTS:
             self._all_responses = self._all_responses[-MAX_STORED_RESULTS:]
 
         return self
 
+    def add_uuids(self, uuids: Dict[int, uuid_package.UUID]) -> None:
+        """Add a list of uuids to the batch return object."""
+        self.uuids.update(uuids)
+        self._all_responses.extend(uuids.values())
+
+        if len(self.uuids) >= MAX_STORED_RESULTS:
+            old_max = max(self.uuids.keys())
+            old_min = min(self.uuids.keys())
+            for k in range(old_min, old_max - MAX_STORED_RESULTS + 1):
+                if k in self.uuids:
+                    del self.uuids[k]
+        if len(self._all_responses) > MAX_STORED_RESULTS:
+            self._all_responses = self._all_responses[-MAX_STORED_RESULTS:]
+
+    def add_errors(self, errors: Dict[int, ErrorObject]) -> None:
+        """Add a list of errors to the batch return object."""
+        self.has_errors = True
+        self.errors.update(errors)
+        self._all_responses.extend(errors.values())
+
+        for key in errors.keys():
+            if key in self.uuids:
+                del self.uuids[key]
+
 
 @dataclass
 class BatchReferenceReturn:
@@ -260,6 +289,11 @@ def __add__(self, other: "BatchReferenceReturn") -> "BatchReferenceReturn":
         self.has_errors = self.has_errors or other.has_errors
         return self
 
+    def add_errors(self, errors: Dict[int, ErrorReference]) -> None:
+        """Add a list of errors to the batch return object."""
+        self.has_errors = True
+        self.errors.update(errors)
+
 
 class BatchResult:
     """This class contains the results of a batch operation.
diff --git a/weaviate/collections/classes/generative.py b/weaviate/collections/classes/generative.py
index 65ed6369a..b0e15be3a 100644
--- a/weaviate/collections/classes/generative.py
+++ b/weaviate/collections/classes/generative.py
@@ -125,7 +125,7 @@ def _to_grpc(self, opts: _GenerativeConfigRuntimeOptions) -> generative_pb2.Gene
                 target_model=self.target_model,
                 target_variant=self.target_variant,
                 temperature=self.temperature,
-                max_tokens=self.max_tokens,
+                # max_tokens=self.max_tokens,
                 images=_to_text_array(opts.images),
                 image_properties=_to_text_array(opts.image_properties),
             ),
diff --git a/weaviate/collections/classes/types.py b/weaviate/collections/classes/types.py
index d0031b81c..404a0fd08 100644
--- a/weaviate/collections/classes/types.py
+++ b/weaviate/collections/classes/types.py
@@ -80,7 +80,9 @@ class _PhoneNumber(_PhoneNumberBase):
 
 WeaviateProperties: TypeAlias = Mapping[str, WeaviateField]
 
-Properties = TypeVar("Properties", bound=Mapping[str, Any], default=WeaviateProperties)
+Properties = TypeVar(
+    "Properties", bound=Mapping[str, Any], default=WeaviateProperties, contravariant=True
+)
 """`Properties` is used wherever a single generic type is needed for properties"""
 
 TProperties = TypeVar("TProperties", bound=Mapping[str, Any], default=WeaviateProperties)
diff --git a/weaviate/collections/collection/sync.py b/weaviate/collections/collection/sync.py
index 830681b47..88f728b30 100644
--- a/weaviate/collections/collection/sync.py
+++ b/weaviate/collections/collection/sync.py
@@ -5,7 +5,11 @@
 from weaviate.cluster import _Cluster
 from weaviate.collections.aggregate import _AggregateCollection
 from weaviate.collections.backups import _CollectionBackup
-from weaviate.collections.batch.collection import _BatchCollectionWrapper
+from weaviate.collections.batch.collection import (
+    _BatchCollection,
+    _BatchCollectionNew,
+    _BatchCollectionWrapper,
+)
 from weaviate.collections.classes.cluster import Shard
 from weaviate.collections.classes.config import ConsistencyLevel
 from weaviate.collections.classes.grpc import METADATA, PROPERTIES, REFERENCES
@@ -97,6 +101,11 @@ def __init__(
             name,
             tenant,
             config,
+            batch_client=_BatchCollectionNew[Properties]
+            if connection._weaviate_version.is_at_least(
+                1, 32, 0
+            )  # todo: change to 1.33.0 when it lands
+            else _BatchCollection[Properties],
         )
         """This namespace contains all the functionality to upload data in batches to Weaviate for this specific collection."""
         self.config: _ConfigCollection = config
diff --git a/weaviate/collections/collections/base.py b/weaviate/collections/collections/base.py
index 444de6307..32296c137 100644
--- a/weaviate/collections/collections/base.py
+++ b/weaviate/collections/collections/base.py
@@ -50,7 +50,7 @@ def get(
             weaviate.exceptions.WeaviateInvalidInputError: If the input parameters are invalid.
             weaviate.exceptions.InvalidDataModelException: If the data model is not a valid data model, i.e., it is not a `dict` nor a `TypedDict`.
         """
-        return self.use(
+        return self._use(
             name=name,
             data_model_properties=data_model_properties,
             data_model_references=data_model_references,
diff --git a/weaviate/collections/data/executor.py b/weaviate/collections/data/executor.py
index 7e349a3cc..eb63a744d 100644
--- a/weaviate/collections/data/executor.py
+++ b/weaviate/collections/data/executor.py
@@ -19,8 +19,8 @@
 
 from httpx import Response
 
+from weaviate.collections.batch.grpc_batch import _BatchGRPC
 from weaviate.collections.batch.grpc_batch_delete import _BatchDeleteGRPC
-from weaviate.collections.batch.grpc_batch_objects import _BatchGRPC
 from weaviate.collections.batch.rest import _BatchREST
 from weaviate.collections.classes.batch import (
     BatchObjectReturn,
@@ -74,6 +74,7 @@ def __init__(
         self.__batch_grpc = _BatchGRPC(
             weaviate_version=connection._weaviate_version,
             consistency_level=consistency_level,
+            grpc_max_msg_size=connection._grpc_max_msg_size,
         )
         self.__batch_rest = _BatchREST(consistency_level=consistency_level)
         self.__batch_delete = _BatchDeleteGRPC(
@@ -446,8 +447,9 @@ def reference_add_many(
                 tenant=self._tenant,
                 from_uuid=str(ref.from_uuid),
                 to_uuid=None,  # not relevant here, this entry is only needed for the batch module
+                index=idx,
             )
-            for ref in refs
+            for idx, ref in enumerate(refs)
             for beacon in ref._to_beacons()
         ]
         return self.__batch_rest.references(self._connection, references=list(batch))
diff --git a/weaviate/connect/v4.py b/weaviate/connect/v4.py
index 282e42351..3734f650a 100644
--- a/weaviate/connect/v4.py
+++ b/weaviate/connect/v4.py
@@ -9,6 +9,7 @@
     Any,
     Awaitable,
     Dict,
+    Generator,
     List,
     Literal,
     Optional,
@@ -66,6 +67,7 @@
     InsufficientPermissionsError,
     UnexpectedStatusCodeError,
     WeaviateBatchError,
+    WeaviateBatchStreamError,
     WeaviateClosedClientError,
     WeaviateConnectionError,
     WeaviateDeleteManyError,
@@ -76,6 +78,7 @@
     WeaviateStartUpError,
     WeaviateTenantGetError,
     WeaviateTimeoutError,
+    _BatchStreamShutdownError,
 )
 from weaviate.proto.v1 import (
     aggregate_pb2,
@@ -909,8 +912,8 @@ def resp(res: Response) -> Optional[Dict[str, Any]]:
 class ConnectionSync(_ConnectionBase):
     """Connection class used to communicate to a weaviate instance."""
 
-    def connect(self) -> None:
-        if self._connected:
+    def connect(self, force: bool = False) -> None:
+        if self._connected and not force:
             return None
 
         self._open_connections_rest(self._auth, "sync")
@@ -1027,6 +1030,24 @@ def grpc_batch_objects(
                 raise InsufficientPermissionsError(error)
             raise WeaviateBatchError(str(error.details()))
 
+    def grpc_batch_stream(
+        self,
+        requests: Generator[batch_pb2.BatchStreamRequest, None, None],
+    ) -> Generator[batch_pb2.BatchStreamReply, None, None]:
+        try:
+            assert self.grpc_stub is not None
+            for msg in self.grpc_stub.BatchStream(
+                request_iterator=requests, metadata=self.grpc_headers()
+            ):
+                yield msg
+        except RpcError as e:
+            error = cast(Call, e)
+            if error.code() == StatusCode.PERMISSION_DENIED:
+                raise InsufficientPermissionsError(error)
+            if error.code() == StatusCode.ABORTED:
+                raise _BatchStreamShutdownError()
+            raise WeaviateBatchStreamError(str(error.details()))
+
     def grpc_batch_delete(
         self, request: batch_delete_pb2.BatchDeleteRequest
     ) -> batch_delete_pb2.BatchDeleteReply:
diff --git a/weaviate/exceptions.py b/weaviate/exceptions.py
index 301487835..5c6c771c9 100644
--- a/weaviate/exceptions.py
+++ b/weaviate/exceptions.py
@@ -241,6 +241,22 @@ def __init__(self, message: str):
         self.message = message
 
 
+class WeaviateBatchSendError(WeaviateQueryError):
+    """Is raised if a gRPC batch send request to Weaviate fails in any way."""
+
+    def __init__(self, message: str):
+        super().__init__(message, "GRPC batch send")
+        self.message = message
+
+
+class WeaviateBatchStreamError(WeaviateQueryError):
+    """Is raised if a gRPC batch stream request to Weaviate fails in any way."""
+
+    def __init__(self, message: str):
+        super().__init__(message, "GRPC batch stream")
+        self.message = message
+
+
 class WeaviateDeleteManyError(WeaviateQueryError):
     """Is raised if a gRPC delete many request to Weaviate fails in any way."""
 
@@ -383,3 +399,7 @@ def __init__(self, pb: version.Version, grpc: version.Version) -> None:
         super().__init__(
             f"gRPC incompatibility detected. Protobuf: {pb.base_version}, gRPC: {grpc.base_version}. Ensure that your protobuf and grpcio versions are compatible or runtime errors may occur."
         )
+
+
+class _BatchStreamShutdownError(Exception):
+    """Internal exception to signal that the batch stream was shutdown."""
diff --git a/weaviate/proto/v1/v4216/v1/batch_pb2.py b/weaviate/proto/v1/v4216/v1/batch_pb2.py
index 43cc40ade..ec84caf09 100644
--- a/weaviate/proto/v1/v4216/v1/batch_pb2.py
+++ b/weaviate/proto/v1/v4216/v1/batch_pb2.py
@@ -15,7 +15,7 @@
 from weaviate.proto.v1.v4216.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xd6\x02\n\x10\x42\x61tchSendRequest\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x38\n\x07objects\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchSendRequest.ObjectsH\x00\x12>\n\nreferences\x18\x03 \x01(\x0b\x32(.weaviate.v1.BatchSendRequest.ReferencesH\x00\x12\x32\n\x04stop\x18\x04 \x01(\x0b\x32\".weaviate.v1.BatchSendRequest.StopH\x00\x1a\x06\n\x04Stop\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"B\n\x0e\x42\x61tchSendReply\x12\x17\n\x0fnext_batch_size\x18\x01 \x01(\x05\x12\x17\n\x0f\x62\x61\x63koff_seconds\x18\x02 \x01(\x02\"\xc7\x01\n\x12\x42\x61tchStreamRequest\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x12\x19\n\x0cobject_index\x18\x02 \x01(\x05H\x01\x88\x01\x01\x12\x1c\n\x0freference_index\x18\x03 \x01(\x05H\x02\x88\x01\x01\x42\x14\n\x12_consistency_levelB\x0f\n\r_object_indexB\x12\n\x10_reference_index\"\xf0\x03\n\x12\x42\x61tchStreamMessage\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x36\n\x05\x65rror\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.ErrorH\x00\x12\x36\n\x05start\x18\x03 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.StartH\x00\x12\x34\n\x04stop\x18\x04 \x01(\x0b\x32$.weaviate.v1.BatchStreamMessage.StopH\x00\x12<\n\x08shutdown\x18\x05 \x01(\x0b\x32(.weaviate.v1.BatchStreamMessage.ShutdownH\x00\x12\x45\n\rshutting_down\x18\x06 \x01(\x0b\x32,.weaviate.v1.BatchStreamMessage.ShuttingDownH\x00\x1a\x07\n\x05Start\x1a\x06\n\x04Stop\x1a\n\n\x08Shutdown\x1a\x0e\n\x0cShuttingDown\x1a\x64\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\r\n\x05index\x18\x02 \x01(\x05\x12\x14\n\x0cis_retriable\x18\x03 \x01(\x08\x12\x11\n\tis_object\x18\x04 \x01(\x08\x12\x14\n\x0cis_reference\x18\x05 \x01(\x08\x42\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xa6\x04\n\x12\x42\x61tchStreamRequest\x12\x36\n\x05start\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamRequest.StartH\x00\x12\x34\n\x04\x64\x61ta\x18\x02 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.DataH\x00\x12\x34\n\x04stop\x18\x03 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.StopH\x00\x1a\\\n\x05Start\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\x1a\x06\n\x04Stop\x1a\xfa\x01\n\x04\x44\x61ta\x12=\n\x07objects\x18\x01 \x01(\x0b\x32,.weaviate.v1.BatchStreamRequest.Data.Objects\x12\x43\n\nreferences\x18\x02 \x01(\x0b\x32/.weaviate.v1.BatchStreamRequest.Data.References\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"\x98\x05\n\x10\x42\x61tchStreamReply\x12\x38\n\x07results\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.ResultsH\x00\x12\x43\n\rshutting_down\x18\x02 \x01(\x0b\x32*.weaviate.v1.BatchStreamReply.ShuttingDownH\x00\x12:\n\x08shutdown\x18\x03 \x01(\x0b\x32&.weaviate.v1.BatchStreamReply.ShutdownH\x00\x12\x38\n\x07started\x18\x04 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.StartedH\x00\x12\x38\n\x07\x62\x61\x63koff\x18\x05 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.BackoffH\x00\x1a\t\n\x07Started\x1a\x0e\n\x0cShuttingDown\x1a\n\n\x08Shutdown\x1a\x1d\n\x07\x42\x61\x63koff\x12\x12\n\nbatch_size\x18\x01 \x01(\x05\x1a\x83\x02\n\x07Results\x12;\n\x06\x65rrors\x18\x01 \x03(\x0b\x32+.weaviate.v1.BatchStreamReply.Results.Error\x12@\n\tsuccesses\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchStreamReply.Results.Success\x1a\x42\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tail\x1a\x35\n\x07Success\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tailB\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -29,46 +29,50 @@
   _globals['_BATCHOBJECTSREQUEST']._serialized_end=226
   _globals['_BATCHREFERENCESREQUEST']._serialized_start=229
   _globals['_BATCHREFERENCESREQUEST']._serialized_end=387
-  _globals['_BATCHSENDREQUEST']._serialized_start=390
-  _globals['_BATCHSENDREQUEST']._serialized_end=732
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_start=603
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_end=609
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_start=611
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_end=662
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_start=664
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_end=721
-  _globals['_BATCHSENDREPLY']._serialized_start=734
-  _globals['_BATCHSENDREPLY']._serialized_end=800
-  _globals['_BATCHSTREAMREQUEST']._serialized_start=803
-  _globals['_BATCHSTREAMREQUEST']._serialized_end=1002
-  _globals['_BATCHSTREAMMESSAGE']._serialized_start=1005
-  _globals['_BATCHSTREAMMESSAGE']._serialized_end=1501
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_start=1345
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_end=1352
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_start=603
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_end=609
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_start=1362
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_end=1372
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_start=1374
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_end=1388
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_start=1390
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_end=1490
-  _globals['_BATCHOBJECT']._serialized_start=1504
-  _globals['_BATCHOBJECT']._serialized_end=2494
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1708
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2352
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2354
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2410
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2412
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2494
-  _globals['_BATCHREFERENCE']._serialized_start=2497
-  _globals['_BATCHREFERENCE']._serialized_end=2650
-  _globals['_BATCHOBJECTSREPLY']._serialized_start=2653
-  _globals['_BATCHOBJECTSREPLY']._serialized_end=2789
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2789
-  _globals['_BATCHREFERENCESREPLY']._serialized_start=2792
-  _globals['_BATCHREFERENCESREPLY']._serialized_end=2934
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2789
+  _globals['_BATCHSTREAMREQUEST']._serialized_start=390
+  _globals['_BATCHSTREAMREQUEST']._serialized_end=940
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_start=576
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_end=668
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_start=670
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_end=676
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_start=679
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_end=929
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_start=819
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_end=870
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_start=872
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_end=929
+  _globals['_BATCHSTREAMREPLY']._serialized_start=943
+  _globals['_BATCHSTREAMREPLY']._serialized_end=1607
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_start=1266
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_end=1275
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_start=1277
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_end=1291
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_start=1293
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_end=1303
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_start=1305
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_end=1334
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_start=1337
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_end=1596
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_start=1475
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_end=1541
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_start=1543
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_end=1596
+  _globals['_BATCHOBJECT']._serialized_start=1610
+  _globals['_BATCHOBJECT']._serialized_end=2600
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1814
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2458
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2460
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2516
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2518
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2600
+  _globals['_BATCHREFERENCE']._serialized_start=2603
+  _globals['_BATCHREFERENCE']._serialized_end=2756
+  _globals['_BATCHOBJECTSREPLY']._serialized_start=2759
+  _globals['_BATCHOBJECTSREPLY']._serialized_end=2895
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2895
+  _globals['_BATCHREFERENCESREPLY']._serialized_start=2898
+  _globals['_BATCHREFERENCESREPLY']._serialized_end=3040
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2895
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v4216/v1/batch_pb2.pyi b/weaviate/proto/v1/v4216/v1/batch_pb2.pyi
index 6c585ef32..17ef5a965 100644
--- a/weaviate/proto/v1/v4216/v1/batch_pb2.pyi
+++ b/weaviate/proto/v1/v4216/v1/batch_pb2.pyi
@@ -23,89 +23,91 @@ class BatchReferencesRequest(_message.Message):
     consistency_level: _base_pb2.ConsistencyLevel
     def __init__(self, references: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ..., consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
 
-class BatchSendRequest(_message.Message):
-    __slots__ = ["stream_id", "objects", "references", "stop"]
+class BatchStreamRequest(_message.Message):
+    __slots__ = ["start", "data", "stop"]
+    class Start(_message.Message):
+        __slots__ = ["consistency_level"]
+        CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
+        consistency_level: _base_pb2.ConsistencyLevel
+        def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
     class Stop(_message.Message):
         __slots__ = []
         def __init__(self) -> None: ...
-    class Objects(_message.Message):
-        __slots__ = ["values"]
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchObject]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
-    class References(_message.Message):
-        __slots__ = ["values"]
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchReference]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    OBJECTS_FIELD_NUMBER: _ClassVar[int]
-    REFERENCES_FIELD_NUMBER: _ClassVar[int]
+    class Data(_message.Message):
+        __slots__ = ["objects", "references"]
+        class Objects(_message.Message):
+            __slots__ = ["values"]
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchObject]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
+        class References(_message.Message):
+            __slots__ = ["values"]
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchReference]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
+        OBJECTS_FIELD_NUMBER: _ClassVar[int]
+        REFERENCES_FIELD_NUMBER: _ClassVar[int]
+        objects: BatchStreamRequest.Data.Objects
+        references: BatchStreamRequest.Data.References
+        def __init__(self, objects: _Optional[_Union[BatchStreamRequest.Data.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchStreamRequest.Data.References, _Mapping]] = ...) -> None: ...
+    START_FIELD_NUMBER: _ClassVar[int]
+    DATA_FIELD_NUMBER: _ClassVar[int]
     STOP_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    objects: BatchSendRequest.Objects
-    references: BatchSendRequest.References
-    stop: BatchSendRequest.Stop
-    def __init__(self, stream_id: _Optional[str] = ..., objects: _Optional[_Union[BatchSendRequest.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchSendRequest.References, _Mapping]] = ..., stop: _Optional[_Union[BatchSendRequest.Stop, _Mapping]] = ...) -> None: ...
-
-class BatchSendReply(_message.Message):
-    __slots__ = ["next_batch_size", "backoff_seconds"]
-    NEXT_BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
-    BACKOFF_SECONDS_FIELD_NUMBER: _ClassVar[int]
-    next_batch_size: int
-    backoff_seconds: float
-    def __init__(self, next_batch_size: _Optional[int] = ..., backoff_seconds: _Optional[float] = ...) -> None: ...
+    start: BatchStreamRequest.Start
+    data: BatchStreamRequest.Data
+    stop: BatchStreamRequest.Stop
+    def __init__(self, start: _Optional[_Union[BatchStreamRequest.Start, _Mapping]] = ..., data: _Optional[_Union[BatchStreamRequest.Data, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamRequest.Stop, _Mapping]] = ...) -> None: ...
 
-class BatchStreamRequest(_message.Message):
-    __slots__ = ["consistency_level", "object_index", "reference_index"]
-    CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
-    OBJECT_INDEX_FIELD_NUMBER: _ClassVar[int]
-    REFERENCE_INDEX_FIELD_NUMBER: _ClassVar[int]
-    consistency_level: _base_pb2.ConsistencyLevel
-    object_index: int
-    reference_index: int
-    def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ..., object_index: _Optional[int] = ..., reference_index: _Optional[int] = ...) -> None: ...
-
-class BatchStreamMessage(_message.Message):
-    __slots__ = ["stream_id", "error", "start", "stop", "shutdown", "shutting_down"]
-    class Start(_message.Message):
+class BatchStreamReply(_message.Message):
+    __slots__ = ["results", "shutting_down", "shutdown", "started", "backoff"]
+    class Started(_message.Message):
         __slots__ = []
         def __init__(self) -> None: ...
-    class Stop(_message.Message):
+    class ShuttingDown(_message.Message):
         __slots__ = []
         def __init__(self) -> None: ...
     class Shutdown(_message.Message):
         __slots__ = []
         def __init__(self) -> None: ...
-    class ShuttingDown(_message.Message):
-        __slots__ = []
-        def __init__(self) -> None: ...
-    class Error(_message.Message):
-        __slots__ = ["error", "index", "is_retriable", "is_object", "is_reference"]
-        ERROR_FIELD_NUMBER: _ClassVar[int]
-        INDEX_FIELD_NUMBER: _ClassVar[int]
-        IS_RETRIABLE_FIELD_NUMBER: _ClassVar[int]
-        IS_OBJECT_FIELD_NUMBER: _ClassVar[int]
-        IS_REFERENCE_FIELD_NUMBER: _ClassVar[int]
-        error: str
-        index: int
-        is_retriable: bool
-        is_object: bool
-        is_reference: bool
-        def __init__(self, error: _Optional[str] = ..., index: _Optional[int] = ..., is_retriable: bool = ..., is_object: bool = ..., is_reference: bool = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    ERROR_FIELD_NUMBER: _ClassVar[int]
-    START_FIELD_NUMBER: _ClassVar[int]
-    STOP_FIELD_NUMBER: _ClassVar[int]
-    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    class Backoff(_message.Message):
+        __slots__ = ["batch_size"]
+        BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
+        batch_size: int
+        def __init__(self, batch_size: _Optional[int] = ...) -> None: ...
+    class Results(_message.Message):
+        __slots__ = ["errors", "successes"]
+        class Error(_message.Message):
+            __slots__ = ["error", "uuid", "beacon"]
+            ERROR_FIELD_NUMBER: _ClassVar[int]
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            error: str
+            uuid: str
+            beacon: str
+            def __init__(self, error: _Optional[str] = ..., uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        class Success(_message.Message):
+            __slots__ = ["uuid", "beacon"]
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            uuid: str
+            beacon: str
+            def __init__(self, uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        ERRORS_FIELD_NUMBER: _ClassVar[int]
+        SUCCESSES_FIELD_NUMBER: _ClassVar[int]
+        errors: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Error]
+        successes: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Success]
+        def __init__(self, errors: _Optional[_Iterable[_Union[BatchStreamReply.Results.Error, _Mapping]]] = ..., successes: _Optional[_Iterable[_Union[BatchStreamReply.Results.Success, _Mapping]]] = ...) -> None: ...
+    RESULTS_FIELD_NUMBER: _ClassVar[int]
     SHUTTING_DOWN_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    error: BatchStreamMessage.Error
-    start: BatchStreamMessage.Start
-    stop: BatchStreamMessage.Stop
-    shutdown: BatchStreamMessage.Shutdown
-    shutting_down: BatchStreamMessage.ShuttingDown
-    def __init__(self, stream_id: _Optional[str] = ..., error: _Optional[_Union[BatchStreamMessage.Error, _Mapping]] = ..., start: _Optional[_Union[BatchStreamMessage.Start, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamMessage.Stop, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamMessage.Shutdown, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamMessage.ShuttingDown, _Mapping]] = ...) -> None: ...
+    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    STARTED_FIELD_NUMBER: _ClassVar[int]
+    BACKOFF_FIELD_NUMBER: _ClassVar[int]
+    results: BatchStreamReply.Results
+    shutting_down: BatchStreamReply.ShuttingDown
+    shutdown: BatchStreamReply.Shutdown
+    started: BatchStreamReply.Started
+    backoff: BatchStreamReply.Backoff
+    def __init__(self, results: _Optional[_Union[BatchStreamReply.Results, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamReply.ShuttingDown, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamReply.Shutdown, _Mapping]] = ..., started: _Optional[_Union[BatchStreamReply.Started, _Mapping]] = ..., backoff: _Optional[_Union[BatchStreamReply.Backoff, _Mapping]] = ...) -> None: ...
 
 class BatchObject(_message.Message):
     __slots__ = ["uuid", "vector", "properties", "collection", "tenant", "vector_bytes", "vectors"]
diff --git a/weaviate/proto/v1/v4216/v1/file_replication_pb2.py b/weaviate/proto/v1/v4216/v1/file_replication_pb2.py
index 3d901cb42..2f798f705 100644
--- a/weaviate/proto/v1/v4216/v1/file_replication_pb2.py
+++ b/weaviate/proto/v1/v4216/v1/file_replication_pb2.py
@@ -13,14 +13,14 @@
 
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42y\n#io.weaviate.client.grpc.protocol.v1B\x1cWeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
 _builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'v1.file_replication_pb2', _globals)
 if _descriptor._USE_C_DESCRIPTORS == False:
   DESCRIPTOR._options = None
-  DESCRIPTOR._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
+  DESCRIPTOR._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\034WeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_COMPRESSIONTYPE']._serialized_start=857
   _globals['_COMPRESSIONTYPE']._serialized_end=992
   _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_start=42
diff --git a/weaviate/proto/v1/v4216/v1/generative_pb2.py b/weaviate/proto/v1/v4216/v1/generative_pb2.py
index a49bf3b90..25bb31752 100644
--- a/weaviate/proto/v1/v4216/v1/generative_pb2.py
+++ b/weaviate/proto/v1/v4216/v1/generative_pb2.py
@@ -14,7 +14,7 @@
 from weaviate.proto.v1.v4216.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x84\x03\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperature\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x88\x04\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x12+\n\x06images\x18\n \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\t\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0b \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\n\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -43,89 +43,89 @@
   _globals['_GENERATIVEAWS']._serialized_start=1806
   _globals['_GENERATIVEAWS']._serialized_end=2259
   _globals['_GENERATIVECOHERE']._serialized_start=2262
-  _globals['_GENERATIVECOHERE']._serialized_end=2650
-  _globals['_GENERATIVEDUMMY']._serialized_start=2652
-  _globals['_GENERATIVEDUMMY']._serialized_end=2669
-  _globals['_GENERATIVEMISTRAL']._serialized_start=2672
-  _globals['_GENERATIVEMISTRAL']._serialized_end=2869
-  _globals['_GENERATIVEOLLAMA']._serialized_start=2872
-  _globals['_GENERATIVEOLLAMA']._serialized_end=3138
-  _globals['_GENERATIVEOPENAI']._serialized_start=3141
-  _globals['_GENERATIVEOPENAI']._serialized_end=4264
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3746
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=3909
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=3911
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4010
-  _globals['_GENERATIVEGOOGLE']._serialized_start=4267
-  _globals['_GENERATIVEGOOGLE']._serialized_end=4925
-  _globals['_GENERATIVEDATABRICKS']._serialized_start=4928
-  _globals['_GENERATIVEDATABRICKS']._serialized_end=5392
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5395
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5617
-  _globals['_GENERATIVENVIDIA']._serialized_start=5620
-  _globals['_GENERATIVENVIDIA']._serialized_end=5816
-  _globals['_GENERATIVEXAI']._serialized_start=5819
-  _globals['_GENERATIVEXAI']._serialized_end=6144
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6147
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6293
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6241
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6293
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6295
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6323
-  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6325
-  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6348
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6351
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7147
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6648
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6790
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6793
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=6990
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=6992
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7090
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7149
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7174
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7177
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7434
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7436
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7462
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7465
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7720
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7723
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8595
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=7904
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8030
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8033
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8258
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8260
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8371
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8374
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8563
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8598
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8861
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8864
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9127
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9130
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9385
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9388
-  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9637
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEMETADATA']._serialized_start=9640
-  _globals['_GENERATIVEMETADATA']._serialized_end=10423
-  _globals['_GENERATIVEREPLY']._serialized_start=10426
-  _globals['_GENERATIVEREPLY']._serialized_end=10588
-  _globals['_GENERATIVERESULT']._serialized_start=10590
-  _globals['_GENERATIVERESULT']._serialized_end=10654
-  _globals['_GENERATIVEDEBUG']._serialized_start=10656
-  _globals['_GENERATIVEDEBUG']._serialized_end=10715
+  _globals['_GENERATIVECOHERE']._serialized_end=2782
+  _globals['_GENERATIVEDUMMY']._serialized_start=2784
+  _globals['_GENERATIVEDUMMY']._serialized_end=2801
+  _globals['_GENERATIVEMISTRAL']._serialized_start=2804
+  _globals['_GENERATIVEMISTRAL']._serialized_end=3001
+  _globals['_GENERATIVEOLLAMA']._serialized_start=3004
+  _globals['_GENERATIVEOLLAMA']._serialized_end=3270
+  _globals['_GENERATIVEOPENAI']._serialized_start=3273
+  _globals['_GENERATIVEOPENAI']._serialized_end=4396
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3878
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=4041
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=4043
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4142
+  _globals['_GENERATIVEGOOGLE']._serialized_start=4399
+  _globals['_GENERATIVEGOOGLE']._serialized_end=5057
+  _globals['_GENERATIVEDATABRICKS']._serialized_start=5060
+  _globals['_GENERATIVEDATABRICKS']._serialized_end=5524
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5527
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5749
+  _globals['_GENERATIVENVIDIA']._serialized_start=5752
+  _globals['_GENERATIVENVIDIA']._serialized_end=5948
+  _globals['_GENERATIVEXAI']._serialized_start=5951
+  _globals['_GENERATIVEXAI']._serialized_end=6276
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6279
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6425
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6373
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6425
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6427
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6455
+  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6457
+  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6480
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6483
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7279
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6780
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6922
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6925
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=7122
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=7124
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7222
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7281
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7306
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7309
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7566
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7568
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7594
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7597
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7852
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7855
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8727
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=8036
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8162
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8165
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8390
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8392
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8503
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8506
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8695
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8730
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8993
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8996
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9259
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9262
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9517
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9520
+  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9769
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEMETADATA']._serialized_start=9772
+  _globals['_GENERATIVEMETADATA']._serialized_end=10555
+  _globals['_GENERATIVEREPLY']._serialized_start=10558
+  _globals['_GENERATIVEREPLY']._serialized_end=10720
+  _globals['_GENERATIVERESULT']._serialized_start=10722
+  _globals['_GENERATIVERESULT']._serialized_end=10786
+  _globals['_GENERATIVEDEBUG']._serialized_start=10788
+  _globals['_GENERATIVEDEBUG']._serialized_end=10847
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v4216/v1/generative_pb2.pyi b/weaviate/proto/v1/v4216/v1/generative_pb2.pyi
index 0eaf35fff..96dfa986f 100644
--- a/weaviate/proto/v1/v4216/v1/generative_pb2.pyi
+++ b/weaviate/proto/v1/v4216/v1/generative_pb2.pyi
@@ -130,7 +130,7 @@ class GenerativeAWS(_message.Message):
     def __init__(self, model: _Optional[str] = ..., temperature: _Optional[float] = ..., service: _Optional[str] = ..., region: _Optional[str] = ..., endpoint: _Optional[str] = ..., target_model: _Optional[str] = ..., target_variant: _Optional[str] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., max_tokens: _Optional[int] = ...) -> None: ...
 
 class GenerativeCohere(_message.Message):
-    __slots__ = ["base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature"]
+    __slots__ = ["base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature", "images", "image_properties"]
     BASE_URL_FIELD_NUMBER: _ClassVar[int]
     FREQUENCY_PENALTY_FIELD_NUMBER: _ClassVar[int]
     MAX_TOKENS_FIELD_NUMBER: _ClassVar[int]
@@ -140,6 +140,8 @@ class GenerativeCohere(_message.Message):
     PRESENCE_PENALTY_FIELD_NUMBER: _ClassVar[int]
     STOP_SEQUENCES_FIELD_NUMBER: _ClassVar[int]
     TEMPERATURE_FIELD_NUMBER: _ClassVar[int]
+    IMAGES_FIELD_NUMBER: _ClassVar[int]
+    IMAGE_PROPERTIES_FIELD_NUMBER: _ClassVar[int]
     base_url: str
     frequency_penalty: float
     max_tokens: int
@@ -149,7 +151,9 @@ class GenerativeCohere(_message.Message):
     presence_penalty: float
     stop_sequences: _base_pb2.TextArray
     temperature: float
-    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ...) -> None: ...
+    images: _base_pb2.TextArray
+    image_properties: _base_pb2.TextArray
+    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ...) -> None: ...
 
 class GenerativeDummy(_message.Message):
     __slots__ = []
diff --git a/weaviate/proto/v1/v4216/v1/weaviate_pb2.py b/weaviate/proto/v1/v4216/v1/weaviate_pb2.py
index d9f2a91e8..cd8babfed 100644
--- a/weaviate/proto/v1/v4216/v1/weaviate_pb2.py
+++ b/weaviate/proto/v1/v4216/v1/weaviate_pb2.py
@@ -18,7 +18,7 @@
 from weaviate.proto.v1.v4216.v1 import tenants_pb2 as v1_dot_tenants__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\x87\x05\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12I\n\tBatchSend\x12\x1d.weaviate.v1.BatchSendRequest\x1a\x1b.weaviate.v1.BatchSendReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1f.weaviate.v1.BatchStreamMessage\"\x00\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\xbc\x04\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1d.weaviate.v1.BatchStreamReply\"\x00(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -27,5 +27,5 @@
   DESCRIPTOR._options = None
   DESCRIPTOR._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_WEAVIATE']._serialized_start=133
-  _globals['_WEAVIATE']._serialized_end=780
+  _globals['_WEAVIATE']._serialized_end=705
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v4216/v1/weaviate_pb2_grpc.py b/weaviate/proto/v1/v4216/v1/weaviate_pb2_grpc.py
index 3ef7d95aa..74beca6b2 100644
--- a/weaviate/proto/v1/v4216/v1/weaviate_pb2_grpc.py
+++ b/weaviate/proto/v1/v4216/v1/weaviate_pb2_grpc.py
@@ -48,15 +48,10 @@ def __init__(self, channel):
                 request_serializer=v1_dot_aggregate__pb2.AggregateRequest.SerializeToString,
                 response_deserializer=v1_dot_aggregate__pb2.AggregateReply.FromString,
                 )
-        self.BatchSend = channel.unary_unary(
-                '/weaviate.v1.Weaviate/BatchSend',
-                request_serializer=v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchSendReply.FromString,
-                )
-        self.BatchStream = channel.unary_stream(
+        self.BatchStream = channel.stream_stream(
                 '/weaviate.v1.Weaviate/BatchStream',
                 request_serializer=v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchStreamMessage.FromString,
+                response_deserializer=v1_dot_batch__pb2.BatchStreamReply.FromString,
                 )
 
 
@@ -99,13 +94,7 @@ def Aggregate(self, request, context):
         context.set_details('Method not implemented!')
         raise NotImplementedError('Method not implemented!')
 
-    def BatchSend(self, request, context):
-        """Missing associated documentation comment in .proto file."""
-        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
-        context.set_details('Method not implemented!')
-        raise NotImplementedError('Method not implemented!')
-
-    def BatchStream(self, request, context):
+    def BatchStream(self, request_iterator, context):
         """Missing associated documentation comment in .proto file."""
         context.set_code(grpc.StatusCode.UNIMPLEMENTED)
         context.set_details('Method not implemented!')
@@ -144,15 +133,10 @@ def add_WeaviateServicer_to_server(servicer, server):
                     request_deserializer=v1_dot_aggregate__pb2.AggregateRequest.FromString,
                     response_serializer=v1_dot_aggregate__pb2.AggregateReply.SerializeToString,
             ),
-            'BatchSend': grpc.unary_unary_rpc_method_handler(
-                    servicer.BatchSend,
-                    request_deserializer=v1_dot_batch__pb2.BatchSendRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchSendReply.SerializeToString,
-            ),
-            'BatchStream': grpc.unary_stream_rpc_method_handler(
+            'BatchStream': grpc.stream_stream_rpc_method_handler(
                     servicer.BatchStream,
                     request_deserializer=v1_dot_batch__pb2.BatchStreamRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchStreamMessage.SerializeToString,
+                    response_serializer=v1_dot_batch__pb2.BatchStreamReply.SerializeToString,
             ),
     }
     generic_handler = grpc.method_handlers_generic_handler(
@@ -267,24 +251,7 @@ def Aggregate(request,
             insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
 
     @staticmethod
-    def BatchSend(request,
-            target,
-            options=(),
-            channel_credentials=None,
-            call_credentials=None,
-            insecure=False,
-            compression=None,
-            wait_for_ready=None,
-            timeout=None,
-            metadata=None):
-        return grpc.experimental.unary_unary(request, target, '/weaviate.v1.Weaviate/BatchSend',
-            v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchSendReply.FromString,
-            options, channel_credentials,
-            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
-
-    @staticmethod
-    def BatchStream(request,
+    def BatchStream(request_iterator,
             target,
             options=(),
             channel_credentials=None,
@@ -294,8 +261,8 @@ def BatchStream(request,
             wait_for_ready=None,
             timeout=None,
             metadata=None):
-        return grpc.experimental.unary_stream(request, target, '/weaviate.v1.Weaviate/BatchStream',
+        return grpc.experimental.stream_stream(request_iterator, target, '/weaviate.v1.Weaviate/BatchStream',
             v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchStreamMessage.FromString,
+            v1_dot_batch__pb2.BatchStreamReply.FromString,
             options, channel_credentials,
             insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
diff --git a/weaviate/proto/v1/v51/v1/file_replication_pb2.py b/weaviate/proto/v1/v51/v1/file_replication_pb2.py
new file mode 100644
index 000000000..443621397
--- /dev/null
+++ b/weaviate/proto/v1/v51/v1/file_replication_pb2.py
@@ -0,0 +1,49 @@
+# -*- coding: utf-8 -*-
+# Generated by the protocol buffer compiler.  DO NOT EDIT!
+# source: v1/file_replication.proto
+# Protobuf Python Version: 4.25.0
+"""Generated protocol buffer code."""
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import descriptor_pool as _descriptor_pool
+from google.protobuf import symbol_database as _symbol_database
+from google.protobuf.internal import builder as _builder
+# @@protoc_insertion_point(imports)
+
+_sym_db = _symbol_database.Default()
+
+
+
+
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+
+_globals = globals()
+_builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
+_builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'v1.file_replication_pb2', _globals)
+if _descriptor._USE_C_DESCRIPTORS == False:
+  _globals['DESCRIPTOR']._options = None
+  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
+  _globals['_COMPRESSIONTYPE']._serialized_start=857
+  _globals['_COMPRESSIONTYPE']._serialized_end=992
+  _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_start=42
+  _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_end=132
+  _globals['_PAUSEFILEACTIVITYRESPONSE']._serialized_start=134
+  _globals['_PAUSEFILEACTIVITYRESPONSE']._serialized_end=201
+  _globals['_RESUMEFILEACTIVITYREQUEST']._serialized_start=203
+  _globals['_RESUMEFILEACTIVITYREQUEST']._serialized_end=270
+  _globals['_RESUMEFILEACTIVITYRESPONSE']._serialized_start=272
+  _globals['_RESUMEFILEACTIVITYRESPONSE']._serialized_end=340
+  _globals['_LISTFILESREQUEST']._serialized_start=342
+  _globals['_LISTFILESREQUEST']._serialized_end=400
+  _globals['_LISTFILESRESPONSE']._serialized_start=402
+  _globals['_LISTFILESRESPONSE']._serialized_end=481
+  _globals['_GETFILEMETADATAREQUEST']._serialized_start=483
+  _globals['_GETFILEMETADATAREQUEST']._serialized_end=566
+  _globals['_FILEMETADATA']._serialized_start=568
+  _globals['_FILEMETADATA']._serialized_end=670
+  _globals['_GETFILEREQUEST']._serialized_start=672
+  _globals['_GETFILEREQUEST']._serialized_end=798
+  _globals['_FILECHUNK']._serialized_start=800
+  _globals['_FILECHUNK']._serialized_end=854
+  _globals['_FILEREPLICATIONSERVICE']._serialized_start=995
+  _globals['_FILEREPLICATIONSERVICE']._serialized_end=1453
+# @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v51/v1/file_replication_pb2.pyi b/weaviate/proto/v1/v51/v1/file_replication_pb2.pyi
new file mode 100644
index 000000000..29b87cf22
--- /dev/null
+++ b/weaviate/proto/v1/v51/v1/file_replication_pb2.pyi
@@ -0,0 +1,116 @@
+from google.protobuf.internal import containers as _containers
+from google.protobuf.internal import enum_type_wrapper as _enum_type_wrapper
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import message as _message
+from typing import ClassVar as _ClassVar, Iterable as _Iterable, Optional as _Optional, Union as _Union
+
+DESCRIPTOR: _descriptor.FileDescriptor
+
+class CompressionType(int, metaclass=_enum_type_wrapper.EnumTypeWrapper):
+    __slots__ = ()
+    COMPRESSION_TYPE_UNSPECIFIED: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_GZIP: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_ZLIB: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_DEFLATE: _ClassVar[CompressionType]
+COMPRESSION_TYPE_UNSPECIFIED: CompressionType
+COMPRESSION_TYPE_GZIP: CompressionType
+COMPRESSION_TYPE_ZLIB: CompressionType
+COMPRESSION_TYPE_DEFLATE: CompressionType
+
+class PauseFileActivityRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "schema_version")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    SCHEMA_VERSION_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    schema_version: int
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., schema_version: _Optional[int] = ...) -> None: ...
+
+class PauseFileActivityResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ResumeFileActivityRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ResumeFileActivityResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ListFilesRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ListFilesResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_names")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAMES_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_names: _containers.RepeatedScalarFieldContainer[str]
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_names: _Optional[_Iterable[str]] = ...) -> None: ...
+
+class GetFileMetadataRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ...) -> None: ...
+
+class FileMetadata(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name", "size", "crc32")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    SIZE_FIELD_NUMBER: _ClassVar[int]
+    CRC32_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    size: int
+    crc32: int
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ..., size: _Optional[int] = ..., crc32: _Optional[int] = ...) -> None: ...
+
+class GetFileRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name", "compression")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    COMPRESSION_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    compression: CompressionType
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ..., compression: _Optional[_Union[CompressionType, str]] = ...) -> None: ...
+
+class FileChunk(_message.Message):
+    __slots__ = ("offset", "data", "eof")
+    OFFSET_FIELD_NUMBER: _ClassVar[int]
+    DATA_FIELD_NUMBER: _ClassVar[int]
+    EOF_FIELD_NUMBER: _ClassVar[int]
+    offset: int
+    data: bytes
+    eof: bool
+    def __init__(self, offset: _Optional[int] = ..., data: _Optional[bytes] = ..., eof: bool = ...) -> None: ...
diff --git a/weaviate/proto/v1/v51/v1/file_replication_pb2_grpc.py b/weaviate/proto/v1/v51/v1/file_replication_pb2_grpc.py
new file mode 100644
index 000000000..dba9b8e5c
--- /dev/null
+++ b/weaviate/proto/v1/v51/v1/file_replication_pb2_grpc.py
@@ -0,0 +1,198 @@
+# Generated by the gRPC Python protocol compiler plugin. DO NOT EDIT!
+"""Client and server classes corresponding to protobuf-defined services."""
+import grpc
+
+from weaviate.proto.v1.v51.v1 import file_replication_pb2 as v1_dot_file__replication__pb2
+
+
+class FileReplicationServiceStub(object):
+    """Missing associated documentation comment in .proto file."""
+
+    def __init__(self, channel):
+        """Constructor.
+
+        Args:
+            channel: A grpc.Channel.
+        """
+        self.PauseFileActivity = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/PauseFileActivity',
+                request_serializer=v1_dot_file__replication__pb2.PauseFileActivityRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.PauseFileActivityResponse.FromString,
+                )
+        self.ResumeFileActivity = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/ResumeFileActivity',
+                request_serializer=v1_dot_file__replication__pb2.ResumeFileActivityRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.ResumeFileActivityResponse.FromString,
+                )
+        self.ListFiles = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/ListFiles',
+                request_serializer=v1_dot_file__replication__pb2.ListFilesRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.ListFilesResponse.FromString,
+                )
+        self.GetFileMetadata = channel.stream_stream(
+                '/weaviate.v1.FileReplicationService/GetFileMetadata',
+                request_serializer=v1_dot_file__replication__pb2.GetFileMetadataRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.FileMetadata.FromString,
+                )
+        self.GetFile = channel.stream_stream(
+                '/weaviate.v1.FileReplicationService/GetFile',
+                request_serializer=v1_dot_file__replication__pb2.GetFileRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.FileChunk.FromString,
+                )
+
+
+class FileReplicationServiceServicer(object):
+    """Missing associated documentation comment in .proto file."""
+
+    def PauseFileActivity(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def ResumeFileActivity(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def ListFiles(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def GetFileMetadata(self, request_iterator, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def GetFile(self, request_iterator, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+
+def add_FileReplicationServiceServicer_to_server(servicer, server):
+    rpc_method_handlers = {
+            'PauseFileActivity': grpc.unary_unary_rpc_method_handler(
+                    servicer.PauseFileActivity,
+                    request_deserializer=v1_dot_file__replication__pb2.PauseFileActivityRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.PauseFileActivityResponse.SerializeToString,
+            ),
+            'ResumeFileActivity': grpc.unary_unary_rpc_method_handler(
+                    servicer.ResumeFileActivity,
+                    request_deserializer=v1_dot_file__replication__pb2.ResumeFileActivityRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.ResumeFileActivityResponse.SerializeToString,
+            ),
+            'ListFiles': grpc.unary_unary_rpc_method_handler(
+                    servicer.ListFiles,
+                    request_deserializer=v1_dot_file__replication__pb2.ListFilesRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.ListFilesResponse.SerializeToString,
+            ),
+            'GetFileMetadata': grpc.stream_stream_rpc_method_handler(
+                    servicer.GetFileMetadata,
+                    request_deserializer=v1_dot_file__replication__pb2.GetFileMetadataRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.FileMetadata.SerializeToString,
+            ),
+            'GetFile': grpc.stream_stream_rpc_method_handler(
+                    servicer.GetFile,
+                    request_deserializer=v1_dot_file__replication__pb2.GetFileRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.FileChunk.SerializeToString,
+            ),
+    }
+    generic_handler = grpc.method_handlers_generic_handler(
+            'weaviate.v1.FileReplicationService', rpc_method_handlers)
+    server.add_generic_rpc_handlers((generic_handler,))
+
+
+ # This class is part of an EXPERIMENTAL API.
+class FileReplicationService(object):
+    """Missing associated documentation comment in .proto file."""
+
+    @staticmethod
+    def PauseFileActivity(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(request, target, '/weaviate.v1.FileReplicationService/PauseFileActivity',
+            v1_dot_file__replication__pb2.PauseFileActivityRequest.SerializeToString,
+            v1_dot_file__replication__pb2.PauseFileActivityResponse.FromString,
+            options, channel_credentials,
+            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
+
+    @staticmethod
+    def ResumeFileActivity(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(request, target, '/weaviate.v1.FileReplicationService/ResumeFileActivity',
+            v1_dot_file__replication__pb2.ResumeFileActivityRequest.SerializeToString,
+            v1_dot_file__replication__pb2.ResumeFileActivityResponse.FromString,
+            options, channel_credentials,
+            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
+
+    @staticmethod
+    def ListFiles(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(request, target, '/weaviate.v1.FileReplicationService/ListFiles',
+            v1_dot_file__replication__pb2.ListFilesRequest.SerializeToString,
+            v1_dot_file__replication__pb2.ListFilesResponse.FromString,
+            options, channel_credentials,
+            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
+
+    @staticmethod
+    def GetFileMetadata(request_iterator,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.stream_stream(request_iterator, target, '/weaviate.v1.FileReplicationService/GetFileMetadata',
+            v1_dot_file__replication__pb2.GetFileMetadataRequest.SerializeToString,
+            v1_dot_file__replication__pb2.FileMetadata.FromString,
+            options, channel_credentials,
+            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
+
+    @staticmethod
+    def GetFile(request_iterator,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.stream_stream(request_iterator, target, '/weaviate.v1.FileReplicationService/GetFile',
+            v1_dot_file__replication__pb2.GetFileRequest.SerializeToString,
+            v1_dot_file__replication__pb2.FileChunk.FromString,
+            options, channel_credentials,
+            insecure, call_credentials, compression, wait_for_ready, timeout, metadata)
diff --git a/weaviate/proto/v1/v52/v1/file_replication_pb2.py b/weaviate/proto/v1/v52/v1/file_replication_pb2.py
new file mode 100644
index 000000000..2ec011d81
--- /dev/null
+++ b/weaviate/proto/v1/v52/v1/file_replication_pb2.py
@@ -0,0 +1,59 @@
+# -*- coding: utf-8 -*-
+# Generated by the protocol buffer compiler.  DO NOT EDIT!
+# NO CHECKED-IN PROTOBUF GENCODE
+# source: v1/file_replication.proto
+# Protobuf Python Version: 5.27.2
+"""Generated protocol buffer code."""
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import descriptor_pool as _descriptor_pool
+from google.protobuf import runtime_version as _runtime_version
+from google.protobuf import symbol_database as _symbol_database
+from google.protobuf.internal import builder as _builder
+_runtime_version.ValidateProtobufRuntimeVersion(
+    _runtime_version.Domain.PUBLIC,
+    5,
+    27,
+    2,
+    '',
+    'v1/file_replication.proto'
+)
+# @@protoc_insertion_point(imports)
+
+_sym_db = _symbol_database.Default()
+
+
+
+
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+
+_globals = globals()
+_builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
+_builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'v1.file_replication_pb2', _globals)
+if not _descriptor._USE_C_DESCRIPTORS:
+  _globals['DESCRIPTOR']._loaded_options = None
+  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
+  _globals['_COMPRESSIONTYPE']._serialized_start=857
+  _globals['_COMPRESSIONTYPE']._serialized_end=992
+  _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_start=42
+  _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_end=132
+  _globals['_PAUSEFILEACTIVITYRESPONSE']._serialized_start=134
+  _globals['_PAUSEFILEACTIVITYRESPONSE']._serialized_end=201
+  _globals['_RESUMEFILEACTIVITYREQUEST']._serialized_start=203
+  _globals['_RESUMEFILEACTIVITYREQUEST']._serialized_end=270
+  _globals['_RESUMEFILEACTIVITYRESPONSE']._serialized_start=272
+  _globals['_RESUMEFILEACTIVITYRESPONSE']._serialized_end=340
+  _globals['_LISTFILESREQUEST']._serialized_start=342
+  _globals['_LISTFILESREQUEST']._serialized_end=400
+  _globals['_LISTFILESRESPONSE']._serialized_start=402
+  _globals['_LISTFILESRESPONSE']._serialized_end=481
+  _globals['_GETFILEMETADATAREQUEST']._serialized_start=483
+  _globals['_GETFILEMETADATAREQUEST']._serialized_end=566
+  _globals['_FILEMETADATA']._serialized_start=568
+  _globals['_FILEMETADATA']._serialized_end=670
+  _globals['_GETFILEREQUEST']._serialized_start=672
+  _globals['_GETFILEREQUEST']._serialized_end=798
+  _globals['_FILECHUNK']._serialized_start=800
+  _globals['_FILECHUNK']._serialized_end=854
+  _globals['_FILEREPLICATIONSERVICE']._serialized_start=995
+  _globals['_FILEREPLICATIONSERVICE']._serialized_end=1453
+# @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v52/v1/file_replication_pb2.pyi b/weaviate/proto/v1/v52/v1/file_replication_pb2.pyi
new file mode 100644
index 000000000..29b87cf22
--- /dev/null
+++ b/weaviate/proto/v1/v52/v1/file_replication_pb2.pyi
@@ -0,0 +1,116 @@
+from google.protobuf.internal import containers as _containers
+from google.protobuf.internal import enum_type_wrapper as _enum_type_wrapper
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import message as _message
+from typing import ClassVar as _ClassVar, Iterable as _Iterable, Optional as _Optional, Union as _Union
+
+DESCRIPTOR: _descriptor.FileDescriptor
+
+class CompressionType(int, metaclass=_enum_type_wrapper.EnumTypeWrapper):
+    __slots__ = ()
+    COMPRESSION_TYPE_UNSPECIFIED: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_GZIP: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_ZLIB: _ClassVar[CompressionType]
+    COMPRESSION_TYPE_DEFLATE: _ClassVar[CompressionType]
+COMPRESSION_TYPE_UNSPECIFIED: CompressionType
+COMPRESSION_TYPE_GZIP: CompressionType
+COMPRESSION_TYPE_ZLIB: CompressionType
+COMPRESSION_TYPE_DEFLATE: CompressionType
+
+class PauseFileActivityRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "schema_version")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    SCHEMA_VERSION_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    schema_version: int
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., schema_version: _Optional[int] = ...) -> None: ...
+
+class PauseFileActivityResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ResumeFileActivityRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ResumeFileActivityResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ListFilesRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ...) -> None: ...
+
+class ListFilesResponse(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_names")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAMES_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_names: _containers.RepeatedScalarFieldContainer[str]
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_names: _Optional[_Iterable[str]] = ...) -> None: ...
+
+class GetFileMetadataRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ...) -> None: ...
+
+class FileMetadata(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name", "size", "crc32")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    SIZE_FIELD_NUMBER: _ClassVar[int]
+    CRC32_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    size: int
+    crc32: int
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ..., size: _Optional[int] = ..., crc32: _Optional[int] = ...) -> None: ...
+
+class GetFileRequest(_message.Message):
+    __slots__ = ("index_name", "shard_name", "file_name", "compression")
+    INDEX_NAME_FIELD_NUMBER: _ClassVar[int]
+    SHARD_NAME_FIELD_NUMBER: _ClassVar[int]
+    FILE_NAME_FIELD_NUMBER: _ClassVar[int]
+    COMPRESSION_FIELD_NUMBER: _ClassVar[int]
+    index_name: str
+    shard_name: str
+    file_name: str
+    compression: CompressionType
+    def __init__(self, index_name: _Optional[str] = ..., shard_name: _Optional[str] = ..., file_name: _Optional[str] = ..., compression: _Optional[_Union[CompressionType, str]] = ...) -> None: ...
+
+class FileChunk(_message.Message):
+    __slots__ = ("offset", "data", "eof")
+    OFFSET_FIELD_NUMBER: _ClassVar[int]
+    DATA_FIELD_NUMBER: _ClassVar[int]
+    EOF_FIELD_NUMBER: _ClassVar[int]
+    offset: int
+    data: bytes
+    eof: bool
+    def __init__(self, offset: _Optional[int] = ..., data: _Optional[bytes] = ..., eof: bool = ...) -> None: ...
diff --git a/weaviate/proto/v1/v52/v1/file_replication_pb2_grpc.py b/weaviate/proto/v1/v52/v1/file_replication_pb2_grpc.py
new file mode 100644
index 000000000..9280952c9
--- /dev/null
+++ b/weaviate/proto/v1/v52/v1/file_replication_pb2_grpc.py
@@ -0,0 +1,269 @@
+# Generated by the gRPC Python protocol compiler plugin. DO NOT EDIT!
+"""Client and server classes corresponding to protobuf-defined services."""
+import grpc
+import warnings
+
+from weaviate.proto.v1.v52.v1 import file_replication_pb2 as v1_dot_file__replication__pb2
+
+GRPC_GENERATED_VERSION = '1.66.2'
+GRPC_VERSION = grpc.__version__
+_version_not_supported = False
+
+try:
+    from grpc._utilities import first_version_is_lower
+    _version_not_supported = first_version_is_lower(GRPC_VERSION, GRPC_GENERATED_VERSION)
+except ImportError:
+    _version_not_supported = True
+
+if _version_not_supported:
+    raise RuntimeError(
+        f'The grpc package installed is at version {GRPC_VERSION},'
+        + f' but the generated code in v1/file_replication_pb2_grpc.py depends on'
+        + f' grpcio>={GRPC_GENERATED_VERSION}.'
+        + f' Please upgrade your grpc module to grpcio>={GRPC_GENERATED_VERSION}'
+        + f' or downgrade your generated code using grpcio-tools<={GRPC_VERSION}.'
+    )
+
+
+class FileReplicationServiceStub(object):
+    """Missing associated documentation comment in .proto file."""
+
+    def __init__(self, channel):
+        """Constructor.
+
+        Args:
+            channel: A grpc.Channel.
+        """
+        self.PauseFileActivity = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/PauseFileActivity',
+                request_serializer=v1_dot_file__replication__pb2.PauseFileActivityRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.PauseFileActivityResponse.FromString,
+                _registered_method=True)
+        self.ResumeFileActivity = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/ResumeFileActivity',
+                request_serializer=v1_dot_file__replication__pb2.ResumeFileActivityRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.ResumeFileActivityResponse.FromString,
+                _registered_method=True)
+        self.ListFiles = channel.unary_unary(
+                '/weaviate.v1.FileReplicationService/ListFiles',
+                request_serializer=v1_dot_file__replication__pb2.ListFilesRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.ListFilesResponse.FromString,
+                _registered_method=True)
+        self.GetFileMetadata = channel.stream_stream(
+                '/weaviate.v1.FileReplicationService/GetFileMetadata',
+                request_serializer=v1_dot_file__replication__pb2.GetFileMetadataRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.FileMetadata.FromString,
+                _registered_method=True)
+        self.GetFile = channel.stream_stream(
+                '/weaviate.v1.FileReplicationService/GetFile',
+                request_serializer=v1_dot_file__replication__pb2.GetFileRequest.SerializeToString,
+                response_deserializer=v1_dot_file__replication__pb2.FileChunk.FromString,
+                _registered_method=True)
+
+
+class FileReplicationServiceServicer(object):
+    """Missing associated documentation comment in .proto file."""
+
+    def PauseFileActivity(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def ResumeFileActivity(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def ListFiles(self, request, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def GetFileMetadata(self, request_iterator, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+    def GetFile(self, request_iterator, context):
+        """Missing associated documentation comment in .proto file."""
+        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
+        context.set_details('Method not implemented!')
+        raise NotImplementedError('Method not implemented!')
+
+
+def add_FileReplicationServiceServicer_to_server(servicer, server):
+    rpc_method_handlers = {
+            'PauseFileActivity': grpc.unary_unary_rpc_method_handler(
+                    servicer.PauseFileActivity,
+                    request_deserializer=v1_dot_file__replication__pb2.PauseFileActivityRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.PauseFileActivityResponse.SerializeToString,
+            ),
+            'ResumeFileActivity': grpc.unary_unary_rpc_method_handler(
+                    servicer.ResumeFileActivity,
+                    request_deserializer=v1_dot_file__replication__pb2.ResumeFileActivityRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.ResumeFileActivityResponse.SerializeToString,
+            ),
+            'ListFiles': grpc.unary_unary_rpc_method_handler(
+                    servicer.ListFiles,
+                    request_deserializer=v1_dot_file__replication__pb2.ListFilesRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.ListFilesResponse.SerializeToString,
+            ),
+            'GetFileMetadata': grpc.stream_stream_rpc_method_handler(
+                    servicer.GetFileMetadata,
+                    request_deserializer=v1_dot_file__replication__pb2.GetFileMetadataRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.FileMetadata.SerializeToString,
+            ),
+            'GetFile': grpc.stream_stream_rpc_method_handler(
+                    servicer.GetFile,
+                    request_deserializer=v1_dot_file__replication__pb2.GetFileRequest.FromString,
+                    response_serializer=v1_dot_file__replication__pb2.FileChunk.SerializeToString,
+            ),
+    }
+    generic_handler = grpc.method_handlers_generic_handler(
+            'weaviate.v1.FileReplicationService', rpc_method_handlers)
+    server.add_generic_rpc_handlers((generic_handler,))
+    server.add_registered_method_handlers('weaviate.v1.FileReplicationService', rpc_method_handlers)
+
+
+ # This class is part of an EXPERIMENTAL API.
+class FileReplicationService(object):
+    """Missing associated documentation comment in .proto file."""
+
+    @staticmethod
+    def PauseFileActivity(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(
+            request,
+            target,
+            '/weaviate.v1.FileReplicationService/PauseFileActivity',
+            v1_dot_file__replication__pb2.PauseFileActivityRequest.SerializeToString,
+            v1_dot_file__replication__pb2.PauseFileActivityResponse.FromString,
+            options,
+            channel_credentials,
+            insecure,
+            call_credentials,
+            compression,
+            wait_for_ready,
+            timeout,
+            metadata,
+            _registered_method=True)
+
+    @staticmethod
+    def ResumeFileActivity(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(
+            request,
+            target,
+            '/weaviate.v1.FileReplicationService/ResumeFileActivity',
+            v1_dot_file__replication__pb2.ResumeFileActivityRequest.SerializeToString,
+            v1_dot_file__replication__pb2.ResumeFileActivityResponse.FromString,
+            options,
+            channel_credentials,
+            insecure,
+            call_credentials,
+            compression,
+            wait_for_ready,
+            timeout,
+            metadata,
+            _registered_method=True)
+
+    @staticmethod
+    def ListFiles(request,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.unary_unary(
+            request,
+            target,
+            '/weaviate.v1.FileReplicationService/ListFiles',
+            v1_dot_file__replication__pb2.ListFilesRequest.SerializeToString,
+            v1_dot_file__replication__pb2.ListFilesResponse.FromString,
+            options,
+            channel_credentials,
+            insecure,
+            call_credentials,
+            compression,
+            wait_for_ready,
+            timeout,
+            metadata,
+            _registered_method=True)
+
+    @staticmethod
+    def GetFileMetadata(request_iterator,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.stream_stream(
+            request_iterator,
+            target,
+            '/weaviate.v1.FileReplicationService/GetFileMetadata',
+            v1_dot_file__replication__pb2.GetFileMetadataRequest.SerializeToString,
+            v1_dot_file__replication__pb2.FileMetadata.FromString,
+            options,
+            channel_credentials,
+            insecure,
+            call_credentials,
+            compression,
+            wait_for_ready,
+            timeout,
+            metadata,
+            _registered_method=True)
+
+    @staticmethod
+    def GetFile(request_iterator,
+            target,
+            options=(),
+            channel_credentials=None,
+            call_credentials=None,
+            insecure=False,
+            compression=None,
+            wait_for_ready=None,
+            timeout=None,
+            metadata=None):
+        return grpc.experimental.stream_stream(
+            request_iterator,
+            target,
+            '/weaviate.v1.FileReplicationService/GetFile',
+            v1_dot_file__replication__pb2.GetFileRequest.SerializeToString,
+            v1_dot_file__replication__pb2.FileChunk.FromString,
+            options,
+            channel_credentials,
+            insecure,
+            call_credentials,
+            compression,
+            wait_for_ready,
+            timeout,
+            metadata,
+            _registered_method=True)
diff --git a/weaviate/proto/v1/v5261/v1/batch_pb2.py b/weaviate/proto/v1/v5261/v1/batch_pb2.py
index 6747a21ce..86b722431 100644
--- a/weaviate/proto/v1/v5261/v1/batch_pb2.py
+++ b/weaviate/proto/v1/v5261/v1/batch_pb2.py
@@ -16,7 +16,7 @@
 from weaviate.proto.v1.v5261.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xd6\x02\n\x10\x42\x61tchSendRequest\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x38\n\x07objects\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchSendRequest.ObjectsH\x00\x12>\n\nreferences\x18\x03 \x01(\x0b\x32(.weaviate.v1.BatchSendRequest.ReferencesH\x00\x12\x32\n\x04stop\x18\x04 \x01(\x0b\x32\".weaviate.v1.BatchSendRequest.StopH\x00\x1a\x06\n\x04Stop\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"B\n\x0e\x42\x61tchSendReply\x12\x17\n\x0fnext_batch_size\x18\x01 \x01(\x05\x12\x17\n\x0f\x62\x61\x63koff_seconds\x18\x02 \x01(\x02\"\xc7\x01\n\x12\x42\x61tchStreamRequest\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x12\x19\n\x0cobject_index\x18\x02 \x01(\x05H\x01\x88\x01\x01\x12\x1c\n\x0freference_index\x18\x03 \x01(\x05H\x02\x88\x01\x01\x42\x14\n\x12_consistency_levelB\x0f\n\r_object_indexB\x12\n\x10_reference_index\"\xf0\x03\n\x12\x42\x61tchStreamMessage\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x36\n\x05\x65rror\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.ErrorH\x00\x12\x36\n\x05start\x18\x03 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.StartH\x00\x12\x34\n\x04stop\x18\x04 \x01(\x0b\x32$.weaviate.v1.BatchStreamMessage.StopH\x00\x12<\n\x08shutdown\x18\x05 \x01(\x0b\x32(.weaviate.v1.BatchStreamMessage.ShutdownH\x00\x12\x45\n\rshutting_down\x18\x06 \x01(\x0b\x32,.weaviate.v1.BatchStreamMessage.ShuttingDownH\x00\x1a\x07\n\x05Start\x1a\x06\n\x04Stop\x1a\n\n\x08Shutdown\x1a\x0e\n\x0cShuttingDown\x1a\x64\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\r\n\x05index\x18\x02 \x01(\x05\x12\x14\n\x0cis_retriable\x18\x03 \x01(\x08\x12\x11\n\tis_object\x18\x04 \x01(\x08\x12\x14\n\x0cis_reference\x18\x05 \x01(\x08\x42\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xa6\x04\n\x12\x42\x61tchStreamRequest\x12\x36\n\x05start\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamRequest.StartH\x00\x12\x34\n\x04\x64\x61ta\x18\x02 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.DataH\x00\x12\x34\n\x04stop\x18\x03 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.StopH\x00\x1a\\\n\x05Start\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\x1a\x06\n\x04Stop\x1a\xfa\x01\n\x04\x44\x61ta\x12=\n\x07objects\x18\x01 \x01(\x0b\x32,.weaviate.v1.BatchStreamRequest.Data.Objects\x12\x43\n\nreferences\x18\x02 \x01(\x0b\x32/.weaviate.v1.BatchStreamRequest.Data.References\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"\x98\x05\n\x10\x42\x61tchStreamReply\x12\x38\n\x07results\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.ResultsH\x00\x12\x43\n\rshutting_down\x18\x02 \x01(\x0b\x32*.weaviate.v1.BatchStreamReply.ShuttingDownH\x00\x12:\n\x08shutdown\x18\x03 \x01(\x0b\x32&.weaviate.v1.BatchStreamReply.ShutdownH\x00\x12\x38\n\x07started\x18\x04 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.StartedH\x00\x12\x38\n\x07\x62\x61\x63koff\x18\x05 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.BackoffH\x00\x1a\t\n\x07Started\x1a\x0e\n\x0cShuttingDown\x1a\n\n\x08Shutdown\x1a\x1d\n\x07\x42\x61\x63koff\x12\x12\n\nbatch_size\x18\x01 \x01(\x05\x1a\x83\x02\n\x07Results\x12;\n\x06\x65rrors\x18\x01 \x03(\x0b\x32+.weaviate.v1.BatchStreamReply.Results.Error\x12@\n\tsuccesses\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchStreamReply.Results.Success\x1a\x42\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tail\x1a\x35\n\x07Success\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tailB\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -30,46 +30,50 @@
   _globals['_BATCHOBJECTSREQUEST']._serialized_end=226
   _globals['_BATCHREFERENCESREQUEST']._serialized_start=229
   _globals['_BATCHREFERENCESREQUEST']._serialized_end=387
-  _globals['_BATCHSENDREQUEST']._serialized_start=390
-  _globals['_BATCHSENDREQUEST']._serialized_end=732
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_start=603
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_end=609
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_start=611
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_end=662
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_start=664
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_end=721
-  _globals['_BATCHSENDREPLY']._serialized_start=734
-  _globals['_BATCHSENDREPLY']._serialized_end=800
-  _globals['_BATCHSTREAMREQUEST']._serialized_start=803
-  _globals['_BATCHSTREAMREQUEST']._serialized_end=1002
-  _globals['_BATCHSTREAMMESSAGE']._serialized_start=1005
-  _globals['_BATCHSTREAMMESSAGE']._serialized_end=1501
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_start=1345
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_end=1352
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_start=603
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_end=609
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_start=1362
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_end=1372
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_start=1374
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_end=1388
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_start=1390
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_end=1490
-  _globals['_BATCHOBJECT']._serialized_start=1504
-  _globals['_BATCHOBJECT']._serialized_end=2494
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1708
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2352
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2354
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2410
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2412
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2494
-  _globals['_BATCHREFERENCE']._serialized_start=2497
-  _globals['_BATCHREFERENCE']._serialized_end=2650
-  _globals['_BATCHOBJECTSREPLY']._serialized_start=2653
-  _globals['_BATCHOBJECTSREPLY']._serialized_end=2789
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2789
-  _globals['_BATCHREFERENCESREPLY']._serialized_start=2792
-  _globals['_BATCHREFERENCESREPLY']._serialized_end=2934
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2789
+  _globals['_BATCHSTREAMREQUEST']._serialized_start=390
+  _globals['_BATCHSTREAMREQUEST']._serialized_end=940
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_start=576
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_end=668
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_start=670
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_end=676
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_start=679
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_end=929
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_start=819
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_end=870
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_start=872
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_end=929
+  _globals['_BATCHSTREAMREPLY']._serialized_start=943
+  _globals['_BATCHSTREAMREPLY']._serialized_end=1607
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_start=1266
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_end=1275
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_start=1277
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_end=1291
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_start=1293
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_end=1303
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_start=1305
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_end=1334
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_start=1337
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_end=1596
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_start=1475
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_end=1541
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_start=1543
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_end=1596
+  _globals['_BATCHOBJECT']._serialized_start=1610
+  _globals['_BATCHOBJECT']._serialized_end=2600
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1814
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2458
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2460
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2516
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2518
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2600
+  _globals['_BATCHREFERENCE']._serialized_start=2603
+  _globals['_BATCHREFERENCE']._serialized_end=2756
+  _globals['_BATCHOBJECTSREPLY']._serialized_start=2759
+  _globals['_BATCHOBJECTSREPLY']._serialized_end=2895
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2895
+  _globals['_BATCHREFERENCESREPLY']._serialized_start=2898
+  _globals['_BATCHREFERENCESREPLY']._serialized_end=3040
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2895
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v5261/v1/batch_pb2.pyi b/weaviate/proto/v1/v5261/v1/batch_pb2.pyi
index e89a47d37..d975b0157 100644
--- a/weaviate/proto/v1/v5261/v1/batch_pb2.pyi
+++ b/weaviate/proto/v1/v5261/v1/batch_pb2.pyi
@@ -23,89 +23,91 @@ class BatchReferencesRequest(_message.Message):
     consistency_level: _base_pb2.ConsistencyLevel
     def __init__(self, references: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ..., consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
 
-class BatchSendRequest(_message.Message):
-    __slots__ = ("stream_id", "objects", "references", "stop")
+class BatchStreamRequest(_message.Message):
+    __slots__ = ("start", "data", "stop")
+    class Start(_message.Message):
+        __slots__ = ("consistency_level",)
+        CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
+        consistency_level: _base_pb2.ConsistencyLevel
+        def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
     class Stop(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class Objects(_message.Message):
-        __slots__ = ("values",)
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchObject]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
-    class References(_message.Message):
-        __slots__ = ("values",)
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchReference]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    OBJECTS_FIELD_NUMBER: _ClassVar[int]
-    REFERENCES_FIELD_NUMBER: _ClassVar[int]
+    class Data(_message.Message):
+        __slots__ = ("objects", "references")
+        class Objects(_message.Message):
+            __slots__ = ("values",)
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchObject]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
+        class References(_message.Message):
+            __slots__ = ("values",)
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchReference]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
+        OBJECTS_FIELD_NUMBER: _ClassVar[int]
+        REFERENCES_FIELD_NUMBER: _ClassVar[int]
+        objects: BatchStreamRequest.Data.Objects
+        references: BatchStreamRequest.Data.References
+        def __init__(self, objects: _Optional[_Union[BatchStreamRequest.Data.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchStreamRequest.Data.References, _Mapping]] = ...) -> None: ...
+    START_FIELD_NUMBER: _ClassVar[int]
+    DATA_FIELD_NUMBER: _ClassVar[int]
     STOP_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    objects: BatchSendRequest.Objects
-    references: BatchSendRequest.References
-    stop: BatchSendRequest.Stop
-    def __init__(self, stream_id: _Optional[str] = ..., objects: _Optional[_Union[BatchSendRequest.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchSendRequest.References, _Mapping]] = ..., stop: _Optional[_Union[BatchSendRequest.Stop, _Mapping]] = ...) -> None: ...
-
-class BatchSendReply(_message.Message):
-    __slots__ = ("next_batch_size", "backoff_seconds")
-    NEXT_BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
-    BACKOFF_SECONDS_FIELD_NUMBER: _ClassVar[int]
-    next_batch_size: int
-    backoff_seconds: float
-    def __init__(self, next_batch_size: _Optional[int] = ..., backoff_seconds: _Optional[float] = ...) -> None: ...
+    start: BatchStreamRequest.Start
+    data: BatchStreamRequest.Data
+    stop: BatchStreamRequest.Stop
+    def __init__(self, start: _Optional[_Union[BatchStreamRequest.Start, _Mapping]] = ..., data: _Optional[_Union[BatchStreamRequest.Data, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamRequest.Stop, _Mapping]] = ...) -> None: ...
 
-class BatchStreamRequest(_message.Message):
-    __slots__ = ("consistency_level", "object_index", "reference_index")
-    CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
-    OBJECT_INDEX_FIELD_NUMBER: _ClassVar[int]
-    REFERENCE_INDEX_FIELD_NUMBER: _ClassVar[int]
-    consistency_level: _base_pb2.ConsistencyLevel
-    object_index: int
-    reference_index: int
-    def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ..., object_index: _Optional[int] = ..., reference_index: _Optional[int] = ...) -> None: ...
-
-class BatchStreamMessage(_message.Message):
-    __slots__ = ("stream_id", "error", "start", "stop", "shutdown", "shutting_down")
-    class Start(_message.Message):
+class BatchStreamReply(_message.Message):
+    __slots__ = ("results", "shutting_down", "shutdown", "started", "backoff")
+    class Started(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class Stop(_message.Message):
+    class ShuttingDown(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
     class Shutdown(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class ShuttingDown(_message.Message):
-        __slots__ = ()
-        def __init__(self) -> None: ...
-    class Error(_message.Message):
-        __slots__ = ("error", "index", "is_retriable", "is_object", "is_reference")
-        ERROR_FIELD_NUMBER: _ClassVar[int]
-        INDEX_FIELD_NUMBER: _ClassVar[int]
-        IS_RETRIABLE_FIELD_NUMBER: _ClassVar[int]
-        IS_OBJECT_FIELD_NUMBER: _ClassVar[int]
-        IS_REFERENCE_FIELD_NUMBER: _ClassVar[int]
-        error: str
-        index: int
-        is_retriable: bool
-        is_object: bool
-        is_reference: bool
-        def __init__(self, error: _Optional[str] = ..., index: _Optional[int] = ..., is_retriable: bool = ..., is_object: bool = ..., is_reference: bool = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    ERROR_FIELD_NUMBER: _ClassVar[int]
-    START_FIELD_NUMBER: _ClassVar[int]
-    STOP_FIELD_NUMBER: _ClassVar[int]
-    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    class Backoff(_message.Message):
+        __slots__ = ("batch_size",)
+        BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
+        batch_size: int
+        def __init__(self, batch_size: _Optional[int] = ...) -> None: ...
+    class Results(_message.Message):
+        __slots__ = ("errors", "successes")
+        class Error(_message.Message):
+            __slots__ = ("error", "uuid", "beacon")
+            ERROR_FIELD_NUMBER: _ClassVar[int]
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            error: str
+            uuid: str
+            beacon: str
+            def __init__(self, error: _Optional[str] = ..., uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        class Success(_message.Message):
+            __slots__ = ("uuid", "beacon")
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            uuid: str
+            beacon: str
+            def __init__(self, uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        ERRORS_FIELD_NUMBER: _ClassVar[int]
+        SUCCESSES_FIELD_NUMBER: _ClassVar[int]
+        errors: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Error]
+        successes: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Success]
+        def __init__(self, errors: _Optional[_Iterable[_Union[BatchStreamReply.Results.Error, _Mapping]]] = ..., successes: _Optional[_Iterable[_Union[BatchStreamReply.Results.Success, _Mapping]]] = ...) -> None: ...
+    RESULTS_FIELD_NUMBER: _ClassVar[int]
     SHUTTING_DOWN_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    error: BatchStreamMessage.Error
-    start: BatchStreamMessage.Start
-    stop: BatchStreamMessage.Stop
-    shutdown: BatchStreamMessage.Shutdown
-    shutting_down: BatchStreamMessage.ShuttingDown
-    def __init__(self, stream_id: _Optional[str] = ..., error: _Optional[_Union[BatchStreamMessage.Error, _Mapping]] = ..., start: _Optional[_Union[BatchStreamMessage.Start, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamMessage.Stop, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamMessage.Shutdown, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamMessage.ShuttingDown, _Mapping]] = ...) -> None: ...
+    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    STARTED_FIELD_NUMBER: _ClassVar[int]
+    BACKOFF_FIELD_NUMBER: _ClassVar[int]
+    results: BatchStreamReply.Results
+    shutting_down: BatchStreamReply.ShuttingDown
+    shutdown: BatchStreamReply.Shutdown
+    started: BatchStreamReply.Started
+    backoff: BatchStreamReply.Backoff
+    def __init__(self, results: _Optional[_Union[BatchStreamReply.Results, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamReply.ShuttingDown, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamReply.Shutdown, _Mapping]] = ..., started: _Optional[_Union[BatchStreamReply.Started, _Mapping]] = ..., backoff: _Optional[_Union[BatchStreamReply.Backoff, _Mapping]] = ...) -> None: ...
 
 class BatchObject(_message.Message):
     __slots__ = ("uuid", "vector", "properties", "collection", "tenant", "vector_bytes", "vectors")
diff --git a/weaviate/proto/v1/v5261/v1/file_replication_pb2.py b/weaviate/proto/v1/v5261/v1/file_replication_pb2.py
index 6eb78addb..6c647b702 100644
--- a/weaviate/proto/v1/v5261/v1/file_replication_pb2.py
+++ b/weaviate/proto/v1/v5261/v1/file_replication_pb2.py
@@ -14,14 +14,14 @@
 
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42y\n#io.weaviate.client.grpc.protocol.v1B\x1cWeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
 _builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'v1.file_replication_pb2', _globals)
 if not _descriptor._USE_C_DESCRIPTORS:
   _globals['DESCRIPTOR']._loaded_options = None
-  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
+  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\034WeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_COMPRESSIONTYPE']._serialized_start=857
   _globals['_COMPRESSIONTYPE']._serialized_end=992
   _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_start=42
diff --git a/weaviate/proto/v1/v5261/v1/generative_pb2.py b/weaviate/proto/v1/v5261/v1/generative_pb2.py
index 5b83faf84..1af15a41e 100644
--- a/weaviate/proto/v1/v5261/v1/generative_pb2.py
+++ b/weaviate/proto/v1/v5261/v1/generative_pb2.py
@@ -15,7 +15,7 @@
 from weaviate.proto.v1.v5261.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x84\x03\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperature\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x88\x04\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x12+\n\x06images\x18\n \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\t\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0b \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\n\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -44,89 +44,89 @@
   _globals['_GENERATIVEAWS']._serialized_start=1806
   _globals['_GENERATIVEAWS']._serialized_end=2259
   _globals['_GENERATIVECOHERE']._serialized_start=2262
-  _globals['_GENERATIVECOHERE']._serialized_end=2650
-  _globals['_GENERATIVEDUMMY']._serialized_start=2652
-  _globals['_GENERATIVEDUMMY']._serialized_end=2669
-  _globals['_GENERATIVEMISTRAL']._serialized_start=2672
-  _globals['_GENERATIVEMISTRAL']._serialized_end=2869
-  _globals['_GENERATIVEOLLAMA']._serialized_start=2872
-  _globals['_GENERATIVEOLLAMA']._serialized_end=3138
-  _globals['_GENERATIVEOPENAI']._serialized_start=3141
-  _globals['_GENERATIVEOPENAI']._serialized_end=4264
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3746
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=3909
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=3911
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4010
-  _globals['_GENERATIVEGOOGLE']._serialized_start=4267
-  _globals['_GENERATIVEGOOGLE']._serialized_end=4925
-  _globals['_GENERATIVEDATABRICKS']._serialized_start=4928
-  _globals['_GENERATIVEDATABRICKS']._serialized_end=5392
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5395
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5617
-  _globals['_GENERATIVENVIDIA']._serialized_start=5620
-  _globals['_GENERATIVENVIDIA']._serialized_end=5816
-  _globals['_GENERATIVEXAI']._serialized_start=5819
-  _globals['_GENERATIVEXAI']._serialized_end=6144
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6147
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6293
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6241
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6293
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6295
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6323
-  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6325
-  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6348
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6351
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7147
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6648
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6790
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6793
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=6990
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=6992
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7090
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7149
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7174
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7177
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7434
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7436
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7462
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7465
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7720
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7723
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8595
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=7904
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8030
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8033
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8258
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8260
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8371
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8374
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8563
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8598
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8861
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8864
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9127
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9130
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9385
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9388
-  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9637
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEMETADATA']._serialized_start=9640
-  _globals['_GENERATIVEMETADATA']._serialized_end=10423
-  _globals['_GENERATIVEREPLY']._serialized_start=10426
-  _globals['_GENERATIVEREPLY']._serialized_end=10588
-  _globals['_GENERATIVERESULT']._serialized_start=10590
-  _globals['_GENERATIVERESULT']._serialized_end=10654
-  _globals['_GENERATIVEDEBUG']._serialized_start=10656
-  _globals['_GENERATIVEDEBUG']._serialized_end=10715
+  _globals['_GENERATIVECOHERE']._serialized_end=2782
+  _globals['_GENERATIVEDUMMY']._serialized_start=2784
+  _globals['_GENERATIVEDUMMY']._serialized_end=2801
+  _globals['_GENERATIVEMISTRAL']._serialized_start=2804
+  _globals['_GENERATIVEMISTRAL']._serialized_end=3001
+  _globals['_GENERATIVEOLLAMA']._serialized_start=3004
+  _globals['_GENERATIVEOLLAMA']._serialized_end=3270
+  _globals['_GENERATIVEOPENAI']._serialized_start=3273
+  _globals['_GENERATIVEOPENAI']._serialized_end=4396
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3878
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=4041
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=4043
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4142
+  _globals['_GENERATIVEGOOGLE']._serialized_start=4399
+  _globals['_GENERATIVEGOOGLE']._serialized_end=5057
+  _globals['_GENERATIVEDATABRICKS']._serialized_start=5060
+  _globals['_GENERATIVEDATABRICKS']._serialized_end=5524
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5527
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5749
+  _globals['_GENERATIVENVIDIA']._serialized_start=5752
+  _globals['_GENERATIVENVIDIA']._serialized_end=5948
+  _globals['_GENERATIVEXAI']._serialized_start=5951
+  _globals['_GENERATIVEXAI']._serialized_end=6276
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6279
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6425
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6373
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6425
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6427
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6455
+  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6457
+  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6480
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6483
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7279
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6780
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6922
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6925
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=7122
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=7124
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7222
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7281
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7306
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7309
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7566
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7568
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7594
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7597
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7852
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7855
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8727
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=8036
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8162
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8165
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8390
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8392
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8503
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8506
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8695
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8730
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8993
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8996
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9259
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9262
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9517
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9520
+  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9769
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEMETADATA']._serialized_start=9772
+  _globals['_GENERATIVEMETADATA']._serialized_end=10555
+  _globals['_GENERATIVEREPLY']._serialized_start=10558
+  _globals['_GENERATIVEREPLY']._serialized_end=10720
+  _globals['_GENERATIVERESULT']._serialized_start=10722
+  _globals['_GENERATIVERESULT']._serialized_end=10786
+  _globals['_GENERATIVEDEBUG']._serialized_start=10788
+  _globals['_GENERATIVEDEBUG']._serialized_end=10847
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v5261/v1/generative_pb2.pyi b/weaviate/proto/v1/v5261/v1/generative_pb2.pyi
index d794710dc..1784bedba 100644
--- a/weaviate/proto/v1/v5261/v1/generative_pb2.pyi
+++ b/weaviate/proto/v1/v5261/v1/generative_pb2.pyi
@@ -130,7 +130,7 @@ class GenerativeAWS(_message.Message):
     def __init__(self, model: _Optional[str] = ..., temperature: _Optional[float] = ..., service: _Optional[str] = ..., region: _Optional[str] = ..., endpoint: _Optional[str] = ..., target_model: _Optional[str] = ..., target_variant: _Optional[str] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., max_tokens: _Optional[int] = ...) -> None: ...
 
 class GenerativeCohere(_message.Message):
-    __slots__ = ("base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature")
+    __slots__ = ("base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature", "images", "image_properties")
     BASE_URL_FIELD_NUMBER: _ClassVar[int]
     FREQUENCY_PENALTY_FIELD_NUMBER: _ClassVar[int]
     MAX_TOKENS_FIELD_NUMBER: _ClassVar[int]
@@ -140,6 +140,8 @@ class GenerativeCohere(_message.Message):
     PRESENCE_PENALTY_FIELD_NUMBER: _ClassVar[int]
     STOP_SEQUENCES_FIELD_NUMBER: _ClassVar[int]
     TEMPERATURE_FIELD_NUMBER: _ClassVar[int]
+    IMAGES_FIELD_NUMBER: _ClassVar[int]
+    IMAGE_PROPERTIES_FIELD_NUMBER: _ClassVar[int]
     base_url: str
     frequency_penalty: float
     max_tokens: int
@@ -149,7 +151,9 @@ class GenerativeCohere(_message.Message):
     presence_penalty: float
     stop_sequences: _base_pb2.TextArray
     temperature: float
-    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ...) -> None: ...
+    images: _base_pb2.TextArray
+    image_properties: _base_pb2.TextArray
+    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ...) -> None: ...
 
 class GenerativeDummy(_message.Message):
     __slots__ = ()
diff --git a/weaviate/proto/v1/v5261/v1/weaviate_pb2.py b/weaviate/proto/v1/v5261/v1/weaviate_pb2.py
index c781cdfec..936bcfc05 100644
--- a/weaviate/proto/v1/v5261/v1/weaviate_pb2.py
+++ b/weaviate/proto/v1/v5261/v1/weaviate_pb2.py
@@ -19,7 +19,7 @@
 from weaviate.proto.v1.v5261.v1 import tenants_pb2 as v1_dot_tenants__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\x87\x05\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12I\n\tBatchSend\x12\x1d.weaviate.v1.BatchSendRequest\x1a\x1b.weaviate.v1.BatchSendReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1f.weaviate.v1.BatchStreamMessage\"\x00\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\xbc\x04\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1d.weaviate.v1.BatchStreamReply\"\x00(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -28,5 +28,5 @@
   _globals['DESCRIPTOR']._loaded_options = None
   _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_WEAVIATE']._serialized_start=133
-  _globals['_WEAVIATE']._serialized_end=780
+  _globals['_WEAVIATE']._serialized_end=705
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v5261/v1/weaviate_pb2_grpc.py b/weaviate/proto/v1/v5261/v1/weaviate_pb2_grpc.py
index 47b66a0da..e10059f8f 100644
--- a/weaviate/proto/v1/v5261/v1/weaviate_pb2_grpc.py
+++ b/weaviate/proto/v1/v5261/v1/weaviate_pb2_grpc.py
@@ -73,15 +73,10 @@ def __init__(self, channel):
                 request_serializer=v1_dot_aggregate__pb2.AggregateRequest.SerializeToString,
                 response_deserializer=v1_dot_aggregate__pb2.AggregateReply.FromString,
                 _registered_method=True)
-        self.BatchSend = channel.unary_unary(
-                '/weaviate.v1.Weaviate/BatchSend',
-                request_serializer=v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchSendReply.FromString,
-                _registered_method=True)
-        self.BatchStream = channel.unary_stream(
+        self.BatchStream = channel.stream_stream(
                 '/weaviate.v1.Weaviate/BatchStream',
                 request_serializer=v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchStreamMessage.FromString,
+                response_deserializer=v1_dot_batch__pb2.BatchStreamReply.FromString,
                 _registered_method=True)
 
 
@@ -124,13 +119,7 @@ def Aggregate(self, request, context):
         context.set_details('Method not implemented!')
         raise NotImplementedError('Method not implemented!')
 
-    def BatchSend(self, request, context):
-        """Missing associated documentation comment in .proto file."""
-        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
-        context.set_details('Method not implemented!')
-        raise NotImplementedError('Method not implemented!')
-
-    def BatchStream(self, request, context):
+    def BatchStream(self, request_iterator, context):
         """Missing associated documentation comment in .proto file."""
         context.set_code(grpc.StatusCode.UNIMPLEMENTED)
         context.set_details('Method not implemented!')
@@ -169,15 +158,10 @@ def add_WeaviateServicer_to_server(servicer, server):
                     request_deserializer=v1_dot_aggregate__pb2.AggregateRequest.FromString,
                     response_serializer=v1_dot_aggregate__pb2.AggregateReply.SerializeToString,
             ),
-            'BatchSend': grpc.unary_unary_rpc_method_handler(
-                    servicer.BatchSend,
-                    request_deserializer=v1_dot_batch__pb2.BatchSendRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchSendReply.SerializeToString,
-            ),
-            'BatchStream': grpc.unary_stream_rpc_method_handler(
+            'BatchStream': grpc.stream_stream_rpc_method_handler(
                     servicer.BatchStream,
                     request_deserializer=v1_dot_batch__pb2.BatchStreamRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchStreamMessage.SerializeToString,
+                    response_serializer=v1_dot_batch__pb2.BatchStreamReply.SerializeToString,
             ),
     }
     generic_handler = grpc.method_handlers_generic_handler(
@@ -352,7 +336,7 @@ def Aggregate(request,
             _registered_method=True)
 
     @staticmethod
-    def BatchSend(request,
+    def BatchStream(request_iterator,
             target,
             options=(),
             channel_credentials=None,
@@ -362,39 +346,12 @@ def BatchSend(request,
             wait_for_ready=None,
             timeout=None,
             metadata=None):
-        return grpc.experimental.unary_unary(
-            request,
-            target,
-            '/weaviate.v1.Weaviate/BatchSend',
-            v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchSendReply.FromString,
-            options,
-            channel_credentials,
-            insecure,
-            call_credentials,
-            compression,
-            wait_for_ready,
-            timeout,
-            metadata,
-            _registered_method=True)
-
-    @staticmethod
-    def BatchStream(request,
-            target,
-            options=(),
-            channel_credentials=None,
-            call_credentials=None,
-            insecure=False,
-            compression=None,
-            wait_for_ready=None,
-            timeout=None,
-            metadata=None):
-        return grpc.experimental.unary_stream(
-            request,
+        return grpc.experimental.stream_stream(
+            request_iterator,
             target,
             '/weaviate.v1.Weaviate/BatchStream',
             v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchStreamMessage.FromString,
+            v1_dot_batch__pb2.BatchStreamReply.FromString,
             options,
             channel_credentials,
             insecure,
diff --git a/weaviate/proto/v1/v6300/v1/batch_pb2.py b/weaviate/proto/v1/v6300/v1/batch_pb2.py
index d45d45f18..f7434e1d3 100644
--- a/weaviate/proto/v1/v6300/v1/batch_pb2.py
+++ b/weaviate/proto/v1/v6300/v1/batch_pb2.py
@@ -26,7 +26,7 @@
 from weaviate.proto.v1.v6300.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xd6\x02\n\x10\x42\x61tchSendRequest\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x38\n\x07objects\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchSendRequest.ObjectsH\x00\x12>\n\nreferences\x18\x03 \x01(\x0b\x32(.weaviate.v1.BatchSendRequest.ReferencesH\x00\x12\x32\n\x04stop\x18\x04 \x01(\x0b\x32\".weaviate.v1.BatchSendRequest.StopH\x00\x1a\x06\n\x04Stop\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"B\n\x0e\x42\x61tchSendReply\x12\x17\n\x0fnext_batch_size\x18\x01 \x01(\x05\x12\x17\n\x0f\x62\x61\x63koff_seconds\x18\x02 \x01(\x02\"\xc7\x01\n\x12\x42\x61tchStreamRequest\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x12\x19\n\x0cobject_index\x18\x02 \x01(\x05H\x01\x88\x01\x01\x12\x1c\n\x0freference_index\x18\x03 \x01(\x05H\x02\x88\x01\x01\x42\x14\n\x12_consistency_levelB\x0f\n\r_object_indexB\x12\n\x10_reference_index\"\xf0\x03\n\x12\x42\x61tchStreamMessage\x12\x11\n\tstream_id\x18\x01 \x01(\t\x12\x36\n\x05\x65rror\x18\x02 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.ErrorH\x00\x12\x36\n\x05start\x18\x03 \x01(\x0b\x32%.weaviate.v1.BatchStreamMessage.StartH\x00\x12\x34\n\x04stop\x18\x04 \x01(\x0b\x32$.weaviate.v1.BatchStreamMessage.StopH\x00\x12<\n\x08shutdown\x18\x05 \x01(\x0b\x32(.weaviate.v1.BatchStreamMessage.ShutdownH\x00\x12\x45\n\rshutting_down\x18\x06 \x01(\x0b\x32,.weaviate.v1.BatchStreamMessage.ShuttingDownH\x00\x1a\x07\n\x05Start\x1a\x06\n\x04Stop\x1a\n\n\x08Shutdown\x1a\x0e\n\x0cShuttingDown\x1a\x64\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\r\n\x05index\x18\x02 \x01(\x05\x12\x14\n\x0cis_retriable\x18\x03 \x01(\x08\x12\x11\n\tis_object\x18\x04 \x01(\x08\x12\x14\n\x0cis_reference\x18\x05 \x01(\x08\x42\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x0ev1/batch.proto\x12\x0bweaviate.v1\x1a\x1cgoogle/protobuf/struct.proto\x1a\rv1/base.proto\"\x95\x01\n\x13\x42\x61tchObjectsRequest\x12)\n\x07objects\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\x9e\x01\n\x16\x42\x61tchReferencesRequest\x12/\n\nreferences\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReference\x12=\n\x11\x63onsistency_level\x18\x02 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\"\xa6\x04\n\x12\x42\x61tchStreamRequest\x12\x36\n\x05start\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamRequest.StartH\x00\x12\x34\n\x04\x64\x61ta\x18\x02 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.DataH\x00\x12\x34\n\x04stop\x18\x03 \x01(\x0b\x32$.weaviate.v1.BatchStreamRequest.StopH\x00\x1a\\\n\x05Start\x12=\n\x11\x63onsistency_level\x18\x01 \x01(\x0e\x32\x1d.weaviate.v1.ConsistencyLevelH\x00\x88\x01\x01\x42\x14\n\x12_consistency_level\x1a\x06\n\x04Stop\x1a\xfa\x01\n\x04\x44\x61ta\x12=\n\x07objects\x18\x01 \x01(\x0b\x32,.weaviate.v1.BatchStreamRequest.Data.Objects\x12\x43\n\nreferences\x18\x02 \x01(\x0b\x32/.weaviate.v1.BatchStreamRequest.Data.References\x1a\x33\n\x07Objects\x12(\n\x06values\x18\x01 \x03(\x0b\x32\x18.weaviate.v1.BatchObject\x1a\x39\n\nReferences\x12+\n\x06values\x18\x01 \x03(\x0b\x32\x1b.weaviate.v1.BatchReferenceB\t\n\x07message\"\x98\x05\n\x10\x42\x61tchStreamReply\x12\x38\n\x07results\x18\x01 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.ResultsH\x00\x12\x43\n\rshutting_down\x18\x02 \x01(\x0b\x32*.weaviate.v1.BatchStreamReply.ShuttingDownH\x00\x12:\n\x08shutdown\x18\x03 \x01(\x0b\x32&.weaviate.v1.BatchStreamReply.ShutdownH\x00\x12\x38\n\x07started\x18\x04 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.StartedH\x00\x12\x38\n\x07\x62\x61\x63koff\x18\x05 \x01(\x0b\x32%.weaviate.v1.BatchStreamReply.BackoffH\x00\x1a\t\n\x07Started\x1a\x0e\n\x0cShuttingDown\x1a\n\n\x08Shutdown\x1a\x1d\n\x07\x42\x61\x63koff\x12\x12\n\nbatch_size\x18\x01 \x01(\x05\x1a\x83\x02\n\x07Results\x12;\n\x06\x65rrors\x18\x01 \x03(\x0b\x32+.weaviate.v1.BatchStreamReply.Results.Error\x12@\n\tsuccesses\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchStreamReply.Results.Success\x1a\x42\n\x05\x45rror\x12\r\n\x05\x65rror\x18\x01 \x01(\t\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tail\x1a\x35\n\x07Success\x12\x0e\n\x04uuid\x18\x02 \x01(\tH\x00\x12\x10\n\x06\x62\x65\x61\x63on\x18\x03 \x01(\tH\x00\x42\x08\n\x06\x64\x65tailB\t\n\x07message\"\xde\x07\n\x0b\x42\x61tchObject\x12\x0c\n\x04uuid\x18\x01 \x01(\t\x12\x12\n\x06vector\x18\x02 \x03(\x02\x42\x02\x18\x01\x12\x37\n\nproperties\x18\x03 \x01(\x0b\x32#.weaviate.v1.BatchObject.Properties\x12\x12\n\ncollection\x18\x04 \x01(\t\x12\x0e\n\x06tenant\x18\x05 \x01(\t\x12\x14\n\x0cvector_bytes\x18\x06 \x01(\x0c\x12%\n\x07vectors\x18\x17 \x03(\x0b\x32\x14.weaviate.v1.Vectors\x1a\x84\x05\n\nProperties\x12\x33\n\x12non_ref_properties\x18\x01 \x01(\x0b\x32\x17.google.protobuf.Struct\x12N\n\x17single_target_ref_props\x18\x02 \x03(\x0b\x32-.weaviate.v1.BatchObject.SingleTargetRefProps\x12L\n\x16multi_target_ref_props\x18\x03 \x03(\x0b\x32,.weaviate.v1.BatchObject.MultiTargetRefProps\x12\x43\n\x17number_array_properties\x18\x04 \x03(\x0b\x32\".weaviate.v1.NumberArrayProperties\x12=\n\x14int_array_properties\x18\x05 \x03(\x0b\x32\x1f.weaviate.v1.IntArrayProperties\x12?\n\x15text_array_properties\x18\x06 \x03(\x0b\x32 .weaviate.v1.TextArrayProperties\x12\x45\n\x18\x62oolean_array_properties\x18\x07 \x03(\x0b\x32#.weaviate.v1.BooleanArrayProperties\x12\x38\n\x11object_properties\x18\x08 \x03(\x0b\x32\x1d.weaviate.v1.ObjectProperties\x12\x43\n\x17object_array_properties\x18\t \x03(\x0b\x32\".weaviate.v1.ObjectArrayProperties\x12\x18\n\x10\x65mpty_list_props\x18\n \x03(\t\x1a\x38\n\x14SingleTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x1aR\n\x13MultiTargetRefProps\x12\r\n\x05uuids\x18\x01 \x03(\t\x12\x11\n\tprop_name\x18\x02 \x01(\t\x12\x19\n\x11target_collection\x18\x03 \x01(\t\"\x99\x01\n\x0e\x42\x61tchReference\x12\x0c\n\x04name\x18\x01 \x01(\t\x12\x17\n\x0f\x66rom_collection\x18\x02 \x01(\t\x12\x11\n\tfrom_uuid\x18\x03 \x01(\t\x12\x1a\n\rto_collection\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x0f\n\x07to_uuid\x18\x05 \x01(\t\x12\x0e\n\x06tenant\x18\x06 \x01(\tB\x10\n\x0e_to_collection\"\x88\x01\n\x11\x42\x61tchObjectsReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12\x39\n\x06\x65rrors\x18\x02 \x03(\x0b\x32).weaviate.v1.BatchObjectsReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\t\"\x8e\x01\n\x14\x42\x61tchReferencesReply\x12\x0c\n\x04took\x18\x01 \x01(\x02\x12<\n\x06\x65rrors\x18\x02 \x03(\x0b\x32,.weaviate.v1.BatchReferencesReply.BatchError\x1a*\n\nBatchError\x12\r\n\x05index\x18\x01 \x01(\x05\x12\r\n\x05\x65rror\x18\x02 \x01(\tBo\n#io.weaviate.client.grpc.protocol.v1B\x12WeaviateProtoBatchZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -40,46 +40,50 @@
   _globals['_BATCHOBJECTSREQUEST']._serialized_end=226
   _globals['_BATCHREFERENCESREQUEST']._serialized_start=229
   _globals['_BATCHREFERENCESREQUEST']._serialized_end=387
-  _globals['_BATCHSENDREQUEST']._serialized_start=390
-  _globals['_BATCHSENDREQUEST']._serialized_end=732
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_start=603
-  _globals['_BATCHSENDREQUEST_STOP']._serialized_end=609
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_start=611
-  _globals['_BATCHSENDREQUEST_OBJECTS']._serialized_end=662
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_start=664
-  _globals['_BATCHSENDREQUEST_REFERENCES']._serialized_end=721
-  _globals['_BATCHSENDREPLY']._serialized_start=734
-  _globals['_BATCHSENDREPLY']._serialized_end=800
-  _globals['_BATCHSTREAMREQUEST']._serialized_start=803
-  _globals['_BATCHSTREAMREQUEST']._serialized_end=1002
-  _globals['_BATCHSTREAMMESSAGE']._serialized_start=1005
-  _globals['_BATCHSTREAMMESSAGE']._serialized_end=1501
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_start=1345
-  _globals['_BATCHSTREAMMESSAGE_START']._serialized_end=1352
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_start=603
-  _globals['_BATCHSTREAMMESSAGE_STOP']._serialized_end=609
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_start=1362
-  _globals['_BATCHSTREAMMESSAGE_SHUTDOWN']._serialized_end=1372
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_start=1374
-  _globals['_BATCHSTREAMMESSAGE_SHUTTINGDOWN']._serialized_end=1388
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_start=1390
-  _globals['_BATCHSTREAMMESSAGE_ERROR']._serialized_end=1490
-  _globals['_BATCHOBJECT']._serialized_start=1504
-  _globals['_BATCHOBJECT']._serialized_end=2494
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1708
-  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2352
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2354
-  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2410
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2412
-  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2494
-  _globals['_BATCHREFERENCE']._serialized_start=2497
-  _globals['_BATCHREFERENCE']._serialized_end=2650
-  _globals['_BATCHOBJECTSREPLY']._serialized_start=2653
-  _globals['_BATCHOBJECTSREPLY']._serialized_end=2789
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2789
-  _globals['_BATCHREFERENCESREPLY']._serialized_start=2792
-  _globals['_BATCHREFERENCESREPLY']._serialized_end=2934
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2747
-  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2789
+  _globals['_BATCHSTREAMREQUEST']._serialized_start=390
+  _globals['_BATCHSTREAMREQUEST']._serialized_end=940
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_start=576
+  _globals['_BATCHSTREAMREQUEST_START']._serialized_end=668
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_start=670
+  _globals['_BATCHSTREAMREQUEST_STOP']._serialized_end=676
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_start=679
+  _globals['_BATCHSTREAMREQUEST_DATA']._serialized_end=929
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_start=819
+  _globals['_BATCHSTREAMREQUEST_DATA_OBJECTS']._serialized_end=870
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_start=872
+  _globals['_BATCHSTREAMREQUEST_DATA_REFERENCES']._serialized_end=929
+  _globals['_BATCHSTREAMREPLY']._serialized_start=943
+  _globals['_BATCHSTREAMREPLY']._serialized_end=1607
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_start=1266
+  _globals['_BATCHSTREAMREPLY_STARTED']._serialized_end=1275
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_start=1277
+  _globals['_BATCHSTREAMREPLY_SHUTTINGDOWN']._serialized_end=1291
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_start=1293
+  _globals['_BATCHSTREAMREPLY_SHUTDOWN']._serialized_end=1303
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_start=1305
+  _globals['_BATCHSTREAMREPLY_BACKOFF']._serialized_end=1334
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_start=1337
+  _globals['_BATCHSTREAMREPLY_RESULTS']._serialized_end=1596
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_start=1475
+  _globals['_BATCHSTREAMREPLY_RESULTS_ERROR']._serialized_end=1541
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_start=1543
+  _globals['_BATCHSTREAMREPLY_RESULTS_SUCCESS']._serialized_end=1596
+  _globals['_BATCHOBJECT']._serialized_start=1610
+  _globals['_BATCHOBJECT']._serialized_end=2600
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_start=1814
+  _globals['_BATCHOBJECT_PROPERTIES']._serialized_end=2458
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_start=2460
+  _globals['_BATCHOBJECT_SINGLETARGETREFPROPS']._serialized_end=2516
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_start=2518
+  _globals['_BATCHOBJECT_MULTITARGETREFPROPS']._serialized_end=2600
+  _globals['_BATCHREFERENCE']._serialized_start=2603
+  _globals['_BATCHREFERENCE']._serialized_end=2756
+  _globals['_BATCHOBJECTSREPLY']._serialized_start=2759
+  _globals['_BATCHOBJECTSREPLY']._serialized_end=2895
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHOBJECTSREPLY_BATCHERROR']._serialized_end=2895
+  _globals['_BATCHREFERENCESREPLY']._serialized_start=2898
+  _globals['_BATCHREFERENCESREPLY']._serialized_end=3040
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_start=2853
+  _globals['_BATCHREFERENCESREPLY_BATCHERROR']._serialized_end=2895
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v6300/v1/batch_pb2.pyi b/weaviate/proto/v1/v6300/v1/batch_pb2.pyi
index 8f3de73bd..aa308b1d4 100644
--- a/weaviate/proto/v1/v6300/v1/batch_pb2.pyi
+++ b/weaviate/proto/v1/v6300/v1/batch_pb2.pyi
@@ -24,89 +24,91 @@ class BatchReferencesRequest(_message.Message):
     consistency_level: _base_pb2.ConsistencyLevel
     def __init__(self, references: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ..., consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
 
-class BatchSendRequest(_message.Message):
-    __slots__ = ("stream_id", "objects", "references", "stop")
+class BatchStreamRequest(_message.Message):
+    __slots__ = ("start", "data", "stop")
+    class Start(_message.Message):
+        __slots__ = ("consistency_level",)
+        CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
+        consistency_level: _base_pb2.ConsistencyLevel
+        def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ...) -> None: ...
     class Stop(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class Objects(_message.Message):
-        __slots__ = ("values",)
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchObject]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
-    class References(_message.Message):
-        __slots__ = ("values",)
-        VALUES_FIELD_NUMBER: _ClassVar[int]
-        values: _containers.RepeatedCompositeFieldContainer[BatchReference]
-        def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    OBJECTS_FIELD_NUMBER: _ClassVar[int]
-    REFERENCES_FIELD_NUMBER: _ClassVar[int]
+    class Data(_message.Message):
+        __slots__ = ("objects", "references")
+        class Objects(_message.Message):
+            __slots__ = ("values",)
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchObject]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchObject, _Mapping]]] = ...) -> None: ...
+        class References(_message.Message):
+            __slots__ = ("values",)
+            VALUES_FIELD_NUMBER: _ClassVar[int]
+            values: _containers.RepeatedCompositeFieldContainer[BatchReference]
+            def __init__(self, values: _Optional[_Iterable[_Union[BatchReference, _Mapping]]] = ...) -> None: ...
+        OBJECTS_FIELD_NUMBER: _ClassVar[int]
+        REFERENCES_FIELD_NUMBER: _ClassVar[int]
+        objects: BatchStreamRequest.Data.Objects
+        references: BatchStreamRequest.Data.References
+        def __init__(self, objects: _Optional[_Union[BatchStreamRequest.Data.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchStreamRequest.Data.References, _Mapping]] = ...) -> None: ...
+    START_FIELD_NUMBER: _ClassVar[int]
+    DATA_FIELD_NUMBER: _ClassVar[int]
     STOP_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    objects: BatchSendRequest.Objects
-    references: BatchSendRequest.References
-    stop: BatchSendRequest.Stop
-    def __init__(self, stream_id: _Optional[str] = ..., objects: _Optional[_Union[BatchSendRequest.Objects, _Mapping]] = ..., references: _Optional[_Union[BatchSendRequest.References, _Mapping]] = ..., stop: _Optional[_Union[BatchSendRequest.Stop, _Mapping]] = ...) -> None: ...
-
-class BatchSendReply(_message.Message):
-    __slots__ = ("next_batch_size", "backoff_seconds")
-    NEXT_BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
-    BACKOFF_SECONDS_FIELD_NUMBER: _ClassVar[int]
-    next_batch_size: int
-    backoff_seconds: float
-    def __init__(self, next_batch_size: _Optional[int] = ..., backoff_seconds: _Optional[float] = ...) -> None: ...
+    start: BatchStreamRequest.Start
+    data: BatchStreamRequest.Data
+    stop: BatchStreamRequest.Stop
+    def __init__(self, start: _Optional[_Union[BatchStreamRequest.Start, _Mapping]] = ..., data: _Optional[_Union[BatchStreamRequest.Data, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamRequest.Stop, _Mapping]] = ...) -> None: ...
 
-class BatchStreamRequest(_message.Message):
-    __slots__ = ("consistency_level", "object_index", "reference_index")
-    CONSISTENCY_LEVEL_FIELD_NUMBER: _ClassVar[int]
-    OBJECT_INDEX_FIELD_NUMBER: _ClassVar[int]
-    REFERENCE_INDEX_FIELD_NUMBER: _ClassVar[int]
-    consistency_level: _base_pb2.ConsistencyLevel
-    object_index: int
-    reference_index: int
-    def __init__(self, consistency_level: _Optional[_Union[_base_pb2.ConsistencyLevel, str]] = ..., object_index: _Optional[int] = ..., reference_index: _Optional[int] = ...) -> None: ...
-
-class BatchStreamMessage(_message.Message):
-    __slots__ = ("stream_id", "error", "start", "stop", "shutdown", "shutting_down")
-    class Start(_message.Message):
+class BatchStreamReply(_message.Message):
+    __slots__ = ("results", "shutting_down", "shutdown", "started", "backoff")
+    class Started(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class Stop(_message.Message):
+    class ShuttingDown(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
     class Shutdown(_message.Message):
         __slots__ = ()
         def __init__(self) -> None: ...
-    class ShuttingDown(_message.Message):
-        __slots__ = ()
-        def __init__(self) -> None: ...
-    class Error(_message.Message):
-        __slots__ = ("error", "index", "is_retriable", "is_object", "is_reference")
-        ERROR_FIELD_NUMBER: _ClassVar[int]
-        INDEX_FIELD_NUMBER: _ClassVar[int]
-        IS_RETRIABLE_FIELD_NUMBER: _ClassVar[int]
-        IS_OBJECT_FIELD_NUMBER: _ClassVar[int]
-        IS_REFERENCE_FIELD_NUMBER: _ClassVar[int]
-        error: str
-        index: int
-        is_retriable: bool
-        is_object: bool
-        is_reference: bool
-        def __init__(self, error: _Optional[str] = ..., index: _Optional[int] = ..., is_retriable: bool = ..., is_object: bool = ..., is_reference: bool = ...) -> None: ...
-    STREAM_ID_FIELD_NUMBER: _ClassVar[int]
-    ERROR_FIELD_NUMBER: _ClassVar[int]
-    START_FIELD_NUMBER: _ClassVar[int]
-    STOP_FIELD_NUMBER: _ClassVar[int]
-    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    class Backoff(_message.Message):
+        __slots__ = ("batch_size",)
+        BATCH_SIZE_FIELD_NUMBER: _ClassVar[int]
+        batch_size: int
+        def __init__(self, batch_size: _Optional[int] = ...) -> None: ...
+    class Results(_message.Message):
+        __slots__ = ("errors", "successes")
+        class Error(_message.Message):
+            __slots__ = ("error", "uuid", "beacon")
+            ERROR_FIELD_NUMBER: _ClassVar[int]
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            error: str
+            uuid: str
+            beacon: str
+            def __init__(self, error: _Optional[str] = ..., uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        class Success(_message.Message):
+            __slots__ = ("uuid", "beacon")
+            UUID_FIELD_NUMBER: _ClassVar[int]
+            BEACON_FIELD_NUMBER: _ClassVar[int]
+            uuid: str
+            beacon: str
+            def __init__(self, uuid: _Optional[str] = ..., beacon: _Optional[str] = ...) -> None: ...
+        ERRORS_FIELD_NUMBER: _ClassVar[int]
+        SUCCESSES_FIELD_NUMBER: _ClassVar[int]
+        errors: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Error]
+        successes: _containers.RepeatedCompositeFieldContainer[BatchStreamReply.Results.Success]
+        def __init__(self, errors: _Optional[_Iterable[_Union[BatchStreamReply.Results.Error, _Mapping]]] = ..., successes: _Optional[_Iterable[_Union[BatchStreamReply.Results.Success, _Mapping]]] = ...) -> None: ...
+    RESULTS_FIELD_NUMBER: _ClassVar[int]
     SHUTTING_DOWN_FIELD_NUMBER: _ClassVar[int]
-    stream_id: str
-    error: BatchStreamMessage.Error
-    start: BatchStreamMessage.Start
-    stop: BatchStreamMessage.Stop
-    shutdown: BatchStreamMessage.Shutdown
-    shutting_down: BatchStreamMessage.ShuttingDown
-    def __init__(self, stream_id: _Optional[str] = ..., error: _Optional[_Union[BatchStreamMessage.Error, _Mapping]] = ..., start: _Optional[_Union[BatchStreamMessage.Start, _Mapping]] = ..., stop: _Optional[_Union[BatchStreamMessage.Stop, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamMessage.Shutdown, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamMessage.ShuttingDown, _Mapping]] = ...) -> None: ...
+    SHUTDOWN_FIELD_NUMBER: _ClassVar[int]
+    STARTED_FIELD_NUMBER: _ClassVar[int]
+    BACKOFF_FIELD_NUMBER: _ClassVar[int]
+    results: BatchStreamReply.Results
+    shutting_down: BatchStreamReply.ShuttingDown
+    shutdown: BatchStreamReply.Shutdown
+    started: BatchStreamReply.Started
+    backoff: BatchStreamReply.Backoff
+    def __init__(self, results: _Optional[_Union[BatchStreamReply.Results, _Mapping]] = ..., shutting_down: _Optional[_Union[BatchStreamReply.ShuttingDown, _Mapping]] = ..., shutdown: _Optional[_Union[BatchStreamReply.Shutdown, _Mapping]] = ..., started: _Optional[_Union[BatchStreamReply.Started, _Mapping]] = ..., backoff: _Optional[_Union[BatchStreamReply.Backoff, _Mapping]] = ...) -> None: ...
 
 class BatchObject(_message.Message):
     __slots__ = ("uuid", "vector", "properties", "collection", "tenant", "vector_bytes", "vectors")
diff --git a/weaviate/proto/v1/v6300/v1/file_replication_pb2.py b/weaviate/proto/v1/v6300/v1/file_replication_pb2.py
index aee6086ed..bccc6c8d1 100644
--- a/weaviate/proto/v1/v6300/v1/file_replication_pb2.py
+++ b/weaviate/proto/v1/v6300/v1/file_replication_pb2.py
@@ -24,14 +24,14 @@
 
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x19v1/file_replication.proto\x12\x0bweaviate.v1\"Z\n\x18PauseFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x16\n\x0eschema_version\x18\x03 \x01(\x04\"C\n\x19PauseFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"C\n\x19ResumeFileActivityRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"D\n\x1aResumeFileActivityResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\":\n\x10ListFilesRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\"O\n\x11ListFilesResponse\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x12\n\nfile_names\x18\x03 \x03(\t\"S\n\x16GetFileMetadataRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\"f\n\x0c\x46ileMetadata\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x0c\n\x04size\x18\x04 \x01(\x03\x12\r\n\x05\x63rc32\x18\x05 \x01(\r\"~\n\x0eGetFileRequest\x12\x12\n\nindex_name\x18\x01 \x01(\t\x12\x12\n\nshard_name\x18\x02 \x01(\t\x12\x11\n\tfile_name\x18\x03 \x01(\t\x12\x31\n\x0b\x63ompression\x18\x04 \x01(\x0e\x32\x1c.weaviate.v1.CompressionType\"6\n\tFileChunk\x12\x0e\n\x06offset\x18\x01 \x01(\x03\x12\x0c\n\x04\x64\x61ta\x18\x02 \x01(\x0c\x12\x0b\n\x03\x65of\x18\x03 \x01(\x08*\x87\x01\n\x0f\x43ompressionType\x12 \n\x1c\x43OMPRESSION_TYPE_UNSPECIFIED\x10\x00\x12\x19\n\x15\x43OMPRESSION_TYPE_GZIP\x10\x01\x12\x19\n\x15\x43OMPRESSION_TYPE_ZLIB\x10\x02\x12\x1c\n\x18\x43OMPRESSION_TYPE_DEFLATE\x10\x03\x32\xca\x03\n\x16\x46ileReplicationService\x12\x62\n\x11PauseFileActivity\x12%.weaviate.v1.PauseFileActivityRequest\x1a&.weaviate.v1.PauseFileActivityResponse\x12\x65\n\x12ResumeFileActivity\x12&.weaviate.v1.ResumeFileActivityRequest\x1a\'.weaviate.v1.ResumeFileActivityResponse\x12J\n\tListFiles\x12\x1d.weaviate.v1.ListFilesRequest\x1a\x1e.weaviate.v1.ListFilesResponse\x12U\n\x0fGetFileMetadata\x12#.weaviate.v1.GetFileMetadataRequest\x1a\x19.weaviate.v1.FileMetadata(\x01\x30\x01\x12\x42\n\x07GetFile\x12\x1b.weaviate.v1.GetFileRequest\x1a\x16.weaviate.v1.FileChunk(\x01\x30\x01\x42y\n#io.weaviate.client.grpc.protocol.v1B\x1cWeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
 _builder.BuildTopDescriptorsAndMessages(DESCRIPTOR, 'v1.file_replication_pb2', _globals)
 if not _descriptor._USE_C_DESCRIPTORS:
   _globals['DESCRIPTOR']._loaded_options = None
-  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
+  _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\034WeaviateProtoFileReplicationZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_COMPRESSIONTYPE']._serialized_start=857
   _globals['_COMPRESSIONTYPE']._serialized_end=992
   _globals['_PAUSEFILEACTIVITYREQUEST']._serialized_start=42
diff --git a/weaviate/proto/v1/v6300/v1/generative_pb2.py b/weaviate/proto/v1/v6300/v1/generative_pb2.py
index 51914271c..411748a7f 100644
--- a/weaviate/proto/v1/v6300/v1/generative_pb2.py
+++ b/weaviate/proto/v1/v6300/v1/generative_pb2.py
@@ -25,7 +25,7 @@
 from weaviate.proto.v1.v6300.v1 import base_pb2 as v1_dot_base__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x84\x03\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperature\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x13v1/generative.proto\x12\x0bweaviate.v1\x1a\rv1/base.proto\"\xdd\x03\n\x10GenerativeSearch\x12\"\n\x16single_response_prompt\x18\x01 \x01(\tB\x02\x18\x01\x12!\n\x15grouped_response_task\x18\x02 \x01(\tB\x02\x18\x01\x12\x1e\n\x12grouped_properties\x18\x03 \x03(\tB\x02\x18\x01\x12\x34\n\x06single\x18\x04 \x01(\x0b\x32$.weaviate.v1.GenerativeSearch.Single\x12\x36\n\x07grouped\x18\x05 \x01(\x0b\x32%.weaviate.v1.GenerativeSearch.Grouped\x1aY\n\x06Single\x12\x0e\n\x06prompt\x18\x01 \x01(\t\x12\r\n\x05\x64\x65\x62ug\x18\x02 \x01(\x08\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x1a\x98\x01\n\x07Grouped\x12\x0c\n\x04task\x18\x01 \x01(\t\x12/\n\nproperties\x18\x02 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x00\x88\x01\x01\x12\x30\n\x07queries\x18\x03 \x03(\x0b\x32\x1f.weaviate.v1.GenerativeProvider\x12\r\n\x05\x64\x65\x62ug\x18\x04 \x01(\x08\x42\r\n\x0b_properties\"\xc0\x05\n\x12GenerativeProvider\x12\x17\n\x0freturn_metadata\x18\x01 \x01(\x08\x12\x35\n\tanthropic\x18\x02 \x01(\x0b\x32 .weaviate.v1.GenerativeAnthropicH\x00\x12\x33\n\x08\x61nyscale\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeAnyscaleH\x00\x12)\n\x03\x61ws\x18\x04 \x01(\x0b\x32\x1a.weaviate.v1.GenerativeAWSH\x00\x12/\n\x06\x63ohere\x18\x05 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeCohereH\x00\x12-\n\x05\x64ummy\x18\x06 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDummyH\x00\x12\x31\n\x07mistral\x18\x07 \x01(\x0b\x32\x1e.weaviate.v1.GenerativeMistralH\x00\x12/\n\x06ollama\x18\x08 \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOllamaH\x00\x12/\n\x06openai\x18\t \x01(\x0b\x32\x1d.weaviate.v1.GenerativeOpenAIH\x00\x12/\n\x06google\x18\n \x01(\x0b\x32\x1d.weaviate.v1.GenerativeGoogleH\x00\x12\x37\n\ndatabricks\x18\x0b \x01(\x0b\x32!.weaviate.v1.GenerativeDatabricksH\x00\x12\x37\n\nfriendliai\x18\x0c \x01(\x0b\x32!.weaviate.v1.GenerativeFriendliAIH\x00\x12/\n\x06nvidia\x18\r \x01(\x0b\x32\x1d.weaviate.v1.GenerativeNvidiaH\x00\x12)\n\x03xai\x18\x0e \x01(\x0b\x32\x1a.weaviate.v1.GenerativeXAIH\x00\x42\x06\n\x04kind\"\xb1\x03\n\x13GenerativeAnthropic\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x12+\n\x06images\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x80\x01\n\x12GenerativeAnyscale\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperature\"\xc5\x03\n\rGenerativeAWS\x12\x12\n\x05model\x18\x03 \x01(\tH\x00\x88\x01\x01\x12\x18\n\x0btemperature\x18\x08 \x01(\x01H\x01\x88\x01\x01\x12\x14\n\x07service\x18\t \x01(\tH\x02\x88\x01\x01\x12\x13\n\x06region\x18\n \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x65ndpoint\x18\x0b \x01(\tH\x04\x88\x01\x01\x12\x19\n\x0ctarget_model\x18\x0c \x01(\tH\x05\x88\x01\x01\x12\x1b\n\x0etarget_variant\x18\r \x01(\tH\x06\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x10 \x01(\x03H\t\x88\x01\x01\x42\x08\n\x06_modelB\x0e\n\x0c_temperatureB\n\n\x08_serviceB\t\n\x07_regionB\x0b\n\t_endpointB\x0f\n\r_target_modelB\x11\n\x0f_target_variantB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\r\n\x0b_max_tokens\"\x88\x04\n\x10GenerativeCohere\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x12\n\x05model\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x0e\n\x01k\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x0e\n\x01p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x18\n\x0btemperature\x18\t \x01(\x01H\x08\x88\x01\x01\x12+\n\x06images\x18\n \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\t\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0b \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\n\x88\x01\x01\x42\x0b\n\t_base_urlB\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_kB\x04\n\x02_pB\x13\n\x11_presence_penaltyB\x11\n\x0f_stop_sequencesB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x11\n\x0fGenerativeDummy\"\xc5\x01\n\x11GenerativeMistral\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x12\n\x05top_p\x18\x05 \x01(\x01H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\x8a\x02\n\x10GenerativeOllama\x12\x19\n\x0c\x61pi_endpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12+\n\x06images\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x12\x35\n\x10image_properties\x18\x05 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x04\x88\x01\x01\x42\x0f\n\r_api_endpointB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xe3\x08\n\x10GenerativeOpenAI\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x0e\n\x01n\x18\x04 \x01(\x03H\x03\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12)\n\x04stop\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x18\n\x0btemperature\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x12\n\x05top_p\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12\x15\n\x08\x62\x61se_url\x18\t \x01(\tH\x08\x88\x01\x01\x12\x18\n\x0b\x61pi_version\x18\n \x01(\tH\t\x88\x01\x01\x12\x1a\n\rresource_name\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x1a\n\rdeployment_id\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12\x15\n\x08is_azure\x18\r \x01(\x08H\x0c\x88\x01\x01\x12+\n\x06images\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0f \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0e\x88\x01\x01\x12L\n\x10reasoning_effort\x18\x10 \x01(\x0e\x32-.weaviate.v1.GenerativeOpenAI.ReasoningEffortH\x0f\x88\x01\x01\x12?\n\tverbosity\x18\x11 \x01(\x0e\x32\'.weaviate.v1.GenerativeOpenAI.VerbosityH\x10\x88\x01\x01\"\xa3\x01\n\x0fReasoningEffort\x12 \n\x1cREASONING_EFFORT_UNSPECIFIED\x10\x00\x12\x1c\n\x18REASONING_EFFORT_MINIMAL\x10\x01\x12\x18\n\x14REASONING_EFFORT_LOW\x10\x02\x12\x1b\n\x17REASONING_EFFORT_MEDIUM\x10\x03\x12\x19\n\x15REASONING_EFFORT_HIGH\x10\x04\"c\n\tVerbosity\x12\x19\n\x15VERBOSITY_UNSPECIFIED\x10\x00\x12\x11\n\rVERBOSITY_LOW\x10\x01\x12\x14\n\x10VERBOSITY_MEDIUM\x10\x02\x12\x12\n\x0eVERBOSITY_HIGH\x10\x03\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\x0b\n\t_base_urlB\x0e\n\x0c_api_versionB\x10\n\x0e_resource_nameB\x10\n\x0e_deployment_idB\x0b\n\t_is_azureB\t\n\x07_imagesB\x13\n\x11_image_propertiesB\x13\n\x11_reasoning_effortB\x0c\n\n_verbosity\"\x92\x05\n\x10GenerativeGoogle\x12\x1e\n\x11\x66requency_penalty\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x12\n\x05model\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x18\n\x0btemperature\x18\x05 \x01(\x01H\x04\x88\x01\x01\x12\x12\n\x05top_k\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x12\n\x05top_p\x18\x07 \x01(\x01H\x06\x88\x01\x01\x12\x33\n\x0estop_sequences\x18\x08 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x07\x88\x01\x01\x12\x19\n\x0c\x61pi_endpoint\x18\t \x01(\tH\x08\x88\x01\x01\x12\x17\n\nproject_id\x18\n \x01(\tH\t\x88\x01\x01\x12\x18\n\x0b\x65ndpoint_id\x18\x0b \x01(\tH\n\x88\x01\x01\x12\x13\n\x06region\x18\x0c \x01(\tH\x0b\x88\x01\x01\x12+\n\x06images\x18\r \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x0c\x88\x01\x01\x12\x35\n\x10image_properties\x18\x0e \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\r\x88\x01\x01\x42\x14\n\x12_frequency_penaltyB\r\n\x0b_max_tokensB\x08\n\x06_modelB\x13\n\x11_presence_penaltyB\x0e\n\x0c_temperatureB\x08\n\x06_top_kB\x08\n\x06_top_pB\x11\n\x0f_stop_sequencesB\x0f\n\r_api_endpointB\r\n\x0b_project_idB\x0e\n\x0c_endpoint_idB\t\n\x07_regionB\t\n\x07_imagesB\x13\n\x11_image_properties\"\xd0\x03\n\x14GenerativeDatabricks\x12\x15\n\x08\x65ndpoint\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x1e\n\x11\x66requency_penalty\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x16\n\tlog_probs\x18\x04 \x01(\x08H\x03\x88\x01\x01\x12\x1a\n\rtop_log_probs\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x06 \x01(\x03H\x05\x88\x01\x01\x12\x0e\n\x01n\x18\x07 \x01(\x03H\x06\x88\x01\x01\x12\x1d\n\x10presence_penalty\x18\x08 \x01(\x01H\x07\x88\x01\x01\x12)\n\x04stop\x18\t \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x08\x88\x01\x01\x12\x18\n\x0btemperature\x18\n \x01(\x01H\t\x88\x01\x01\x12\x12\n\x05top_p\x18\x0b \x01(\x01H\n\x88\x01\x01\x42\x0b\n\t_endpointB\x08\n\x06_modelB\x14\n\x12_frequency_penaltyB\x0c\n\n_log_probsB\x10\n\x0e_top_log_probsB\r\n\x0b_max_tokensB\x04\n\x02_nB\x13\n\x11_presence_penaltyB\x07\n\x05_stopB\x0e\n\x0c_temperatureB\x08\n\x06_top_p\"\xde\x01\n\x14GenerativeFriendliAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x12\x18\n\x0btemperature\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x0e\n\x01n\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12\x12\n\x05top_p\x18\x06 \x01(\x01H\x05\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\r\n\x0b_max_tokensB\x0e\n\x0c_temperatureB\x04\n\x02_nB\x08\n\x06_top_p\"\xc4\x01\n\x10GenerativeNvidia\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokens\"\xc5\x02\n\rGenerativeXAI\x12\x15\n\x08\x62\x61se_url\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x12\n\x05model\x18\x02 \x01(\tH\x01\x88\x01\x01\x12\x18\n\x0btemperature\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x12\n\x05top_p\x18\x04 \x01(\x01H\x03\x88\x01\x01\x12\x17\n\nmax_tokens\x18\x05 \x01(\x03H\x04\x88\x01\x01\x12+\n\x06images\x18\x06 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x05\x88\x01\x01\x12\x35\n\x10image_properties\x18\x07 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x06\x88\x01\x01\x42\x0b\n\t_base_urlB\x08\n\x06_modelB\x0e\n\x0c_temperatureB\x08\n\x06_top_pB\r\n\x0b_max_tokensB\t\n\x07_imagesB\x13\n\x11_image_properties\"\x92\x01\n\x1bGenerativeAnthropicMetadata\x12=\n\x05usage\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeAnthropicMetadata.Usage\x1a\x34\n\x05Usage\x12\x14\n\x0cinput_tokens\x18\x01 \x01(\x03\x12\x15\n\routput_tokens\x18\x02 \x01(\x03\"\x1c\n\x1aGenerativeAnyscaleMetadata\"\x17\n\x15GenerativeAWSMetadata\"\x9c\x06\n\x18GenerativeCohereMetadata\x12J\n\x0b\x61pi_version\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeCohereMetadata.ApiVersionH\x00\x88\x01\x01\x12L\n\x0c\x62illed_units\x18\x02 \x01(\x0b\x32\x31.weaviate.v1.GenerativeCohereMetadata.BilledUnitsH\x01\x88\x01\x01\x12\x41\n\x06tokens\x18\x03 \x01(\x0b\x32,.weaviate.v1.GenerativeCohereMetadata.TokensH\x02\x88\x01\x01\x12-\n\x08warnings\x18\x04 \x01(\x0b\x32\x16.weaviate.v1.TextArrayH\x03\x88\x01\x01\x1a\x8e\x01\n\nApiVersion\x12\x14\n\x07version\x18\x01 \x01(\tH\x00\x88\x01\x01\x12\x1a\n\ris_deprecated\x18\x02 \x01(\x08H\x01\x88\x01\x01\x12\x1c\n\x0fis_experimental\x18\x03 \x01(\x08H\x02\x88\x01\x01\x42\n\n\x08_versionB\x10\n\x0e_is_deprecatedB\x12\n\x10_is_experimental\x1a\xc5\x01\n\x0b\x42illedUnits\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x12\x19\n\x0csearch_units\x18\x03 \x01(\x01H\x02\x88\x01\x01\x12\x1c\n\x0f\x63lassifications\x18\x04 \x01(\x01H\x03\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0f\n\r_search_unitsB\x12\n\x10_classifications\x1a\x62\n\x06Tokens\x12\x19\n\x0cinput_tokens\x18\x01 \x01(\x01H\x00\x88\x01\x01\x12\x1a\n\routput_tokens\x18\x02 \x01(\x01H\x01\x88\x01\x01\x42\x0f\n\r_input_tokensB\x10\n\x0e_output_tokensB\x0e\n\x0c_api_versionB\x0f\n\r_billed_unitsB\t\n\x07_tokensB\x0b\n\t_warnings\"\x19\n\x17GenerativeDummyMetadata\"\x81\x02\n\x19GenerativeMistralMetadata\x12@\n\x05usage\x18\x01 \x01(\x0b\x32,.weaviate.v1.GenerativeMistralMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x1a\n\x18GenerativeOllamaMetadata\"\xff\x01\n\x18GenerativeOpenAIMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeOpenAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xe8\x06\n\x18GenerativeGoogleMetadata\x12\x45\n\x08metadata\x18\x01 \x01(\x0b\x32..weaviate.v1.GenerativeGoogleMetadata.MetadataH\x00\x88\x01\x01\x12P\n\x0eusage_metadata\x18\x02 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.UsageMetadataH\x01\x88\x01\x01\x1a~\n\nTokenCount\x12&\n\x19total_billable_characters\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x42\x1c\n\x1a_total_billable_charactersB\x0f\n\r_total_tokens\x1a\xe1\x01\n\rTokenMetadata\x12P\n\x11input_token_count\x18\x01 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x00\x88\x01\x01\x12Q\n\x12output_token_count\x18\x02 \x01(\x0b\x32\x30.weaviate.v1.GenerativeGoogleMetadata.TokenCountH\x01\x88\x01\x01\x42\x14\n\x12_input_token_countB\x15\n\x13_output_token_count\x1ao\n\x08Metadata\x12P\n\x0etoken_metadata\x18\x01 \x01(\x0b\x32\x33.weaviate.v1.GenerativeGoogleMetadata.TokenMetadataH\x00\x88\x01\x01\x42\x11\n\x0f_token_metadata\x1a\xbd\x01\n\rUsageMetadata\x12\x1f\n\x12prompt_token_count\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12#\n\x16\x63\x61ndidates_token_count\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x1e\n\x11total_token_count\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x15\n\x13_prompt_token_countB\x19\n\x17_candidates_token_countB\x14\n\x12_total_token_countB\x0b\n\t_metadataB\x11\n\x0f_usage_metadata\"\x87\x02\n\x1cGenerativeDatabricksMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeDatabricksMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x87\x02\n\x1cGenerativeFriendliAIMetadata\x12\x43\n\x05usage\x18\x01 \x01(\x0b\x32/.weaviate.v1.GenerativeFriendliAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xff\x01\n\x18GenerativeNvidiaMetadata\x12?\n\x05usage\x18\x01 \x01(\x0b\x32+.weaviate.v1.GenerativeNvidiaMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\xf9\x01\n\x15GenerativeXAIMetadata\x12<\n\x05usage\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeXAIMetadata.UsageH\x00\x88\x01\x01\x1a\x97\x01\n\x05Usage\x12\x1a\n\rprompt_tokens\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x1e\n\x11\x63ompletion_tokens\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x19\n\x0ctotal_tokens\x18\x03 \x01(\x03H\x02\x88\x01\x01\x42\x10\n\x0e_prompt_tokensB\x14\n\x12_completion_tokensB\x0f\n\r_total_tokensB\x08\n\x06_usage\"\x8f\x06\n\x12GenerativeMetadata\x12=\n\tanthropic\x18\x01 \x01(\x0b\x32(.weaviate.v1.GenerativeAnthropicMetadataH\x00\x12;\n\x08\x61nyscale\x18\x02 \x01(\x0b\x32\'.weaviate.v1.GenerativeAnyscaleMetadataH\x00\x12\x31\n\x03\x61ws\x18\x03 \x01(\x0b\x32\".weaviate.v1.GenerativeAWSMetadataH\x00\x12\x37\n\x06\x63ohere\x18\x04 \x01(\x0b\x32%.weaviate.v1.GenerativeCohereMetadataH\x00\x12\x35\n\x05\x64ummy\x18\x05 \x01(\x0b\x32$.weaviate.v1.GenerativeDummyMetadataH\x00\x12\x39\n\x07mistral\x18\x06 \x01(\x0b\x32&.weaviate.v1.GenerativeMistralMetadataH\x00\x12\x37\n\x06ollama\x18\x07 \x01(\x0b\x32%.weaviate.v1.GenerativeOllamaMetadataH\x00\x12\x37\n\x06openai\x18\x08 \x01(\x0b\x32%.weaviate.v1.GenerativeOpenAIMetadataH\x00\x12\x37\n\x06google\x18\t \x01(\x0b\x32%.weaviate.v1.GenerativeGoogleMetadataH\x00\x12?\n\ndatabricks\x18\n \x01(\x0b\x32).weaviate.v1.GenerativeDatabricksMetadataH\x00\x12?\n\nfriendliai\x18\x0b \x01(\x0b\x32).weaviate.v1.GenerativeFriendliAIMetadataH\x00\x12\x37\n\x06nvidia\x18\x0c \x01(\x0b\x32%.weaviate.v1.GenerativeNvidiaMetadataH\x00\x12\x31\n\x03xai\x18\r \x01(\x0b\x32\".weaviate.v1.GenerativeXAIMetadataH\x00\x42\x06\n\x04kind\"\xa2\x01\n\x0fGenerativeReply\x12\x0e\n\x06result\x18\x01 \x01(\t\x12\x30\n\x05\x64\x65\x62ug\x18\x02 \x01(\x0b\x32\x1c.weaviate.v1.GenerativeDebugH\x00\x88\x01\x01\x12\x36\n\x08metadata\x18\x03 \x01(\x0b\x32\x1f.weaviate.v1.GenerativeMetadataH\x01\x88\x01\x01\x42\x08\n\x06_debugB\x0b\n\t_metadata\"@\n\x10GenerativeResult\x12,\n\x06values\x18\x01 \x03(\x0b\x32\x1c.weaviate.v1.GenerativeReply\";\n\x0fGenerativeDebug\x12\x18\n\x0b\x66ull_prompt\x18\x01 \x01(\tH\x00\x88\x01\x01\x42\x0e\n\x0c_full_promptBt\n#io.weaviate.client.grpc.protocol.v1B\x17WeaviateProtoGenerativeZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -54,89 +54,89 @@
   _globals['_GENERATIVEAWS']._serialized_start=1806
   _globals['_GENERATIVEAWS']._serialized_end=2259
   _globals['_GENERATIVECOHERE']._serialized_start=2262
-  _globals['_GENERATIVECOHERE']._serialized_end=2650
-  _globals['_GENERATIVEDUMMY']._serialized_start=2652
-  _globals['_GENERATIVEDUMMY']._serialized_end=2669
-  _globals['_GENERATIVEMISTRAL']._serialized_start=2672
-  _globals['_GENERATIVEMISTRAL']._serialized_end=2869
-  _globals['_GENERATIVEOLLAMA']._serialized_start=2872
-  _globals['_GENERATIVEOLLAMA']._serialized_end=3138
-  _globals['_GENERATIVEOPENAI']._serialized_start=3141
-  _globals['_GENERATIVEOPENAI']._serialized_end=4264
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3746
-  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=3909
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=3911
-  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4010
-  _globals['_GENERATIVEGOOGLE']._serialized_start=4267
-  _globals['_GENERATIVEGOOGLE']._serialized_end=4925
-  _globals['_GENERATIVEDATABRICKS']._serialized_start=4928
-  _globals['_GENERATIVEDATABRICKS']._serialized_end=5392
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5395
-  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5617
-  _globals['_GENERATIVENVIDIA']._serialized_start=5620
-  _globals['_GENERATIVENVIDIA']._serialized_end=5816
-  _globals['_GENERATIVEXAI']._serialized_start=5819
-  _globals['_GENERATIVEXAI']._serialized_end=6144
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6147
-  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6293
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6241
-  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6293
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6295
-  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6323
-  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6325
-  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6348
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6351
-  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7147
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6648
-  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6790
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6793
-  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=6990
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=6992
-  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7090
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7149
-  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7174
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7177
-  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7434
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7436
-  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7462
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7465
-  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7720
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7723
-  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8595
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=7904
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8030
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8033
-  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8258
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8260
-  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8371
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8374
-  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8563
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8598
-  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8861
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8864
-  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9127
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9130
-  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9385
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9388
-  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9637
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7273
-  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7424
-  _globals['_GENERATIVEMETADATA']._serialized_start=9640
-  _globals['_GENERATIVEMETADATA']._serialized_end=10423
-  _globals['_GENERATIVEREPLY']._serialized_start=10426
-  _globals['_GENERATIVEREPLY']._serialized_end=10588
-  _globals['_GENERATIVERESULT']._serialized_start=10590
-  _globals['_GENERATIVERESULT']._serialized_end=10654
-  _globals['_GENERATIVEDEBUG']._serialized_start=10656
-  _globals['_GENERATIVEDEBUG']._serialized_end=10715
+  _globals['_GENERATIVECOHERE']._serialized_end=2782
+  _globals['_GENERATIVEDUMMY']._serialized_start=2784
+  _globals['_GENERATIVEDUMMY']._serialized_end=2801
+  _globals['_GENERATIVEMISTRAL']._serialized_start=2804
+  _globals['_GENERATIVEMISTRAL']._serialized_end=3001
+  _globals['_GENERATIVEOLLAMA']._serialized_start=3004
+  _globals['_GENERATIVEOLLAMA']._serialized_end=3270
+  _globals['_GENERATIVEOPENAI']._serialized_start=3273
+  _globals['_GENERATIVEOPENAI']._serialized_end=4396
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_start=3878
+  _globals['_GENERATIVEOPENAI_REASONINGEFFORT']._serialized_end=4041
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_start=4043
+  _globals['_GENERATIVEOPENAI_VERBOSITY']._serialized_end=4142
+  _globals['_GENERATIVEGOOGLE']._serialized_start=4399
+  _globals['_GENERATIVEGOOGLE']._serialized_end=5057
+  _globals['_GENERATIVEDATABRICKS']._serialized_start=5060
+  _globals['_GENERATIVEDATABRICKS']._serialized_end=5524
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_start=5527
+  _globals['_GENERATIVEFRIENDLIAI']._serialized_end=5749
+  _globals['_GENERATIVENVIDIA']._serialized_start=5752
+  _globals['_GENERATIVENVIDIA']._serialized_end=5948
+  _globals['_GENERATIVEXAI']._serialized_start=5951
+  _globals['_GENERATIVEXAI']._serialized_end=6276
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_start=6279
+  _globals['_GENERATIVEANTHROPICMETADATA']._serialized_end=6425
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_start=6373
+  _globals['_GENERATIVEANTHROPICMETADATA_USAGE']._serialized_end=6425
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_start=6427
+  _globals['_GENERATIVEANYSCALEMETADATA']._serialized_end=6455
+  _globals['_GENERATIVEAWSMETADATA']._serialized_start=6457
+  _globals['_GENERATIVEAWSMETADATA']._serialized_end=6480
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_start=6483
+  _globals['_GENERATIVECOHEREMETADATA']._serialized_end=7279
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_start=6780
+  _globals['_GENERATIVECOHEREMETADATA_APIVERSION']._serialized_end=6922
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_start=6925
+  _globals['_GENERATIVECOHEREMETADATA_BILLEDUNITS']._serialized_end=7122
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_start=7124
+  _globals['_GENERATIVECOHEREMETADATA_TOKENS']._serialized_end=7222
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_start=7281
+  _globals['_GENERATIVEDUMMYMETADATA']._serialized_end=7306
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_start=7309
+  _globals['_GENERATIVEMISTRALMETADATA']._serialized_end=7566
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEMISTRALMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_start=7568
+  _globals['_GENERATIVEOLLAMAMETADATA']._serialized_end=7594
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_start=7597
+  _globals['_GENERATIVEOPENAIMETADATA']._serialized_end=7852
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEOPENAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_start=7855
+  _globals['_GENERATIVEGOOGLEMETADATA']._serialized_end=8727
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_start=8036
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENCOUNT']._serialized_end=8162
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_start=8165
+  _globals['_GENERATIVEGOOGLEMETADATA_TOKENMETADATA']._serialized_end=8390
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_start=8392
+  _globals['_GENERATIVEGOOGLEMETADATA_METADATA']._serialized_end=8503
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_start=8506
+  _globals['_GENERATIVEGOOGLEMETADATA_USAGEMETADATA']._serialized_end=8695
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_start=8730
+  _globals['_GENERATIVEDATABRICKSMETADATA']._serialized_end=8993
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEDATABRICKSMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_start=8996
+  _globals['_GENERATIVEFRIENDLIAIMETADATA']._serialized_end=9259
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEFRIENDLIAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_start=9262
+  _globals['_GENERATIVENVIDIAMETADATA']._serialized_end=9517
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVENVIDIAMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEXAIMETADATA']._serialized_start=9520
+  _globals['_GENERATIVEXAIMETADATA']._serialized_end=9769
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_start=7405
+  _globals['_GENERATIVEXAIMETADATA_USAGE']._serialized_end=7556
+  _globals['_GENERATIVEMETADATA']._serialized_start=9772
+  _globals['_GENERATIVEMETADATA']._serialized_end=10555
+  _globals['_GENERATIVEREPLY']._serialized_start=10558
+  _globals['_GENERATIVEREPLY']._serialized_end=10720
+  _globals['_GENERATIVERESULT']._serialized_start=10722
+  _globals['_GENERATIVERESULT']._serialized_end=10786
+  _globals['_GENERATIVEDEBUG']._serialized_start=10788
+  _globals['_GENERATIVEDEBUG']._serialized_end=10847
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v6300/v1/generative_pb2.pyi b/weaviate/proto/v1/v6300/v1/generative_pb2.pyi
index 6f240d18d..9e9177127 100644
--- a/weaviate/proto/v1/v6300/v1/generative_pb2.pyi
+++ b/weaviate/proto/v1/v6300/v1/generative_pb2.pyi
@@ -131,7 +131,7 @@ class GenerativeAWS(_message.Message):
     def __init__(self, model: _Optional[str] = ..., temperature: _Optional[float] = ..., service: _Optional[str] = ..., region: _Optional[str] = ..., endpoint: _Optional[str] = ..., target_model: _Optional[str] = ..., target_variant: _Optional[str] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., max_tokens: _Optional[int] = ...) -> None: ...
 
 class GenerativeCohere(_message.Message):
-    __slots__ = ("base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature")
+    __slots__ = ("base_url", "frequency_penalty", "max_tokens", "model", "k", "p", "presence_penalty", "stop_sequences", "temperature", "images", "image_properties")
     BASE_URL_FIELD_NUMBER: _ClassVar[int]
     FREQUENCY_PENALTY_FIELD_NUMBER: _ClassVar[int]
     MAX_TOKENS_FIELD_NUMBER: _ClassVar[int]
@@ -141,6 +141,8 @@ class GenerativeCohere(_message.Message):
     PRESENCE_PENALTY_FIELD_NUMBER: _ClassVar[int]
     STOP_SEQUENCES_FIELD_NUMBER: _ClassVar[int]
     TEMPERATURE_FIELD_NUMBER: _ClassVar[int]
+    IMAGES_FIELD_NUMBER: _ClassVar[int]
+    IMAGE_PROPERTIES_FIELD_NUMBER: _ClassVar[int]
     base_url: str
     frequency_penalty: float
     max_tokens: int
@@ -150,7 +152,9 @@ class GenerativeCohere(_message.Message):
     presence_penalty: float
     stop_sequences: _base_pb2.TextArray
     temperature: float
-    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ...) -> None: ...
+    images: _base_pb2.TextArray
+    image_properties: _base_pb2.TextArray
+    def __init__(self, base_url: _Optional[str] = ..., frequency_penalty: _Optional[float] = ..., max_tokens: _Optional[int] = ..., model: _Optional[str] = ..., k: _Optional[int] = ..., p: _Optional[float] = ..., presence_penalty: _Optional[float] = ..., stop_sequences: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., temperature: _Optional[float] = ..., images: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ..., image_properties: _Optional[_Union[_base_pb2.TextArray, _Mapping]] = ...) -> None: ...
 
 class GenerativeDummy(_message.Message):
     __slots__ = ()
diff --git a/weaviate/proto/v1/v6300/v1/weaviate_pb2.py b/weaviate/proto/v1/v6300/v1/weaviate_pb2.py
index 95e9a7af6..d3e78d5d3 100644
--- a/weaviate/proto/v1/v6300/v1/weaviate_pb2.py
+++ b/weaviate/proto/v1/v6300/v1/weaviate_pb2.py
@@ -29,7 +29,7 @@
 from weaviate.proto.v1.v6300.v1 import tenants_pb2 as v1_dot_tenants__pb2
 
 
-DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\x87\x05\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12I\n\tBatchSend\x12\x1d.weaviate.v1.BatchSendRequest\x1a\x1b.weaviate.v1.BatchSendReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1f.weaviate.v1.BatchStreamMessage\"\x00\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(b'\n\x11v1/weaviate.proto\x12\x0bweaviate.v1\x1a\x12v1/aggregate.proto\x1a\x0ev1/batch.proto\x1a\x15v1/batch_delete.proto\x1a\x13v1/search_get.proto\x1a\x10v1/tenants.proto2\xbc\x04\n\x08Weaviate\x12@\n\x06Search\x12\x1a.weaviate.v1.SearchRequest\x1a\x18.weaviate.v1.SearchReply\"\x00\x12R\n\x0c\x42\x61tchObjects\x12 .weaviate.v1.BatchObjectsRequest\x1a\x1e.weaviate.v1.BatchObjectsReply\"\x00\x12[\n\x0f\x42\x61tchReferences\x12#.weaviate.v1.BatchReferencesRequest\x1a!.weaviate.v1.BatchReferencesReply\"\x00\x12O\n\x0b\x42\x61tchDelete\x12\x1f.weaviate.v1.BatchDeleteRequest\x1a\x1d.weaviate.v1.BatchDeleteReply\"\x00\x12L\n\nTenantsGet\x12\x1e.weaviate.v1.TenantsGetRequest\x1a\x1c.weaviate.v1.TenantsGetReply\"\x00\x12I\n\tAggregate\x12\x1d.weaviate.v1.AggregateRequest\x1a\x1b.weaviate.v1.AggregateReply\"\x00\x12S\n\x0b\x42\x61tchStream\x12\x1f.weaviate.v1.BatchStreamRequest\x1a\x1d.weaviate.v1.BatchStreamReply\"\x00(\x01\x30\x01\x42j\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocolb\x06proto3')
 
 _globals = globals()
 _builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, _globals)
@@ -38,5 +38,5 @@
   _globals['DESCRIPTOR']._loaded_options = None
   _globals['DESCRIPTOR']._serialized_options = b'\n#io.weaviate.client.grpc.protocol.v1B\rWeaviateProtoZ4github.com/weaviate/weaviate/grpc/generated;protocol'
   _globals['_WEAVIATE']._serialized_start=133
-  _globals['_WEAVIATE']._serialized_end=780
+  _globals['_WEAVIATE']._serialized_end=705
 # @@protoc_insertion_point(module_scope)
diff --git a/weaviate/proto/v1/v6300/v1/weaviate_pb2_grpc.py b/weaviate/proto/v1/v6300/v1/weaviate_pb2_grpc.py
index a1942d9e0..efa58064c 100644
--- a/weaviate/proto/v1/v6300/v1/weaviate_pb2_grpc.py
+++ b/weaviate/proto/v1/v6300/v1/weaviate_pb2_grpc.py
@@ -68,15 +68,10 @@ def __init__(self, channel):
                 request_serializer=v1_dot_aggregate__pb2.AggregateRequest.SerializeToString,
                 response_deserializer=v1_dot_aggregate__pb2.AggregateReply.FromString,
                 _registered_method=True)
-        self.BatchSend = channel.unary_unary(
-                '/weaviate.v1.Weaviate/BatchSend',
-                request_serializer=v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchSendReply.FromString,
-                _registered_method=True)
-        self.BatchStream = channel.unary_stream(
+        self.BatchStream = channel.stream_stream(
                 '/weaviate.v1.Weaviate/BatchStream',
                 request_serializer=v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-                response_deserializer=v1_dot_batch__pb2.BatchStreamMessage.FromString,
+                response_deserializer=v1_dot_batch__pb2.BatchStreamReply.FromString,
                 _registered_method=True)
 
 
@@ -119,13 +114,7 @@ def Aggregate(self, request, context):
         context.set_details('Method not implemented!')
         raise NotImplementedError('Method not implemented!')
 
-    def BatchSend(self, request, context):
-        """Missing associated documentation comment in .proto file."""
-        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
-        context.set_details('Method not implemented!')
-        raise NotImplementedError('Method not implemented!')
-
-    def BatchStream(self, request, context):
+    def BatchStream(self, request_iterator, context):
         """Missing associated documentation comment in .proto file."""
         context.set_code(grpc.StatusCode.UNIMPLEMENTED)
         context.set_details('Method not implemented!')
@@ -164,15 +153,10 @@ def add_WeaviateServicer_to_server(servicer, server):
                     request_deserializer=v1_dot_aggregate__pb2.AggregateRequest.FromString,
                     response_serializer=v1_dot_aggregate__pb2.AggregateReply.SerializeToString,
             ),
-            'BatchSend': grpc.unary_unary_rpc_method_handler(
-                    servicer.BatchSend,
-                    request_deserializer=v1_dot_batch__pb2.BatchSendRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchSendReply.SerializeToString,
-            ),
-            'BatchStream': grpc.unary_stream_rpc_method_handler(
+            'BatchStream': grpc.stream_stream_rpc_method_handler(
                     servicer.BatchStream,
                     request_deserializer=v1_dot_batch__pb2.BatchStreamRequest.FromString,
-                    response_serializer=v1_dot_batch__pb2.BatchStreamMessage.SerializeToString,
+                    response_serializer=v1_dot_batch__pb2.BatchStreamReply.SerializeToString,
             ),
     }
     generic_handler = grpc.method_handlers_generic_handler(
@@ -348,7 +332,7 @@ def Aggregate(request,
             _registered_method=True)
 
     @staticmethod
-    def BatchSend(request,
+    def BatchStream(request_iterator,
             target,
             options=(),
             channel_credentials=None,
@@ -358,39 +342,12 @@ def BatchSend(request,
             wait_for_ready=None,
             timeout=None,
             metadata=None):
-        return grpc.experimental.unary_unary(
-            request,
-            target,
-            '/weaviate.v1.Weaviate/BatchSend',
-            v1_dot_batch__pb2.BatchSendRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchSendReply.FromString,
-            options,
-            channel_credentials,
-            insecure,
-            call_credentials,
-            compression,
-            wait_for_ready,
-            timeout,
-            metadata,
-            _registered_method=True)
-
-    @staticmethod
-    def BatchStream(request,
-            target,
-            options=(),
-            channel_credentials=None,
-            call_credentials=None,
-            insecure=False,
-            compression=None,
-            wait_for_ready=None,
-            timeout=None,
-            metadata=None):
-        return grpc.experimental.unary_stream(
-            request,
+        return grpc.experimental.stream_stream(
+            request_iterator,
             target,
             '/weaviate.v1.Weaviate/BatchStream',
             v1_dot_batch__pb2.BatchStreamRequest.SerializeToString,
-            v1_dot_batch__pb2.BatchStreamMessage.FromString,
+            v1_dot_batch__pb2.BatchStreamReply.FromString,
             options,
             channel_credentials,
             insecure,

From 219979006d44a1e585f00309a1cbb67478be6b23 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Tue, 4 Nov 2025 16:40:11 +0000
Subject: [PATCH 11/21] Ensure created backup in test finishes before starting
 new test

---
 integration/test_backup_v4.py | 12 ++++++++++++
 1 file changed, 12 insertions(+)

diff --git a/integration/test_backup_v4.py b/integration/test_backup_v4.py
index 96965889c..d3930dae8 100644
--- a/integration/test_backup_v4.py
+++ b/integration/test_backup_v4.py
@@ -625,6 +625,18 @@ def test_list_backup_ascending_order(client: weaviate.WeaviateClient, request: S
     resp = client.backup.create(backup_id=backup_id, backend=BACKEND)
     assert resp.status == BackupStatus.STARTED
 
+    while True:
+        create_status = client.backup.get_create_status(backup_id, BACKEND)
+        assert create_status.status in [
+            BackupStatus.SUCCESS,
+            BackupStatus.TRANSFERRED,
+            BackupStatus.TRANSFERRING,
+            BackupStatus.STARTED,
+        ]
+        if create_status.status == BackupStatus.SUCCESS:
+            break
+        time.sleep(0.1)
+
     backups = client.backup.list_backups(backend=BACKEND, sort_by_starting_time_asc=True)
     assert backup_id.lower() in [b.backup_id.lower() for b in backups]
 

From dfa3cd30c694ab7f6305f1c92248fb12082fd858 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Fri, 7 Nov 2025 14:57:47 +0000
Subject: [PATCH 12/21] Use `grpc.aio` and `asyncio.Task` to provide
 experimental ssb to async client

---
 integration/test_batch_v4.py                |  98 ++-
 weaviate/client.py                          |   3 +-
 weaviate/client.pyi                         |   3 +-
 weaviate/collections/batch/async_.py        | 482 ++++++++++++++
 weaviate/collections/batch/base.py          | 666 ++++----------------
 weaviate/collections/batch/batch_wrapper.py | 280 +++++++-
 weaviate/collections/batch/client.py        |  61 +-
 weaviate/collections/batch/collection.py    |  14 +-
 weaviate/collections/batch/grpc_batch.py    |  17 +-
 weaviate/collections/batch/sync.py          | 557 ++++++++++++++++
 weaviate/collections/collection/sync.py     |   8 +-
 weaviate/connect/v4.py                      |  53 +-
 12 files changed, 1655 insertions(+), 587 deletions(-)
 create mode 100644 weaviate/collections/batch/async_.py
 create mode 100644 weaviate/collections/batch/sync.py

diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index 4a55b0131..7788ef03d 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -1,9 +1,11 @@
+import asyncio
 import concurrent.futures
 import uuid
 from dataclasses import dataclass
 from typing import Callable, Generator, List, Optional, Protocol, Tuple
 
 import pytest
+import pytest_asyncio
 from _pytest.fixtures import SubRequest
 
 import weaviate
@@ -119,6 +121,53 @@ def _factory(
             client_fixture.close()
 
 
+class AsyncClientFactory(Protocol):
+    """Typing for fixture."""
+
+    async def __call__(
+        self, name: str = "", ports: Tuple[int, int] = (8080, 50051), multi_tenant: bool = False
+    ) -> Tuple[weaviate.WeaviateAsyncClient, str]:
+        """Typing for fixture."""
+        ...
+
+
+@pytest_asyncio.fixture
+async def async_client_factory(request: SubRequest):
+    name_fixtures: List[str] = []
+    client_fixture: Optional[weaviate.WeaviateAsyncClient] = None
+
+    async def _factory(
+        name: str = "", ports: Tuple[int, int] = (8080, 50051), multi_tenant: bool = False
+    ):
+        nonlocal client_fixture, name_fixtures  # noqa: F824
+        name_fixture = _sanitize_collection_name(request.node.name) + name
+        name_fixtures.append(name_fixture)
+        if client_fixture is None:
+            client_fixture = weaviate.use_async_with_local(grpc_port=ports[1], port=ports[0])
+            await client_fixture.connect()
+
+        if await client_fixture.collections.exists(name_fixture):
+            await client_fixture.collections.delete(name_fixture)
+
+        await client_fixture.collections.create(
+            name=name_fixture,
+            properties=[
+                Property(name="name", data_type=DataType.TEXT),
+                Property(name="age", data_type=DataType.INT),
+            ],
+            references=[ReferenceProperty(name="test", target_collection=name_fixture)],
+            multi_tenancy_config=Configure.multi_tenancy(multi_tenant),
+            vectorizer_config=Configure.Vectorizer.none(),
+        )
+        return client_fixture, name_fixture
+
+    try:
+        yield _factory
+    finally:
+        if client_fixture is not None:
+            await client_fixture.close()
+
+
 def test_add_objects_in_multiple_batches(client_factory: ClientFactory) -> None:
     client, name = client_factory()
     with client.batch.rate_limit(50) as batch:
@@ -365,15 +414,15 @@ def test_add_ref_batch_with_tenant(client_factory: ClientFactory) -> None:
 @pytest.mark.parametrize(
     "batching_method",
     [
-        # lambda client: client.batch.dynamic(),
-        # lambda client: client.batch.fixed_size(),
-        # lambda client: client.batch.rate_limit(9999),
+        lambda client: client.batch.dynamic(),
+        lambda client: client.batch.fixed_size(),
+        lambda client: client.batch.rate_limit(9999),
         lambda client: client.batch.experimental(concurrency=1),
     ],
     ids=[
-        # "test_add_ten_thousand_data_objects_dynamic",
-        # "test_add_ten_thousand_data_objects_fixed_size",
-        # "test_add_ten_thousand_data_objects_rate_limit",
+        "test_add_ten_thousand_data_objects_dynamic",
+        "test_add_ten_thousand_data_objects_fixed_size",
+        "test_add_ten_thousand_data_objects_rate_limit",
         "test_add_ten_thousand_data_objects_experimental",
     ],
 )
@@ -768,3 +817,40 @@ def test_references_with_to_uuids(client_factory: ClientFactory) -> None:
 
     assert len(client.batch.failed_references) == 0, client.batch.failed_references
     client.collections.delete(["target", "source"])
+
+
+@pytest.mark.asyncio
+async def test_add_ten_thousand_data_objects_async(
+    async_client_factory: AsyncClientFactory,
+) -> None:
+    """Test adding ten thousand data objects."""
+    client, name = await async_client_factory()
+    if client._connection._weaviate_version.is_lower_than(1, 34, 0):
+        pytest.skip("Server-side batching not supported in Weaviate < 1.34.0")
+    nr_objects = 100000
+    import time
+
+    start = time.time()
+    async with client.batch.experimental(concurrency=1) as batch:
+        async for i in arange(nr_objects):
+            await batch.add_object(
+                collection=name,
+                properties={"name": "test" + str(i)},
+            )
+    end = time.time()
+    print(f"Time taken to add {nr_objects} objects: {end - start} seconds")
+    assert len(client.batch.results.objs.errors) == 0
+    assert len(client.batch.results.objs.all_responses) == nr_objects
+    assert len(client.batch.results.objs.uuids) == nr_objects
+    assert await client.collections.use(name).length() == nr_objects
+    assert client.batch.results.objs.has_errors is False
+    assert len(client.batch.failed_objects) == 0, [
+        obj.message for obj in client.batch.failed_objects
+    ]
+    await client.collections.delete(name)
+
+
+async def arange(count):
+    for i in range(count):
+        yield i
+        await asyncio.sleep(0.0)
diff --git a/weaviate/client.py b/weaviate/client.py
index 8cf856c51..d7f9080f4 100644
--- a/weaviate/client.py
+++ b/weaviate/client.py
@@ -10,7 +10,7 @@
 from .auth import AuthCredentials
 from .backup import _Backup, _BackupAsync
 from .cluster import _Cluster, _ClusterAsync
-from .collections.batch.client import _BatchClientWrapper
+from .collections.batch.client import _BatchClientWrapper, _BatchClientWrapperAsync
 from .collections.collections import _Collections, _CollectionsAsync
 from .config import AdditionalConfig
 from .connect import executor
@@ -76,6 +76,7 @@ def __init__(
         )
         self.alias = _AliasAsync(self._connection)
         self.backup = _BackupAsync(self._connection)
+        self.batch = _BatchClientWrapperAsync(self._connection)
         self.cluster = _ClusterAsync(self._connection)
         self.collections = _CollectionsAsync(self._connection)
         self.debug = _DebugAsync(self._connection)
diff --git a/weaviate/client.pyi b/weaviate/client.pyi
index 205a34b4e..9b32af15f 100644
--- a/weaviate/client.pyi
+++ b/weaviate/client.pyi
@@ -18,7 +18,7 @@ from weaviate.users.sync import _Users
 
 from .backup import _Backup, _BackupAsync
 from .cluster import _Cluster, _ClusterAsync
-from .collections.batch.client import _BatchClientWrapper
+from .collections.batch.client import _BatchClientWrapper, _BatchClientWrapperAsync
 from .debug import _Debug, _DebugAsync
 from .rbac import _Roles, _RolesAsync
 from .types import NUMBER
@@ -29,6 +29,7 @@ class WeaviateAsyncClient(_WeaviateClientExecutor[ConnectionAsync]):
     _connection: ConnectionAsync
     alias: _AliasAsync
     backup: _BackupAsync
+    batch: _BatchClientWrapperAsync
     collections: _CollectionsAsync
     cluster: _ClusterAsync
     debug: _DebugAsync
diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
new file mode 100644
index 000000000..f5f5758d3
--- /dev/null
+++ b/weaviate/collections/batch/async_.py
@@ -0,0 +1,482 @@
+import asyncio
+import time
+import uuid as uuid_package
+from typing import (
+    AsyncGenerator,
+    List,
+    Optional,
+    Set,
+    Union,
+)
+
+from pydantic import ValidationError
+
+from weaviate.collections.batch.base import (
+    ObjectsBatchRequest,
+    ReferencesBatchRequest,
+    _BatchDataWrapper,
+    _BatchMode,
+    _ServerSideBatching,
+)
+from weaviate.collections.batch.grpc_batch import _BatchGRPC
+from weaviate.collections.classes.batch import (
+    BatchObject,
+    BatchObjectReturn,
+    BatchReference,
+    ErrorObject,
+    ErrorReference,
+    Shard,
+)
+from weaviate.collections.classes.config import ConsistencyLevel
+from weaviate.collections.classes.internal import (
+    ReferenceInput,
+    ReferenceInputs,
+    ReferenceToMulti,
+)
+from weaviate.collections.classes.types import WeaviateProperties
+from weaviate.connect.v4 import ConnectionAsync
+from weaviate.exceptions import (
+    WeaviateBatchValidationError,
+    WeaviateGRPCUnavailableError,
+    WeaviateStartUpError,
+)
+from weaviate.logger import logger
+from weaviate.proto.v1 import batch_pb2
+from weaviate.types import UUID, VECTORS
+
+
+class _BgTasks:
+    def __init__(self, send: asyncio.Task[None], recv: asyncio.Task[None]) -> None:
+        self.send = send
+        self.recv = recv
+
+
+class _BatchBaseAsync:
+    def __init__(
+        self,
+        connection: ConnectionAsync,
+        consistency_level: Optional[ConsistencyLevel],
+        results: _BatchDataWrapper,
+        batch_mode: _BatchMode,
+        objects: Optional[ObjectsBatchRequest[batch_pb2.BatchObject]] = None,
+        references: Optional[ReferencesBatchRequest] = None,
+    ) -> None:
+        self.__batch_objects = objects or ObjectsBatchRequest[batch_pb2.BatchObject]()
+        self.__batch_references = references or ReferencesBatchRequest[batch_pb2.BatchReference]()
+
+        self.__connection = connection
+        self.__consistency_level: ConsistencyLevel = consistency_level or ConsistencyLevel.QUORUM
+        self.__batch_size = 100
+
+        self.__batch_grpc = _BatchGRPC(
+            connection._weaviate_version, self.__consistency_level, connection._grpc_max_msg_size
+        )
+        self.__stream = self.__connection.grpc_batch_stream()
+
+        # lookup table for objects that are currently being processed - is used to not send references from objects that have not been added yet
+        self.__uuid_lookup: Set[str] = set()
+
+        # we do not want that users can access the results directly as they are not thread-safe
+        self.__results_for_wrapper_backup = results
+        self.__results_for_wrapper = _BatchDataWrapper()
+
+        self.__objs_count = 0
+        self.__refs_count = 0
+
+        self.__uuid_lookup_lock = asyncio.Lock()
+
+        self.__is_shutting_down = asyncio.Event()
+        self.__is_shutdown = asyncio.Event()
+
+        self.__objs_cache_lock = asyncio.Lock()
+        self.__refs_cache_lock = asyncio.Lock()
+        self.__objs_cache: dict[str, BatchObject] = {}
+        self.__refs_cache: dict[int, BatchReference] = {}
+
+        self.__stop = False
+
+        self.__batch_mode = batch_mode
+
+    @property
+    def number_errors(self) -> int:
+        """Return the number of errors in the batch."""
+        return len(self.__results_for_wrapper.failed_objects) + len(
+            self.__results_for_wrapper.failed_references
+        )
+
+    async def _start(self):
+        assert isinstance(self.__batch_mode, _ServerSideBatching), (
+            "Only server-side batching is supported in this mode"
+        )
+        return _BgTasks(
+            send=asyncio.create_task(self.__send()), recv=asyncio.create_task(self.__recv())
+        )
+
+    async def _shutdown(self) -> None:
+        # Shutdown the current batch and wait for all requests to be finished
+        await self.flush()
+        self.__stop = True
+
+        # copy the results to the public results
+        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
+        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
+        self.__results_for_wrapper_backup.failed_references = (
+            self.__results_for_wrapper.failed_references
+        )
+        self.__results_for_wrapper_backup.imported_shards = (
+            self.__results_for_wrapper.imported_shards
+        )
+
+    async def __send(self) -> None:
+        refresh_time: float = 0.01
+        await self.__connection.grpc_batch_stream_write(
+            self.__stream, batch_pb2.BatchStreamRequest(start=batch_pb2.BatchStreamRequest.Start())
+        )
+        while True:
+            if len(self.__batch_objects) + len(self.__batch_references) > 0:
+                start = time.time()
+                while (len_o := len(self.__batch_objects)) + (
+                    len_r := len(self.__batch_references)
+                ) < self.__batch_size:
+                    # wait for more objects to be added up to the batch size
+                    await asyncio.sleep(0.01)
+                    if time.time() - start >= 1 and (
+                        len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
+                    ):
+                        # no new objects were added in the last second, exit the loop
+                        break
+
+                objs = await self.__batch_objects.apop_items(self.__batch_size)
+                refs = await self.__batch_references.apop_items(
+                    self.__batch_size - len(objs),
+                    uuid_lookup=self.__uuid_lookup,
+                )
+                async with self.__uuid_lookup_lock:
+                    self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
+
+                async for req in self.__generate_stream_requests(objs, refs):
+                    logged = False
+                    while self.__is_shutting_down.is_set() or self.__is_shutdown.is_set():
+                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
+                        # so that the connection is refreshed to a new node where the objects can be accepted
+                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
+                        if not logged:
+                            logger.warning("Waiting for stream to be re-established...")
+                            logged = True
+                            # put sentinel into our queue to signal the end of the current stream
+                            await self.__stream.done_writing()
+                        await asyncio.sleep(1)
+                    if logged:
+                        logger.warning("Stream re-established, resuming sending batches")
+                    await self.__connection.grpc_batch_stream_write(self.__stream, req)
+            elif self.__stop:
+                await self.__connection.grpc_batch_stream_write(
+                    self.__stream,
+                    batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
+                )
+                await self.__stream.done_writing()
+                logger.warning("Batching finished, sent stop signal to batch stream")
+                return
+            await asyncio.sleep(refresh_time)
+
+    async def __generate_stream_requests(
+        self,
+        objs: List[batch_pb2.BatchObject],
+        refs: List[batch_pb2.BatchReference],
+    ) -> AsyncGenerator[batch_pb2.BatchStreamRequest, None]:
+        per_object_overhead = 4  # extra overhead bytes per object in the request
+
+        def request_maker():
+            return batch_pb2.BatchStreamRequest()
+
+        request = request_maker()
+        total_size = request.ByteSize()
+
+        for obj in objs:
+            obj_size = obj.ByteSize() + per_object_overhead
+
+            if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
+                await asyncio.sleep(0)  # yield control to event loop
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.objects.values.append(obj)
+            total_size += obj_size
+
+        for ref in refs:
+            ref_size = ref.ByteSize() + per_object_overhead
+
+            if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
+                await asyncio.sleep(0)  # yield control to event loop
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.references.values.append(ref)
+            total_size += ref_size
+
+        if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
+            await asyncio.sleep(0)  # yield control to event loop
+            yield request
+
+    async def __recv(self) -> None:
+        while True:
+            message = await self.__connection.grpc_batch_stream_read(self.__stream)
+            if not isinstance(message, batch_pb2.BatchStreamReply):
+                logger.warning("Server closed the stream from its side, shutting down batch")
+                return
+            if message.HasField("started"):
+                logger.warning("Batch stream started successfully")
+            if message.HasField("backoff"):
+                if (
+                    message.backoff.batch_size != self.__batch_size
+                    and not self.__is_shutting_down.is_set()
+                    and not self.__is_shutdown.is_set()
+                    and not self.__stop
+                ):
+                    self.__batch_size = message.backoff.batch_size
+                    logger.warning(
+                        f"Updated batch size to {self.__batch_size} as per server request"
+                    )
+            if message.HasField("results"):
+                result_objs = BatchObjectReturn()
+                # result_refs = BatchReferenceReturn()
+                failed_objs: List[ErrorObject] = []
+                failed_refs: List[ErrorReference] = []
+                for error in message.results.errors:
+                    if error.HasField("uuid"):
+                        try:
+                            async with self.__objs_cache_lock:
+                                cached = self.__objs_cache.pop(error.uuid)
+                        except KeyError:
+                            continue
+                        err = ErrorObject(
+                            message=error.error,
+                            object_=cached,
+                        )
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[err],
+                            errors={cached.index: err},
+                        )
+                        failed_objs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "object": error.uuid,
+                                "action": "use {client,collection}.batch.failed_objects to access this error",
+                            }
+                        )
+                    if error.HasField("beacon"):
+                        # TODO: get cached ref from beacon
+                        err = ErrorReference(
+                            message=error.error,
+                            reference=error.beacon,  # pyright: ignore
+                        )
+                        failed_refs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "reference": error.beacon,
+                                "action": "use {client,collection}.batch.failed_references to access this error",
+                            }
+                        )
+                for success in message.results.successes:
+                    if success.HasField("uuid"):
+                        try:
+                            async with self.__objs_cache_lock:
+                                cached = self.__objs_cache.pop(success.uuid)
+                        except KeyError:
+                            continue
+                        uuid = uuid_package.UUID(success.uuid)
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[uuid],
+                            uuids={cached.index: uuid},
+                        )
+                    if success.HasField("beacon"):
+                        # TODO: remove cached ref using beacon
+                        # self.__refs_cache.pop(success.beacon, None)
+                        pass
+                self.__results_for_wrapper.results.objs += result_objs
+                self.__results_for_wrapper.failed_objects.extend(failed_objs)
+                self.__results_for_wrapper.failed_references.extend(failed_refs)
+            elif message.HasField("shutting_down"):
+                logger.warning(
+                    "Received shutting down message from server, pausing sending until stream is re-established"
+                )
+                self.__is_shutting_down.set()
+            elif message.HasField("shutdown"):
+                logger.warning("Received shutdown finished message from server")
+                self.__is_shutdown.set()
+                self.__is_shutting_down.clear()
+                await self.__reconnect()
+
+            # restart the stream if we were shutdown by the node we were connected to
+            if self.__is_shutdown.is_set():
+                logger.warning("Restarting batch recv after shutdown...")
+                self.__is_shutdown.clear()
+                return await self.__recv()
+
+    async def __reconnect(self, retry: int = 0) -> None:
+        try:
+            logger.warning(f"Trying to reconnect after shutdown... {retry + 1}/{5}")
+            self.__connection.close("sync")
+            await self.__connection.connect(force=True)
+            logger.warning("Reconnected successfully")
+            self.__stream = self.__connection.grpc_batch_stream()
+        except (WeaviateStartUpError, WeaviateGRPCUnavailableError) as e:
+            if retry < 5:
+                await asyncio.sleep(2**retry)
+                await self.__reconnect(retry + 1)
+            else:
+                logger.error("Failed to reconnect after 5 attempts")
+                self.__bg_thread_exception = e
+
+    # def __start_bg_threads(self) -> _BgThreads:
+    #     """Create a background thread that periodically checks how congested the batch queue is."""
+    #     self.__shut_background_thread_down = threading.Event()
+
+    #     def batch_send_wrapper() -> None:
+    #         try:
+    #             self.__batch_send()
+    #             logger.warning("exited batch send thread")
+    #         except Exception as e:
+    #             logger.error(e)
+    #             self.__bg_thread_exception = e
+
+    #     def batch_recv_wrapper() -> None:
+    #         socket_hung_up = False
+    #         try:
+    #             self.__batch_recv()
+    #             logger.warning("exited batch receive thread")
+    #         except Exception as e:
+    #             if isinstance(e, WeaviateBatchStreamError) and (
+    #                 "Socket closed" in e.message or "context canceled" in e.message
+    #             ):
+    #                 socket_hung_up = True
+    #             else:
+    #                 logger.error(e)
+    #                 logger.error(type(e))
+    #                 self.__bg_thread_exception = e
+    #         if socket_hung_up:
+    #             # this happens during ungraceful shutdown of the coordinator
+    #             # lets restart the stream and add the cached objects again
+    #             logger.warning("Stream closed unexpectedly, restarting...")
+    #             self.__reconnect()
+    #             # server sets this whenever it restarts, gracefully or unexpectedly, so need to clear it now
+    #             self.__is_shutting_down.clear()
+    #             with self.__objs_cache_lock:
+    #                 logger.warning(
+    #                     f"Re-adding {len(self.__objs_cache)} cached objects to the batch"
+    #                 )
+    #                 self.__batch_objects.prepend(
+    #                     [
+    #                         self.__batch_grpc.grpc_object(o._to_internal())
+    #                         for o in self.__objs_cache.values()
+    #                     ]
+    #                 )
+    #             with self.__refs_cache_lock:
+    #                 self.__batch_references.prepend(
+    #                     [
+    #                         self.__batch_grpc.grpc_reference(o._to_internal())
+    #                         for o in self.__refs_cache.values()
+    #                     ]
+    #                 )
+    #             # start a new stream with a newly reconnected channel
+    #             return batch_recv_wrapper()
+
+    #     threads = _BgThreads(
+    #         send=threading.Thread(
+    #             target=batch_send_wrapper,
+    #             daemon=True,
+    #             name="BgBatchSend",
+    #         ),
+    #         recv=threading.Thread(
+    #             target=batch_recv_wrapper,
+    #             daemon=True,
+    #             name="BgBatchRecv",
+    #         ),
+    #     )
+    #     threads.start_recv()
+    #     return threads
+
+    async def flush(self) -> None:
+        """Flush the batch queue and wait for all requests to be finished."""
+        # bg thread is sending objs+refs automatically, so simply wait for everything to be done
+        while len(self.__batch_objects) > 0 or len(self.__batch_references) > 0:
+            await asyncio.sleep(0.01)
+
+    async def _add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[str] = None,
+    ) -> UUID:
+        try:
+            batch_object = BatchObject(
+                collection=collection,
+                properties=properties,
+                references=references,
+                uuid=uuid,
+                vector=vector,
+                tenant=tenant,
+                index=self.__objs_count,
+            )
+            self.__results_for_wrapper.imported_shards.add(
+                Shard(collection=collection, tenant=tenant)
+            )
+        except ValidationError as e:
+            raise WeaviateBatchValidationError(repr(e))
+        uuid = str(batch_object.uuid)
+        async with self.__uuid_lookup_lock:
+            self.__uuid_lookup.add(uuid)
+        await self.__batch_objects.aadd(self.__batch_grpc.grpc_object(batch_object._to_internal()))
+        async with self.__objs_cache_lock:
+            self.__objs_cache[uuid] = batch_object
+        self.__objs_count += 1
+
+        while len(self.__batch_objects) >= self.__batch_size * 2:
+            await asyncio.sleep(0.01)
+
+        assert batch_object.uuid is not None
+        return batch_object.uuid
+
+    async def _add_reference(
+        self,
+        from_object_uuid: UUID,
+        from_object_collection: str,
+        from_property_name: str,
+        to: ReferenceInput,
+        tenant: Optional[str] = None,
+    ) -> None:
+        if isinstance(to, ReferenceToMulti):
+            to_strs: Union[List[str], List[UUID]] = to.uuids_str
+        elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
+            to_strs = [to]
+        else:
+            to_strs = list(to)
+
+        for uid in to_strs:
+            try:
+                batch_reference = BatchReference(
+                    from_object_collection=from_object_collection,
+                    from_object_uuid=from_object_uuid,
+                    from_property_name=from_property_name,
+                    to_object_collection=(
+                        to.target_collection if isinstance(to, ReferenceToMulti) else None
+                    ),
+                    to_object_uuid=uid,
+                    tenant=tenant,
+                    index=self.__refs_count,
+                )
+            except ValidationError as e:
+                raise WeaviateBatchValidationError(repr(e))
+            await self.__batch_references.aadd(
+                self.__batch_grpc.grpc_reference(batch_reference._to_internal())
+            )
+            async with self.__refs_cache_lock:
+                self.__refs_cache[self.__refs_count] = batch_reference
+                self.__refs_count += 1
diff --git a/weaviate/collections/batch/base.py b/weaviate/collections/batch/base.py
index 385be68c2..054c422d3 100644
--- a/weaviate/collections/batch/base.py
+++ b/weaviate/collections/batch/base.py
@@ -1,3 +1,4 @@
+import asyncio
 import contextvars
 import functools
 import math
@@ -10,8 +11,7 @@
 from concurrent.futures import ThreadPoolExecutor
 from copy import copy
 from dataclasses import dataclass, field
-from queue import Queue
-from typing import Any, Dict, Generator, Generic, List, Optional, Set, TypeVar, Union, cast
+from typing import Any, Dict, Generic, List, Optional, Set, TypeVar, Union, cast
 
 from httpx import ConnectError
 from pydantic import ValidationError
@@ -40,13 +40,10 @@
 )
 from weaviate.collections.classes.types import WeaviateProperties
 from weaviate.connect import executor
-from weaviate.connect.v4 import ConnectionSync
+from weaviate.connect.v4 import ConnectionAsync, ConnectionSync
 from weaviate.exceptions import (
     EmptyResponseException,
-    WeaviateBatchStreamError,
     WeaviateBatchValidationError,
-    WeaviateGRPCUnavailableError,
-    WeaviateStartUpError,
 )
 from weaviate.logger import logger
 from weaviate.proto.v1 import batch_pb2
@@ -75,24 +72,42 @@ class BatchRequest(ABC, Generic[TBatchInput, TBatchReturn]):
     def __init__(self) -> None:
         self._items: List[TBatchInput] = []
         self._lock = threading.Lock()
+        self._alock = asyncio.Lock()
 
     def __len__(self) -> int:
-        return len(self._items)
+        with self._lock:
+            return len(self._items)
+
+    async def alen(self) -> int:
+        """Asynchronously get the length of the BatchRequest."""
+        async with self._alock:
+            return len(self._items)
 
     def add(self, item: TBatchInput) -> None:
         """Add an item to the BatchRequest."""
-        self._lock.acquire()
-        self._items.append(item)
-        self._lock.release()
+        with self._lock:
+            self._items.append(item)
+
+    async def aadd(self, item: TBatchInput) -> None:
+        """Asynchronously add an item to the BatchRequest."""
+        async with self._alock:
+            self._items.append(item)
 
     def prepend(self, item: List[TBatchInput]) -> None:
         """Add items to the front of the BatchRequest.
 
         This is intended to be used when objects should be retries, eg. after a temporary error.
         """
-        self._lock.acquire()
-        self._items = item + self._items
-        self._lock.release()
+        with self._lock:
+            self._items = item + self._items
+
+    async def aprepend(self, item: List[TBatchInput]) -> None:
+        """Asynchronously add items to the front of the BatchRequest.
+
+        This is intended to be used when objects should be retries, eg. after a temporary error.
+        """
+        async with self._alock:
+            self._items = item + self._items
 
 
 Ref = TypeVar("Ref", bound=Union[_BatchReference, batch_pb2.BatchReference])
@@ -101,15 +116,9 @@ def prepend(self, item: List[TBatchInput]) -> None:
 class ReferencesBatchRequest(BatchRequest[Ref, BatchReferenceReturn]):
     """Collect Weaviate-object references to add them in one request to Weaviate."""
 
-    def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
-        """Pop the given number of items from the BatchRequest queue.
-
-        Returns:
-            A list of items from the BatchRequest.
-        """
+    def __pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
         ret: List[Ref] = []
         i = 0
-        self._lock.acquire()
         while len(ret) < pop_amount and len(self._items) > 0 and i < len(self._items):
             if self._items[i].from_uuid not in uuid_lookup and (
                 self._items[i].to_uuid is None or self._items[i].to_uuid not in uuid_lookup
@@ -117,19 +126,48 @@ def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
                 ret.append(self._items.pop(i))
             else:
                 i += 1
-        self._lock.release()
         return ret
 
+    def pop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
+        """Pop the given number of items from the BatchRequest queue.
+
+        Returns:
+            A list of items from the BatchRequest.
+        """
+        with self._lock:
+            return self.__pop_items(pop_amount, uuid_lookup)
+
+    async def apop_items(self, pop_amount: int, uuid_lookup: Set[str]) -> List[Ref]:
+        """Asynchronously pop the given number of items from the BatchRequest queue.
+
+        Returns:
+            A list of items from the BatchRequest.
+        """
+        async with self._alock:
+            return self.__pop_items(pop_amount, uuid_lookup)
+
+    def __head(self) -> Optional[Ref]:
+        if len(self._items) > 0:
+            return self._items[0]
+        return None
+
     def head(self) -> Optional[Ref]:
         """Get the first item from the BatchRequest queue without removing it.
 
         Returns:
             The first item from the BatchRequest or None if the queue is empty.
         """
-        self._lock.acquire()
-        item = self._items[0] if len(self._items) > 0 else None
-        self._lock.release()
-        return item
+        with self._lock:
+            return self.__head()
+
+    async def ahead(self) -> Optional[Ref]:
+        """Asynchronously get the first item from the BatchRequest queue without removing it.
+
+        Returns:
+            The first item from the BatchRequest or None if the queue is empty.
+        """
+        async with self._alock:
+            return self.__head()
 
 
 Obj = TypeVar("Obj", bound=Union[_BatchObject, batch_pb2.BatchObject])
@@ -138,33 +176,55 @@ def head(self) -> Optional[Ref]:
 class ObjectsBatchRequest(Generic[Obj], BatchRequest[Obj, BatchObjectReturn]):
     """Collect objects for one batch request to weaviate."""
 
-    def pop_items(self, pop_amount: int) -> List[Obj]:
-        """Pop the given number of items from the BatchRequest queue.
-
-        Returns:
-            A list of items from the BatchRequest.
-        """
-        self._lock.acquire()
+    def __pop_items(self, pop_amount: int) -> List[Obj]:
         if pop_amount >= len(self._items):
             ret = copy(self._items)
             self._items.clear()
         else:
             ret = copy(self._items[:pop_amount])
             self._items = self._items[pop_amount:]
-
-        self._lock.release()
         return ret
 
+    def pop_items(self, pop_amount: int) -> List[Obj]:
+        """Pop the given number of items from the BatchRequest queue.
+
+        Returns:
+            A list of items from the BatchRequest.
+        """
+        with self._lock:
+            return self.__pop_items(pop_amount)
+
+    async def apop_items(self, pop_amount: int) -> List[Obj]:
+        """Asynchronously pop the given number of items from the BatchRequest queue.
+
+        Returns:
+            A list of items from the BatchRequest.
+        """
+        async with self._alock:
+            return self.__pop_items(pop_amount)
+
+    def __head(self) -> Optional[Obj]:
+        if len(self._items) > 0:
+            return self._items[0]
+        return None
+
     def head(self) -> Optional[Obj]:
         """Get the first item from the BatchRequest queue without removing it.
 
         Returns:
             The first item from the BatchRequest or None if the queue is empty.
         """
-        self._lock.acquire()
-        item = self._items[0] if len(self._items) > 0 else None
-        self._lock.release()
-        return item
+        with self._lock:
+            return self.__head()
+
+    async def ahead(self) -> Optional[Obj]:
+        """Asynchronously get the first item from the BatchRequest queue without removing it.
+
+        Returns:
+            The first item from the BatchRequest or None if the queue is empty.
+        """
+        async with self._alock:
+            return self.__head()
 
 
 @dataclass
@@ -834,529 +894,35 @@ def recv_alive(self) -> bool:
         return self.recv.is_alive()
 
 
-class _BatchBaseNew:
-    def __init__(
-        self,
-        connection: ConnectionSync,
-        consistency_level: Optional[ConsistencyLevel],
-        results: _BatchDataWrapper,
-        batch_mode: _BatchMode,
-        executor: ThreadPoolExecutor,
-        vectorizer_batching: bool,
-        objects: Optional[ObjectsBatchRequest[batch_pb2.BatchObject]] = None,
-        references: Optional[ReferencesBatchRequest] = None,
-    ) -> None:
-        self.__batch_objects = objects or ObjectsBatchRequest[batch_pb2.BatchObject]()
-        self.__batch_references = references or ReferencesBatchRequest[batch_pb2.BatchReference]()
-
-        self.__connection = connection
-        self.__consistency_level: ConsistencyLevel = consistency_level or ConsistencyLevel.QUORUM
-        self.__batch_size = 100
-
-        self.__batch_grpc = _BatchGRPC(
-            connection._weaviate_version, self.__consistency_level, connection._grpc_max_msg_size
-        )
-
-        # lookup table for objects that are currently being processed - is used to not send references from objects that have not been added yet
-        self.__uuid_lookup: Set[str] = set()
-
-        # we do not want that users can access the results directly as they are not thread-safe
-        self.__results_for_wrapper_backup = results
-        self.__results_for_wrapper = _BatchDataWrapper()
-
-        self.__objs_count = 0
-        self.__refs_count = 0
-
-        self.__uuid_lookup_lock = threading.Lock()
-        self.__results_lock = threading.Lock()
-
-        self.__bg_thread_exception: Optional[Exception] = None
-        self.__is_shutting_down = threading.Event()
-        self.__is_shutdown = threading.Event()
-
-        self.__objs_cache_lock = threading.Lock()
-        self.__refs_cache_lock = threading.Lock()
-        self.__objs_cache: dict[str, BatchObject] = {}
-        self.__refs_cache: dict[int, BatchReference] = {}
-
-        # maxsize=1 so that __batch_send does not run faster than generator for __batch_recv
-        # thereby using too much buffer in case of server-side shutdown
-        self.__reqs: Queue[Optional[batch_pb2.BatchStreamRequest]] = Queue(maxsize=1)
-
-        self.__stop = False
-
-        self.__batch_mode = batch_mode
-
-        self.__total = 0
-
-    @property
-    def number_errors(self) -> int:
-        """Return the number of errors in the batch."""
-        return len(self.__results_for_wrapper.failed_objects) + len(
-            self.__results_for_wrapper.failed_references
-        )
-
-    def __all_threads_alive(self) -> bool:
-        return self.__bg_threads is not None and all(
-            thread.is_alive() for thread in self.__bg_threads
-        )
-
-    def __any_threads_alive(self) -> bool:
-        return self.__bg_threads is not None and any(
-            thread.is_alive() for thread in self.__bg_threads
-        )
-
-    def _start(self) -> None:
-        assert isinstance(self.__batch_mode, _ServerSideBatching), (
-            "Only server-side batching is supported in this mode"
-        )
-        self.__bg_threads = [
-            self.__start_bg_threads() for _ in range(self.__batch_mode.concurrency)
-        ]
-        logger.warning(
-            f"Provisioned {len(self.__bg_threads)} stream(s) to the server for batch processing"
-        )
-        now = time.time()
-        while not self.__all_threads_alive():
-            # wait for the stream to be started by __batch_stream
-            time.sleep(0.01)
-            if time.time() - now > 10:
-                raise WeaviateBatchValidationError(
-                    "Batch stream was not started within 10 seconds. Please check your connection."
-                )
-
-    def _shutdown(self) -> None:
-        # Shutdown the current batch and wait for all requests to be finished
-        self.flush()
-        self.__stop = True
-
-        # we are done, wait for bg threads to finish
-        # self.__batch_stream will set the shutdown event when it receives
-        # the stop message from the server
-        while self.__any_threads_alive():
-            time.sleep(1)
-        logger.warning("Send & receive threads finished.")
-
-        # copy the results to the public results
-        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
-        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
-        self.__results_for_wrapper_backup.failed_references = (
-            self.__results_for_wrapper.failed_references
-        )
-        self.__results_for_wrapper_backup.imported_shards = (
-            self.__results_for_wrapper.imported_shards
-        )
-
-    def __batch_send(self) -> None:
-        refresh_time: float = 0.01
-        while (
-            self.__shut_background_thread_down is not None
-            and not self.__shut_background_thread_down.is_set()
-        ):
-            if len(self.__batch_objects) + len(self.__batch_references) > 0:
-                self._batch_send = True
-                start = time.time()
-                while (len_o := len(self.__batch_objects)) + (
-                    len_r := len(self.__batch_references)
-                ) < self.__batch_size:
-                    # wait for more objects to be added up to the batch size
-                    time.sleep(0.01)
-                    if (
-                        self.__shut_background_thread_down is not None
-                        and self.__shut_background_thread_down.is_set()
-                    ):
-                        logger.warning("Threads were shutdown, exiting batch send loop")
-                        # shutdown was requested, exit early
-                        self.__reqs.put(None)
-                        return
-                    if time.time() - start >= 1 and (
-                        len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
-                    ):
-                        # no new objects were added in the last second, exit the loop
-                        break
-
-                objs = self.__batch_objects.pop_items(self.__batch_size)
-                refs = self.__batch_references.pop_items(
-                    self.__batch_size - len(objs),
-                    uuid_lookup=self.__uuid_lookup,
-                )
-                with self.__uuid_lookup_lock:
-                    self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
-
-                for req in self.__generate_stream_requests(objs, refs):
-                    logged = False
-                    while self.__is_shutting_down.is_set() or self.__is_shutdown.is_set():
-                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
-                        # so that the connection is refreshed to a new node where the objects can be accepted
-                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
-                        if not logged:
-                            logger.warning("Waiting for stream to be re-established...")
-                            logged = True
-                            # put sentinel into our queue to signal the end of the current stream
-                            self.__reqs.put(None)
-                        time.sleep(1)
-                    if logged:
-                        logger.warning("Stream re-established, resuming sending batches")
-                    self.__reqs.put(req)
-            elif self.__stop:
-                # we are done, send the sentinel into our queue to be consumed by the batch sender
-                self.__reqs.put(None)  # signal the end of the stream
-                logger.warning("Batching finished, sent stop signal to batch stream")
-                return
-            time.sleep(refresh_time)
-
-    def __generate_stream_requests(
-        self,
-        objs: List[batch_pb2.BatchObject],
-        refs: List[batch_pb2.BatchReference],
-    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
-        per_object_overhead = 4  # extra overhead bytes per object in the request
-
-        def request_maker():
-            return batch_pb2.BatchStreamRequest()
-
-        request = request_maker()
-        total_size = request.ByteSize()
-
-        for obj in objs:
-            obj_size = obj.ByteSize() + per_object_overhead
-
-            if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
-                yield request
-                request = request_maker()
-                total_size = request.ByteSize()
-
-            request.data.objects.values.append(obj)
-            total_size += obj_size
-
-        for ref in refs:
-            ref_size = ref.ByteSize() + per_object_overhead
-
-            if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
-                yield request
-                request = request_maker()
-                total_size = request.ByteSize()
-
-            request.data.references.values.append(ref)
-            total_size += ref_size
-
-        if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
-            yield request
-
-    def __generate_stream_requests_for_grpc(
-        self,
-    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
-        yield batch_pb2.BatchStreamRequest(
-            start=batch_pb2.BatchStreamRequest.Start(
-                consistency_level=self.__batch_grpc._consistency_level,
-            ),
-        )
-        while (
-            self.__shut_background_thread_down is not None
-            and not self.__shut_background_thread_down.is_set()
-        ):
-            req = self.__reqs.get()
-            if req is not None:
-                self.__total += len(req.data.objects.values) + len(req.data.references.values)
-                yield req
-                continue
-            if self.__stop and not (
-                self.__is_shutting_down.is_set() or self.__is_shutdown.is_set()
-            ):
-                logger.warning("Batching finished, closing the client-side of the stream")
-                yield batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop())
-                return
-            if self.__is_shutting_down.is_set():
-                logger.warning("Server shutting down, closing the client-side of the stream")
-                return
-            logger.warning("Received sentinel, but not stopping, continuing...")
-
-    def __batch_recv(self) -> None:
-        for message in self.__batch_grpc.stream(
-            connection=self.__connection,
-            requests=self.__generate_stream_requests_for_grpc(),
-        ):
-            if message.HasField("started"):
-                logger.warning("Batch stream started successfully")
-                for threads in self.__bg_threads:
-                    threads.start_send()
-            if message.HasField("backoff"):
-                if (
-                    message.backoff.batch_size != self.__batch_size
-                    and not self.__is_shutting_down.is_set()
-                    and not self.__is_shutdown.is_set()
-                    and not self.__stop
-                ):
-                    self.__batch_size = message.backoff.batch_size
-                    logger.warning(
-                        f"Updated batch size to {self.__batch_size} as per server request"
-                    )
-            if message.HasField("results"):
-                result_objs = BatchObjectReturn()
-                # result_refs = BatchReferenceReturn()
-                failed_objs: List[ErrorObject] = []
-                failed_refs: List[ErrorReference] = []
-                for error in message.results.errors:
-                    if error.HasField("uuid"):
-                        try:
-                            cached = self.__objs_cache.pop(error.uuid)
-                        except KeyError:
-                            continue
-                        err = ErrorObject(
-                            message=error.error,
-                            object_=cached,
-                        )
-                        result_objs += BatchObjectReturn(
-                            _all_responses=[err],
-                            errors={cached.index: err},
-                        )
-                        failed_objs.append(err)
-                        logger.warning(
-                            {
-                                "error": error.error,
-                                "object": error.uuid,
-                                "action": "use {client,collection}.batch.failed_objects to access this error",
-                            }
-                        )
-                    if error.HasField("beacon"):
-                        # TODO: get cached ref from beacon
-                        err = ErrorReference(
-                            message=error.error,
-                            reference=error.beacon,  # pyright: ignore
-                        )
-                        failed_refs.append(err)
-                        logger.warning(
-                            {
-                                "error": error.error,
-                                "reference": error.beacon,
-                                "action": "use {client,collection}.batch.failed_references to access this error",
-                            }
-                        )
-                for success in message.results.successes:
-                    if success.HasField("uuid"):
-                        try:
-                            cached = self.__objs_cache.pop(success.uuid)
-                        except KeyError:
-                            continue
-                        uuid = uuid_package.UUID(success.uuid)
-                        result_objs += BatchObjectReturn(
-                            _all_responses=[uuid],
-                            uuids={cached.index: uuid},
-                        )
-                    if success.HasField("beacon"):
-                        # TODO: remove cached ref using beacon
-                        # self.__refs_cache.pop(success.beacon, None)
-                        pass
-                with self.__results_lock:
-                    self.__results_for_wrapper.results.objs += result_objs
-                    self.__results_for_wrapper.failed_objects.extend(failed_objs)
-                    self.__results_for_wrapper.failed_references.extend(failed_refs)
-            elif message.HasField("shutting_down"):
-                logger.warning(
-                    "Received shutting down message from server, pausing sending until stream is re-established"
-                )
-                self.__is_shutting_down.set()
-            elif message.HasField("shutdown"):
-                logger.warning("Received shutdown finished message from server")
-                self.__is_shutdown.set()
-                self.__is_shutting_down.clear()
-                self.__reconnect()
-
-        # restart the stream if we were shutdown by the node we were connected to ensuring that the index is
-        # propagated properly from it to the new one
-        if self.__is_shutdown.is_set():
-            logger.warning("Restarting batch recv after shutdown...")
-            self.__is_shutdown.clear()
-            return self.__batch_recv()
-        else:
-            logger.warning("Server closed the stream from its side, shutting down batch")
-            return
-
-    def __reconnect(self, retry: int = 0) -> None:
-        try:
-            logger.warning(f"Trying to reconnect after shutdown... {retry + 1}/{5}")
-            self.__connection.close("sync")
-            self.__connection.connect(force=True)
-            logger.warning("Reconnected successfully")
-        except (WeaviateStartUpError, WeaviateGRPCUnavailableError) as e:
-            if retry < 5:
-                time.sleep(2**retry)
-                self.__reconnect(retry + 1)
-            else:
-                logger.error("Failed to reconnect after 5 attempts")
-                self.__bg_thread_exception = e
-
-    def __start_bg_threads(self) -> _BgThreads:
-        """Create a background thread that periodically checks how congested the batch queue is."""
-        self.__shut_background_thread_down = threading.Event()
-
-        def batch_send_wrapper() -> None:
-            try:
-                self.__batch_send()
-                logger.warning("exited batch send thread")
-            except Exception as e:
-                logger.error(e)
-                self.__bg_thread_exception = e
-
-        def batch_recv_wrapper() -> None:
-            socket_hung_up = False
-            try:
-                self.__batch_recv()
-                logger.warning("exited batch receive thread")
-            except Exception as e:
-                if isinstance(e, WeaviateBatchStreamError) and (
-                    "Socket closed" in e.message or "context canceled" in e.message
-                ):
-                    socket_hung_up = True
-                else:
-                    logger.error(e)
-                    logger.error(type(e))
-                    self.__bg_thread_exception = e
-            if socket_hung_up:
-                # this happens during ungraceful shutdown of the coordinator
-                # lets restart the stream and add the cached objects again
-                logger.warning("Stream closed unexpectedly, restarting...")
-                self.__reconnect()
-                # server sets this whenever it restarts, gracefully or unexpectedly, so need to clear it now
-                self.__is_shutting_down.clear()
-                with self.__objs_cache_lock:
-                    logger.warning(
-                        f"Re-adding {len(self.__objs_cache)} cached objects to the batch"
-                    )
-                    self.__batch_objects.prepend(
-                        [
-                            self.__batch_grpc.grpc_object(o._to_internal())
-                            for o in self.__objs_cache.values()
-                        ]
-                    )
-                with self.__refs_cache_lock:
-                    self.__batch_references.prepend(
-                        [
-                            self.__batch_grpc.grpc_reference(o._to_internal())
-                            for o in self.__refs_cache.values()
-                        ]
-                    )
-                # start a new stream with a newly reconnected channel
-                return batch_recv_wrapper()
-
-        threads = _BgThreads(
-            send=threading.Thread(
-                target=batch_send_wrapper,
-                daemon=True,
-                name="BgBatchSend",
-            ),
-            recv=threading.Thread(
-                target=batch_recv_wrapper,
-                daemon=True,
-                name="BgBatchRecv",
-            ),
-        )
-        threads.start_recv()
-        return threads
-
-    def flush(self) -> None:
-        """Flush the batch queue and wait for all requests to be finished."""
-        # bg thread is sending objs+refs automatically, so simply wait for everything to be done
-        while len(self.__batch_objects) > 0 or len(self.__batch_references) > 0:
-            time.sleep(0.01)
-            self.__check_bg_threads_alive()
+class _ClusterBatch:
+    def __init__(self, connection: ConnectionSync):
+        self._connection = connection
 
-    def _add_object(
+    def get_nodes_status(
         self,
-        collection: str,
-        properties: Optional[WeaviateProperties] = None,
-        references: Optional[ReferenceInputs] = None,
-        uuid: Optional[UUID] = None,
-        vector: Optional[VECTORS] = None,
-        tenant: Optional[str] = None,
-    ) -> UUID:
-        self.__check_bg_threads_alive()
+    ) -> List[Node]:
         try:
-            batch_object = BatchObject(
-                collection=collection,
-                properties=properties,
-                references=references,
-                uuid=uuid,
-                vector=vector,
-                tenant=tenant,
-                index=self.__objs_count,
-            )
-            self.__results_for_wrapper.imported_shards.add(
-                Shard(collection=collection, tenant=tenant)
-            )
-        except ValidationError as e:
-            raise WeaviateBatchValidationError(repr(e))
-        uuid = str(batch_object.uuid)
-        with self.__uuid_lookup_lock:
-            self.__uuid_lookup.add(uuid)
-        self.__batch_objects.add(self.__batch_grpc.grpc_object(batch_object._to_internal()))
-        with self.__objs_cache_lock:
-            self.__objs_cache[uuid] = batch_object
-        self.__objs_count += 1
-
-        # block if queue gets too long or weaviate is overloaded - reading files is faster them sending them so we do
-        # not need a long queue
-        while len(self.__batch_objects) >= self.__batch_size * 2:
-            self.__check_bg_threads_alive()
-            time.sleep(0.01)
-
-        assert batch_object.uuid is not None
-        return batch_object.uuid
-
-    def _add_reference(
-        self,
-        from_object_uuid: UUID,
-        from_object_collection: str,
-        from_property_name: str,
-        to: ReferenceInput,
-        tenant: Optional[str] = None,
-    ) -> None:
-        self.__check_bg_threads_alive()
-        if isinstance(to, ReferenceToMulti):
-            to_strs: Union[List[str], List[UUID]] = to.uuids_str
-        elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
-            to_strs = [to]
-        else:
-            to_strs = list(to)
-
-        for uid in to_strs:
-            try:
-                batch_reference = BatchReference(
-                    from_object_collection=from_object_collection,
-                    from_object_uuid=from_object_uuid,
-                    from_property_name=from_property_name,
-                    to_object_collection=(
-                        to.target_collection if isinstance(to, ReferenceToMulti) else None
-                    ),
-                    to_object_uuid=uid,
-                    tenant=tenant,
-                    index=self.__refs_count,
-                )
-            except ValidationError as e:
-                raise WeaviateBatchValidationError(repr(e))
-            self.__batch_references.add(
-                self.__batch_grpc.grpc_reference(batch_reference._to_internal())
-            )
-            with self.__refs_cache_lock:
-                self.__refs_cache[self.__refs_count] = batch_reference
-                self.__refs_count += 1
-
-    def __check_bg_threads_alive(self) -> None:
-        if self.__any_threads_alive():
-            return
+            response = executor.result(self._connection.get(path="/nodes"))
+        except ConnectError as conn_err:
+            raise ConnectError("Get nodes status failed due to connection error") from conn_err
 
-        raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
+        response_typed = _decode_json_response_dict(response, "Nodes status")
+        assert response_typed is not None
+        nodes = response_typed.get("nodes")
+        if nodes is None or nodes == []:
+            raise EmptyResponseException("Nodes status response returned empty")
+        return cast(List[Node], nodes)
 
 
-class _ClusterBatch:
-    def __init__(self, connection: ConnectionSync):
+class _ClusterBatchAsync:
+    def __init__(self, connection: ConnectionAsync):
         self._connection = connection
 
-    def get_nodes_status(
+    async def get_nodes_status(
         self,
     ) -> List[Node]:
         try:
-            response = executor.result(self._connection.get(path="/nodes"))
+            response = await executor.aresult(self._connection.get(path="/nodes"))
         except ConnectError as conn_err:
             raise ConnectError("Get nodes status failed due to connection error") from conn_err
 
diff --git a/weaviate/collections/batch/batch_wrapper.py b/weaviate/collections/batch/batch_wrapper.py
index a64f267ca..f8e40395c 100644
--- a/weaviate/collections/batch/batch_wrapper.py
+++ b/weaviate/collections/batch/batch_wrapper.py
@@ -1,14 +1,18 @@
+import asyncio
 import time
 from typing import Any, Generic, List, Optional, Protocol, TypeVar, Union, cast
 
+from weaviate.collections.batch.async_ import _BatchBaseAsync
 from weaviate.collections.batch.base import (
     _BatchBase,
-    _BatchBaseNew,
     _BatchDataWrapper,
     _BatchMode,
     _ClusterBatch,
+    _ClusterBatchAsync,
     _DynamicBatching,
+    _ServerSideBatching,
 )
+from weaviate.collections.batch.sync import _BatchBaseSync
 from weaviate.collections.classes.batch import (
     BatchResult,
     ErrorObject,
@@ -20,7 +24,7 @@
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.collections.classes.types import Properties, WeaviateProperties
 from weaviate.connect import executor
-from weaviate.connect.v4 import ConnectionSync
+from weaviate.connect.v4 import ConnectionAsync, ConnectionSync
 from weaviate.logger import logger
 from weaviate.types import UUID, VECTORS
 from weaviate.util import _capitalize_first_letter, _decode_json_response_list
@@ -34,7 +38,7 @@ def __init__(
     ):
         self._connection = connection
         self._consistency_level = consistency_level
-        self._current_batch: Optional[Union[_BatchBase, _BatchBaseNew]] = None
+        self._current_batch: Optional[Union[_BatchBase, _BatchBaseSync]] = None
         # config options
         self._batch_mode: _BatchMode = _DynamicBatching()
 
@@ -127,6 +131,109 @@ def results(self) -> BatchResult:
         return self._batch_data.results
 
 
+class _BatchWrapperAsync:
+    def __init__(
+        self,
+        connection: ConnectionAsync,
+        consistency_level: Optional[ConsistencyLevel],
+    ):
+        self._connection = connection
+        self._consistency_level = consistency_level
+        self._current_batch: Optional[_BatchBaseAsync] = None
+        # config options
+        self._batch_mode: _BatchMode = _ServerSideBatching(1)
+
+        self._batch_data = _BatchDataWrapper()
+        self._cluster = _ClusterBatchAsync(connection)
+
+    async def __is_ready(
+        self, max_count: int, shards: Optional[List[Shard]], backoff_count: int = 0
+    ) -> bool:
+        try:
+            readinesses = await asyncio.gather(
+                *[
+                    self.__get_shards_readiness(shard)
+                    for shard in shards or self._batch_data.imported_shards
+                ]
+            )
+            return all(all(readiness) for readiness in readinesses)
+        except Exception as e:
+            logger.warning(
+                f"Error while getting class shards statuses: {e}, trying again with 2**n={2**backoff_count}s exponential backoff with n={backoff_count}"
+            )
+            if backoff_count >= max_count:
+                raise e
+            await asyncio.sleep(2**backoff_count)
+            return await self.__is_ready(max_count, shards, backoff_count + 1)
+
+    async def wait_for_vector_indexing(
+        self, shards: Optional[List[Shard]] = None, how_many_failures: int = 5
+    ) -> None:
+        """Wait for the all the vectors of the batch imported objects to be indexed.
+
+        Upon network error, it will retry to get the shards' status for `how_many_failures` times
+        with exponential backoff (2**n seconds with n=0,1,2,...,how_many_failures).
+
+        Args:
+            shards: The shards to check the status of. If `None` it will check the status of all the shards of the imported objects in the batch.
+            how_many_failures: How many times to try to get the shards' status before raising an exception. Default 5.
+        """
+        if shards is not None and not isinstance(shards, list):
+            raise TypeError(f"'shards' must be of type List[Shard]. Given type: {type(shards)}.")
+        if shards is not None and not isinstance(shards[0], Shard):
+            raise TypeError(f"'shards' must be of type List[Shard]. Given type: {type(shards)}.")
+
+        waiting_count = 0
+        while not await self.__is_ready(how_many_failures, shards):
+            if waiting_count % 20 == 0:  # print every 5s
+                logger.debug("Waiting for async indexing to finish...")
+            await asyncio.sleep(0.25)
+            waiting_count += 1
+        logger.debug("Async indexing finished!")
+
+    async def __get_shards_readiness(self, shard: Shard) -> List[bool]:
+        path = f"/schema/{_capitalize_first_letter(shard.collection)}/shards{'' if shard.tenant is None else f'?tenant={shard.tenant}'}"
+        response = await executor.aresult(self._connection.get(path=path))
+
+        res = _decode_json_response_list(response, "Get shards' status")
+        assert res is not None
+        return [
+            (cast(str, shard.get("status")) == "READY")
+            & (cast(int, shard.get("vectorQueueSize")) == 0)
+            for shard in res
+        ]
+
+    async def _get_shards_readiness(self, shard: Shard) -> List[bool]:
+        return await self.__get_shards_readiness(shard)
+
+    @property
+    def failed_objects(self) -> List[ErrorObject]:
+        """Get all failed objects from the batch manager.
+
+        Returns:
+            A list of all the failed objects from the batch.
+        """
+        return self._batch_data.failed_objects
+
+    @property
+    def failed_references(self) -> List[ErrorReference]:
+        """Get all failed references from the batch manager.
+
+        Returns:
+            A list of all the failed references from the batch.
+        """
+        return self._batch_data.failed_references
+
+    @property
+    def results(self) -> BatchResult:
+        """Get the results of the batch operation.
+
+        Returns:
+            The results of the batch operation.
+        """
+        return self._batch_data.results
+
+
 class BatchClientProtocol(Protocol):
     def add_object(
         self,
@@ -204,6 +311,83 @@ def number_errors(self) -> int:
         ...
 
 
+class BatchClientProtocolAsync(Protocol):
+    async def add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> UUID:
+        """Add one object to this batch.
+
+        NOTE: If the UUID of one of the objects already exists then the existing object will be
+        replaced by the new object.
+
+        Args:
+            collection: The name of the collection this object belongs to.
+            properties: The data properties of the object to be added as a dictionary.
+            references: The references of the object to be added as a dictionary.
+            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
+                If it is None an UUIDv4 will generated, by default None
+            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
+                vector was generated using the _identical_ vectorization module that is configured for the class. In this
+                case this vector takes precedence.
+                Supported types are:
+                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
+                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Returns:
+            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    async def add_reference(
+        self,
+        from_uuid: UUID,
+        from_collection: str,
+        from_property: str,
+        to: ReferenceInput,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> None:
+        """Add one reference to this batch.
+
+        Args:
+            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
+            from_collection: The name of the collection that should reference another object.
+            from_property: The name of the property that contains the reference.
+            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
+                For multi-target references use wvc.Reference.to_multi_target().
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        ...
+
+    async def flush(self) -> None:
+        """Flush the current batch.
+
+        This will send all the objects and references in the current batch to Weaviate.
+        """
+        ...
+
+    @property
+    def number_errors(self) -> int:
+        """Get the number of errors in the current batch.
+
+        Returns:
+            The number of errors in the current batch.
+        """
+        ...
+
+
 class BatchCollectionProtocol(Generic[Properties], Protocol[Properties]):
     def add_object(
         self,
@@ -260,7 +444,7 @@ def number_errors(self) -> int:
         ...
 
 
-T = TypeVar("T", bound=Union[_BatchBase, _BatchBaseNew])
+T = TypeVar("T", bound=Union[_BatchBase, _BatchBaseSync])
 P = TypeVar("P", bound=Union[BatchClientProtocol, BatchCollectionProtocol[Properties]])
 
 
@@ -274,3 +458,91 @@ def __exit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
     def __enter__(self) -> P:
         self.__current_batch._start()
         return self.__current_batch  # pyright: ignore[reportReturnType]
+
+
+class BatchClientAsync(_BatchBaseAsync):
+    async def add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> UUID:
+        """Add one object to this batch.
+
+        NOTE: If the UUID of one of the objects already exists then the existing object will be
+        replaced by the new object.
+
+        Args:
+            collection: The name of the collection this object belongs to.
+            properties: The data properties of the object to be added as a dictionary.
+            references: The references of the object to be added as a dictionary.
+            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
+                If it is None an UUIDv4 will generated, by default None
+            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
+                vector was generated using the _identical_ vectorization module that is configured for the class. In this
+                case this vector takes precedence.
+                Supported types are:
+                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
+                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Returns:
+            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        return await super()._add_object(
+            collection=collection,
+            properties=properties,
+            references=references,
+            uuid=uuid,
+            vector=vector,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+    async def add_reference(
+        self,
+        from_uuid: UUID,
+        from_collection: str,
+        from_property: str,
+        to: ReferenceInput,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> None:
+        """Add one reference to this batch.
+
+        Args:
+            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
+            from_collection: The name of the collection that should reference another object.
+            from_property: The name of the property that contains the reference.
+            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
+                For multi-target references use wvc.Reference.to_multi_target().
+            tenant: The tenant name or Tenant object to be used for this request.
+
+        Raises:
+            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
+        """
+        await super()._add_reference(
+            from_object_uuid=from_uuid,
+            from_object_collection=from_collection,
+            from_property_name=from_property,
+            to=to,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+
+class _ContextManagerWrapperAsync:
+    def __init__(self, current_batch: BatchClientAsync):
+        self.__current_batch = current_batch
+
+    async def __aexit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
+        await self.__current_batch._shutdown()
+        await self.__bg_tasks.send
+        await self.__bg_tasks.recv
+
+    async def __aenter__(self) -> BatchClientAsync:
+        self.__bg_tasks = await self.__current_batch._start()
+        return self.__current_batch
diff --git a/weaviate/collections/batch/client.py b/weaviate/collections/batch/client.py
index a86a3be10..0aaddd718 100644
--- a/weaviate/collections/batch/client.py
+++ b/weaviate/collections/batch/client.py
@@ -3,7 +3,6 @@
 
 from weaviate.collections.batch.base import (
     _BatchBase,
-    _BatchBaseNew,
     _BatchDataWrapper,
     _DynamicBatching,
     _FixedSizeBatching,
@@ -11,16 +10,20 @@
     _ServerSideBatching,
 )
 from weaviate.collections.batch.batch_wrapper import (
+    BatchClientAsync,
     BatchClientProtocol,
     _BatchMode,
     _BatchWrapper,
+    _BatchWrapperAsync,
     _ContextManagerWrapper,
+    _ContextManagerWrapperAsync,
 )
+from weaviate.collections.batch.sync import _BatchBaseSync
 from weaviate.collections.classes.config import ConsistencyLevel, Vectorizers
 from weaviate.collections.classes.internal import ReferenceInput, ReferenceInputs
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.collections.classes.types import WeaviateProperties
-from weaviate.connect.v4 import ConnectionSync
+from weaviate.connect.v4 import ConnectionAsync, ConnectionSync
 from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateUnsupportedFeatureError
 from weaviate.types import UUID, VECTORS
 
@@ -102,7 +105,7 @@ def add_reference(
         )
 
 
-class _BatchClientNew(_BatchBaseNew):
+class _BatchClientSync(_BatchBaseSync):
     def add_object(
         self,
         collection: str,
@@ -177,10 +180,11 @@ def add_reference(
 
 
 BatchClient = _BatchClient
-BatchClientNew = _BatchClientNew
+BatchClientSync = _BatchClientSync
 ClientBatchingContextManager = _ContextManagerWrapper[
-    Union[BatchClient, BatchClientNew], BatchClientProtocol
+    Union[BatchClient, BatchClientSync], BatchClientProtocol
 ]
+AsyncClientBatchingContextManager = _ContextManagerWrapperAsync
 
 
 class _BatchClientWrapper(_BatchWrapper):
@@ -197,7 +201,7 @@ def __init__(
         # define one executor per client with it shared between all child batch contexts
 
     def __create_batch_and_reset(
-        self, batch_client: Union[Type[_BatchClient], Type[_BatchClientNew]]
+        self, batch_client: Union[Type[_BatchClient], Type[_BatchClientSync]]
     ):
         if self._vectorizer_batching is None or not self._vectorizer_batching:
             try:
@@ -311,4 +315,47 @@ def experimental(
             concurrency=1,  # hard-code until client-side multi-threading is fixed
         )
         self._consistency_level = consistency_level
-        return self.__create_batch_and_reset(_BatchClientNew)
+        return self.__create_batch_and_reset(_BatchClientSync)
+
+
+class _BatchClientWrapperAsync(_BatchWrapperAsync):
+    def __init__(
+        self,
+        connection: ConnectionAsync,
+    ):
+        super().__init__(connection, None)
+        self._vectorizer_batching: Optional[bool] = None
+
+    def __create_batch_and_reset(self):
+        self._batch_data = _BatchDataWrapper()  # clear old data
+        return _ContextManagerWrapperAsync(
+            BatchClientAsync(
+                connection=self._connection,
+                consistency_level=self._consistency_level,
+                results=self._batch_data,
+                batch_mode=self._batch_mode,
+            )
+        )
+
+    def experimental(
+        self,
+        *,
+        concurrency: Optional[int] = None,
+        consistency_level: Optional[ConsistencyLevel] = None,
+    ) -> AsyncClientBatchingContextManager:
+        """Configure the batching context manager using the experimental server-side batching mode.
+
+        When you exit the context manager, the final batch will be sent automatically.
+        """
+        if self._connection._weaviate_version.is_lower_than(1, 34, 0):
+            raise WeaviateUnsupportedFeatureError(
+                "Server-side batching", str(self._connection._weaviate_version), "1.34.0"
+            )
+        self._batch_mode = _ServerSideBatching(
+            # concurrency=concurrency
+            # if concurrency is not None
+            # else len(self._cluster.get_nodes_status())
+            concurrency=1,  # hard-code until client-side multi-threading is fixed
+        )
+        self._consistency_level = consistency_level
+        return self.__create_batch_and_reset()
diff --git a/weaviate/collections/batch/collection.py b/weaviate/collections/batch/collection.py
index 6abe4aaac..dcca3d9d7 100644
--- a/weaviate/collections/batch/collection.py
+++ b/weaviate/collections/batch/collection.py
@@ -3,7 +3,6 @@
 
 from weaviate.collections.batch.base import (
     _BatchBase,
-    _BatchBaseNew,
     _BatchDataWrapper,
     _BatchMode,
     _DynamicBatching,
@@ -16,6 +15,7 @@
     _BatchWrapper,
     _ContextManagerWrapper,
 )
+from weaviate.collections.batch.sync import _BatchBaseSync
 from weaviate.collections.classes.config import ConsistencyLevel, Vectorizers
 from weaviate.collections.classes.internal import ReferenceInput, ReferenceInputs
 from weaviate.collections.classes.types import Properties
@@ -78,7 +78,7 @@ def add_reference(
         )
 
 
-class _BatchCollectionNew(Generic[Properties], _BatchBaseNew):
+class _BatchCollectionSync(Generic[Properties], _BatchBaseSync):
     def __init__(
         self,
         executor: ThreadPoolExecutor,
@@ -161,9 +161,9 @@ def add_reference(
 
 
 BatchCollection = _BatchCollection
-BatchCollectionNew = _BatchCollectionNew
+BatchCollectionSync = _BatchCollectionSync
 CollectionBatchingContextManager = _ContextManagerWrapper[
-    Union[BatchCollection[Properties], BatchCollectionNew[Properties]],
+    Union[BatchCollection[Properties], BatchCollectionSync[Properties]],
     BatchCollectionProtocol[Properties],
 ]
 
@@ -177,7 +177,7 @@ def __init__(
         tenant: Optional[str],
         config: "_ConfigCollection",
         batch_client: Union[
-            Type[_BatchCollection[Properties]], Type[_BatchCollectionNew[Properties]]
+            Type[_BatchCollection[Properties]], Type[_BatchCollectionSync[Properties]]
         ],
     ) -> None:
         super().__init__(connection, consistency_level)
@@ -192,7 +192,7 @@ def __init__(
     def __create_batch_and_reset(
         self,
         batch_client: Union[
-            Type[_BatchCollection[Properties]], Type[_BatchCollectionNew[Properties]]
+            Type[_BatchCollection[Properties]], Type[_BatchCollectionSync[Properties]]
         ],
     ):
         if self._vectorizer_batching is None:
@@ -278,4 +278,4 @@ def experimental(
             # else len(self._cluster.get_nodes_status())
             concurrency=1,  # hard-code until client-side multi-threading is fixed
         )
-        return self.__create_batch_and_reset(_BatchCollectionNew)
+        return self.__create_batch_and_reset(_BatchCollectionSync)
diff --git a/weaviate/collections/batch/grpc_batch.py b/weaviate/collections/batch/grpc_batch.py
index 7384dcb49..6f01b2287 100644
--- a/weaviate/collections/batch/grpc_batch.py
+++ b/weaviate/collections/batch/grpc_batch.py
@@ -20,7 +20,7 @@
 from weaviate.collections.grpc.shared import _BaseGRPC, _is_1d_vector, _Pack
 from weaviate.connect import executor
 from weaviate.connect.base import MAX_GRPC_MESSAGE_LENGTH
-from weaviate.connect.v4 import Connection, ConnectionSync
+from weaviate.connect.v4 import Connection, ConnectionAsync, ConnectionSync
 from weaviate.exceptions import (
     WeaviateInsertInvalidPropertyError,
     WeaviateInsertManyAllFailedError,
@@ -203,8 +203,8 @@ def stream(
         connection: ConnectionSync,
         *,
         requests: Generator[batch_pb2.BatchStreamRequest, None, None],
-    ) -> Generator[batch_pb2.BatchStreamReply, None, None]:
-        """Start a new stream for receiving messages about the ongoing server-side batching from Weaviate.
+    ):
+        """Start a new sync stream for send/recv messages about the ongoing server-side batching from Weaviate.
 
         Args:
             connection: The connection to the Weaviate instance.
@@ -212,6 +212,17 @@ def stream(
         """
         return connection.grpc_batch_stream(requests=requests)
 
+    def astream(
+        self,
+        connection: ConnectionAsync,
+    ):
+        """Start a new async stream for send/recv messages about the ongoing server-side batching from Weaviate.
+
+        Args:
+            connection: The connection to the Weaviate instance.
+        """
+        return connection.grpc_batch_stream()
+
     def __translate_properties_from_python_to_grpc(
         self, data: Dict[str, Any], refs: ReferenceInputs
     ) -> batch_pb2.BatchObject.Properties:
diff --git a/weaviate/collections/batch/sync.py b/weaviate/collections/batch/sync.py
new file mode 100644
index 000000000..3c9c24f25
--- /dev/null
+++ b/weaviate/collections/batch/sync.py
@@ -0,0 +1,557 @@
+import threading
+import time
+import uuid as uuid_package
+from concurrent.futures import ThreadPoolExecutor
+from queue import Queue
+from typing import Generator, List, Optional, Set, Union
+
+from pydantic import ValidationError
+
+from weaviate.collections.batch.base import (
+    ObjectsBatchRequest,
+    ReferencesBatchRequest,
+    _BatchDataWrapper,
+    _BatchMode,
+    _BgThreads,
+    _ServerSideBatching,
+)
+from weaviate.collections.batch.grpc_batch import _BatchGRPC
+from weaviate.collections.classes.batch import (
+    BatchObject,
+    BatchObjectReturn,
+    BatchReference,
+    ErrorObject,
+    ErrorReference,
+    Shard,
+)
+from weaviate.collections.classes.config import ConsistencyLevel
+from weaviate.collections.classes.internal import (
+    ReferenceInput,
+    ReferenceInputs,
+    ReferenceToMulti,
+)
+from weaviate.collections.classes.types import WeaviateProperties
+from weaviate.connect.v4 import ConnectionSync
+from weaviate.exceptions import (
+    WeaviateBatchStreamError,
+    WeaviateBatchValidationError,
+    WeaviateGRPCUnavailableError,
+    WeaviateStartUpError,
+)
+from weaviate.logger import logger
+from weaviate.proto.v1 import batch_pb2
+from weaviate.types import UUID, VECTORS
+
+
+class _BatchBaseSync:
+    def __init__(
+        self,
+        connection: ConnectionSync,
+        consistency_level: Optional[ConsistencyLevel],
+        results: _BatchDataWrapper,
+        batch_mode: _BatchMode,
+        executor: ThreadPoolExecutor,
+        vectorizer_batching: bool,
+        objects: Optional[ObjectsBatchRequest[batch_pb2.BatchObject]] = None,
+        references: Optional[ReferencesBatchRequest] = None,
+    ) -> None:
+        self.__batch_objects = objects or ObjectsBatchRequest[batch_pb2.BatchObject]()
+        self.__batch_references = references or ReferencesBatchRequest[batch_pb2.BatchReference]()
+
+        self.__connection = connection
+        self.__consistency_level: ConsistencyLevel = consistency_level or ConsistencyLevel.QUORUM
+        self.__batch_size = 100
+
+        self.__batch_grpc = _BatchGRPC(
+            connection._weaviate_version, self.__consistency_level, connection._grpc_max_msg_size
+        )
+
+        # lookup table for objects that are currently being processed - is used to not send references from objects that have not been added yet
+        self.__uuid_lookup: Set[str] = set()
+
+        # we do not want that users can access the results directly as they are not thread-safe
+        self.__results_for_wrapper_backup = results
+        self.__results_for_wrapper = _BatchDataWrapper()
+
+        self.__objs_count = 0
+        self.__refs_count = 0
+
+        self.__uuid_lookup_lock = threading.Lock()
+        self.__results_lock = threading.Lock()
+
+        self.__bg_thread_exception: Optional[Exception] = None
+        self.__is_shutting_down = threading.Event()
+        self.__is_shutdown = threading.Event()
+
+        self.__objs_cache_lock = threading.Lock()
+        self.__refs_cache_lock = threading.Lock()
+        self.__objs_cache: dict[str, BatchObject] = {}
+        self.__refs_cache: dict[int, BatchReference] = {}
+
+        # maxsize=1 so that __batch_send does not run faster than generator for __batch_recv
+        # thereby using too much buffer in case of server-side shutdown
+        self.__reqs: Queue[Optional[batch_pb2.BatchStreamRequest]] = Queue(maxsize=1)
+
+        self.__stop = False
+
+        self.__batch_mode = batch_mode
+
+        self.__total = 0
+
+    @property
+    def number_errors(self) -> int:
+        """Return the number of errors in the batch."""
+        return len(self.__results_for_wrapper.failed_objects) + len(
+            self.__results_for_wrapper.failed_references
+        )
+
+    def __all_threads_alive(self) -> bool:
+        return self.__bg_threads is not None and all(
+            thread.is_alive() for thread in self.__bg_threads
+        )
+
+    def __any_threads_alive(self) -> bool:
+        return self.__bg_threads is not None and any(
+            thread.is_alive() for thread in self.__bg_threads
+        )
+
+    def _start(self) -> None:
+        assert isinstance(self.__batch_mode, _ServerSideBatching), (
+            "Only server-side batching is supported in this mode"
+        )
+        self.__bg_threads = [
+            self.__start_bg_threads() for _ in range(self.__batch_mode.concurrency)
+        ]
+        logger.warning(
+            f"Provisioned {len(self.__bg_threads)} stream(s) to the server for batch processing"
+        )
+        now = time.time()
+        while not self.__all_threads_alive():
+            # wait for the stream to be started by __batch_stream
+            time.sleep(0.01)
+            if time.time() - now > 10:
+                raise WeaviateBatchValidationError(
+                    "Batch stream was not started within 10 seconds. Please check your connection."
+                )
+
+    def _shutdown(self) -> None:
+        # Shutdown the current batch and wait for all requests to be finished
+        self.flush()
+        self.__stop = True
+
+        # we are done, wait for bg threads to finish
+        # self.__batch_stream will set the shutdown event when it receives
+        # the stop message from the server
+        while self.__any_threads_alive():
+            time.sleep(1)
+        logger.warning("Send & receive threads finished.")
+
+        # copy the results to the public results
+        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
+        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
+        self.__results_for_wrapper_backup.failed_references = (
+            self.__results_for_wrapper.failed_references
+        )
+        self.__results_for_wrapper_backup.imported_shards = (
+            self.__results_for_wrapper.imported_shards
+        )
+
+    def __batch_send(self) -> None:
+        refresh_time: float = 0.01
+        while (
+            self.__shut_background_thread_down is not None
+            and not self.__shut_background_thread_down.is_set()
+        ):
+            if len(self.__batch_objects) + len(self.__batch_references) > 0:
+                self._batch_send = True
+                start = time.time()
+                while (len_o := len(self.__batch_objects)) + (
+                    len_r := len(self.__batch_references)
+                ) < self.__batch_size:
+                    # wait for more objects to be added up to the batch size
+                    time.sleep(0.01)
+                    if (
+                        self.__shut_background_thread_down is not None
+                        and self.__shut_background_thread_down.is_set()
+                    ):
+                        logger.warning("Threads were shutdown, exiting batch send loop")
+                        # shutdown was requested, exit early
+                        self.__reqs.put(None)
+                        return
+                    if time.time() - start >= 1 and (
+                        len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
+                    ):
+                        # no new objects were added in the last second, exit the loop
+                        break
+
+                objs = self.__batch_objects.pop_items(self.__batch_size)
+                refs = self.__batch_references.pop_items(
+                    self.__batch_size - len(objs),
+                    uuid_lookup=self.__uuid_lookup,
+                )
+                with self.__uuid_lookup_lock:
+                    self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
+
+                for req in self.__generate_stream_requests(objs, refs):
+                    logged = False
+                    while self.__is_shutting_down.is_set() or self.__is_shutdown.is_set():
+                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
+                        # so that the connection is refreshed to a new node where the objects can be accepted
+                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
+                        if not logged:
+                            logger.warning("Waiting for stream to be re-established...")
+                            logged = True
+                            # put sentinel into our queue to signal the end of the current stream
+                            self.__reqs.put(None)
+                        time.sleep(1)
+                    if logged:
+                        logger.warning("Stream re-established, resuming sending batches")
+                    self.__reqs.put(req)
+            elif self.__stop:
+                # we are done, send the sentinel into our queue to be consumed by the batch sender
+                self.__reqs.put(None)  # signal the end of the stream
+                logger.warning("Batching finished, sent stop signal to batch stream")
+                return
+            time.sleep(refresh_time)
+
+    def __generate_stream_requests(
+        self,
+        objs: List[batch_pb2.BatchObject],
+        refs: List[batch_pb2.BatchReference],
+    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
+        per_object_overhead = 4  # extra overhead bytes per object in the request
+
+        def request_maker():
+            return batch_pb2.BatchStreamRequest()
+
+        request = request_maker()
+        total_size = request.ByteSize()
+
+        for obj in objs:
+            obj_size = obj.ByteSize() + per_object_overhead
+
+            if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.objects.values.append(obj)
+            total_size += obj_size
+
+        for ref in refs:
+            ref_size = ref.ByteSize() + per_object_overhead
+
+            if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
+                yield request
+                request = request_maker()
+                total_size = request.ByteSize()
+
+            request.data.references.values.append(ref)
+            total_size += ref_size
+
+        if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
+            yield request
+
+    def __generate_stream_requests_for_grpc(
+        self,
+    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
+        yield batch_pb2.BatchStreamRequest(
+            start=batch_pb2.BatchStreamRequest.Start(
+                consistency_level=self.__batch_grpc._consistency_level,
+            ),
+        )
+        while (
+            self.__shut_background_thread_down is not None
+            and not self.__shut_background_thread_down.is_set()
+        ):
+            req = self.__reqs.get()
+            if req is not None:
+                self.__total += len(req.data.objects.values) + len(req.data.references.values)
+                yield req
+                continue
+            if self.__stop and not (
+                self.__is_shutting_down.is_set() or self.__is_shutdown.is_set()
+            ):
+                logger.warning("Batching finished, closing the client-side of the stream")
+                yield batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop())
+                return
+            if self.__is_shutting_down.is_set():
+                logger.warning("Server shutting down, closing the client-side of the stream")
+                return
+            logger.warning("Received sentinel, but not stopping, continuing...")
+
+    def __batch_recv(self) -> None:
+        for message in self.__batch_grpc.stream(
+            connection=self.__connection,
+            requests=self.__generate_stream_requests_for_grpc(),
+        ):
+            if message.HasField("started"):
+                logger.warning("Batch stream started successfully")
+                for threads in self.__bg_threads:
+                    threads.start_send()
+            if message.HasField("backoff"):
+                if (
+                    message.backoff.batch_size != self.__batch_size
+                    and not self.__is_shutting_down.is_set()
+                    and not self.__is_shutdown.is_set()
+                    and not self.__stop
+                ):
+                    self.__batch_size = message.backoff.batch_size
+                    logger.warning(
+                        f"Updated batch size to {self.__batch_size} as per server request"
+                    )
+            if message.HasField("results"):
+                result_objs = BatchObjectReturn()
+                # result_refs = BatchReferenceReturn()
+                failed_objs: List[ErrorObject] = []
+                failed_refs: List[ErrorReference] = []
+                for error in message.results.errors:
+                    if error.HasField("uuid"):
+                        try:
+                            cached = self.__objs_cache.pop(error.uuid)
+                        except KeyError:
+                            continue
+                        err = ErrorObject(
+                            message=error.error,
+                            object_=cached,
+                        )
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[err],
+                            errors={cached.index: err},
+                        )
+                        failed_objs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "object": error.uuid,
+                                "action": "use {client,collection}.batch.failed_objects to access this error",
+                            }
+                        )
+                    if error.HasField("beacon"):
+                        # TODO: get cached ref from beacon
+                        err = ErrorReference(
+                            message=error.error,
+                            reference=error.beacon,  # pyright: ignore
+                        )
+                        failed_refs.append(err)
+                        logger.warning(
+                            {
+                                "error": error.error,
+                                "reference": error.beacon,
+                                "action": "use {client,collection}.batch.failed_references to access this error",
+                            }
+                        )
+                for success in message.results.successes:
+                    if success.HasField("uuid"):
+                        try:
+                            cached = self.__objs_cache.pop(success.uuid)
+                        except KeyError:
+                            continue
+                        uuid = uuid_package.UUID(success.uuid)
+                        result_objs += BatchObjectReturn(
+                            _all_responses=[uuid],
+                            uuids={cached.index: uuid},
+                        )
+                    if success.HasField("beacon"):
+                        # TODO: remove cached ref using beacon
+                        # self.__refs_cache.pop(success.beacon, None)
+                        pass
+                with self.__results_lock:
+                    self.__results_for_wrapper.results.objs += result_objs
+                    self.__results_for_wrapper.failed_objects.extend(failed_objs)
+                    self.__results_for_wrapper.failed_references.extend(failed_refs)
+            elif message.HasField("shutting_down"):
+                logger.warning(
+                    "Received shutting down message from server, pausing sending until stream is re-established"
+                )
+                self.__is_shutting_down.set()
+            elif message.HasField("shutdown"):
+                logger.warning("Received shutdown finished message from server")
+                self.__is_shutdown.set()
+                self.__is_shutting_down.clear()
+                self.__reconnect()
+
+        # restart the stream if we were shutdown by the node we were connected to ensuring that the index is
+        # propagated properly from it to the new one
+        if self.__is_shutdown.is_set():
+            logger.warning("Restarting batch recv after shutdown...")
+            self.__is_shutdown.clear()
+            return self.__batch_recv()
+        else:
+            logger.warning("Server closed the stream from its side, shutting down batch")
+            return
+
+    def __reconnect(self, retry: int = 0) -> None:
+        try:
+            logger.warning(f"Trying to reconnect after shutdown... {retry + 1}/{5}")
+            self.__connection.close("sync")
+            self.__connection.connect(force=True)
+            logger.warning("Reconnected successfully")
+        except (WeaviateStartUpError, WeaviateGRPCUnavailableError) as e:
+            if retry < 5:
+                time.sleep(2**retry)
+                self.__reconnect(retry + 1)
+            else:
+                logger.error("Failed to reconnect after 5 attempts")
+                self.__bg_thread_exception = e
+
+    def __start_bg_threads(self) -> _BgThreads:
+        """Create a background thread that periodically checks how congested the batch queue is."""
+        self.__shut_background_thread_down = threading.Event()
+
+        def batch_send_wrapper() -> None:
+            try:
+                self.__batch_send()
+                logger.warning("exited batch send thread")
+            except Exception as e:
+                logger.error(e)
+                self.__bg_thread_exception = e
+
+        def batch_recv_wrapper() -> None:
+            socket_hung_up = False
+            try:
+                self.__batch_recv()
+                logger.warning("exited batch receive thread")
+            except Exception as e:
+                if isinstance(e, WeaviateBatchStreamError) and (
+                    "Socket closed" in e.message or "context canceled" in e.message
+                ):
+                    socket_hung_up = True
+                else:
+                    logger.error(e)
+                    logger.error(type(e))
+                    self.__bg_thread_exception = e
+            if socket_hung_up:
+                # this happens during ungraceful shutdown of the coordinator
+                # lets restart the stream and add the cached objects again
+                logger.warning("Stream closed unexpectedly, restarting...")
+                self.__reconnect()
+                # server sets this whenever it restarts, gracefully or unexpectedly, so need to clear it now
+                self.__is_shutting_down.clear()
+                with self.__objs_cache_lock:
+                    logger.warning(
+                        f"Re-adding {len(self.__objs_cache)} cached objects to the batch"
+                    )
+                    self.__batch_objects.prepend(
+                        [
+                            self.__batch_grpc.grpc_object(o._to_internal())
+                            for o in self.__objs_cache.values()
+                        ]
+                    )
+                with self.__refs_cache_lock:
+                    self.__batch_references.prepend(
+                        [
+                            self.__batch_grpc.grpc_reference(o._to_internal())
+                            for o in self.__refs_cache.values()
+                        ]
+                    )
+                # start a new stream with a newly reconnected channel
+                return batch_recv_wrapper()
+
+        threads = _BgThreads(
+            send=threading.Thread(
+                target=batch_send_wrapper,
+                daemon=True,
+                name="BgBatchSend",
+            ),
+            recv=threading.Thread(
+                target=batch_recv_wrapper,
+                daemon=True,
+                name="BgBatchRecv",
+            ),
+        )
+        threads.start_recv()
+        return threads
+
+    def flush(self) -> None:
+        """Flush the batch queue and wait for all requests to be finished."""
+        # bg thread is sending objs+refs automatically, so simply wait for everything to be done
+        while len(self.__batch_objects) > 0 or len(self.__batch_references) > 0:
+            time.sleep(0.01)
+            self.__check_bg_threads_alive()
+
+    def _add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[str] = None,
+    ) -> UUID:
+        self.__check_bg_threads_alive()
+        try:
+            batch_object = BatchObject(
+                collection=collection,
+                properties=properties,
+                references=references,
+                uuid=uuid,
+                vector=vector,
+                tenant=tenant,
+                index=self.__objs_count,
+            )
+            self.__results_for_wrapper.imported_shards.add(
+                Shard(collection=collection, tenant=tenant)
+            )
+        except ValidationError as e:
+            raise WeaviateBatchValidationError(repr(e))
+        uuid = str(batch_object.uuid)
+        with self.__uuid_lookup_lock:
+            self.__uuid_lookup.add(uuid)
+        self.__batch_objects.add(self.__batch_grpc.grpc_object(batch_object._to_internal()))
+        with self.__objs_cache_lock:
+            self.__objs_cache[uuid] = batch_object
+        self.__objs_count += 1
+
+        # block if queue gets too long or weaviate is overloaded - reading files is faster them sending them so we do
+        # not need a long queue
+        while len(self.__batch_objects) >= self.__batch_size * 2:
+            self.__check_bg_threads_alive()
+            time.sleep(0.01)
+
+        assert batch_object.uuid is not None
+        return batch_object.uuid
+
+    def _add_reference(
+        self,
+        from_object_uuid: UUID,
+        from_object_collection: str,
+        from_property_name: str,
+        to: ReferenceInput,
+        tenant: Optional[str] = None,
+    ) -> None:
+        self.__check_bg_threads_alive()
+        if isinstance(to, ReferenceToMulti):
+            to_strs: Union[List[str], List[UUID]] = to.uuids_str
+        elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
+            to_strs = [to]
+        else:
+            to_strs = list(to)
+
+        for uid in to_strs:
+            try:
+                batch_reference = BatchReference(
+                    from_object_collection=from_object_collection,
+                    from_object_uuid=from_object_uuid,
+                    from_property_name=from_property_name,
+                    to_object_collection=(
+                        to.target_collection if isinstance(to, ReferenceToMulti) else None
+                    ),
+                    to_object_uuid=uid,
+                    tenant=tenant,
+                    index=self.__refs_count,
+                )
+            except ValidationError as e:
+                raise WeaviateBatchValidationError(repr(e))
+            self.__batch_references.add(
+                self.__batch_grpc.grpc_reference(batch_reference._to_internal())
+            )
+            with self.__refs_cache_lock:
+                self.__refs_cache[self.__refs_count] = batch_reference
+                self.__refs_count += 1
+
+    def __check_bg_threads_alive(self) -> None:
+        if self.__any_threads_alive():
+            return
+
+        raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
diff --git a/weaviate/collections/collection/sync.py b/weaviate/collections/collection/sync.py
index 88f728b30..6f9369cec 100644
--- a/weaviate/collections/collection/sync.py
+++ b/weaviate/collections/collection/sync.py
@@ -7,7 +7,7 @@
 from weaviate.collections.backups import _CollectionBackup
 from weaviate.collections.batch.collection import (
     _BatchCollection,
-    _BatchCollectionNew,
+    _BatchCollectionSync,
     _BatchCollectionWrapper,
 )
 from weaviate.collections.classes.cluster import Shard
@@ -101,10 +101,8 @@ def __init__(
             name,
             tenant,
             config,
-            batch_client=_BatchCollectionNew[Properties]
-            if connection._weaviate_version.is_at_least(
-                1, 32, 0
-            )  # todo: change to 1.33.0 when it lands
+            batch_client=_BatchCollectionSync[Properties]
+            if connection._weaviate_version.is_at_least(1, 34, 0)
             else _BatchCollection[Properties],
         )
         """This namespace contains all the functionality to upload data in batches to Weaviate for this specific collection."""
diff --git a/weaviate/connect/v4.py b/weaviate/connect/v4.py
index 3734f650a..ecdaf666b 100644
--- a/weaviate/connect/v4.py
+++ b/weaviate/connect/v4.py
@@ -20,13 +20,14 @@
     overload,
 )
 
+import grpc
 from authlib.integrations.httpx_client import (  # type: ignore
     AsyncOAuth2Client,
     OAuth2Client,
 )
 from grpc import Call, RpcError, StatusCode
 from grpc import Channel as SyncChannel  # type: ignore
-from grpc.aio import AioRpcError
+from grpc.aio import AioRpcError, StreamStreamCall
 from grpc.aio import Channel as AsyncChannel  # type: ignore
 
 # from grpclib.client import Channel
@@ -1114,8 +1115,8 @@ def grpc_aggregate(
 class ConnectionAsync(_ConnectionBase):
     """Connection class used to communicate to a weaviate instance."""
 
-    async def connect(self) -> None:
-        if self._connected:
+    async def connect(self, force: bool = False) -> None:
+        if self._connected and not force:
             return None
 
         await executor.aresult(self._open_connections_rest(self._auth, "async"))
@@ -1247,6 +1248,52 @@ async def grpc_batch_delete(
                 raise InsufficientPermissionsError(e)
             raise WeaviateDeleteManyError(str(e))
 
+    def grpc_batch_stream(
+        self,
+    ) -> StreamStreamCall[batch_pb2.BatchStreamRequest, batch_pb2.BatchStreamReply]:
+        assert isinstance(self._grpc_channel, grpc.aio.Channel)
+        return self._grpc_channel.stream_stream(
+            "/weaviate.v1.Weaviate/BatchStream",
+            request_serializer=batch_pb2.BatchStreamRequest.SerializeToString,
+            response_deserializer=batch_pb2.BatchStreamReply.FromString,
+        )(
+            request_iterator=None,
+            timeout=self.timeout_config.insert,
+            metadata=self.grpc_headers(),
+        )
+
+    async def grpc_batch_stream_write(
+        self,
+        stream: StreamStreamCall[batch_pb2.BatchStreamRequest, batch_pb2.BatchStreamReply],
+        request: batch_pb2.BatchStreamRequest,
+    ) -> None:
+        try:
+            await stream.write(request)
+        except AioRpcError as e:
+            error = cast(Call, e)
+            if error.code() == StatusCode.PERMISSION_DENIED:
+                raise InsufficientPermissionsError(error)
+            if error.code() == StatusCode.ABORTED:
+                raise _BatchStreamShutdownError()
+            raise WeaviateBatchStreamError(str(error.details()))
+
+    async def grpc_batch_stream_read(
+        self,
+        stream: StreamStreamCall[batch_pb2.BatchStreamRequest, batch_pb2.BatchStreamReply],
+    ) -> Optional[batch_pb2.BatchStreamReply]:
+        try:
+            msg = await stream.read()
+            if not isinstance(msg, batch_pb2.BatchStreamReply):
+                return None
+            return msg
+        except AioRpcError as e:
+            error = cast(Call, e)
+            if error.code() == StatusCode.PERMISSION_DENIED:
+                raise InsufficientPermissionsError(error)
+            if error.code() == StatusCode.ABORTED:
+                raise _BatchStreamShutdownError()
+            raise WeaviateBatchStreamError(str(error.details()))
+
     async def grpc_tenants_get(
         self, request: tenants_pb2.TenantsGetRequest
     ) -> tenants_pb2.TenantsGetReply:

From dcf586e3b0ef7f23ede2f06cac6e539e34c1487e Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Tue, 20 Jan 2026 15:22:36 +0000
Subject: [PATCH 13/21] Only test SSB fpr <1.36 vers

---
 integration/test_batch_v4.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index 619ef26c8..90b6588c8 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -824,8 +824,8 @@ async def test_add_one_hundred_thousand_data_objects_async(
 ) -> None:
     """Test adding one hundred thousand data objects."""
     client, name = await async_client_factory()
-    if client._connection._weaviate_version.is_lower_than(1, 34, 0):
-        pytest.skip("Server-side batching not supported in Weaviate < 1.34.0")
+    if client._connection._weaviate_version.is_lower_than(1, 36, 0):
+        pytest.skip("Server-side batching not supported in Weaviate < 1.36.0")
     nr_objects = 100000
     import time
 

From 69fb0f9b3afdec6149bd47f96f0f9a1dd575afc8 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Mon, 26 Jan 2026 13:56:49 +0000
Subject: [PATCH 14/21] Add experimental batching to async collections

---
 integration/test_batch_v4.py                |   2 +-
 integration/test_collection_batch.py        |  68 +++++++++-
 weaviate/collections/batch/batch_wrapper.py |  95 ++++++--------
 weaviate/collections/batch/client.py        | 118 ++++++------------
 weaviate/collections/batch/collection.py    | 131 +++++++++++++++-----
 weaviate/collections/collection/async_.py   |  12 ++
 weaviate/collections/collection/sync.py     |   2 +-
 7 files changed, 258 insertions(+), 170 deletions(-)

diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index 90b6588c8..b8ec61dbb 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -831,7 +831,7 @@ async def test_add_one_hundred_thousand_data_objects_async(
 
     start = time.time()
     async with client.batch.experimental(concurrency=1) as batch:
-        async for i in arange(nr_objects):
+        for i in range(nr_objects):
             await batch.add_object(
                 collection=name,
                 properties={"name": "test" + str(i)},
diff --git a/integration/test_collection_batch.py b/integration/test_collection_batch.py
index 72b3b7c53..b40a488e0 100644
--- a/integration/test_collection_batch.py
+++ b/integration/test_collection_batch.py
@@ -1,10 +1,10 @@
 import uuid
 from dataclasses import dataclass
-from typing import Any, Generator, Optional, Protocol, Union
+from typing import Any, Awaitable, Generator, Optional, Protocol, Union
 
 import pytest
 
-from integration.conftest import CollectionFactory, CollectionFactoryGet
+from integration.conftest import AsyncCollectionFactory, CollectionFactory, CollectionFactoryGet
 from weaviate.collections import Collection
 from weaviate.collections.classes.config import (
     Configure,
@@ -17,6 +17,8 @@
 from weaviate.collections.classes.tenants import Tenant
 from weaviate.types import VECTORS
 
+from weaviate.collections.collection.async_ import CollectionAsync
+
 UUID = Union[str, uuid.UUID]
 
 
@@ -55,11 +57,21 @@ def __call__(self, name: str = "", multi_tenancy: bool = False) -> Collection[An
         ...
 
 
+class BatchCollectionAsync(Protocol):
+    """Typing for fixture."""
+
+    def __call__(
+        self, name: str = "", multi_tenancy: bool = False
+    ) -> Awaitable[CollectionAsync[Any, Any]]:
+        """Typing for fixture."""
+        ...
+
+
 @pytest.fixture
 def batch_collection(
     collection_factory: CollectionFactory,
 ) -> Generator[BatchCollection, None, None]:
-    def _factory(name: str = "", multi_tenancy: bool = False) -> Collection[Any, Any]:
+    def _factory(name: str = "", multi_tenancy: bool = False):
         collection = collection_factory(
             name=name,
             vectorizer_config=Configure.Vectorizer.none(),
@@ -78,6 +90,29 @@ def _factory(name: str = "", multi_tenancy: bool = False) -> Collection[Any, Any
     yield _factory
 
 
+@pytest.fixture
+def batch_collection_async(
+    async_collection_factory: AsyncCollectionFactory,
+) -> Generator[BatchCollectionAsync, None, None]:
+    async def _factory(name: str = "", multi_tenancy: bool = False):
+        collection = await async_collection_factory(
+            name=name,
+            vectorizer_config=Configure.Vectorizer.none(),
+            properties=[
+                Property(name="name", data_type=DataType.TEXT),
+                Property(name="age", data_type=DataType.INT),
+            ],
+            multi_tenancy_config=Configure.multi_tenancy(multi_tenancy),
+        )
+        await collection.config.add_reference(
+            ReferenceProperty(name="test", target_collection=collection.name)
+        )
+
+        return collection
+
+    yield _factory
+
+
 @pytest.mark.parametrize(
     "vector",
     [None, [1, 2, 3], MockNumpyTorch([1, 2, 3]), MockTensorFlow([1, 2, 3])],
@@ -233,3 +268,30 @@ def test_non_existant_collection(collection_factory_get: CollectionFactoryGet) -
 
     # above should not throw - depending on the autoschema config this might create an error or
     # not, so we do not check for errors here
+
+
+@pytest.mark.asyncio
+async def test_add_one_hundred_thousand_data_objects_async(
+    batch_collection_async: BatchCollectionAsync,
+) -> None:
+    """Test adding one hundred thousand data objects."""
+    col = await batch_collection_async()
+    if col._connection._weaviate_version.is_lower_than(1, 36, 0):
+        pytest.skip("Server-side batching not supported in Weaviate < 1.36.0")
+    nr_objects = 100000
+    import time
+
+    start = time.time()
+    async with col.batch.experimental() as batch:
+        for i in range(nr_objects):
+            await batch.add_object(
+                properties={"name": "test" + str(i)},
+            )
+    end = time.time()
+    print(f"Time taken to add {nr_objects} objects: {end - start} seconds")
+    assert len(col.batch.results.objs.errors) == 0
+    assert len(col.batch.results.objs.all_responses) == nr_objects
+    assert len(col.batch.results.objs.uuids) == nr_objects
+    assert await col.length() == nr_objects
+    assert col.batch.results.objs.has_errors is False
+    assert len(col.batch.failed_objects) == 0, [obj.message for obj in col.batch.failed_objects]
diff --git a/weaviate/collections/batch/batch_wrapper.py b/weaviate/collections/batch/batch_wrapper.py
index f8e40395c..88bf2dc6f 100644
--- a/weaviate/collections/batch/batch_wrapper.py
+++ b/weaviate/collections/batch/batch_wrapper.py
@@ -444,50 +444,27 @@ def number_errors(self) -> int:
         ...
 
 
-T = TypeVar("T", bound=Union[_BatchBase, _BatchBaseSync])
-P = TypeVar("P", bound=Union[BatchClientProtocol, BatchCollectionProtocol[Properties]])
-
-
-class _ContextManagerWrapper(Generic[T, P]):
-    def __init__(self, current_batch: T):
-        self.__current_batch: T = current_batch
-
-    def __exit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
-        self.__current_batch._shutdown()
-
-    def __enter__(self) -> P:
-        self.__current_batch._start()
-        return self.__current_batch  # pyright: ignore[reportReturnType]
-
-
-class BatchClientAsync(_BatchBaseAsync):
+class BatchCollectionProtocolAsync(Generic[Properties], Protocol[Properties]):
     async def add_object(
         self,
-        collection: str,
-        properties: Optional[WeaviateProperties] = None,
+        properties: Optional[Properties] = None,
         references: Optional[ReferenceInputs] = None,
         uuid: Optional[UUID] = None,
         vector: Optional[VECTORS] = None,
-        tenant: Optional[Union[str, Tenant]] = None,
     ) -> UUID:
         """Add one object to this batch.
 
-        NOTE: If the UUID of one of the objects already exists then the existing object will be
-        replaced by the new object.
+        NOTE: If the UUID of one of the objects already exists then the existing object will be replaced by the new object.
 
         Args:
-            collection: The name of the collection this object belongs to.
             properties: The data properties of the object to be added as a dictionary.
             references: The references of the object to be added as a dictionary.
-            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
-                If it is None an UUIDv4 will generated, by default None
+            uuid: The UUID of the object as an uuid.UUID object or str. If it is None an UUIDv4 will generated, by default None
             vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
                 vector was generated using the _identical_ vectorization module that is configured for the class. In this
-                case this vector takes precedence.
-                Supported types are:
+                case this vector takes precedence. Supported types are:
                 - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
                 - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
-            tenant: The tenant name or Tenant object to be used for this request.
 
         Returns:
             The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
@@ -495,47 +472,53 @@ async def add_object(
         Raises:
             WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
         """
-        return await super()._add_object(
-            collection=collection,
-            properties=properties,
-            references=references,
-            uuid=uuid,
-            vector=vector,
-            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
-        )
+        ...
 
     async def add_reference(
-        self,
-        from_uuid: UUID,
-        from_collection: str,
-        from_property: str,
-        to: ReferenceInput,
-        tenant: Optional[Union[str, Tenant]] = None,
+        self, from_uuid: UUID, from_property: str, to: Union[ReferenceInput, List[UUID]]
     ) -> None:
-        """Add one reference to this batch.
+        """Add a reference to this batch.
 
         Args:
             from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
-            from_collection: The name of the collection that should reference another object.
             from_property: The name of the property that contains the reference.
             to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
                 For multi-target references use wvc.Reference.to_multi_target().
-            tenant: The tenant name or Tenant object to be used for this request.
 
         Raises:
             WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
         """
-        await super()._add_reference(
-            from_object_uuid=from_uuid,
-            from_object_collection=from_collection,
-            from_property_name=from_property,
-            to=to,
-            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
-        )
+        ...
+
+    @property
+    def number_errors(self) -> int:
+        """Get the number of errors in the current batch.
+
+        Returns:
+            The number of errors in the current batch.
+        """
+        ...
 
 
-class _ContextManagerWrapperAsync:
-    def __init__(self, current_batch: BatchClientAsync):
+T = TypeVar("T", bound=Union[_BatchBase, _BatchBaseSync])
+P = TypeVar("P", bound=Union[BatchClientProtocol, BatchCollectionProtocol[Properties]])
+Q = TypeVar("Q", bound=Union[BatchClientProtocolAsync, BatchCollectionProtocolAsync[Properties]])
+
+
+class _ContextManagerWrapper(Generic[T, P]):
+    def __init__(self, current_batch: T):
+        self.__current_batch: T = current_batch
+
+    def __exit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
+        self.__current_batch._shutdown()
+
+    def __enter__(self) -> P:
+        self.__current_batch._start()
+        return self.__current_batch  # pyright: ignore[reportReturnType]
+
+
+class _ContextManagerWrapperAsync(Generic[Q]):
+    def __init__(self, current_batch: _BatchBaseAsync):
         self.__current_batch = current_batch
 
     async def __aexit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
@@ -543,6 +526,6 @@ async def __aexit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
         await self.__bg_tasks.send
         await self.__bg_tasks.recv
 
-    async def __aenter__(self) -> BatchClientAsync:
+    async def __aenter__(self) -> Q:
         self.__bg_tasks = await self.__current_batch._start()
-        return self.__current_batch
+        return self.__current_batch  # pyright: ignore[reportReturnType]
diff --git a/weaviate/collections/batch/client.py b/weaviate/collections/batch/client.py
index 0aaddd718..8a34431dd 100644
--- a/weaviate/collections/batch/client.py
+++ b/weaviate/collections/batch/client.py
@@ -1,6 +1,7 @@
 from concurrent.futures import ThreadPoolExecutor
 from typing import TYPE_CHECKING, Optional, Type, Union
 
+from weaviate.collections.batch.async_ import _BatchBaseAsync
 from weaviate.collections.batch.base import (
     _BatchBase,
     _BatchDataWrapper,
@@ -10,8 +11,8 @@
     _ServerSideBatching,
 )
 from weaviate.collections.batch.batch_wrapper import (
-    BatchClientAsync,
     BatchClientProtocol,
+    BatchClientProtocolAsync,
     _BatchMode,
     _BatchWrapper,
     _BatchWrapperAsync,
@@ -41,31 +42,6 @@ def add_object(
         vector: Optional[VECTORS] = None,
         tenant: Optional[Union[str, Tenant]] = None,
     ) -> UUID:
-        """Add one object to this batch.
-
-        NOTE: If the UUID of one of the objects already exists then the existing object will be
-        replaced by the new object.
-
-        Args:
-            collection: The name of the collection this object belongs to.
-            properties: The data properties of the object to be added as a dictionary.
-            references: The references of the object to be added as a dictionary.
-            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
-                If it is None an UUIDv4 will generated, by default None
-            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
-                vector was generated using the _identical_ vectorization module that is configured for the class. In this
-                case this vector takes precedence.
-                Supported types are:
-                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
-                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
-            tenant: The tenant name or Tenant object to be used for this request.
-
-        Returns:
-            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
-
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
         return super()._add_object(
             collection=collection,
             properties=properties,
@@ -83,19 +59,6 @@ def add_reference(
         to: ReferenceInput,
         tenant: Optional[Union[str, Tenant]] = None,
     ) -> None:
-        """Add one reference to this batch.
-
-        Args:
-            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
-            from_collection: The name of the collection that should reference another object.
-            from_property: The name of the property that contains the reference.
-            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
-                For multi-target references use wvc.Reference.to_multi_target().
-            tenant: The tenant name or Tenant object to be used for this request.
-
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
         super()._add_reference(
             from_object_uuid=from_uuid,
             from_object_collection=from_collection,
@@ -115,31 +78,6 @@ def add_object(
         vector: Optional[VECTORS] = None,
         tenant: Optional[Union[str, Tenant]] = None,
     ) -> UUID:
-        """Add one object to this batch.
-
-        NOTE: If the UUID of one of the objects already exists then the existing object will be
-        replaced by the new object.
-
-        Args:
-            collection: The name of the collection this object belongs to.
-            properties: The data properties of the object to be added as a dictionary.
-            references: The references of the object to be added as a dictionary.
-            uuid: The UUID of the object as an uuid.UUID object or str. It can be a Weaviate beacon or Weaviate href.
-                If it is None an UUIDv4 will generated, by default None
-            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
-                vector was generated using the _identical_ vectorization module that is configured for the class. In this
-                case this vector takes precedence.
-                Supported types are:
-                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
-                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
-            tenant: The tenant name or Tenant object to be used for this request.
-
-        Returns:
-            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
-
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
         return super()._add_object(
             collection=collection,
             properties=properties,
@@ -157,19 +95,6 @@ def add_reference(
         to: ReferenceInput,
         tenant: Optional[Union[str, Tenant]] = None,
     ) -> None:
-        """Add one reference to this batch.
-
-        Args:
-            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
-            from_collection: The name of the collection that should reference another object.
-            from_property: The name of the property that contains the reference.
-            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
-                For multi-target references use wvc.Reference.to_multi_target().
-            tenant: The tenant name or Tenant object to be used for this request.
-
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
         super()._add_reference(
             from_object_uuid=from_uuid,
             from_object_collection=from_collection,
@@ -179,12 +104,49 @@ def add_reference(
         )
 
 
+class _BatchClientAsync(_BatchBaseAsync):
+    async def add_object(
+        self,
+        collection: str,
+        properties: Optional[WeaviateProperties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> UUID:
+        return await super()._add_object(
+            collection=collection,
+            properties=properties,
+            references=references,
+            uuid=uuid,
+            vector=vector,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+    async def add_reference(
+        self,
+        from_uuid: UUID,
+        from_collection: str,
+        from_property: str,
+        to: ReferenceInput,
+        tenant: Optional[Union[str, Tenant]] = None,
+    ) -> None:
+        await super()._add_reference(
+            from_object_uuid=from_uuid,
+            from_object_collection=from_collection,
+            from_property_name=from_property,
+            to=to,
+            tenant=tenant.name if isinstance(tenant, Tenant) else tenant,
+        )
+
+
 BatchClient = _BatchClient
 BatchClientSync = _BatchClientSync
+BatchClientAsync = _BatchClientAsync
 ClientBatchingContextManager = _ContextManagerWrapper[
     Union[BatchClient, BatchClientSync], BatchClientProtocol
 ]
-AsyncClientBatchingContextManager = _ContextManagerWrapperAsync
+AsyncClientBatchingContextManager = _ContextManagerWrapperAsync[BatchClientProtocolAsync]
 
 
 class _BatchClientWrapper(_BatchWrapper):
diff --git a/weaviate/collections/batch/collection.py b/weaviate/collections/batch/collection.py
index dcca3d9d7..f877203ae 100644
--- a/weaviate/collections/batch/collection.py
+++ b/weaviate/collections/batch/collection.py
@@ -1,6 +1,7 @@
 from concurrent.futures import ThreadPoolExecutor
 from typing import TYPE_CHECKING, Generic, List, Optional, Type, Union
 
+from weaviate.collections.batch.async_ import _BatchBaseAsync
 from weaviate.collections.batch.base import (
     _BatchBase,
     _BatchDataWrapper,
@@ -12,14 +13,17 @@
 )
 from weaviate.collections.batch.batch_wrapper import (
     BatchCollectionProtocol,
+    BatchCollectionProtocolAsync,
     _BatchWrapper,
+    _BatchWrapperAsync,
     _ContextManagerWrapper,
+    _ContextManagerWrapperAsync,
 )
 from weaviate.collections.batch.sync import _BatchBaseSync
 from weaviate.collections.classes.config import ConsistencyLevel, Vectorizers
 from weaviate.collections.classes.internal import ReferenceInput, ReferenceInputs
 from weaviate.collections.classes.types import Properties
-from weaviate.connect.v4 import ConnectionSync
+from weaviate.connect.v4 import ConnectionAsync, ConnectionSync
 from weaviate.exceptions import UnexpectedStatusCodeError, WeaviateUnsupportedFeatureError
 from weaviate.types import UUID, VECTORS
 
@@ -108,26 +112,6 @@ def add_object(
         uuid: Optional[UUID] = None,
         vector: Optional[VECTORS] = None,
     ) -> UUID:
-        """Add one object to this batch.
-
-        NOTE: If the UUID of one of the objects already exists then the existing object will be replaced by the new object.
-
-        Args:
-            properties: The data properties of the object to be added as a dictionary.
-            references: The references of the object to be added as a dictionary.
-            uuid: The UUID of the object as an uuid.UUID object or str. If it is None an UUIDv4 will generated, by default None
-            vector: The embedding of the object. Can be used when a collection does not have a vectorization module or the given
-                vector was generated using the _identical_ vectorization module that is configured for the class. In this
-                case this vector takes precedence. Supported types are:
-                - for single vectors: `list`, 'numpy.ndarray`, `torch.Tensor` and `tf.Tensor`, by default None.
-                - for named vectors: Dict[str, *list above*], where the string is the name of the vector.
-
-        Returns:
-            The UUID of the added object. If one was not provided a UUIDv4 will be auto-generated for you and returned here.
-
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
         return self._add_object(
             collection=self.__name,
             properties=properties,
@@ -140,18 +124,54 @@ def add_object(
     def add_reference(
         self, from_uuid: UUID, from_property: str, to: Union[ReferenceInput, List[UUID]]
     ) -> None:
-        """Add a reference to this batch.
+        self._add_reference(
+            from_uuid,
+            self.__name,
+            from_property,
+            to,
+            self.__tenant,
+        )
 
-        Args:
-            from_uuid: The UUID of the object, as an uuid.UUID object or str, that should reference another object.
-            from_property: The name of the property that contains the reference.
-            to: The UUID of the referenced object, as an uuid.UUID object or str, that is actually referenced.
-                For multi-target references use wvc.Reference.to_multi_target().
 
-        Raises:
-            WeaviateBatchValidationError: If the provided options are in the format required by Weaviate.
-        """
-        self._add_reference(
+class _BatchCollectionAsync(Generic[Properties], _BatchBaseAsync):
+    def __init__(
+        self,
+        connection: ConnectionAsync,
+        consistency_level: Optional[ConsistencyLevel],
+        results: _BatchDataWrapper,
+        batch_mode: _BatchMode,
+        name: str,
+        tenant: Optional[str],
+    ) -> None:
+        super().__init__(
+            connection=connection,
+            consistency_level=consistency_level,
+            results=results,
+            batch_mode=batch_mode,
+        )
+        self.__name = name
+        self.__tenant = tenant
+
+    async def add_object(
+        self,
+        properties: Optional[Properties] = None,
+        references: Optional[ReferenceInputs] = None,
+        uuid: Optional[UUID] = None,
+        vector: Optional[VECTORS] = None,
+    ) -> UUID:
+        return await self._add_object(
+            collection=self.__name,
+            properties=properties,
+            references=references,
+            uuid=uuid,
+            vector=vector,
+            tenant=self.__tenant,
+        )
+
+    async def add_reference(
+        self, from_uuid: UUID, from_property: str, to: Union[ReferenceInput, List[UUID]]
+    ) -> None:
+        await self._add_reference(
             from_uuid,
             self.__name,
             from_property,
@@ -162,10 +182,14 @@ def add_reference(
 
 BatchCollection = _BatchCollection
 BatchCollectionSync = _BatchCollectionSync
+BatchCollectionAsync = _BatchCollectionAsync
 CollectionBatchingContextManager = _ContextManagerWrapper[
     Union[BatchCollection[Properties], BatchCollectionSync[Properties]],
     BatchCollectionProtocol[Properties],
 ]
+CollectionBatchingContextManagerAsync = _ContextManagerWrapperAsync[
+    BatchCollectionProtocolAsync[Properties]
+]
 
 
 class _BatchCollectionWrapper(Generic[Properties], _BatchWrapper):
@@ -279,3 +303,48 @@ def experimental(
             concurrency=1,  # hard-code until client-side multi-threading is fixed
         )
         return self.__create_batch_and_reset(_BatchCollectionSync)
+
+
+class _BatchCollectionWrapperAsync(Generic[Properties], _BatchWrapperAsync):
+    def __init__(
+        self,
+        connection: ConnectionAsync,
+        consistency_level: Optional[ConsistencyLevel],
+        name: str,
+        tenant: Optional[str],
+    ) -> None:
+        super().__init__(connection, consistency_level)
+        self.__name = name
+        self.__tenant = tenant
+
+    def __create_batch_and_reset(self):
+        self._batch_data = _BatchDataWrapper()  # clear old data
+        return _ContextManagerWrapperAsync(
+            BatchCollectionAsync(
+                connection=self._connection,
+                consistency_level=self._consistency_level,
+                results=self._batch_data,
+                batch_mode=self._batch_mode,
+                name=self.__name,
+                tenant=self.__tenant,
+            )
+        )
+
+    def experimental(
+        self,
+    ) -> CollectionBatchingContextManagerAsync[Properties]:
+        """Configure the batching context manager using the experimental server-side batching mode.
+
+        When you exit the context manager, the final batch will be sent automatically.
+        """
+        if self._connection._weaviate_version.is_lower_than(1, 34, 0):
+            raise WeaviateUnsupportedFeatureError(
+                "Server-side batching", str(self._connection._weaviate_version), "1.34.0"
+            )
+        self._batch_mode = _ServerSideBatching(
+            # concurrency=concurrency
+            # if concurrency is not None
+            # else len(self._cluster.get_nodes_status())
+            concurrency=1,  # hard-code until client-side multi-threading is fixed
+        )
+        return self.__create_batch_and_reset()
diff --git a/weaviate/collections/collection/async_.py b/weaviate/collections/collection/async_.py
index 47ff6d2d1..2c0cea5b0 100644
--- a/weaviate/collections/collection/async_.py
+++ b/weaviate/collections/collection/async_.py
@@ -5,6 +5,9 @@
 from weaviate.cluster import _ClusterAsync
 from weaviate.collections.aggregate import _AggregateCollectionAsync
 from weaviate.collections.backups import _CollectionBackupAsync
+from weaviate.collections.batch.collection import (
+    _BatchCollectionWrapperAsync,
+)
 from weaviate.collections.classes.cluster import Shard
 from weaviate.collections.classes.config import ConsistencyLevel
 from weaviate.collections.classes.grpc import METADATA, PROPERTIES, REFERENCES
@@ -77,6 +80,15 @@ def __init__(
         """This namespace includes all the querying methods available to you when using Weaviate's standard aggregation capabilities."""
         self.backup: _CollectionBackupAsync = _CollectionBackupAsync(connection, name)
         """This namespace includes all the backup methods available to you when backing up a collection in Weaviate."""
+        self.batch: _BatchCollectionWrapperAsync[Properties] = _BatchCollectionWrapperAsync[
+            Properties
+        ](
+            connection,
+            consistency_level,
+            name,
+            tenant,
+        )
+        """This namespace contains all the functionality to upload data in batches to Weaviate for this specific collection."""
         self.config = _ConfigCollectionAsync(connection, name, tenant)
         """This namespace includes all the CRUD methods available to you when modifying the configuration of the collection in Weaviate."""
         self.data = _DataCollectionAsync[Properties](
diff --git a/weaviate/collections/collection/sync.py b/weaviate/collections/collection/sync.py
index 6f9369cec..d50c0c2b5 100644
--- a/weaviate/collections/collection/sync.py
+++ b/weaviate/collections/collection/sync.py
@@ -102,7 +102,7 @@ def __init__(
             tenant,
             config,
             batch_client=_BatchCollectionSync[Properties]
-            if connection._weaviate_version.is_at_least(1, 34, 0)
+            if connection._weaviate_version.is_at_least(1, 36, 0)
             else _BatchCollection[Properties],
         )
         """This namespace contains all the functionality to upload data in batches to Weaviate for this specific collection."""

From d77e31ce9d8a7745a9c3e07b53f70fc6a96dd434 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Mon, 26 Jan 2026 16:33:19 +0000
Subject: [PATCH 15/21] Rename test funcs to avoid naming collisions

---
 integration/test_batch_v4.py         | 2 +-
 integration/test_collection_batch.py | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index b8ec61dbb..66794514c 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -819,7 +819,7 @@ def test_references_with_to_uuids(client_factory: ClientFactory) -> None:
 
 
 @pytest.mark.asyncio
-async def test_add_one_hundred_thousand_data_objects_async(
+async def test_add_one_hundred_thousand_objects_async_client(
     async_client_factory: AsyncClientFactory,
 ) -> None:
     """Test adding one hundred thousand data objects."""
diff --git a/integration/test_collection_batch.py b/integration/test_collection_batch.py
index b40a488e0..ca0eb2116 100644
--- a/integration/test_collection_batch.py
+++ b/integration/test_collection_batch.py
@@ -271,7 +271,7 @@ def test_non_existant_collection(collection_factory_get: CollectionFactoryGet) -
 
 
 @pytest.mark.asyncio
-async def test_add_one_hundred_thousand_data_objects_async(
+async def test_add_one_hundred_thousand_objects_async_collection(
     batch_collection_async: BatchCollectionAsync,
 ) -> None:
     """Test adding one hundred thousand data objects."""

From 18496b91fb5adffb9a942f3fc8ec87087325ebfb Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Wed, 28 Jan 2026 15:00:20 +0000
Subject: [PATCH 16/21] Align async/sync impls: - with new features in 1.36 -
 overall code structure to ease comprehension between the two

---
 integration/test_batch_v4.py                |   7 -
 weaviate/collections/batch/async_.py        | 221 +++++++++++++-------
 weaviate/collections/batch/base.py          |  22 +-
 weaviate/collections/batch/batch_wrapper.py |   7 +-
 weaviate/collections/batch/client.py        |   1 -
 weaviate/collections/batch/collection.py    |   3 -
 weaviate/collections/batch/sync.py          |  80 +++----
 7 files changed, 187 insertions(+), 154 deletions(-)

diff --git a/integration/test_batch_v4.py b/integration/test_batch_v4.py
index 66794514c..8cb175884 100644
--- a/integration/test_batch_v4.py
+++ b/integration/test_batch_v4.py
@@ -1,4 +1,3 @@
-import asyncio
 import concurrent.futures
 import uuid
 from dataclasses import dataclass
@@ -847,9 +846,3 @@ async def test_add_one_hundred_thousand_objects_async_client(
         obj.message for obj in client.batch.failed_objects
     ]
     await client.collections.delete(name)
-
-
-async def arange(count):
-    for i in range(count):
-        yield i
-        await asyncio.sleep(0.0)
diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
index 9533b25ea..8824cb94a 100644
--- a/weaviate/collections/batch/async_.py
+++ b/weaviate/collections/batch/async_.py
@@ -2,7 +2,7 @@
 import time
 import uuid as uuid_package
 from typing import (
-    AsyncGenerator,
+    Generator,
     List,
     Optional,
     Set,
@@ -12,17 +12,17 @@
 from pydantic import ValidationError
 
 from weaviate.collections.batch.base import (
+    GCP_STREAM_TIMEOUT,
     ObjectsBatchRequest,
     ReferencesBatchRequest,
     _BatchDataWrapper,
-    _BatchMode,
-    _ServerSideBatching,
 )
 from weaviate.collections.batch.grpc_batch import _BatchGRPC
 from weaviate.collections.classes.batch import (
     BatchObject,
     BatchObjectReturn,
     BatchReference,
+    BatchReferenceReturn,
     ErrorObject,
     ErrorReference,
     Shard,
@@ -47,9 +47,12 @@
 
 
 class _BgTasks:
-    def __init__(self, send: asyncio.Task[None], recv: asyncio.Task[None]) -> None:
+    def __init__(
+        self, send: asyncio.Task[None], recv: asyncio.Task[None], loop: asyncio.Task[None]
+    ) -> None:
         self.send = send
         self.recv = recv
+        self.loop = loop
 
 
 class _BatchBaseAsync:
@@ -58,14 +61,16 @@ def __init__(
         connection: ConnectionAsync,
         consistency_level: Optional[ConsistencyLevel],
         results: _BatchDataWrapper,
-        batch_mode: _BatchMode,
         objects: Optional[ObjectsBatchRequest[BatchObject]] = None,
-        references: Optional[ReferencesBatchRequest] = None,
+        references: Optional[ReferencesBatchRequest[BatchReference]] = None,
     ) -> None:
         self.__batch_objects = objects or ObjectsBatchRequest[BatchObject]()
         self.__batch_references = references or ReferencesBatchRequest[BatchReference]()
 
         self.__connection = connection
+        self.__is_gcp_on_wcd = connection._connection_params.is_gcp_on_wcd()
+        self.__stream_start: Optional[float] = None
+        self.__is_renewing_stream = asyncio.Event()
         self.__consistency_level: ConsistencyLevel = consistency_level or ConsistencyLevel.QUORUM
         self.__batch_size = 100
 
@@ -84,19 +89,24 @@ def __init__(
         self.__objs_count = 0
         self.__refs_count = 0
 
-        self.__uuid_lookup_lock = asyncio.Lock()
-
+        self.__is_oom = asyncio.Event()
         self.__is_shutting_down = asyncio.Event()
         self.__is_shutdown = asyncio.Event()
 
-        self.__objs_cache_lock = asyncio.Lock()
-        self.__refs_cache_lock = asyncio.Lock()
         self.__objs_cache: dict[str, BatchObject] = {}
-        self.__refs_cache: dict[int, BatchReference] = {}
+        self.__refs_cache: dict[str, BatchReference] = {}
 
-        self.__stop = False
+        self.__inflight_objs: set[str] = set()
+        self.__inflight_refs: set[str] = set()
 
-        self.__batch_mode = batch_mode
+        # maxsize=1 so that __send does not run faster than generator for __recv
+        # thereby using too much buffer in case of server-side shutdown
+        self.__reqs: asyncio.Queue[Optional[batch_pb2.BatchStreamRequest]] = asyncio.Queue(
+            maxsize=1
+        )
+
+        self.__stop = False
+        self.__shutdown_send_task = asyncio.Event()
 
     @property
     def number_errors(self) -> int:
@@ -106,10 +116,6 @@ def number_errors(self) -> int:
         )
 
     async def _start(self):
-        assert isinstance(self.__batch_mode, _ServerSideBatching), (
-            "Only server-side batching is supported in this mode"
-        )
-
         async def send_wrapper() -> None:
             try:
                 await self.__send()
@@ -118,6 +124,14 @@ async def send_wrapper() -> None:
                 logger.error(e)
                 self.__bg_thread_exception = e
 
+        async def loop_wrapper() -> None:
+            try:
+                await self.__loop()
+                logger.warning("exited batch loop thread")
+            except Exception as e:
+                logger.error(e)
+                self.__bg_thread_exception = e
+
         async def recv_wrapper() -> None:
             socket_hung_up = False
             try:
@@ -139,18 +153,15 @@ async def recv_wrapper() -> None:
                 await self.__reconnect()
                 # server sets this whenever it restarts, gracefully or unexpectedly, so need to clear it now
                 self.__is_shutting_down.clear()
-                with self.__objs_cache_lock:
-                    logger.warning(
-                        f"Re-adding {len(self.__objs_cache)} cached objects to the batch"
-                    )
-                    await self.__batch_objects.aprepend(list(self.__objs_cache.values()))
-                with self.__refs_cache_lock:
-                    await self.__batch_references.aprepend(list(self.__refs_cache.values()))
+                await self.__batch_objects.aprepend(list(self.__objs_cache.values()))
+                await self.__batch_references.aprepend(list(self.__refs_cache.values()))
                 # start a new stream with a newly reconnected channel
                 return await recv_wrapper()
 
         return _BgTasks(
-            send=asyncio.create_task(send_wrapper()), recv=asyncio.create_task(recv_wrapper())
+            send=asyncio.create_task(send_wrapper()),
+            recv=asyncio.create_task(recv_wrapper()),
+            loop=asyncio.create_task(loop_wrapper()),
         )
 
     async def _shutdown(self) -> None:
@@ -168,63 +179,48 @@ async def _shutdown(self) -> None:
             self.__results_for_wrapper.imported_shards
         )
 
-    async def __send(self) -> None:
+    async def __loop(self) -> None:
         refresh_time: float = 0.01
-        await self.__connection.grpc_batch_stream_write(
-            self.__stream, batch_pb2.BatchStreamRequest(start=batch_pb2.BatchStreamRequest.Start())
-        )
         while True:
             if len(self.__batch_objects) + len(self.__batch_references) > 0:
+                self._batch_send = True
                 start = time.time()
                 while (len_o := len(self.__batch_objects)) + (
                     len_r := len(self.__batch_references)
                 ) < self.__batch_size:
                     # wait for more objects to be added up to the batch size
                     await asyncio.sleep(0.01)
+                    if self.__shutdown_send_task.is_set():
+                        logger.warning("Tasks were shutdown, exiting batch send loop")
+                        # shutdown was requested, exit early
+                        await self.__reqs.put(None)
+                        return
                     if time.time() - start >= 1 and (
                         len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
                     ):
                         # no new objects were added in the last second, exit the loop
                         break
 
-                objs = await self.__batch_objects.apop_items(self.__batch_size)
-                refs = await self.__batch_references.apop_items(
+                objs = self.__batch_objects.pop_items(self.__batch_size)
+                refs = self.__batch_references.pop_items(
                     self.__batch_size - len(objs),
                     uuid_lookup=self.__uuid_lookup,
                 )
-                async with self.__uuid_lookup_lock:
-                    self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
-
-                async for req in self.__generate_stream_requests(objs, refs):
-                    logged = False
-                    while self.__is_shutting_down.is_set() or self.__is_shutdown.is_set():
-                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
-                        # so that the connection is refreshed to a new node where the objects can be accepted
-                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
-                        if not logged:
-                            logger.warning("Waiting for stream to be re-established...")
-                            logged = True
-                            # put sentinel into our queue to signal the end of the current stream
-                            await self.__stream.done_writing()
-                        await asyncio.sleep(1)
-                    if logged:
-                        logger.warning("Stream re-established, resuming sending batches")
-                    await self.__connection.grpc_batch_stream_write(self.__stream, req)
+
+                for req in self.__generate_stream_requests(objs, refs):
+                    await self.__reqs.put(req)
             elif self.__stop:
-                await self.__connection.grpc_batch_stream_write(
-                    self.__stream,
-                    batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
-                )
-                await self.__stream.done_writing()
+                # we are done, send the sentinel into our queue to be consumed by the batch sender
+                await self.__reqs.put(None)  # signal the end of the stream
                 logger.warning("Batching finished, sent stop signal to batch stream")
                 return
             await asyncio.sleep(refresh_time)
 
-    async def __generate_stream_requests(
+    def __generate_stream_requests(
         self,
         objects: List[BatchObject],
         references: List[BatchReference],
-    ) -> AsyncGenerator[batch_pb2.BatchStreamRequest, None]:
+    ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
         per_object_overhead = 4  # extra overhead bytes per object in the request
 
         def request_maker():
@@ -233,36 +229,83 @@ def request_maker():
         request = request_maker()
         total_size = request.ByteSize()
 
+        inflight_objs = set()
+        inflight_refs = set()
         for object_ in objects:
             obj = self.__batch_grpc.grpc_object(object_._to_internal())
             obj_size = obj.ByteSize() + per_object_overhead
 
             if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
-                await asyncio.sleep(0)  # yield control to event loop
                 yield request
                 request = request_maker()
                 total_size = request.ByteSize()
 
             request.data.objects.values.append(obj)
             total_size += obj_size
+            inflight_objs.add(obj.uuid)
 
         for reference in references:
             ref = self.__batch_grpc.grpc_reference(reference._to_internal())
             ref_size = ref.ByteSize() + per_object_overhead
 
             if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
-                await asyncio.sleep(0)  # yield control to event loop
                 yield request
                 request = request_maker()
                 total_size = request.ByteSize()
 
             request.data.references.values.append(ref)
             total_size += ref_size
+            inflight_refs.add(reference._to_beacon())
+
+        self.__inflight_objs.update(inflight_objs)
+        self.__inflight_refs.update(inflight_refs)
 
         if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
-            await asyncio.sleep(0)  # yield control to event loop
             yield request
 
+    async def __send(self):
+        await self.__connection.grpc_batch_stream_write(
+            stream=self.__stream,
+            request=batch_pb2.BatchStreamRequest(
+                start=batch_pb2.BatchStreamRequest.Start(
+                    consistency_level=self.__batch_grpc._consistency_level,
+                ),
+            ),
+        )
+        while True:
+            if self.__is_gcp_on_wcd:
+                assert self.__stream_start is not None
+                if time.time() - self.__stream_start > GCP_STREAM_TIMEOUT:
+                    logger.warning(
+                        "GCP connections have a maximum lifetime. Re-establishing the batch stream to avoid timeout errors."
+                    )
+                    await self.__connection.grpc_batch_stream_write(
+                        self.__stream,
+                        batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
+                    )
+                    self.__is_renewing_stream.set()
+                    return
+            req = await self.__reqs.get()
+            if req is not None:
+                await self.__connection.grpc_batch_stream_write(self.__stream, req)
+                continue
+            if self.__stop and not (
+                self.__is_shutting_down.is_set() or self.__is_shutdown.is_set()
+            ):
+                logger.warning("Batching finished, closing the client-side of the stream")
+                await self.__connection.grpc_batch_stream_write(
+                    self.__stream,
+                    batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
+                )
+                return
+            if self.__is_shutting_down.is_set():
+                logger.warning("Server shutting down, closing the client-side of the stream")
+                return
+            if self.__is_oom.is_set():
+                logger.warning("Server out-of-memory, closing the client-side of the stream")
+                return
+            logger.warning("Received sentinel, but not stopping, continuing...")
+
     async def __recv(self) -> None:
         while True:
             message = await self.__connection.grpc_batch_stream_read(self.__stream)
@@ -282,16 +325,19 @@ async def __recv(self) -> None:
                     logger.warning(
                         f"Updated batch size to {self.__batch_size} as per server request"
                     )
+            if message.HasField("acks"):
+                self.__inflight_objs.difference_update(message.acks.uuids)
+                self.__uuid_lookup.difference_update(message.acks.uuids)
+                self.__inflight_refs.difference_update(message.acks.beacons)
             if message.HasField("results"):
                 result_objs = BatchObjectReturn()
-                # result_refs = BatchReferenceReturn()
+                result_refs = BatchReferenceReturn()
                 failed_objs: List[ErrorObject] = []
                 failed_refs: List[ErrorReference] = []
                 for error in message.results.errors:
                     if error.HasField("uuid"):
                         try:
-                            async with self.__objs_cache_lock:
-                                cached = self.__objs_cache.pop(error.uuid)
+                            cached = self.__objs_cache.pop(error.uuid)
                         except KeyError:
                             continue
                         err = ErrorObject(
@@ -311,10 +357,16 @@ async def __recv(self) -> None:
                             }
                         )
                     if error.HasField("beacon"):
-                        # TODO: get cached ref from beacon
+                        try:
+                            cached = self.__refs_cache.pop(error.beacon)
+                        except KeyError:
+                            continue
                         err = ErrorReference(
                             message=error.error,
-                            reference=error.beacon,  # pyright: ignore
+                            reference=cached,
+                        )
+                        result_refs += BatchReferenceReturn(
+                            errors={cached.index: err},
                         )
                         failed_refs.append(err)
                         logger.warning(
@@ -327,8 +379,7 @@ async def __recv(self) -> None:
                 for success in message.results.successes:
                     if success.HasField("uuid"):
                         try:
-                            async with self.__objs_cache_lock:
-                                cached = self.__objs_cache.pop(success.uuid)
+                            cached = self.__objs_cache.pop(success.uuid)
                         except KeyError:
                             continue
                         uuid = uuid_package.UUID(success.uuid)
@@ -337,18 +388,31 @@ async def __recv(self) -> None:
                             uuids={cached.index: uuid},
                         )
                     if success.HasField("beacon"):
-                        # TODO: remove cached ref using beacon
-                        # self.__refs_cache.pop(success.beacon, None)
-                        pass
+                        try:
+                            self.__refs_cache.pop(success.beacon, None)
+                        except KeyError:
+                            continue
                 self.__results_for_wrapper.results.objs += result_objs
+                self.__results_for_wrapper.results.refs += result_refs
                 self.__results_for_wrapper.failed_objects.extend(failed_objs)
                 self.__results_for_wrapper.failed_references.extend(failed_refs)
-            elif message.HasField("shutting_down"):
+            if message.HasField("out_of_memory"):
+                logger.warning(
+                    "Server reported out-of-memory error. Batching will wait at most 10 minutes for the server to scale-up. If the server does not recover within this time, the batch will terminate with an error."
+                )
+                self.__is_oom.set()
+                await self.__batch_objects.aprepend(
+                    [self.__objs_cache[uuid] for uuid in message.out_of_memory.uuids]
+                )
+                await self.__batch_references.aprepend(
+                    [self.__refs_cache[beacon] for beacon in message.out_of_memory.beacons]
+                )
+            if message.HasField("shutting_down"):
                 logger.warning(
                     "Received shutting down message from server, pausing sending until stream is re-established"
                 )
                 self.__is_shutting_down.set()
-            elif message.HasField("shutdown"):
+            if message.HasField("shutdown"):
                 logger.warning("Received shutdown finished message from server")
                 self.__is_shutdown.set()
                 self.__is_shutting_down.clear()
@@ -406,14 +470,12 @@ async def _add_object(
         except ValidationError as e:
             raise WeaviateBatchValidationError(repr(e))
         uuid = str(batch_object.uuid)
-        async with self.__uuid_lookup_lock:
-            self.__uuid_lookup.add(uuid)
+        self.__uuid_lookup.add(uuid)
         await self.__batch_objects.aadd(batch_object)
-        async with self.__objs_cache_lock:
-            self.__objs_cache[uuid] = batch_object
+        self.__objs_cache[uuid] = batch_object
         self.__objs_count += 1
 
-        while len(self.__batch_objects) >= self.__batch_size * 2:
+        while len(self.__inflight_objs) >= self.__batch_size:
             await asyncio.sleep(0.01)
 
         assert batch_object.uuid is not None
@@ -450,6 +512,7 @@ async def _add_reference(
             except ValidationError as e:
                 raise WeaviateBatchValidationError(repr(e))
             await self.__batch_references.aadd(batch_reference)
-            async with self.__refs_cache_lock:
-                self.__refs_cache[self.__refs_count] = batch_reference
-                self.__refs_count += 1
+            self.__refs_cache[batch_reference._to_beacon()] = batch_reference
+            self.__refs_count += 1
+            while len(self.__inflight_refs) >= self.__batch_size * 2:
+                await asyncio.sleep(0.01)
diff --git a/weaviate/collections/batch/base.py b/weaviate/collections/batch/base.py
index cef0e952e..ab4dddd14 100644
--- a/weaviate/collections/batch/base.py
+++ b/weaviate/collections/batch/base.py
@@ -863,29 +863,29 @@ def __check_bg_thread_alive(self) -> None:
 
 
 class _BgThreads:
-    def __init__(self, send: threading.Thread, recv: threading.Thread):
-        self.send = send
+    def __init__(self, loop: threading.Thread, recv: threading.Thread):
+        self.loop = loop
         self.recv = recv
         self.__started_recv = False
-        self.__started_send = False
+        self.__started_loop = False
 
     def start_recv(self) -> None:
         if not self.__started_recv:
             self.recv.start()
             self.__started_recv = True
 
-    def start_send(self) -> None:
-        if not self.__started_send:
-            self.send.start()
-            self.__started_send = True
+    def start_loop(self) -> None:
+        if not self.__started_loop:
+            self.loop.start()
+            self.__started_loop = True
 
     def is_alive(self) -> bool:
         """Check if the background threads are still alive."""
-        return self.send_alive() or self.recv_alive()
+        return self.loop_alive() or self.recv_alive()
 
-    def send_alive(self) -> bool:
-        """Check if the send background thread is still alive."""
-        return self.send.is_alive()
+    def loop_alive(self) -> bool:
+        """Check if the loop background thread is still alive."""
+        return self.loop.is_alive()
 
     def recv_alive(self) -> bool:
         """Check if the recv background thread is still alive."""
diff --git a/weaviate/collections/batch/batch_wrapper.py b/weaviate/collections/batch/batch_wrapper.py
index 88bf2dc6f..f991a6f51 100644
--- a/weaviate/collections/batch/batch_wrapper.py
+++ b/weaviate/collections/batch/batch_wrapper.py
@@ -523,8 +523,11 @@ def __init__(self, current_batch: _BatchBaseAsync):
 
     async def __aexit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
         await self.__current_batch._shutdown()
-        await self.__bg_tasks.send
-        await self.__bg_tasks.recv
+        await asyncio.gather(
+            self.__bg_tasks.send,
+            self.__bg_tasks.recv,
+            self.__bg_tasks.loop,
+        )
 
     async def __aenter__(self) -> Q:
         self.__bg_tasks = await self.__current_batch._start()
diff --git a/weaviate/collections/batch/client.py b/weaviate/collections/batch/client.py
index 8a34431dd..ca4126d8d 100644
--- a/weaviate/collections/batch/client.py
+++ b/weaviate/collections/batch/client.py
@@ -295,7 +295,6 @@ def __create_batch_and_reset(self):
                 connection=self._connection,
                 consistency_level=self._consistency_level,
                 results=self._batch_data,
-                batch_mode=self._batch_mode,
             )
         )
 
diff --git a/weaviate/collections/batch/collection.py b/weaviate/collections/batch/collection.py
index f877203ae..e06531680 100644
--- a/weaviate/collections/batch/collection.py
+++ b/weaviate/collections/batch/collection.py
@@ -139,7 +139,6 @@ def __init__(
         connection: ConnectionAsync,
         consistency_level: Optional[ConsistencyLevel],
         results: _BatchDataWrapper,
-        batch_mode: _BatchMode,
         name: str,
         tenant: Optional[str],
     ) -> None:
@@ -147,7 +146,6 @@ def __init__(
             connection=connection,
             consistency_level=consistency_level,
             results=results,
-            batch_mode=batch_mode,
         )
         self.__name = name
         self.__tenant = tenant
@@ -324,7 +322,6 @@ def __create_batch_and_reset(self):
                 connection=self._connection,
                 consistency_level=self._consistency_level,
                 results=self._batch_data,
-                batch_mode=self._batch_mode,
                 name=self.__name,
                 tenant=self.__tenant,
             )
diff --git a/weaviate/collections/batch/sync.py b/weaviate/collections/batch/sync.py
index ea1ee8f61..78d143594 100644
--- a/weaviate/collections/batch/sync.py
+++ b/weaviate/collections/batch/sync.py
@@ -36,7 +36,6 @@
 from weaviate.collections.classes.types import WeaviateProperties
 from weaviate.connect.v4 import ConnectionSync
 from weaviate.exceptions import (
-    WeaviateBatchFailedToReestablishStreamError,
     WeaviateBatchStreamError,
     WeaviateBatchValidationError,
     WeaviateGRPCUnavailableError,
@@ -110,8 +109,6 @@ def __init__(
 
         self.__batch_mode = batch_mode
 
-        self.__total = 0
-
     @property
     def number_errors(self) -> int:
         """Return the number of errors in the batch."""
@@ -170,7 +167,7 @@ def _shutdown(self) -> None:
             self.__results_for_wrapper.imported_shards
         )
 
-    def __send(self) -> None:
+    def __loop(self) -> None:
         refresh_time: float = 0.01
         while (
             self.__shut_background_thread_down is not None
@@ -207,28 +204,6 @@ def __send(self) -> None:
                     self.__uuid_lookup.difference_update(obj.uuid for obj in objs)
 
                 for req in self.__generate_stream_requests(objs, refs):
-                    logged = False
-                    start = time.time()
-                    while (
-                        self.__is_oom.is_set()
-                        or self.__is_shutting_down.is_set()
-                        or self.__is_shutdown.is_set()
-                    ):
-                        # if we were shutdown by the node we were connected to, we need to wait for the stream to be restarted
-                        # so that the connection is refreshed to a new node where the objects can be accepted
-                        # otherwise, we wait until the stream has been started by __batch_stream to send the first batch
-                        if not logged:
-                            logger.warning("Waiting for stream to be re-established...")
-                            logged = True
-                            # put sentinel into our queue to signal the end of the current stream
-                            self.__reqs.put(None)
-                        time.sleep(1)
-                        if time.time() - start > 300:
-                            raise WeaviateBatchFailedToReestablishStreamError(
-                                "Batch stream was not re-established within 5 minutes. Terminating batch."
-                            )
-                    if logged:
-                        logger.warning("Stream re-established, resuming sending batches")
                     self.__reqs.put(req)
             elif self.__stop:
                 # we are done, send the sentinel into our queue to be consumed by the batch sender
@@ -266,8 +241,7 @@ def request_maker():
 
             request.data.objects.values.append(obj)
             total_size += obj_size
-            if self.__connection._weaviate_version.is_at_least(1, 35, 0):
-                inflight_objs.add(obj.uuid)
+            inflight_objs.add(obj.uuid)
 
         for reference in references:
             ref = self.__batch_grpc.grpc_reference(reference._to_internal())
@@ -280,8 +254,7 @@ def request_maker():
 
             request.data.references.values.append(ref)
             total_size += ref_size
-            if self.__connection._weaviate_version.is_at_least(1, 35, 0):
-                inflight_refs.add(reference._to_beacon())
+            inflight_refs.add(reference._to_beacon())
 
         with self.__acks_lock:
             self.__inflight_objs.update(inflight_objs)
@@ -290,7 +263,7 @@ def request_maker():
         if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
             yield request
 
-    def __generate_stream_requests_for_grpc(
+    def __send(
         self,
     ) -> Generator[batch_pb2.BatchStreamRequest, None, None]:
         yield batch_pb2.BatchStreamRequest(
@@ -313,7 +286,6 @@ def __generate_stream_requests_for_grpc(
                     return
             req = self.__reqs.get()
             if req is not None:
-                self.__total += len(req.data.objects.values) + len(req.data.references.values)
                 yield req
                 continue
             if self.__stop and not (
@@ -333,12 +305,12 @@ def __generate_stream_requests_for_grpc(
     def __recv(self) -> None:
         for message in self.__batch_grpc.stream(
             connection=self.__connection,
-            requests=self.__generate_stream_requests_for_grpc(),
+            requests=self.__send(),
         ):
             if message.HasField("started"):
                 logger.warning("Batch stream started successfully")
                 for threads in self.__bg_threads:
-                    threads.start_send()
+                    threads.start_loop()
             if message.HasField("backoff"):
                 if (
                     message.backoff.batch_size != self.__batch_size
@@ -363,7 +335,8 @@ def __recv(self) -> None:
                 for error in message.results.errors:
                     if error.HasField("uuid"):
                         try:
-                            cached = self.__objs_cache.pop(error.uuid)
+                            with self.__objs_cache_lock:
+                                cached = self.__objs_cache.pop(error.uuid)
                         except KeyError:
                             continue
                         err = ErrorObject(
@@ -384,12 +357,13 @@ def __recv(self) -> None:
                         )
                     if error.HasField("beacon"):
                         try:
-                            cached = self.__refs_cache.pop(error.beacon)
+                            with self.__refs_cache_lock:
+                                cached = self.__refs_cache.pop(error.beacon)
                         except KeyError:
                             continue
                         err = ErrorReference(
                             message=error.error,
-                            reference=error.beacon,  # pyright: ignore
+                            reference=cached,
                         )
                         failed_refs.append(err)
                         result_refs += BatchReferenceReturn(
@@ -405,7 +379,8 @@ def __recv(self) -> None:
                 for success in message.results.successes:
                     if success.HasField("uuid"):
                         try:
-                            cached = self.__objs_cache.pop(success.uuid)
+                            with self.__objs_cache_lock:
+                                cached = self.__objs_cache.pop(success.uuid)
                         except KeyError:
                             continue
                         uuid = uuid_package.UUID(success.uuid)
@@ -415,7 +390,8 @@ def __recv(self) -> None:
                         )
                     if success.HasField("beacon"):
                         try:
-                            self.__refs_cache.pop(success.beacon, None)
+                            with self.__refs_cache_lock:
+                                self.__refs_cache.pop(success.beacon, None)
                         except KeyError:
                             continue
                 with self.__results_lock:
@@ -428,12 +404,14 @@ def __recv(self) -> None:
                     "Server reported out-of-memory error. Batching will wait at most 10 minutes for the server to scale-up. If the server does not recover within this time, the batch will terminate with an error."
                 )
                 self.__is_oom.set()
-                self.__batch_objects.prepend(
-                    [self.__objs_cache[uuid] for uuid in message.out_of_memory.uuids]
-                )
-                self.__batch_references.prepend(
-                    [self.__refs_cache[beacon] for beacon in message.out_of_memory.beacons]
-                )
+                with self.__objs_cache_lock:
+                    self.__batch_objects.prepend(
+                        [self.__objs_cache[uuid] for uuid in message.out_of_memory.uuids]
+                    )
+                with self.__refs_cache_lock:
+                    self.__batch_references.prepend(
+                        [self.__refs_cache[beacon] for beacon in message.out_of_memory.beacons]
+                    )
             if message.HasField("shutting_down"):
                 logger.warning(
                     "Received shutting down message from server, pausing sending until stream is re-established"
@@ -490,10 +468,10 @@ def __start_bg_threads(self) -> _BgThreads:
         """Create a background thread that periodically checks how congested the batch queue is."""
         self.__shut_background_thread_down = threading.Event()
 
-        def send_wrapper() -> None:
+        def loop_wrapper() -> None:
             try:
-                self.__send()
-                logger.warning("exited batch send thread")
+                self.__loop()
+                logger.warning("exited batch requests loop thread")
             except Exception as e:
                 logger.error(e)
                 self.__bg_thread_exception = e
@@ -534,10 +512,10 @@ def recv_wrapper() -> None:
                 return recv_wrapper()
 
         threads = _BgThreads(
-            send=threading.Thread(
-                target=send_wrapper,
+            loop=threading.Thread(
+                target=loop_wrapper,
                 daemon=True,
-                name="BgBatchSend",
+                name="BgBatchLoop",
             ),
             recv=threading.Thread(
                 target=recv_wrapper,

From 2598ba24210db43e01eab1d4007bd319a337d2e5 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Wed, 28 Jan 2026 15:28:52 +0000
Subject: [PATCH 17/21] Add missing `stream.done_writing()` to `__send` task

---
 weaviate/collections/batch/async_.py | 13 ++++++++++---
 1 file changed, 10 insertions(+), 3 deletions(-)

diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
index 8824cb94a..ba42a4a46 100644
--- a/weaviate/collections/batch/async_.py
+++ b/weaviate/collections/batch/async_.py
@@ -236,6 +236,8 @@ def request_maker():
             obj_size = obj.ByteSize() + per_object_overhead
 
             if total_size + obj_size >= self.__batch_grpc.grpc_max_msg_size:
+                self.__inflight_objs.update(inflight_objs)
+                self.__inflight_refs.update(inflight_refs)
                 yield request
                 request = request_maker()
                 total_size = request.ByteSize()
@@ -249,6 +251,8 @@ def request_maker():
             ref_size = ref.ByteSize() + per_object_overhead
 
             if total_size + ref_size >= self.__batch_grpc.grpc_max_msg_size:
+                self.__inflight_objs.update(inflight_objs)
+                self.__inflight_refs.update(inflight_refs)
                 yield request
                 request = request_maker()
                 total_size = request.ByteSize()
@@ -257,10 +261,9 @@ def request_maker():
             total_size += ref_size
             inflight_refs.add(reference._to_beacon())
 
-        self.__inflight_objs.update(inflight_objs)
-        self.__inflight_refs.update(inflight_refs)
-
         if len(request.data.objects.values) > 0 or len(request.data.references.values) > 0:
+            self.__inflight_objs.update(inflight_objs)
+            self.__inflight_refs.update(inflight_refs)
             yield request
 
     async def __send(self):
@@ -284,6 +287,7 @@ async def __send(self):
                         batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
                     )
                     self.__is_renewing_stream.set()
+                    await self.__stream.done_writing()
                     return
             req = await self.__reqs.get()
             if req is not None:
@@ -297,12 +301,15 @@ async def __send(self):
                     self.__stream,
                     batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
                 )
+                await self.__stream.done_writing()
                 return
             if self.__is_shutting_down.is_set():
                 logger.warning("Server shutting down, closing the client-side of the stream")
+                await self.__stream.done_writing()
                 return
             if self.__is_oom.is_set():
                 logger.warning("Server out-of-memory, closing the client-side of the stream")
+                await self.__stream.done_writing()
                 return
             logger.warning("Received sentinel, but not stopping, continuing...")
 

From 2bb2659625fac81e3aed490e74ed3533761a5d33 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Wed, 28 Jan 2026 15:30:30 +0000
Subject: [PATCH 18/21] Abstract stop logic

---
 weaviate/collections/batch/async_.py | 19 +++++++++----------
 1 file changed, 9 insertions(+), 10 deletions(-)

diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
index ba42a4a46..16fe79e92 100644
--- a/weaviate/collections/batch/async_.py
+++ b/weaviate/collections/batch/async_.py
@@ -266,6 +266,13 @@ def request_maker():
             self.__inflight_refs.update(inflight_refs)
             yield request
 
+    async def __end_stream(self):
+        await self.__connection.grpc_batch_stream_write(
+            self.__stream,
+            batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
+        )
+        await self.__stream.done_writing()
+
     async def __send(self):
         await self.__connection.grpc_batch_stream_write(
             stream=self.__stream,
@@ -282,12 +289,8 @@ async def __send(self):
                     logger.warning(
                         "GCP connections have a maximum lifetime. Re-establishing the batch stream to avoid timeout errors."
                     )
-                    await self.__connection.grpc_batch_stream_write(
-                        self.__stream,
-                        batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
-                    )
                     self.__is_renewing_stream.set()
-                    await self.__stream.done_writing()
+                    await self.__end_stream()
                     return
             req = await self.__reqs.get()
             if req is not None:
@@ -297,11 +300,7 @@ async def __send(self):
                 self.__is_shutting_down.is_set() or self.__is_shutdown.is_set()
             ):
                 logger.warning("Batching finished, closing the client-side of the stream")
-                await self.__connection.grpc_batch_stream_write(
-                    self.__stream,
-                    batch_pb2.BatchStreamRequest(stop=batch_pb2.BatchStreamRequest.Stop()),
-                )
-                await self.__stream.done_writing()
+                await self.__end_stream()
                 return
             if self.__is_shutting_down.is_set():
                 logger.warning("Server shutting down, closing the client-side of the stream")

From c54ae735b5bb8d6955e83ca1ce5406fc6270a833 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Fri, 30 Jan 2026 11:36:07 +0000
Subject: [PATCH 19/21] Tidy up exception handling in sync/async batching

---
 weaviate/collections/batch/async_.py        | 64 ++++++++++++++-------
 weaviate/collections/batch/base.py          | 23 +++++---
 weaviate/collections/batch/batch_wrapper.py |  8 +--
 weaviate/collections/batch/sync.py          | 43 ++++----------
 4 files changed, 71 insertions(+), 67 deletions(-)

diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
index 16fe79e92..689b21715 100644
--- a/weaviate/collections/batch/async_.py
+++ b/weaviate/collections/batch/async_.py
@@ -54,6 +54,9 @@ def __init__(
         self.recv = recv
         self.loop = loop
 
+    def all_alive(self) -> bool:
+        return all([not self.send.done(), not self.recv.done(), not self.loop.done()])
+
 
 class _BatchBaseAsync:
     def __init__(
@@ -107,6 +110,8 @@ def __init__(
 
         self.__stop = False
         self.__shutdown_send_task = asyncio.Event()
+        self.__bg_exception: Optional[Exception] = None
+        self.__bg_tasks: Optional[_BgTasks] = None
 
     @property
     def number_errors(self) -> int:
@@ -115,6 +120,26 @@ def number_errors(self) -> int:
             self.__results_for_wrapper.failed_references
         )
 
+    def __all_tasks_alive(self) -> bool:
+        return self.__bg_tasks is not None and self.__bg_tasks.all_alive()
+
+    async def _wait(self):
+        assert self.__bg_tasks is not None
+        await asyncio.gather(
+            self.__bg_tasks.send,
+            self.__bg_tasks.recv,
+            self.__bg_tasks.loop,
+        )
+        # copy the results to the public results
+        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
+        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
+        self.__results_for_wrapper_backup.failed_references = (
+            self.__results_for_wrapper.failed_references
+        )
+        self.__results_for_wrapper_backup.imported_shards = (
+            self.__results_for_wrapper.imported_shards
+        )
+
     async def _start(self):
         async def send_wrapper() -> None:
             try:
@@ -122,7 +147,7 @@ async def send_wrapper() -> None:
                 logger.warning("exited batch send thread")
             except Exception as e:
                 logger.error(e)
-                self.__bg_thread_exception = e
+                self.__bg_exception = e
 
         async def loop_wrapper() -> None:
             try:
@@ -130,7 +155,7 @@ async def loop_wrapper() -> None:
                 logger.warning("exited batch loop thread")
             except Exception as e:
                 logger.error(e)
-                self.__bg_thread_exception = e
+                self.__bg_exception = e
 
         async def recv_wrapper() -> None:
             socket_hung_up = False
@@ -144,8 +169,7 @@ async def recv_wrapper() -> None:
                     socket_hung_up = True
                 else:
                     logger.error(e)
-                    logger.error(type(e))
-                    self.__bg_thread_exception = e
+                    self.__bg_exception = e
             if socket_hung_up:
                 # this happens during ungraceful shutdown of the coordinator
                 # lets restart the stream and add the cached objects again
@@ -158,30 +182,18 @@ async def recv_wrapper() -> None:
                 # start a new stream with a newly reconnected channel
                 return await recv_wrapper()
 
-        return _BgTasks(
+        self.__bg_tasks = _BgTasks(
             send=asyncio.create_task(send_wrapper()),
             recv=asyncio.create_task(recv_wrapper()),
             loop=asyncio.create_task(loop_wrapper()),
         )
 
     async def _shutdown(self) -> None:
-        # Shutdown the current batch and wait for all requests to be finished
-        await self.flush()
         self.__stop = True
 
-        # copy the results to the public results
-        self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
-        self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
-        self.__results_for_wrapper_backup.failed_references = (
-            self.__results_for_wrapper.failed_references
-        )
-        self.__results_for_wrapper_backup.imported_shards = (
-            self.__results_for_wrapper.imported_shards
-        )
-
     async def __loop(self) -> None:
         refresh_time: float = 0.01
-        while True:
+        while self.__bg_exception is None:
             if len(self.__batch_objects) + len(self.__batch_references) > 0:
                 self._batch_send = True
                 start = time.time()
@@ -282,7 +294,7 @@ async def __send(self):
                 ),
             ),
         )
-        while True:
+        while self.__bg_exception is None:
             if self.__is_gcp_on_wcd:
                 assert self.__stream_start is not None
                 if time.time() - self.__stream_start > GCP_STREAM_TIMEOUT:
@@ -292,7 +304,7 @@ async def __send(self):
                     self.__is_renewing_stream.set()
                     await self.__end_stream()
                     return
-            req = await self.__reqs.get()
+            req = await asyncio.wait_for(self.__reqs.get(), timeout=1)
             if req is not None:
                 await self.__connection.grpc_batch_stream_write(self.__stream, req)
                 continue
@@ -313,7 +325,7 @@ async def __send(self):
             logger.warning("Received sentinel, but not stopping, continuing...")
 
     async def __recv(self) -> None:
-        while True:
+        while self.__bg_exception is None:
             message = await self.__connection.grpc_batch_stream_read(self.__stream)
             if not isinstance(message, batch_pb2.BatchStreamReply):
                 logger.warning("Server closed the stream from its side, shutting down batch")
@@ -460,6 +472,7 @@ async def _add_object(
         vector: Optional[VECTORS] = None,
         tenant: Optional[str] = None,
     ) -> UUID:
+        self.__check_bg_tasks_alive()
         try:
             batch_object = BatchObject(
                 collection=collection,
@@ -482,6 +495,7 @@ async def _add_object(
         self.__objs_count += 1
 
         while len(self.__inflight_objs) >= self.__batch_size:
+            self.__check_bg_tasks_alive()
             await asyncio.sleep(0.01)
 
         assert batch_object.uuid is not None
@@ -495,6 +509,7 @@ async def _add_reference(
         to: ReferenceInput,
         tenant: Optional[str] = None,
     ) -> None:
+        self.__check_bg_tasks_alive()
         if isinstance(to, ReferenceToMulti):
             to_strs: Union[List[str], List[UUID]] = to.uuids_str
         elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
@@ -521,4 +536,11 @@ async def _add_reference(
             self.__refs_cache[batch_reference._to_beacon()] = batch_reference
             self.__refs_count += 1
             while len(self.__inflight_refs) >= self.__batch_size * 2:
+                self.__check_bg_tasks_alive()
                 await asyncio.sleep(0.01)
+
+    def __check_bg_tasks_alive(self) -> None:
+        if self.__all_tasks_alive():
+            return
+
+        raise self.__bg_exception or Exception("Batch tasks died unexpectedly")
diff --git a/weaviate/collections/batch/base.py b/weaviate/collections/batch/base.py
index ab4dddd14..d56c2879d 100644
--- a/weaviate/collections/batch/base.py
+++ b/weaviate/collections/batch/base.py
@@ -346,7 +346,7 @@ def __init__(
         self.__uuid_lookup_lock = threading.Lock()
         self.__results_lock = threading.Lock()
 
-        self.__bg_thread = self.__start_bg_threads()
+        self.__bg_threads = self.__start_bg_threads()
         self.__bg_thread_exception: Optional[Exception] = None
 
     @property
@@ -365,7 +365,7 @@ def _shutdown(self) -> None:
 
         # we are done, shut bg threads down and end the event loop
         self.__shut_background_thread_down.set()
-        while self.__bg_thread.is_alive():
+        while self.__bg_threads.is_alive():
             time.sleep(0.01)
 
         # copy the results to the public results
@@ -773,7 +773,7 @@ def flush(self) -> None:
             or len(self.__batch_references) > 0
         ):
             time.sleep(0.01)
-            self.__check_bg_thread_alive()
+            self.__check_bg_threads_alive()
 
     def _add_object(
         self,
@@ -784,7 +784,7 @@ def _add_object(
         vector: Optional[VECTORS] = None,
         tenant: Optional[str] = None,
     ) -> UUID:
-        self.__check_bg_thread_alive()
+        self.__check_bg_threads_alive()
         try:
             batch_object = BatchObject(
                 collection=collection,
@@ -810,7 +810,7 @@ def _add_object(
             self.__recommended_num_objects == 0
             or len(self.__batch_objects) >= self.__recommended_num_objects * 2
         ):
-            self.__check_bg_thread_alive()
+            self.__check_bg_threads_alive()
             time.sleep(0.01)
 
         assert batch_object.uuid is not None
@@ -824,7 +824,7 @@ def _add_reference(
         to: ReferenceInput,
         tenant: Optional[str] = None,
     ) -> None:
-        self.__check_bg_thread_alive()
+        self.__check_bg_threads_alive()
         if isinstance(to, ReferenceToMulti):
             to_strs: Union[List[str], List[UUID]] = to.uuids_str
         elif isinstance(to, str) or isinstance(to, uuid_package.UUID):
@@ -853,10 +853,10 @@ def _add_reference(
         # block if queue gets too long or weaviate is overloaded
         while self.__recommended_num_objects == 0:
             time.sleep(0.01)  # block if weaviate is overloaded, also do not send any refs
-            self.__check_bg_thread_alive()
+            self.__check_bg_threads_alive()
 
-    def __check_bg_thread_alive(self) -> None:
-        if self.__bg_thread.is_alive():
+    def __check_bg_threads_alive(self) -> None:
+        if self.__bg_threads.is_alive():
             return
 
         raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
@@ -891,6 +891,11 @@ def recv_alive(self) -> bool:
         """Check if the recv background thread is still alive."""
         return self.recv.is_alive()
 
+    def join(self) -> None:
+        """Join the background threads."""
+        self.loop.join()
+        self.recv.join()
+
 
 class _ClusterBatch:
     def __init__(self, connection: ConnectionSync):
diff --git a/weaviate/collections/batch/batch_wrapper.py b/weaviate/collections/batch/batch_wrapper.py
index f991a6f51..3c1acc827 100644
--- a/weaviate/collections/batch/batch_wrapper.py
+++ b/weaviate/collections/batch/batch_wrapper.py
@@ -523,12 +523,8 @@ def __init__(self, current_batch: _BatchBaseAsync):
 
     async def __aexit__(self, exc_type: Any, exc_val: Any, exc_tb: Any) -> None:
         await self.__current_batch._shutdown()
-        await asyncio.gather(
-            self.__bg_tasks.send,
-            self.__bg_tasks.recv,
-            self.__bg_tasks.loop,
-        )
+        await self.__current_batch._wait()
 
     async def __aenter__(self) -> Q:
-        self.__bg_tasks = await self.__current_batch._start()
+        await self.__current_batch._start()
         return self.__current_batch  # pyright: ignore[reportReturnType]
diff --git a/weaviate/collections/batch/sync.py b/weaviate/collections/batch/sync.py
index 78d143594..54322ee9d 100644
--- a/weaviate/collections/batch/sync.py
+++ b/weaviate/collections/batch/sync.py
@@ -87,7 +87,7 @@ def __init__(
         self.__uuid_lookup_lock = threading.Lock()
         self.__results_lock = threading.Lock()
 
-        self.__bg_thread_exception: Optional[Exception] = None
+        self.__bg_exception: Optional[Exception] = None
         self.__is_oom = threading.Event()
         self.__is_shutting_down = threading.Event()
         self.__is_shutdown = threading.Event()
@@ -145,18 +145,14 @@ def _start(self) -> None:
                     "Batch stream was not started within 60 seconds. Please check your connection."
                 )
 
+    def _wait(self) -> None:
+        for bg_thread in self.__bg_threads:
+            bg_thread.join()
+
     def _shutdown(self) -> None:
         # Shutdown the current batch and wait for all requests to be finished
-        self.flush()
         self.__stop = True
 
-        # we are done, wait for bg threads to finish
-        # self.__batch_stream will set the shutdown event when it receives
-        # the stop message from the server
-        while self.__any_threads_alive():
-            time.sleep(0.05)
-        logger.warning("Send & receive threads finished.")
-
         # copy the results to the public results
         self.__results_for_wrapper_backup.results = self.__results_for_wrapper.results
         self.__results_for_wrapper_backup.failed_objects = self.__results_for_wrapper.failed_objects
@@ -169,10 +165,7 @@ def _shutdown(self) -> None:
 
     def __loop(self) -> None:
         refresh_time: float = 0.01
-        while (
-            self.__shut_background_thread_down is not None
-            and not self.__shut_background_thread_down.is_set()
-        ):
+        while self.__bg_exception is None:
             if len(self.__batch_objects) + len(self.__batch_references) > 0:
                 self._batch_send = True
                 start = time.time()
@@ -181,14 +174,6 @@ def __loop(self) -> None:
                 ) < self.__batch_size:
                     # wait for more objects to be added up to the batch size
                     time.sleep(0.01)
-                    if (
-                        self.__shut_background_thread_down is not None
-                        and self.__shut_background_thread_down.is_set()
-                    ):
-                        logger.warning("Threads were shutdown, exiting batch send loop")
-                        # shutdown was requested, exit early
-                        self.__reqs.put(None)
-                        return
                     if time.time() - start >= 1 and (
                         len_o == len(self.__batch_objects) or len_r == len(self.__batch_references)
                     ):
@@ -271,10 +256,7 @@ def __send(
                 consistency_level=self.__batch_grpc._consistency_level,
             ),
         )
-        while (
-            self.__shut_background_thread_down is not None
-            and not self.__shut_background_thread_down.is_set()
-        ):
+        while self.__bg_exception is not None:
             if self.__is_gcp_on_wcd:
                 assert self.__stream_start is not None
                 if time.time() - self.__stream_start > GCP_STREAM_TIMEOUT:
@@ -462,11 +444,10 @@ def __reconnect(self, retry: int = 0) -> None:
                 self.__reconnect(retry + 1)
             else:
                 logger.error("Failed to reconnect after 5 attempts")
-                self.__bg_thread_exception = e
+                self.__bg_exception = e
 
     def __start_bg_threads(self) -> _BgThreads:
         """Create a background thread that periodically checks how congested the batch queue is."""
-        self.__shut_background_thread_down = threading.Event()
 
         def loop_wrapper() -> None:
             try:
@@ -474,7 +455,7 @@ def loop_wrapper() -> None:
                 logger.warning("exited batch requests loop thread")
             except Exception as e:
                 logger.error(e)
-                self.__bg_thread_exception = e
+                self.__bg_exception = e
 
         def recv_wrapper() -> None:
             socket_hung_up = False
@@ -493,7 +474,7 @@ def recv_wrapper() -> None:
                 else:
                     logger.error(e)
                     logger.error(type(e))
-                    self.__bg_thread_exception = e
+                    self.__bg_exception = e
             if socket_hung_up:
                 # this happens during ungraceful shutdown of the coordinator
                 # lets restart the stream and add the cached objects again
@@ -615,7 +596,7 @@ def _add_reference(
                 time.sleep(0.01)
 
     def __check_bg_threads_alive(self) -> None:
-        if self.__any_threads_alive():
+        if self.__all_threads_alive():
             return
 
-        raise self.__bg_thread_exception or Exception("Batch thread died unexpectedly")
+        raise self.__bg_exception or Exception("Batch thread died unexpectedly")

From 6f31d1e8f8f57c29406aad9dedad5c2f118d3b08 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Fri, 30 Jan 2026 11:37:14 +0000
Subject: [PATCH 20/21] Add support for stream timeouts, defaults to `None`

---
 weaviate/config.py     | 3 +++
 weaviate/connect/v4.py | 6 ++++--
 2 files changed, 7 insertions(+), 2 deletions(-)

diff --git a/weaviate/config.py b/weaviate/config.py
index bc0525531..9d2006829 100644
--- a/weaviate/config.py
+++ b/weaviate/config.py
@@ -56,6 +56,9 @@ class Timeout(BaseModel):
     query: Union[int, float] = Field(default=30, ge=0)
     insert: Union[int, float] = Field(default=90, ge=0)
     init: Union[int, float] = Field(default=2, ge=0)
+    stream: Union[int, float, None] = Field(
+        default=None, ge=0, description="Timeout for streaming operations."
+    )
 
 
 class Proxies(BaseModel):
diff --git a/weaviate/connect/v4.py b/weaviate/connect/v4.py
index 68ddb6e95..0848ba6be 100644
--- a/weaviate/connect/v4.py
+++ b/weaviate/connect/v4.py
@@ -1012,7 +1012,9 @@ def grpc_batch_stream(
         try:
             assert self.grpc_stub is not None
             for msg in self.grpc_stub.BatchStream(
-                request_iterator=requests, metadata=self.grpc_headers()
+                request_iterator=requests,
+                timeout=self.timeout_config.stream,
+                metadata=self.grpc_headers(),
             ):
                 yield msg
         except RpcError as e:
@@ -1232,7 +1234,7 @@ def grpc_batch_stream(
             response_deserializer=batch_pb2.BatchStreamReply.FromString,
         )(
             request_iterator=None,
-            timeout=self.timeout_config.insert,
+            timeout=self.timeout_config.stream,
             metadata=self.grpc_headers(),
         )
 

From 335de4b9ef15b87aa0de8fb2300a63da66ce3e33 Mon Sep 17 00:00:00 2001
From: Tommy Smith <tommy@weaviate.io>
Date: Fri, 30 Jan 2026 11:56:20 +0000
Subject: [PATCH 21/21] Handle async queue get timeouts properly

---
 weaviate/collections/batch/async_.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/weaviate/collections/batch/async_.py b/weaviate/collections/batch/async_.py
index 689b21715..e8b1c3452 100644
--- a/weaviate/collections/batch/async_.py
+++ b/weaviate/collections/batch/async_.py
@@ -304,7 +304,10 @@ async def __send(self):
                     self.__is_renewing_stream.set()
                     await self.__end_stream()
                     return
-            req = await asyncio.wait_for(self.__reqs.get(), timeout=1)
+            try:
+                req = await asyncio.wait_for(self.__reqs.get(), timeout=1)
+            except asyncio.TimeoutError:
+                continue
             if req is not None:
                 await self.__connection.grpc_batch_stream_write(self.__stream, req)
                 continue