update

PierreMarchand20 · PierreMarchand20 · commit d4a3fa387869 · 2025-07-30T16:03:16.000+02:00
diff --git a/example/define_custom_local_operator.py b/example/define_custom_local_operator.py
@@ -2,34 +2,32 @@
 import numpy as np
 
 
-class CustomLocalOperator(Htool.LocalOperator):
+class CustomLocalOperator(Htool.VirtualLocalOperator):
     def __init__(
         self,
         generator: Htool.VirtualGenerator,
-        target_cluster: Htool.Cluster,
-        source_cluster: Htool.Cluster,
-        symmetry: str = "N",
-        UPLO: str = "N",
-        target_use_permutation_to_mvprod: bool = False,
-        source_use_permutation_to_mvprod: bool = False,
+        target_offset: int,
+        target_size: int,
+        target_permutation,
+        source_offset: int,
+        source_size: int,
+        source_permutation,
     ) -> None:
         super().__init__(
-            target_cluster,
-            source_cluster,
-            symmetry,
-            UPLO,
-            target_use_permutation_to_mvprod,
-            source_use_permutation_to_mvprod,
+            target_offset,
+            target_size,
+            source_offset,
+            source_size,
         )
-        self.data = np.zeros((target_cluster.get_size(), source_cluster.get_size()))
+        self.data = np.zeros((target_size, source_size))
         generator.build_submatrix(
-            target_cluster.get_permutation()[
-                target_cluster.get_offset() : target_cluster.get_offset()
-                + target_cluster.get_size()
+            target_permutation[
+                target_offset : target_offset
+                + target_size
             ],
-            source_cluster.get_permutation()[
-                source_cluster.get_offset() : source_cluster.get_offset()
-                + source_cluster.get_size()
+            source_permutation[
+                source_offset : source_offset
+                + source_size
             ],
             self.data,
         )
diff --git a/example/use_custom_local_operator.py b/example/use_custom_local_operator.py
@@ -38,17 +38,17 @@
 # Build local operator
 local_operator = CustomLocalOperator(
     generator,
-    target_cluster.get_cluster_on_partition(mpi4py.MPI.COMM_WORLD.rank),
-    source_cluster,
-    "N",
-    "N",
-    False,
-    False,
+    target_cluster.get_cluster_on_partition(mpi4py.MPI.COMM_WORLD.rank).get_offset(),
+    target_cluster.get_cluster_on_partition(mpi4py.MPI.COMM_WORLD.rank).get_size(),
+    target_cluster.get_cluster_on_partition(mpi4py.MPI.COMM_WORLD.rank).get_permutation(),
+    source_cluster.get_offset(),
+    source_cluster.get_size(),
+    source_cluster.get_permutation(),
 )
 
 # Build distributed operator
 custom_local_approximation = Htool.CustomApproximationBuilder(
-    target_cluster, source_cluster, "N", "N", mpi4py.MPI.COMM_WORLD, local_operator
+    target_cluster, source_cluster, mpi4py.MPI.COMM_WORLD, local_operator
 )
 distributed_operator = custom_local_approximation.distributed_operator
 
diff --git a/example/use_local_hmatrix_compression.py b/example/use_local_hmatrix_compression.py
@@ -72,49 +72,28 @@
 hmatrix = default_local_approximation.hmatrix
 Htool.recompression(hmatrix)
 
-
-# Build off diagonal operators
-off_diagonal_nc_1 = local_source_cluster.get_offset()
-off_diagonal_nc_2 = (
-    source_cluster.get_size()
-    - local_source_cluster.get_size()
-    - local_source_cluster.get_offset()
-)
-local_nc = local_source_cluster.get_size()
-
-off_diagonal_partition = np.zeros((2, 2), dtype=int)
-off_diagonal_partition[0, 0] = 0
-off_diagonal_partition[1, 0] = off_diagonal_nc_1
-off_diagonal_partition[0, 1] = off_diagonal_nc_1 + local_nc
-off_diagonal_partition[1, 1] = off_diagonal_nc_2
-off_diagonal_cluster: Htool.Cluster = cluster_builder.create_cluster_tree(
-    permuted_source_points, number_of_children, 2, partition=off_diagonal_partition
-)
-
-off_diagonal_generator = CustomGenerator(target_points, permuted_source_points)
-
 local_operator_1 = None
-if off_diagonal_nc_1 > 0:
+if local_source_cluster.get_offset() > 0:
     local_operator_1 = CustomLocalOperator(
-        off_diagonal_generator,
-        local_target_cluster,
-        off_diagonal_cluster.get_cluster_on_partition(0),
-        "N",
-        "N",
-        False,
-        True,
+        generator,
+        local_target_cluster.get_offset(),
+        local_target_cluster.get_size(),
+        local_target_cluster.get_permutation(),
+        0,
+        local_source_cluster.get_offset(),
+        source_cluster.get_permutation(),
     )
 
 local_operator_2 = None
-if off_diagonal_nc_2 > 0:
+if source_cluster.get_size()-local_source_cluster.get_size()-local_source_cluster.get_offset() > 0:
     local_operator_2 = CustomLocalOperator(
-        off_diagonal_generator,
-        local_target_cluster,
-        off_diagonal_cluster.get_cluster_on_partition(1),
-        "N",
-        "N",
-        False,
-        True,
+        generator,
+        local_target_cluster.get_offset(),
+        local_target_cluster.get_size(),
+        local_target_cluster.get_permutation(),
+        local_source_cluster.get_size()+local_source_cluster.get_offset(),
+        source_cluster.get_size()-local_source_cluster.get_size()-local_source_cluster.get_offset(),
+        source_cluster.get_permutation(),
     )
 
 if local_operator_1:
@@ -152,26 +131,16 @@
     if dimension == 2:
         ax1 = fig.add_subplot(2, 2, 1)
         ax2 = fig.add_subplot(2, 2, 2)
-        ax3 = fig.add_subplot(2, 2, 3)
-        ax4 = fig.add_subplot(2, 2, 4)
+        ax3 = fig.add_subplot(2, 2, 4)
     elif dimension == 3:
         ax1 = fig.add_subplot(2, 2, 1, projection="3d")
         ax2 = fig.add_subplot(2, 2, 2, projection="3d")
-        ax3 = fig.add_subplot(2, 2, 3, projection="3d")
-        ax4 = fig.add_subplot(2, 2, 4)
+        ax3 = fig.add_subplot(2, 2, 4)
 
     ax1.set_title("source cluster at depth 1")
     ax2.set_title("source cluster at depth 2")
-    ax3.set_title("off diagonal cluster on rank 0 at depth 2")
-    ax4.set_title("Hmatrix on rank 0")
+    ax3.set_title("Hmatrix on rank 0")
     Htool.plot(ax1, source_cluster, source_points, 1)
     Htool.plot(ax2, source_cluster, source_points, 2)
-    if mpi4py.MPI.COMM_WORLD.Get_size() > 1:
-        Htool.plot(
-            ax3,
-            off_diagonal_cluster.get_cluster_on_partition(1),
-            permuted_source_points,
-            2,
-        )
-    Htool.plot(ax4, hmatrix)
+    Htool.plot(ax3, hmatrix)
     plt.show()
diff --git a/lib/htool b/lib/htool
@@ -1 +1 @@
-Subproject commit 3a99253d37af872bbc6d17cf0a92c401133915a8
+Subproject commit 7cba5bcadd8d64a525516afc53cdda022cdcab86
diff --git a/src/htool/distributed_operator/distributed_operator.hpp b/src/htool/distributed_operator/distributed_operator.hpp
@@ -3,15 +3,18 @@
 #include "../misc/utility.hpp"
 #include "../misc/wrapper_mpi.hpp"
 #include <htool/distributed_operator/distributed_operator.hpp>
+#include <htool/distributed_operator/linalg/add_distributed_operator_matrix_product_global_to_global.hpp>
+#include <htool/distributed_operator/linalg/add_distributed_operator_vector_product_global_to_global.hpp>
 #include <htool/distributed_operator/utility.hpp>
+#include <htool/matrix/matrix_view.hpp>
 #include <pybind11/pybind11.h>
 
 template <typename CoefficientPrecision>
 void declare_distributed_operator(py::module &m, const std::string &class_name) {
     using Class = DistributedOperator<CoefficientPrecision>;
 
     py::class_<Class> py_class(m, class_name.c_str());
-    py_class.def(py::init<VirtualPartition<CoefficientPrecision> &, VirtualPartition<CoefficientPrecision> &, char, char, MPI_Comm_wrapper>(), py::keep_alive<1, 2>(), py::keep_alive<1, 3>());
+    py_class.def(py::init<VirtualPartition<CoefficientPrecision> &, VirtualPartition<CoefficientPrecision> &, MPI_Comm_wrapper>(), py::keep_alive<1, 2>(), py::keep_alive<1, 3>());
     py_class.def("add_local_operator", &Class::add_local_operator, py::keep_alive<1, 2>());
 
     // Linear algebra
@@ -25,7 +28,7 @@ void declare_distributed_operator(py::module &m, const std::string &class_name)
             }
             py::array_t<CoefficientPrecision, py::array::f_style> result(std::array<long int, 1>{self.get_target_partition().get_global_size()});
             std::fill_n(result.mutable_data(), self.get_target_partition().get_global_size(), CoefficientPrecision(0));
-            self.vector_product_global_to_global(input.data(), result.mutable_data());
+            htool::add_distributed_operator_vector_product_global_to_global<CoefficientPrecision>('N', 1, self, input.data(), 0, result.mutable_data(), nullptr);
 
             return result;
         },
@@ -46,7 +49,10 @@ void declare_distributed_operator(py::module &m, const std::string &class_name)
             std::array<long int, 2> shape{self.get_target_partition().get_global_size(), mu};
             py::array_t<CoefficientPrecision, py::array::f_style> result(shape);
             std::fill_n(result.mutable_data(), self.get_target_partition().get_global_size() * mu, CoefficientPrecision(0));
-            self.matrix_product_global_to_global(input.data(), result.mutable_data(), mu);
+            MatrixView<const CoefficientPrecision> input_view(self.get_source_partition().get_global_size(), mu, input.data());
+            MatrixView<CoefficientPrecision> output_view(self.get_target_partition().get_global_size(), mu, result.mutable_data());
+            CoefficientPrecision *work = nullptr;
+            add_distributed_operator_matrix_product_global_to_global('N', CoefficientPrecision(1), self, input_view, CoefficientPrecision(0), output_view, work);
 
             return result;
         },
diff --git a/src/htool/distributed_operator/utility.hpp b/src/htool/distributed_operator/utility.hpp
@@ -17,7 +17,7 @@ void declare_distributed_operator_utility(py::module &m, std::string prefix = ""
     std::string default_local_approximation_name = prefix + "DefaultLocalApproximationBuilder";
 
     py::class_<CustomApproximation> custom_approximation_class(m, custom_approximation_name.c_str());
-    custom_approximation_class.def(py::init<const Cluster<CoordinatePrecision> &, const Cluster<CoordinatePrecision> &, char, char, MPI_Comm_wrapper, const VirtualLocalOperator<CoefficientPrecision> &>());
+    custom_approximation_class.def(py::init<const Cluster<CoordinatePrecision> &, const Cluster<CoordinatePrecision> &, MPI_Comm_wrapper, const VirtualLocalOperator<CoefficientPrecision> &>());
     custom_approximation_class.def_property_readonly(
         "distributed_operator", [](const CustomApproximation &self) { return &self.distributed_operator; }, py::return_value_policy::reference_internal);
 
diff --git a/src/htool/local_operator/local_operator.hpp b/src/htool/local_operator/local_operator.hpp
@@ -9,7 +9,7 @@ class LocalOperatorPython : public htool::LocalOperator<CoefficientPrecision, Co
   public:
     using htool::LocalOperator<CoefficientPrecision, CoordinatePrecision>::LocalOperator;
 
-    LocalOperatorPython(const Cluster<CoordinatePrecision> &cluster_tree_target, const Cluster<CoordinatePrecision> &cluster_tree_source, char symmetry = 'N', char UPLO = 'N', bool target_use_permutation_to_mvprod = false, bool source_use_permutation_to_mvprod = false) : LocalOperator<CoefficientPrecision, CoordinatePrecision>(cluster_tree_target, cluster_tree_source, symmetry, UPLO, target_use_permutation_to_mvprod, source_use_permutation_to_mvprod) {}
+    LocalOperatorPython(const Cluster<CoordinatePrecision> &cluster_tree_target, const Cluster<CoordinatePrecision> &cluster_tree_source, bool target_use_permutation_to_mvprod = false, bool source_use_permutation_to_mvprod = false) : LocalOperator<CoefficientPrecision, CoordinatePrecision>(cluster_tree_target, cluster_tree_source, target_use_permutation_to_mvprod, source_use_permutation_to_mvprod) {}
 
     void local_add_vector_product(char trans, CoefficientPrecision alpha, const CoefficientPrecision *in, CoefficientPrecision beta, CoefficientPrecision *out) const override {
 
@@ -19,14 +19,6 @@ class LocalOperatorPython : public htool::LocalOperator<CoefficientPrecision, Co
         add_vector_product(trans, alpha, input, beta, output);
     }
 
-    void local_add_vector_product_symmetric(char trans, CoefficientPrecision alpha, const CoefficientPrecision *in, CoefficientPrecision beta, CoefficientPrecision *out, char UPLO, char symmetry) const override {
-
-        py::array_t<CoefficientPrecision> input(std::array<long int, 1>{this->m_source_cluster.get_size()}, in, py::capsule(in));
-        py::array_t<CoefficientPrecision> output(std::array<long int, 1>{this->m_target_cluster.get_size()}, out, py::capsule(out));
-
-        add_vector_product(trans, alpha, input, beta, output);
-    }
-
     void local_add_matrix_product_row_major(char trans, CoefficientPrecision alpha, const CoefficientPrecision *in, CoefficientPrecision beta, CoefficientPrecision *out, int mu) const override {
 
         py::array_t<CoefficientPrecision, py::array::c_style> input(std::array<long int, 2>{this->m_source_cluster.get_size(), mu}, in, py::capsule(in));
@@ -35,14 +27,6 @@ class LocalOperatorPython : public htool::LocalOperator<CoefficientPrecision, Co
         add_matrix_product_row_major(trans, alpha, input, beta, output);
     }
 
-    void local_add_matrix_product_symmetric_row_major(char trans, CoefficientPrecision alpha, const CoefficientPrecision *in, CoefficientPrecision beta, CoefficientPrecision *out, int mu, char UPLO, char symmetry) const override {
-
-        py::array_t<CoefficientPrecision, py::array::c_style> input(std::array<long int, 2>{this->m_source_cluster.get_size(), 1}, in, py::capsule(in));
-        py::array_t<CoefficientPrecision, py::array::c_style> output(std::array<long int, 2>{this->m_target_cluster.get_size(), 1}, out, py::capsule(out));
-
-        add_matrix_product_row_major(trans, alpha, input, beta, output);
-    }
-
     // lcov does not see it because of trampoline I assume
     virtual void add_vector_product(char trans, CoefficientPrecision alpha, const py::array_t<CoefficientPrecision> &in, CoefficientPrecision beta, py::array_t<CoefficientPrecision> &out) const = 0; // LCOV_EXCL_LINE
     // virtual void local_add_vector_product_symmetric(char trans, CoefficientPrecision alpha, const std::vector<CoefficientPrecision> &in, CoefficientPrecision beta, std::vector<CoefficientPrecision> &out) const = 0; // LCOV_EXCL_LINE
@@ -92,7 +76,7 @@ void declare_local_operator(py::module &m, const std::string &class_name) {
 
     using Class = LocalOperatorPython<CoefficientPrecision, CoordinatePrecision>;
     py::class_<Class, PyLocalOperator<CoefficientPrecision, CoordinatePrecision>, BaseClass> py_class(m, class_name.c_str());
-    py_class.def(py::init<const Cluster<CoordinatePrecision> &, const Cluster<CoordinatePrecision> &, char, char, bool, bool>());
+    py_class.def(py::init<const Cluster<CoordinatePrecision> &, const Cluster<CoordinatePrecision> &, bool, bool>());
     py_class.def("add_vector_product", &Class::add_vector_product, py::arg("trans"), py::arg("alpha"), py::arg("in").noconvert(true), py::arg("beta"), py::arg("out").noconvert(true));
     py_class.def("add_matrix_product_row_major", &Class::add_matrix_product_row_major);
 }
diff --git a/src/htool/local_operator/virtual_local_operator.hpp b/src/htool/local_operator/virtual_local_operator.hpp
@@ -4,15 +4,87 @@
 #include <htool/distributed_operator/interfaces/virtual_local_operator.hpp>
 #include <pybind11/pybind11.h>
 
-// template <typename CoefficientPrecision>
-// class PyVirtualLocalOperator : public htool::VirtualLocalOperator<CoefficientPrecision> {
-//   public:
-// };
+template <typename CoefficientPrecision, typename CoordinatePrecision = CoefficientPrecision>
+class VirtualLocalOperatorPython : public htool::VirtualLocalOperator<CoefficientPrecision> {
+    int m_target_offset;
+    int m_target_size;
+    int m_source_offset;
+    int m_source_size;
+
+  public:
+    VirtualLocalOperatorPython(int target_offset, int target_size, int source_offset, int source_size) : m_target_offset(target_offset), m_target_size(target_size), m_source_offset(source_offset), m_source_size(source_size) {}
+
+    int get_target_offset() const override { return m_target_offset; }
+    int get_source_offset() const override { return m_source_offset; }
+    int get_target_size() const override { return m_target_size; }
+    int get_source_size() const override { return m_source_size; }
+
+    void add_vector_product(char trans, CoefficientPrecision alpha, const CoefficientPrecision *const in, CoefficientPrecision beta, CoefficientPrecision *const out) const override {
+        py::array_t<CoefficientPrecision> input(std::array<long int, 1>{m_source_size}, in, py::capsule(in));
+        py::array_t<CoefficientPrecision> output(std::array<long int, 1>{m_target_size}, out, py::capsule(out));
+
+        local_add_vector_product(trans, alpha, input, beta, output);
+    }
+    void add_matrix_product_row_major(char trans, CoefficientPrecision alpha, const CoefficientPrecision *const in, CoefficientPrecision beta, CoefficientPrecision *const out, int mu) const override {
+        py::array_t<CoefficientPrecision, py::array::c_style> input(std::array<long int, 2>{m_source_size, mu}, in, py::capsule(in));
+        py::array_t<CoefficientPrecision, py::array::c_style> output(std::array<long int, 2>{m_target_size, mu}, out, py::capsule(out));
+
+        local_add_matrix_product_row_major(trans, alpha, input, beta, output);
+    }
+
+    virtual void sub_matrix_product_to_local(const CoefficientPrecision *const in, CoefficientPrecision *const out, int mu, int offset, int size) const override {
+        std::vector<CoefficientPrecision> temp(m_source_size * mu, 0);
+        std::copy_n(in, size * mu, temp.data() + offset * mu);
+        add_matrix_product_row_major('N', 1, temp.data(), 0, out, mu);
+    };
+
+    virtual void local_add_vector_product(char trans, CoefficientPrecision alpha, const py::array_t<CoefficientPrecision> &in, CoefficientPrecision beta, py::array_t<CoefficientPrecision> &out) const = 0; // LCOV_EXCL_LINE
+
+    virtual void local_add_matrix_product_row_major(char trans, CoefficientPrecision alpha, const py::array_t<CoefficientPrecision, py::array::c_style> &in, CoefficientPrecision beta, py::array_t<CoefficientPrecision, py::array::c_style> &out) const = 0; // LCOV_EXCL_LINE
+};
+
+template <typename CoefficientPrecision>
+class PyVirtualLocalOperator : public VirtualLocalOperatorPython<CoefficientPrecision> {
+  public:
+    using VirtualLocalOperatorPython<CoefficientPrecision>::VirtualLocalOperatorPython;
+
+    /* Trampoline (need one for each virtual function) */
+    virtual void local_add_vector_product(char trans, CoefficientPrecision alpha, const py::array_t<CoefficientPrecision> &in, CoefficientPrecision beta, py::array_t<CoefficientPrecision> &out) const override {
+        PYBIND11_OVERRIDE_PURE(
+            void,                                             /* Return type */
+            VirtualLocalOperatorPython<CoefficientPrecision>, /* Parent class */
+            add_vector_product,                               /* Name of function in C++ (must match Python name) */
+            trans,
+            alpha,
+            in,
+            beta,
+            out /* Argument(s) */
+        );
+    }
+    virtual void local_add_matrix_product_row_major(char trans, CoefficientPrecision alpha, const py::array_t<CoefficientPrecision, py::array::c_style> &in, CoefficientPrecision beta, py::array_t<CoefficientPrecision, py::array::c_style> &out) const override {
+        PYBIND11_OVERRIDE_PURE(
+            void,                                             /* Return type */
+            VirtualLocalOperatorPython<CoefficientPrecision>, /* Parent class */
+            add_matrix_product_row_major,                     /* Name of function in C++ (must match Python name) */
+            trans,
+            alpha,
+            in,
+            beta,
+            out /* Argument(s) */
+        );
+    }
+};
 
 template <typename CoefficientPrecision>
-void declare_interface_local_operator(py::module &m, const std::string &class_name) {
-    using Class = htool::VirtualLocalOperator<CoefficientPrecision>;
-    py::class_<Class>(m, class_name.c_str());
+void declare_virtual_local_operator(py::module &m, const std::string &className, const std::string &base_class_name) {
+    using BaseClass = htool::VirtualLocalOperator<CoefficientPrecision>;
+    py::class_<BaseClass>(m, (base_class_name).c_str());
+
+    using Class = VirtualLocalOperatorPython<CoefficientPrecision>;
+    py::class_<Class, PyVirtualLocalOperator<CoefficientPrecision>, BaseClass> py_class(m, className.c_str());
+    py_class.def(py::init<int, int, int, int>());
+    py_class.def("local_add_vector_product", &Class::add_vector_product, py::arg("trans"), py::arg("alpha"), py::arg("in").noconvert(true), py::arg("beta"), py::arg("out").noconvert(true));
+    py_class.def("local_add_matrix_product_row_major", &Class::add_matrix_product_row_major);
 }
 
 #endif
diff --git a/src/htool/main.cpp b/src/htool/main.cpp
diff --git a/src/htool/solver/utility.hpp b/src/htool/solver/utility.hpp
diff --git a/tests/conftest.py b/tests/conftest.py
diff --git a/tests/test_ddm_solver.py b/tests/test_ddm_solver.py