Abstract linear solving method instead of \ (#229)

matbesancon · blegat · web-flow · commit e0fc7af8bf98 · 2023-02-14T16:30:38.000+01:00
* add LinearSolve

* remove LinearSolve for abstract method

* fix constructor

* fix constructor

* fix issue with sparse ldiv

* Update src/QuadraticProgram/QuadraticProgram.jl

Co-authored-by: Benoît Legat &lt;benoit.legat@gmail.com&gt;

* test attribute setting

* docstring

* remove ambiguity

* dont reset on empty

* Apply suggestions from code review

---------

Co-authored-by: Benoît Legat &lt;benoit.legat@gmail.com&gt;
diff --git a/docs/src/examples/custom-relu.jl b/docs/src/examples/custom-relu.jl
@@ -99,7 +99,7 @@ dataset = repeated((train_X, train_Y), epochs);
 
 # training loss function, Flux optimizer
 custom_loss(x, y) = Flux.crossentropy(m(x), y)
-opt = Flux.ADAM()
+opt = Flux.Adam()
 evalcb = () -> @show(custom_loss(train_X, train_Y))
 
 # Train to optimize network parameters
diff --git a/src/QuadraticProgram/QuadraticProgram.jl b/src/QuadraticProgram/QuadraticProgram.jl
@@ -100,12 +100,15 @@ mutable struct Model <: DiffOpt.AbstractModel
     # sensitivity input cache using MOI like sparse format
     input_cache::DiffOpt.InputCache
 
+    # linear solving function to use
+    linear_solver::Any
+
     x::Vector{Float64} # Primal
     λ::Vector{Float64} # Dual of inequalities
     ν::Vector{Float64} # Dual of equalities
 end
 function Model()
-    return Model(Form{Float64}(), nothing, nothing, nothing, DiffOpt.InputCache(), Float64[], Float64[], Float64[])
+    return Model(Form{Float64}(), nothing, nothing, nothing, DiffOpt.InputCache(), nothing, Float64[], Float64[], Float64[])
 end
 
 function MOI.is_empty(model::Model)
@@ -281,11 +284,9 @@ function DiffOpt.reverse_differentiate!(model::Model)
 
     nv = length(model.x)
     Q = view(LHS, 1:nv, 1:nv)
-    partial_grads = if norm(Q) ≈ 0
-        -IterativeSolvers.lsqr(LHS, RHS)
-    else
-        -LHS \ RHS
-    end
+    iterative = norm(Q) ≈ 0
+    solver = model.linear_solver
+    partial_grads = -solve_system(solver, LHS, RHS, iterative)
 
     dz = partial_grads[1:nv]
     dλ = partial_grads[nv+1:nv+nineq]
@@ -302,10 +303,6 @@ function DiffOpt.reverse_differentiate!(model::Model)
     # todo, check MOI signs for dA and dG
 end
 
-_linsolve(A, b) = A \ b
-# See https://github.com/JuliaLang/julia/issues/32668
-_linsolve(A, b::SparseVector) = A \ Vector(b)
-
 # Just a hack that will be removed once we use `MOI.Utilities.MatrixOfConstraints`
 struct _QPSets end
 MOI.Utilities.rows(::_QPSets, ci::MOI.ConstraintIndex) = ci.value
@@ -353,13 +350,9 @@ function DiffOpt.forward_differentiate!(model::Model)
     ]
 
     Q = view(LHS, 1:nv, 1:nv)
-    partial_grads = if norm(Q) ≈ 0
-        -IterativeSolvers.lsqr(LHS', RHS)
-    else
-        -_linsolve(LHS', RHS)
-    end
-
-
+    iterative = norm(Q) ≈ 0
+    solver = model.linear_solver
+    partial_grads = -solve_system(solver, LHS', RHS, iterative)
     dz = partial_grads[1:nv]
     dλ = partial_grads[nv+1:nv+length(λ)]
     dν = partial_grads[nv+length(λ)+1:end]
@@ -395,4 +388,31 @@ function DiffOpt._get_dA(model::Model, ci::LE)
     return DiffOpt.lazy_combination(+, l * dλ[i], model.x, l, dz)
 end
 
+"""
+    LinearAlgebraSolver
+
+Optimizer attribute for the solver to use for the linear algebra operations.
+Each solver must implement: `solve_system(solver, LHS, RHS, iterative::Bool)`.
+"""
+struct LinearAlgebraSolver <: MOI.AbstractOptimizerAttribute end
+
+"""
+Default `solve_system` call uses IterativeSolvers or the default linear solve 
+"""
+function solve_system(::Any, LHS, RHS, iterative)
+    if iterative
+        IterativeSolvers.lsqr(LHS, RHS)
+    else
+        LHS \ RHS
+    end
+end
+# See https://github.com/JuliaLang/julia/issues/32668
+solve_system(::Nothing, LHS, RHS::SparseVector, iterative) = solve_system(nothing, LHS, Vector(RHS), iterative)
+
+MOI.supports(::Model, ::LinearAlgebraSolver) = true
+MOI.get(model::Model, ::LinearAlgebraSolver) = model.linear_solver
+function MOI.set(model::Model, ::LinearAlgebraSolver, linear_solver)
+    model.linear_solver = linear_solver
+end
+
 end
diff --git a/test/solver_interface.jl b/test/solver_interface.jl
@@ -32,3 +32,21 @@ end
     @test_throws ErrorException DiffOpt.forward_differentiate!(model)
     @test_throws ErrorException DiffOpt.reverse_differentiate!(model)
 end
+
+struct TestSolver
+end
+
+# always use IterativeSolvers
+function DiffOpt.QuadraticProgram.solve_system(::TestSolver, LHS, RHS, iterative::Bool)
+    IterativeSolvers.lsqr(LHS, RHS)
+end
+
+@testset "Setting the linear solver in the quadratic solver" begin
+    model = DiffOpt.QuadraticProgram.Model()
+    @test MOI.supports(model, DiffOpt.QuadraticProgram.LinearAlgebraSolver())
+    @test MOI.get(model, DiffOpt.QuadraticProgram.LinearAlgebraSolver()) === nothing
+    MOI.set(model, DiffOpt.QuadraticProgram.LinearAlgebraSolver(), TestSolver())
+    @test MOI.get(model, DiffOpt.QuadraticProgram.LinearAlgebraSolver()) == TestSolver()
+    MOI.empty!(model)
+    @test MOI.get(model, DiffOpt.QuadraticProgram.LinearAlgebraSolver()) == TestSolver()
+end