janhq
diff --git a/‎docs/docs/cli/models/index.mdx‎
Lines changed: 5 additions & 2 deletions b/‎docs/docs/cli/models/index.mdx‎
Lines changed: 5 additions & 2 deletions
diff --git a/‎docs/static/openapi/cortex.json‎
Lines changed: 53 additions & 0 deletions b/‎docs/static/openapi/cortex.json‎
Lines changed: 53 additions & 0 deletions
diff --git a/‎engine/cli/command_line_parser.cc‎
Lines changed: 9 additions & 4 deletions b/‎engine/cli/command_line_parser.cc‎
Lines changed: 9 additions & 4 deletions
diff --git a/‎engine/cli/command_line_parser.h‎
Lines changed: 2 additions & 0 deletions b/‎engine/cli/command_line_parser.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎engine/cli/commands/model_list_cmd.cc‎
Lines changed: 30 additions & 1 deletion b/‎engine/cli/commands/model_list_cmd.cc‎
Lines changed: 30 additions & 1 deletion
diff --git a/‎engine/cli/commands/model_list_cmd.h‎
Lines changed: 2 additions & 1 deletion b/‎engine/cli/commands/model_list_cmd.h‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎engine/controllers/models.cc‎
Lines changed: 4 additions & 0 deletions b/‎engine/controllers/models.cc‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎engine/main.cc‎
Lines changed: 1 addition & 0 deletions b/‎engine/main.cc‎
Lines changed: 1 addition & 0 deletions
@@ -120,8 +120,11 @@ For example, it returns the following:w
 
 | Option                    | Description                                        | Required | Default value | Example              |
 |---------------------------|----------------------------------------------------|----------|---------------|----------------------|
-| `-h`, `--help`            | Display help for command.                          | No       | -             | `-h`             |
-<!-- | `-f`, `--format <format>` | Specify output format for the models list.         | No       | `json`        | `-f json`       | -->
+| `-h`, `--help`            | Display help for command.                          | No       | -             | `-h`                 |
+| `-e`, `--engine`          | Display engines.                                   | No       | -             | `--engine`           |
+| `-v`, `--version`         | Display version for model.                         | No       | -             | `--version`          |
+| `--cpu_mode`              | Display CPU mode.                                  | No       | -             | `--cpu_mode`         |
+| `--gpu_mode`              | Display GPU mode.                                  | No       | -             | `--gpu_mode`         |
 
 ## `cortex models start`
 :::info
 
@@ -3940,6 +3940,55 @@
         },
         "required": ["description", "name", "productName", "status"]
       },
+      "CpuModeDto": {
+        "type": "object",
+        "properties": {
+          "ram": {
+            "type": "number",
+            "example": 1024
+          }
+        }
+      },
+      "GpuModeDto": {
+        "type": "object",
+        "properties": {
+          "ram": {
+            "type": "number",
+            "example": 1024
+          },
+          "vram": {
+            "type": "number",
+            "example": 1024
+          },
+          "ngl": {
+            "type": "number",
+            "example": 30
+          },
+          "context_length": {
+            "type": "number",
+            "example": 4096
+          },
+          "recommend_ngl": {
+            "type": "number",
+            "example": 33
+          }
+        }
+      },
+      "RecommendDto": {
+        "type": "object",
+        "properties": {
+          "cpu_mode": {
+            "type": "object",
+            "$ref": "#/components/schemas/CpuModeDto"
+          },
+          "gpu_mode": {
+            "type": "array",
+            "items": {
+              "$ref": "#/components/schemas/GPUDto"
+            }
+          }
+        }
+      },
       "ModelDto": {
         "type": "object",
         "properties": {
@@ -4064,6 +4113,10 @@
             "type": "string",
             "description": "The engine to use.",
             "example": "llamacpp"
+          },
+          "recommendation": {
+            "type": "object",
+            "$ref": "#/components/schemas/RecommendDto"
           }
         },
         "required": ["id"]
 
@@ -245,14 +245,19 @@ void CommandLineParser::SetupModelCommands() {
                             "Display engine");
   list_models_cmd->add_flag("-v,--version", cml_data_.display_version,
                             "Display version");
+  list_models_cmd->add_flag("--cpu_mode", cml_data_.display_cpu_mode,
+                            "Display cpu mode");
+  list_models_cmd->add_flag("--gpu_mode", cml_data_.display_gpu_mode,
+                            "Display gpu mode");
   list_models_cmd->group(kSubcommands);
   list_models_cmd->callback([this]() {
     if (std::exchange(executed_, true))
       return;
-    commands::ModelListCmd().Exec(cml_data_.config.apiServerHost,
-                                  std::stoi(cml_data_.config.apiServerPort),
-                                  cml_data_.filter, cml_data_.display_engine,
-                                  cml_data_.display_version);
+    commands::ModelListCmd().Exec(
+        cml_data_.config.apiServerHost,
+        std::stoi(cml_data_.config.apiServerPort), cml_data_.filter,
+        cml_data_.display_engine, cml_data_.display_version,
+        cml_data_.display_cpu_mode, cml_data_.display_gpu_mode);
   });
 
   auto get_models_cmd =
 
@@ -64,6 +64,8 @@ class CommandLineParser {
     // for model list
     bool display_engine = false;
     bool display_version = false;
+    bool display_cpu_mode = false;
+    bool display_gpu_mode = false;
     std::string filter = "";
     std::string log_level = "INFO";
 
 
@@ -20,7 +20,8 @@ using Row_t =
 
 void ModelListCmd::Exec(const std::string& host, int port,
                         const std::string& filter, bool display_engine,
-                        bool display_version) {
+                        bool display_version, bool display_cpu_mode,
+                        bool display_gpu_mode) {
   // Start server if server is not started yet
   if (!commands::IsServerAlive(host, port)) {
     CLI_LOG("Starting server ...");
@@ -39,6 +40,12 @@ void ModelListCmd::Exec(const std::string& host, int port,
     column_headers.push_back("Version");
   }
 
+  if (display_cpu_mode) {
+    column_headers.push_back("CPU Mode");
+  }
+  if (display_gpu_mode) {
+    column_headers.push_back("GPU Mode");
+  }
   Row_t header{column_headers.begin(), column_headers.end()};
   table.add_row(header);
   table.format().font_color(Color::green);
@@ -77,6 +84,28 @@ void ModelListCmd::Exec(const std::string& host, int port,
         row.push_back(v["version"].asString());
       }
 
+      if (auto& r = v["recommendation"]; !r.isNull()) {
+        if (display_cpu_mode) {
+          if (!r["cpu_mode"].isNull()) {
+            row.push_back("RAM: " + r["cpu_mode"]["ram"].asString() + " MiB");
+          }
+        }
+
+        if (display_gpu_mode) {
+          if (!r["gpu_mode"].isNull()) {
+            std::string s;
+            s += "ngl: " + r["gpu_mode"][0]["ngl"].asString() + " - ";
+            s += "context: " + r["gpu_mode"][0]["context_length"].asString() +
+                 " - ";
+            s += "RAM: " + r["gpu_mode"][0]["ram"].asString() + " MiB - ";
+            s += "VRAM: " + r["gpu_mode"][0]["vram"].asString() + " MiB - ";
+            s += "recommended ngl: " +
+                 r["gpu_mode"][0]["recommend_ngl"].asString();
+            row.push_back(s);
+          }
+        }
+      }
+
       table.add_row({row.begin(), row.end()});
     }
   }
 
@@ -7,6 +7,7 @@ namespace commands {
 class ModelListCmd {
  public:
   void Exec(const std::string& host, int port, const std::string& filter,
-            bool display_engine = false, bool display_version = false);
+            bool display_engine = false, bool display_version = false,
+            bool display_cpu_mode = false, bool display_gpu_mode = false);
 };
 }  // namespace commands
@@ -171,6 +171,10 @@ void Models::ListModel(
         Json::Value obj = model_config.ToJson();
         obj["id"] = model_entry.model;
         obj["model"] = model_entry.model;
+        auto es = model_service_->GetEstimation(model_entry.model);
+        if (es.has_value()) {
+          obj["recommendation"] = hardware::ToJson(es.value());
+        }
         data.append(std::move(obj));
         yaml_handler.Reset();
       } catch (const std::exception& e) {
 
@@ -20,6 +20,7 @@
 #include "utils/event_processor.h"
 #include "utils/file_logger.h"
 #include "utils/file_manager_utils.h"
+#include "utils/hardware/gguf/gguf_file_estimate.h"
 #include "utils/logging_utils.h"
 #include "utils/system_info_utils.h"
 #include "utils/widechar_conv.h"