Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
vllm-gateway		vllm-gateway
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Repository files navigation

vx

Building an inference optimizer

Components

vLLM Gateway

FastAPI-based gateway for vLLM with comprehensive monitoring, metrics, and load testing capabilities.

Features:

Prometheus metrics (TTFT, tokens/sec, RPS, queue depth)
Grafana dashboards
GPU utilization monitoring
k6 load testing (10/50/100 concurrent users)

See vllm-gateway/README.md for details.

About

An inference optimizer

Apache-2.0 license

Report repository

Releases

No releases published

Packages

Contributors

Languages