From 7b19ab34cc5ad260294155b90c9839c0db2738d7 Mon Sep 17 00:00:00 2001
From: Thorrester <sjforrester32@gmail.com>
Date: Wed, 13 May 2026 17:22:38 -0400
Subject: [PATCH 1/5] Add phase 0 observability contract (#297)

---
 crates/scouter_tracing/src/tracer.rs | 429 +++++++++++++++++++++++++++
 1 file changed, 429 insertions(+)
diff --git a/crates/scouter_tracing/src/tracer.rs b/crates/scouter_tracing/src/tracer.rs
index ccd4c448..4fdb212f 100644
--- a/crates/scouter_tracing/src/tracer.rs
+++ b/crates/scouter_tracing/src/tracer.rs
@@ -64,6 +64,303 @@ static SCOUTER_QUEUE_STORE: RwLock<Option<Py<ScouterQueue>>> = RwLock::new(None)
 // Re-export span capture state from scouter-types for use within this crate.
 pub use scouter_types::span_capture::{CAPTURE_BUFFER_MAX, CAPTURE_BUFFERS, CAPTURING};
 
+/// Stable Phase 0 OLAP observability contract.
+///
+/// These names are intentionally centralized before full instrumentation lands.
+/// Server, dataframe, Delta, and object-store instrumentation should use these
+/// constants instead of string literals so Phase 0 baseline artifacts remain
+/// comparable across later optimization phases.
+pub mod phase0_observability {
+    /// HTTP route contract for the five Phase 0 trace endpoints.
+    pub mod routes {
+        pub const TRACE_PAGINATED_METHOD: &str = "POST";
+        pub const TRACE_PAGINATED_PATH: &str = "{prefix}/trace/paginated";
+        pub const TRACE_PAGINATED_HANDLER: &str = "paginated_traces";
+
+        pub const TRACE_SPANS_METHOD: &str = "GET";
+        pub const TRACE_SPANS_PATH: &str = "{prefix}/trace/spans";
+        pub const TRACE_SPANS_HANDLER: &str = "get_trace_spans";
+
+        pub const TRACE_METRICS_METHOD: &str = "POST";
+        pub const TRACE_METRICS_PATH: &str = "{prefix}/trace/metrics";
+        pub const TRACE_METRICS_HANDLER: &str = "trace_metrics";
+
+        pub const V1_TRACE_SPANS_METHOD: &str = "GET";
+        pub const V1_TRACE_SPANS_PATH: &str = "{prefix}/v1/traces/{id}/spans";
+        pub const V1_TRACE_SPANS_HANDLER: &str = "get_trace_spans_by_id";
+
+        pub const V1_TRACES_METHOD: &str = "POST";
+        pub const V1_TRACES_PATH: &str = "{prefix}/v1/traces";
+        pub const V1_TRACES_HANDLER: &str = "v1_otel_traces";
+    }
+
+    /// Span names used by Phase 0 server and analytical query instrumentation.
+    pub mod span_names {
+        pub const PAGINATED_TRACES_HANDLER: &str = super::routes::TRACE_PAGINATED_HANDLER;
+        pub const GET_TRACE_SPANS_HANDLER: &str = super::routes::TRACE_SPANS_HANDLER;
+        pub const TRACE_METRICS_HANDLER: &str = super::routes::TRACE_METRICS_HANDLER;
+        pub const GET_TRACE_SPANS_BY_ID_HANDLER: &str = super::routes::V1_TRACE_SPANS_HANDLER;
+        pub const V1_OTEL_TRACES_HANDLER: &str = super::routes::V1_TRACES_HANDLER;
+
+        pub const TRACE_QUERY_PAGINATED: &str = "scouter.trace.query.paginated";
+        pub const TRACE_QUERY_METRICS: &str = "scouter.trace.query.metrics";
+        pub const TRACE_QUERY_SPANS: &str = "scouter.trace.query.spans";
+
+        pub const DF_TABLE_RESOLVE: &str = "df.table.resolve";
+        pub const DF_LOGICAL_BUILD: &str = "df.logical.build";
+        pub const DF_PHYSICAL_PLAN: &str = "df.physical.plan";
+        pub const DF_COLLECT: &str = "df.collect";
+        pub const ARROW_CONVERT: &str = "arrow.convert";
+        pub const TRACE_TREE_BUILD: &str = "trace.tree.build";
+
+        pub const DELTA_TABLE_LOAD: &str = "delta.table.load";
+        pub const DELTA_SNAPSHOT_REFRESH: &str = "delta.snapshot.refresh";
+        pub const DELTA_CATALOG_SWAP: &str = "delta.catalog.swap";
+        pub const DELTA_OPTIMIZE: &str = "delta.optimize";
+        pub const UPDATE_INCREMENTAL: &str = "update_incremental";
+
+        /// Shared object-store span name. The concrete operation is recorded in
+        /// `object_store.operation` to keep span-name cardinality stable.
+        pub const OBJECT_STORE_REQUEST: &str = "object_store.request";
+    }
+
+    /// Attribute keys recorded on Phase 0 spans.
+    pub mod attribute_keys {
+        pub const TRACE_QUERY_ENDPOINT: &str = "trace.query.endpoint";
+        pub const TRACE_QUERY_KIND: &str = "trace.query.kind";
+        pub const TRACE_QUERY_HAS_START_TIME: &str = "trace.query.has_start_time";
+        pub const TRACE_QUERY_HAS_END_TIME: &str = "trace.query.has_end_time";
+        pub const TRACE_QUERY_WINDOW_MS: &str = "trace.query.window_ms";
+        pub const TRACE_QUERY_LIMIT: &str = "trace.query.limit";
+        pub const TRACE_QUERY_OFFSET: &str = "trace.query.offset";
+        pub const TRACE_QUERY_TRACE_ID_PRESENT: &str = "trace.query.trace_id_present";
+        pub const TRACE_QUERY_UNBOUNDED: &str = "trace.query.unbounded";
+        pub const TRACE_QUERY_CACHE_HIT: &str = "trace.query.cache.hit";
+        pub const TRACE_QUERY_CACHE_NAME: &str = "trace.query.cache.name";
+        pub const TRACE_QUERY_RESULT_ROWS: &str = "trace.query.result.rows";
+        pub const TRACE_QUERY_RESULT_BYTES_ESTIMATE: &str = "trace.query.result.bytes_estimate";
+        pub const TRACE_QUERY_TABLE_VERSION: &str = "trace.query.table_version";
+        pub const TRACE_QUERY_STORAGE_BACKEND: &str = "trace.query.storage_backend";
+        pub const TRACE_QUERY_REFRESH_ORIGIN: &str = "trace.query.refresh_origin";
+
+        pub const OBJECT_STORE_BACKEND: &str = "object_store.backend";
+        pub const OBJECT_STORE_OPERATION: &str = "object_store.operation";
+        pub const OBJECT_STORE_PATH_KIND: &str = "object_store.path_kind";
+        pub const OBJECT_STORE_PATH_HASH: &str = "object_store.path_hash";
+        pub const OBJECT_STORE_RANGE_START: &str = "object_store.range_start";
+        pub const OBJECT_STORE_RANGE_LEN: &str = "object_store.range_len";
+        pub const OBJECT_STORE_CACHE_HIT: &str = "object_store.cache.hit";
+        pub const OBJECT_STORE_STATUS: &str = "object_store.status";
+        pub const OBJECT_STORE_ERROR_KIND: &str = "object_store.error.kind";
+        pub const PARQUET_FOOTER_CANDIDATE: &str = "parquet_footer_candidate";
+    }
+
+    /// Low-cardinality attribute values used by the Phase 0 contract.
+    pub mod attribute_values {
+        pub const REFRESH_ORIGIN_BACKGROUND: &str = "background";
+        pub const REFRESH_ORIGIN_MAINTENANCE: &str = "maintenance";
+        pub const REFRESH_ORIGIN_REQUEST: &str = "request";
+
+        pub const OBJECT_STORE_OPERATION_LIST: &str = "list";
+        pub const OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER: &str = "list_with_delimiter";
+        pub const OBJECT_STORE_OPERATION_HEAD: &str = "head";
+        pub const OBJECT_STORE_OPERATION_GET: &str = "get";
+        pub const OBJECT_STORE_OPERATION_GET_RANGE: &str = "get_range";
+        pub const OBJECT_STORE_OPERATION_PUT: &str = "put";
+        pub const OBJECT_STORE_OPERATION_DELETE: &str = "delete";
+        pub const OBJECT_STORE_OPERATION_COPY: &str = "copy";
+
+        pub const OBJECT_STORE_PATH_KIND_DELTA_LOG: &str = "delta_log";
+        pub const OBJECT_STORE_PATH_KIND_PARQUET_DATA: &str = "parquet_data";
+        pub const OBJECT_STORE_PATH_KIND_CHECKPOINT: &str = "checkpoint";
+        pub const OBJECT_STORE_PATH_KIND_UNKNOWN: &str = "unknown";
+
+        pub const REFRESH_ENGINE_TRACE_SPANS: &str = "trace_spans";
+        pub const REFRESH_ENGINE_TRACE_SUMMARIES: &str = "trace_summaries";
+        pub const REFRESH_ENGINE_GEN_AI_SPANS: &str = "gen_ai_spans";
+        pub const REFRESH_ENGINE_TRACE_DISPATCH: &str = "trace_dispatch";
+        pub const REFRESH_ENGINE_BIFROST: &str = "bifrost";
+        pub const REFRESH_ENGINE_EVAL_SCENARIOS: &str = "eval_scenarios";
+        pub const REFRESH_ENGINE_CONTROL: &str = "control";
+    }
+
+    /// Prometheus metric names for Phase 0 trace OLAP observability.
+    pub mod metric_names {
+        pub const TRACE_QUERY_DURATION_MS: &str = "scouter_trace_query_duration_ms";
+        pub const TRACE_DF_COLLECT_DURATION_MS: &str = "scouter_trace_df_collect_duration_ms";
+        pub const TRACE_DF_PLAN_DURATION_MS: &str = "scouter_trace_df_plan_duration_ms";
+        pub const TRACE_DELTA_REFRESH_DURATION_MS: &str = "scouter_trace_delta_refresh_duration_ms";
+        pub const TRACE_OBJECT_STORE_REQUESTS_TOTAL: &str =
+            "scouter_trace_object_store_requests_total";
+        pub const TRACE_OBJECT_STORE_REQUEST_DURATION_MS: &str =
+            "scouter_trace_object_store_request_duration_ms";
+        pub const TRACE_OBJECT_STORE_BYTES_TOTAL: &str = "scouter_trace_object_store_bytes_total";
+        pub const TRACE_CACHE_HITS_TOTAL: &str = "scouter_trace_cache_hits_total";
+        pub const TRACE_CACHE_MISSES_TOTAL: &str = "scouter_trace_cache_misses_total";
+        pub const TRACE_UNBOUNDED_LOOKUP_TOTAL: &str = "scouter_trace_unbounded_lookup_total";
+        pub const REFRESH_ON_REQUEST_PATH_TOTAL: &str = "scouter_refresh_on_request_path_total";
+    }
+
+    #[derive(Clone, Copy, Debug, Eq, PartialEq)]
+    pub enum Phase0MetricKind {
+        Counter,
+        Histogram,
+    }
+
+    #[derive(Clone, Copy, Debug, Eq, PartialEq)]
+    pub struct Phase0MetricContract {
+        pub name: &'static str,
+        pub kind: Phase0MetricKind,
+        pub description: &'static str,
+        pub labels: &'static [&'static str],
+    }
+
+    pub const PHASE0_SPAN_NAMES: &[&str] = &[
+        span_names::PAGINATED_TRACES_HANDLER,
+        span_names::GET_TRACE_SPANS_HANDLER,
+        span_names::TRACE_METRICS_HANDLER,
+        span_names::GET_TRACE_SPANS_BY_ID_HANDLER,
+        span_names::V1_OTEL_TRACES_HANDLER,
+        span_names::TRACE_QUERY_PAGINATED,
+        span_names::TRACE_QUERY_METRICS,
+        span_names::TRACE_QUERY_SPANS,
+        span_names::DF_TABLE_RESOLVE,
+        span_names::DF_LOGICAL_BUILD,
+        span_names::DF_PHYSICAL_PLAN,
+        span_names::DF_COLLECT,
+        span_names::ARROW_CONVERT,
+        span_names::TRACE_TREE_BUILD,
+        span_names::DELTA_TABLE_LOAD,
+        span_names::DELTA_SNAPSHOT_REFRESH,
+        span_names::DELTA_CATALOG_SWAP,
+        span_names::DELTA_OPTIMIZE,
+        span_names::UPDATE_INCREMENTAL,
+        span_names::OBJECT_STORE_REQUEST,
+    ];
+
+    pub const PHASE0_TRACE_QUERY_ATTRIBUTE_KEYS: &[&str] = &[
+        attribute_keys::TRACE_QUERY_ENDPOINT,
+        attribute_keys::TRACE_QUERY_KIND,
+        attribute_keys::TRACE_QUERY_HAS_START_TIME,
+        attribute_keys::TRACE_QUERY_HAS_END_TIME,
+        attribute_keys::TRACE_QUERY_WINDOW_MS,
+        attribute_keys::TRACE_QUERY_LIMIT,
+        attribute_keys::TRACE_QUERY_OFFSET,
+        attribute_keys::TRACE_QUERY_TRACE_ID_PRESENT,
+        attribute_keys::TRACE_QUERY_UNBOUNDED,
+        attribute_keys::TRACE_QUERY_CACHE_HIT,
+        attribute_keys::TRACE_QUERY_CACHE_NAME,
+        attribute_keys::TRACE_QUERY_RESULT_ROWS,
+        attribute_keys::TRACE_QUERY_RESULT_BYTES_ESTIMATE,
+        attribute_keys::TRACE_QUERY_TABLE_VERSION,
+        attribute_keys::TRACE_QUERY_STORAGE_BACKEND,
+        attribute_keys::TRACE_QUERY_REFRESH_ORIGIN,
+    ];
+
+    pub const PHASE0_OBJECT_STORE_ATTRIBUTE_KEYS: &[&str] = &[
+        attribute_keys::OBJECT_STORE_BACKEND,
+        attribute_keys::OBJECT_STORE_OPERATION,
+        attribute_keys::OBJECT_STORE_PATH_KIND,
+        attribute_keys::OBJECT_STORE_PATH_HASH,
+        attribute_keys::OBJECT_STORE_RANGE_START,
+        attribute_keys::OBJECT_STORE_RANGE_LEN,
+        attribute_keys::OBJECT_STORE_CACHE_HIT,
+        attribute_keys::OBJECT_STORE_STATUS,
+        attribute_keys::OBJECT_STORE_ERROR_KIND,
+        attribute_keys::PARQUET_FOOTER_CANDIDATE,
+    ];
+
+    pub const PHASE0_METRIC_CONTRACTS: &[Phase0MetricContract] = &[
+        Phase0MetricContract {
+            name: metric_names::TRACE_QUERY_DURATION_MS,
+            kind: Phase0MetricKind::Histogram,
+            description: "End-to-end duration for Phase 0 trace query handlers.",
+            labels: &["endpoint", "kind", "unbounded"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_DF_COLLECT_DURATION_MS,
+            kind: Phase0MetricKind::Histogram,
+            description: "Duration spent in DataFusion collect() for trace queries.",
+            labels: &["endpoint", "table"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_DF_PLAN_DURATION_MS,
+            kind: Phase0MetricKind::Histogram,
+            description: "Duration spent building DataFusion logical or physical plans.",
+            labels: &["endpoint", "phase"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_DELTA_REFRESH_DURATION_MS,
+            kind: Phase0MetricKind::Histogram,
+            description: "Duration spent refreshing Delta snapshots for trace tables.",
+            labels: &["engine", "origin"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_OBJECT_STORE_REQUESTS_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Object-store requests issued by trace analytical paths.",
+            labels: &["backend", "operation", "path_kind", "status"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_OBJECT_STORE_REQUEST_DURATION_MS,
+            kind: Phase0MetricKind::Histogram,
+            description: "Object-store request duration for trace analytical paths.",
+            labels: &["backend", "operation", "path_kind", "status"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_OBJECT_STORE_BYTES_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Object-store bytes read or written by trace analytical paths.",
+            labels: &["backend", "operation", "path_kind"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_CACHE_HITS_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Cache hits observed by trace analytical paths.",
+            labels: &["cache_name"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_CACHE_MISSES_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Cache misses observed by trace analytical paths.",
+            labels: &["cache_name"],
+        },
+        Phase0MetricContract {
+            name: metric_names::TRACE_UNBOUNDED_LOOKUP_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Trace lookups issued without explicit time bounds.",
+            labels: &["endpoint", "kind"],
+        },
+        Phase0MetricContract {
+            name: metric_names::REFRESH_ON_REQUEST_PATH_TOTAL,
+            kind: Phase0MetricKind::Counter,
+            description: "Delta refreshes observed on synchronous request paths.",
+            labels: &["engine"],
+        },
+    ];
+
+    pub const PHASE0_OBJECT_STORE_OPERATIONS: &[&str] = &[
+        attribute_values::OBJECT_STORE_OPERATION_LIST,
+        attribute_values::OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER,
+        attribute_values::OBJECT_STORE_OPERATION_HEAD,
+        attribute_values::OBJECT_STORE_OPERATION_GET,
+        attribute_values::OBJECT_STORE_OPERATION_GET_RANGE,
+        attribute_values::OBJECT_STORE_OPERATION_PUT,
+        attribute_values::OBJECT_STORE_OPERATION_DELETE,
+        attribute_values::OBJECT_STORE_OPERATION_COPY,
+    ];
+
+    pub const PHASE0_REFRESH_ON_REQUEST_ENGINES: &[&str] = &[
+        attribute_values::REFRESH_ENGINE_TRACE_SPANS,
+        attribute_values::REFRESH_ENGINE_TRACE_SUMMARIES,
+        attribute_values::REFRESH_ENGINE_GEN_AI_SPANS,
+        attribute_values::REFRESH_ENGINE_TRACE_DISPATCH,
+        attribute_values::REFRESH_ENGINE_BIFROST,
+        attribute_values::REFRESH_ENGINE_EVAL_SCENARIOS,
+        attribute_values::REFRESH_ENGINE_CONTROL,
+    ];
+}
+
 fn get_tracer_provider() -> Result<Option<Arc<SdkTracerProvider>>, TraceError> {
     TRACER_PROVIDER_STORE
         .read()
@@ -1850,6 +2147,7 @@ mod capture_tests {
     use super::*;
     use scouter_types::trace::{Attribute, SCOUTER_EVAL_RUN_ID_ATTR};
     use serde_json::Value;
+    use std::collections::BTreeSet;
     use std::sync::atomic::Ordering;
 
     const RUN_ID: &str = "capture_test_run";
@@ -1983,4 +2281,135 @@ mod capture_tests {
         assert!(scouter_types::span_capture::get_all_captured_spans(RUN_ID).is_empty());
         reset();
     }
+
+    #[test]
+    fn phase0_route_contract_preserves_in_scope_trace_endpoints() {
+        use phase0_observability::routes;
+
+        assert_eq!(routes::TRACE_PAGINATED_METHOD, "POST");
+        assert_eq!(routes::TRACE_PAGINATED_PATH, "{prefix}/trace/paginated");
+        assert_eq!(routes::TRACE_SPANS_METHOD, "GET");
+        assert_eq!(routes::TRACE_SPANS_PATH, "{prefix}/trace/spans");
+        assert_eq!(routes::TRACE_METRICS_METHOD, "POST");
+        assert_eq!(routes::TRACE_METRICS_PATH, "{prefix}/trace/metrics");
+        assert_eq!(routes::V1_TRACE_SPANS_METHOD, "GET");
+        assert_eq!(routes::V1_TRACE_SPANS_PATH, "{prefix}/v1/traces/{id}/spans");
+        assert_eq!(routes::V1_TRACES_METHOD, "POST");
+        assert_eq!(routes::V1_TRACES_PATH, "{prefix}/v1/traces");
+    }
+
+    #[test]
+    fn phase0_span_names_are_complete_and_unique() {
+        use phase0_observability::{PHASE0_SPAN_NAMES, span_names};
+
+        let expected = [
+            span_names::PAGINATED_TRACES_HANDLER,
+            span_names::GET_TRACE_SPANS_HANDLER,
+            span_names::TRACE_METRICS_HANDLER,
+            span_names::GET_TRACE_SPANS_BY_ID_HANDLER,
+            span_names::V1_OTEL_TRACES_HANDLER,
+            span_names::TRACE_QUERY_PAGINATED,
+            span_names::TRACE_QUERY_METRICS,
+            span_names::TRACE_QUERY_SPANS,
+            span_names::DF_TABLE_RESOLVE,
+            span_names::DF_LOGICAL_BUILD,
+            span_names::DF_PHYSICAL_PLAN,
+            span_names::DF_COLLECT,
+            span_names::ARROW_CONVERT,
+            span_names::TRACE_TREE_BUILD,
+            span_names::DELTA_TABLE_LOAD,
+            span_names::DELTA_SNAPSHOT_REFRESH,
+            span_names::DELTA_CATALOG_SWAP,
+            span_names::DELTA_OPTIMIZE,
+            span_names::UPDATE_INCREMENTAL,
+            span_names::OBJECT_STORE_REQUEST,
+        ];
+
+        assert_eq!(PHASE0_SPAN_NAMES, expected);
+        assert_unique(PHASE0_SPAN_NAMES);
+    }
+
+    #[test]
+    fn phase0_metric_contracts_are_complete_and_unique() {
+        use phase0_observability::{PHASE0_METRIC_CONTRACTS, Phase0MetricKind, metric_names};
+
+        let names: Vec<&str> = PHASE0_METRIC_CONTRACTS
+            .iter()
+            .map(|metric| metric.name)
+            .collect();
+        assert_unique(&names);
+
+        let expected = [
+            metric_names::TRACE_QUERY_DURATION_MS,
+            metric_names::TRACE_DF_COLLECT_DURATION_MS,
+            metric_names::TRACE_DF_PLAN_DURATION_MS,
+            metric_names::TRACE_DELTA_REFRESH_DURATION_MS,
+            metric_names::TRACE_OBJECT_STORE_REQUESTS_TOTAL,
+            metric_names::TRACE_OBJECT_STORE_REQUEST_DURATION_MS,
+            metric_names::TRACE_OBJECT_STORE_BYTES_TOTAL,
+            metric_names::TRACE_CACHE_HITS_TOTAL,
+            metric_names::TRACE_CACHE_MISSES_TOTAL,
+            metric_names::TRACE_UNBOUNDED_LOOKUP_TOTAL,
+            metric_names::REFRESH_ON_REQUEST_PATH_TOTAL,
+        ];
+        assert_eq!(names, expected);
+
+        let refresh_metric = PHASE0_METRIC_CONTRACTS
+            .iter()
+            .find(|metric| metric.name == metric_names::REFRESH_ON_REQUEST_PATH_TOTAL)
+            .unwrap();
+        assert_eq!(refresh_metric.kind, Phase0MetricKind::Counter);
+        assert_eq!(refresh_metric.labels, ["engine"]);
+    }
+
+    #[test]
+    fn phase0_attribute_keys_are_complete_and_unique() {
+        use phase0_observability::{
+            PHASE0_OBJECT_STORE_ATTRIBUTE_KEYS, PHASE0_TRACE_QUERY_ATTRIBUTE_KEYS, attribute_keys,
+        };
+
+        let expected_trace_keys = [
+            attribute_keys::TRACE_QUERY_ENDPOINT,
+            attribute_keys::TRACE_QUERY_KIND,
+            attribute_keys::TRACE_QUERY_HAS_START_TIME,
+            attribute_keys::TRACE_QUERY_HAS_END_TIME,
+            attribute_keys::TRACE_QUERY_WINDOW_MS,
+            attribute_keys::TRACE_QUERY_LIMIT,
+            attribute_keys::TRACE_QUERY_OFFSET,
+            attribute_keys::TRACE_QUERY_TRACE_ID_PRESENT,
+            attribute_keys::TRACE_QUERY_UNBOUNDED,
+            attribute_keys::TRACE_QUERY_CACHE_HIT,
+            attribute_keys::TRACE_QUERY_CACHE_NAME,
+            attribute_keys::TRACE_QUERY_RESULT_ROWS,
+            attribute_keys::TRACE_QUERY_RESULT_BYTES_ESTIMATE,
+            attribute_keys::TRACE_QUERY_TABLE_VERSION,
+            attribute_keys::TRACE_QUERY_STORAGE_BACKEND,
+            attribute_keys::TRACE_QUERY_REFRESH_ORIGIN,
+        ];
+        assert_eq!(PHASE0_TRACE_QUERY_ATTRIBUTE_KEYS, expected_trace_keys);
+        assert_unique(PHASE0_TRACE_QUERY_ATTRIBUTE_KEYS);
+
+        let expected_object_store_keys = [
+            attribute_keys::OBJECT_STORE_BACKEND,
+            attribute_keys::OBJECT_STORE_OPERATION,
+            attribute_keys::OBJECT_STORE_PATH_KIND,
+            attribute_keys::OBJECT_STORE_PATH_HASH,
+            attribute_keys::OBJECT_STORE_RANGE_START,
+            attribute_keys::OBJECT_STORE_RANGE_LEN,
+            attribute_keys::OBJECT_STORE_CACHE_HIT,
+            attribute_keys::OBJECT_STORE_STATUS,
+            attribute_keys::OBJECT_STORE_ERROR_KIND,
+            attribute_keys::PARQUET_FOOTER_CANDIDATE,
+        ];
+        assert_eq!(
+            PHASE0_OBJECT_STORE_ATTRIBUTE_KEYS,
+            expected_object_store_keys
+        );
+        assert_unique(PHASE0_OBJECT_STORE_ATTRIBUTE_KEYS);
+    }
+
+    fn assert_unique(values: &[&str]) {
+        let unique = values.iter().copied().collect::<BTreeSet<_>>();
+        assert_eq!(unique.len(), values.len());
+    }
 }

From 94fa74ce4c8ccef960d3b846a2e824ebdd855b20 Mon Sep 17 00:00:00 2001
From: Thorrester <sjforrester32@gmail.com>
Date: Wed, 13 May 2026 18:16:52 -0400
Subject: [PATCH 2/5] Add phase0 trace query spans (#299)

---
 .../src/parquet/tracing/engine.rs             | 128 ++++-
 .../src/parquet/tracing/queries.rs            | 535 +++++++++++++-----
 .../src/parquet/tracing/summary.rs            | 161 +++++-
 .../src/api/routes/trace/route.rs             | 275 ++++++++-
 4 files changed, 888 insertions(+), 211 deletions(-)

diff --git a/crates/scouter_dataframe/src/parquet/tracing/engine.rs b/crates/scouter_dataframe/src/parquet/tracing/engine.rs
index 6a92fda1..40027bdb 100644
--- a/crates/scouter_dataframe/src/parquet/tracing/engine.rs
+++ b/crates/scouter_dataframe/src/parquet/tracing/engine.rs
@@ -29,7 +29,7 @@ use std::sync::Arc;
 use tokio::sync::oneshot;
 use tokio::sync::{RwLock as AsyncRwLock, mpsc};
 use tokio::time::{Duration, interval};
-use tracing::{debug, error, info, instrument};
+use tracing::{Instrument, Level, debug, error, info, instrument, span};
 use url::Url;
 
 const TRACE_SPAN_TABLE_NAME: &str = "trace_spans";
@@ -38,6 +38,17 @@ const TRACE_SPAN_TABLE_NAME: &str = "trace_spans";
 const TASK_OPTIMIZE: &str = "trace_optimize";
 const TASK_RETENTION: &str = "trace_retention";
 
+mod phase0 {
+    #[allow(dead_code)]
+    pub mod spans {
+        pub const DELTA_TABLE_LOAD: &str = "delta.table.load";
+        pub const DELTA_SNAPSHOT_REFRESH: &str = "delta.snapshot.refresh";
+        pub const DELTA_CATALOG_SWAP: &str = "delta.catalog.swap";
+        pub const DELTA_OPTIMIZE: &str = "delta.optimize";
+        pub const UPDATE_INCREMENTAL: &str = "update_incremental";
+    }
+}
+
 /// Days from year-0001 to Unix epoch (1970-01-01), used to convert chrono → Arrow Date32.
 /// Equivalent to `NaiveDate::from_ymd_opt(1970, 1, 1).unwrap().num_days_from_ce()`.
 const UNIX_EPOCH_DAYS: i32 = 719_163;
@@ -149,6 +160,12 @@ async fn build_or_create_table_inner(
             Ok(builder) => builder
                 .with_storage_backend(store, table_url.clone())
                 .load()
+                .instrument(span!(
+                    Level::INFO,
+                    phase0::spans::DELTA_TABLE_LOAD,
+                    table = TRACE_SPAN_TABLE_NAME,
+                    mode = "probe"
+                ))
                 .await
                 .is_ok(),
             Err(_) => false,
@@ -168,6 +185,12 @@ async fn build_or_create_table_inner(
         let mut table = DeltaTableBuilder::from_url(table_url.clone())?
             .with_storage_backend(store, table_url)
             .load()
+            .instrument(span!(
+                Level::INFO,
+                phase0::spans::DELTA_TABLE_LOAD,
+                table = TRACE_SPAN_TABLE_NAME,
+                mode = "existing"
+            ))
             .await?;
 
         // Schema evolution: add any columns present in the desired schema but missing from the
@@ -254,6 +277,13 @@ impl TraceSpanDBEngine {
         // A freshly-created table has no committed Parquet files yet — table_provider()
         // returns an error in that case. Defer registration until the first write populates the log.
         if let Ok(provider) = delta_table.table_provider().await {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DELTA_CATALOG_SWAP,
+                table = TRACE_SPAN_TABLE_NAME,
+                reason = "init"
+            )
+            .entered();
             catalog.swap(TRACE_SPAN_TABLE_NAME, provider);
         } else {
             info!("Empty table at init — deferring catalog registration until first write");
@@ -416,7 +446,15 @@ impl TraceSpanDBEngine {
 
         let new_provider = updated_table.table_provider().await?;
         // Atomic single-step swap — no deregister/register gap where queries see "not found".
+        let _catalog_span = span!(
+            Level::INFO,
+            phase0::spans::DELTA_CATALOG_SWAP,
+            table = TRACE_SPAN_TABLE_NAME,
+            reason = "write"
+        )
+        .entered();
         self.catalog.swap(TRACE_SPAN_TABLE_NAME, new_provider);
+        drop(_catalog_span);
         // Ensure the table's object store is registered with the DataFusion session
         // so that DeltaScan::scan() can resolve file URLs during query execution.
         updated_table.update_datafusion_session(&self.ctx.state())?;
@@ -431,21 +469,38 @@ impl TraceSpanDBEngine {
 
         let current_table = table_guard.clone();
 
-        let (updated_table, _metrics) = current_table
-            .optimize()
-            .with_target_size(std::num::NonZero::new(128 * 1024 * 1024).unwrap())
-            .with_type(OptimizeType::ZOrder(vec![
-                "start_time".to_string(),
-                "service_name".to_string(),
-            ]))
-            // Bloom filters must be re-specified here — compaction rewrites all Parquet files
-            // from scratch using these properties. Without this, every compaction cycle
-            // silently discards all bloom filters on the rewritten files.
-            .with_writer_properties(Self::build_writer_props())
-            .await?;
+        let optimize_span = span!(
+            Level::INFO,
+            phase0::spans::DELTA_OPTIMIZE,
+            table = TRACE_SPAN_TABLE_NAME
+        );
+        let (updated_table, _metrics) = async {
+            current_table
+                .optimize()
+                .with_target_size(std::num::NonZero::new(128 * 1024 * 1024).unwrap())
+                .with_type(OptimizeType::ZOrder(vec![
+                    "start_time".to_string(),
+                    "service_name".to_string(),
+                ]))
+                // Bloom filters must be re-specified here — compaction rewrites all Parquet files
+                // from scratch using these properties. Without this, every compaction cycle
+                // silently discards all bloom filters on the rewritten files.
+                .with_writer_properties(Self::build_writer_props())
+                .await
+        }
+        .instrument(optimize_span)
+        .await?;
 
-        self.catalog
-            .swap(TRACE_SPAN_TABLE_NAME, updated_table.table_provider().await?);
+        let new_provider = updated_table.table_provider().await?;
+        let _catalog_span = span!(
+            Level::INFO,
+            phase0::spans::DELTA_CATALOG_SWAP,
+            table = TRACE_SPAN_TABLE_NAME,
+            reason = "optimize"
+        )
+        .entered();
+        self.catalog.swap(TRACE_SPAN_TABLE_NAME, new_provider);
+        drop(_catalog_span);
         updated_table.update_datafusion_session(&self.ctx.state())?;
 
         *table_guard = updated_table;
@@ -463,8 +518,16 @@ impl TraceSpanDBEngine {
             .with_enforce_retention_duration(false)
             .await?;
 
-        self.catalog
-            .swap(TRACE_SPAN_TABLE_NAME, updated_table.table_provider().await?);
+        let new_provider = updated_table.table_provider().await?;
+        let _catalog_span = span!(
+            Level::INFO,
+            phase0::spans::DELTA_CATALOG_SWAP,
+            table = TRACE_SPAN_TABLE_NAME,
+            reason = "vacuum"
+        )
+        .entered();
+        self.catalog.swap(TRACE_SPAN_TABLE_NAME, new_provider);
+        drop(_catalog_span);
         updated_table.update_datafusion_session(&self.ctx.state())?;
 
         *table_guard = updated_table;
@@ -498,8 +561,16 @@ impl TraceSpanDBEngine {
             cutoff_date
         );
 
-        self.catalog
-            .swap(TRACE_SPAN_TABLE_NAME, updated_table.table_provider().await?);
+        let new_provider = updated_table.table_provider().await?;
+        let _catalog_span = span!(
+            Level::INFO,
+            phase0::spans::DELTA_CATALOG_SWAP,
+            table = TRACE_SPAN_TABLE_NAME,
+            reason = "expire"
+        )
+        .entered();
+        self.catalog.swap(TRACE_SPAN_TABLE_NAME, new_provider);
+        drop(_catalog_span);
         updated_table.update_datafusion_session(&self.ctx.state())?;
 
         *table_guard = updated_table;
@@ -569,6 +640,7 @@ impl TraceSpanDBEngine {
     /// This is mainly for multiple pods sharing the same storage.
     /// Safety: clones the table before calling `update_incremental` so that a failure
     /// (e.g. "Not a Delta table" on an empty table) leaves the original guard intact.
+    #[instrument(skip_all, name = "delta.snapshot.refresh", fields(table = TRACE_SPAN_TABLE_NAME))]
     async fn refresh_table(&self) -> Result<(), TraceEngineError> {
         let mut table_guard = self.table.write().await;
         let current_version = table_guard.version();
@@ -576,7 +648,15 @@ impl TraceSpanDBEngine {
         // Clone before update_incremental — on failure the clone is discarded and the
         // original guard stays intact, avoiding the corrupted-state bug described at line 301.
         let mut refreshed = table_guard.clone();
-        match refreshed.update_incremental(None).await {
+        match refreshed
+            .update_incremental(None)
+            .instrument(span!(
+                Level::INFO,
+                phase0::spans::UPDATE_INCREMENTAL,
+                table = TRACE_SPAN_TABLE_NAME
+            ))
+            .await
+        {
             Ok(_) => {
                 if refreshed.version() > current_version {
                     info!(
@@ -586,7 +666,15 @@ impl TraceSpanDBEngine {
                     );
                     let new_provider = refreshed.table_provider().await?;
                     // Atomic swap — no gap between deregister and register.
+                    let _catalog_span = span!(
+                        Level::INFO,
+                        phase0::spans::DELTA_CATALOG_SWAP,
+                        table = TRACE_SPAN_TABLE_NAME,
+                        reason = "refresh"
+                    )
+                    .entered();
                     self.catalog.swap(TRACE_SPAN_TABLE_NAME, new_provider);
+                    drop(_catalog_span);
                     refreshed.update_datafusion_session(&self.ctx.state())?;
                     *table_guard = refreshed;
                 }
diff --git a/crates/scouter_dataframe/src/parquet/tracing/queries.rs b/crates/scouter_dataframe/src/parquet/tracing/queries.rs
index b00222c3..f1a6838c 100644
--- a/crates/scouter_dataframe/src/parquet/tracing/queries.rs
+++ b/crates/scouter_dataframe/src/parquet/tracing/queries.rs
@@ -24,7 +24,20 @@ use std::hash::{Hash, Hasher};
 use std::sync::Arc;
 use std::sync::atomic::{AtomicU64, Ordering};
 use std::time::Duration;
-use tracing::{error, info, instrument};
+use tracing::{Instrument, Level, error, info, instrument, span};
+
+mod phase0 {
+    pub mod spans {
+        pub const TRACE_QUERY_METRICS: &str = "scouter.trace.query.metrics";
+        pub const TRACE_QUERY_SPANS: &str = "scouter.trace.query.spans";
+        pub const DF_TABLE_RESOLVE: &str = "df.table.resolve";
+        pub const DF_LOGICAL_BUILD: &str = "df.logical.build";
+        pub const DF_PHYSICAL_PLAN: &str = "df.physical.plan";
+        pub const DF_COLLECT: &str = "df.collect";
+        pub const ARROW_CONVERT: &str = "arrow.convert";
+        pub const TRACE_TREE_BUILD: &str = "trace.tree.build";
+    }
+}
 
 /// Days from year-0001 to Unix epoch (1970-01-01), used to convert chrono → Arrow Date32.
 const UNIX_EPOCH_DAYS: i32 = 719_163;
@@ -128,50 +141,119 @@ struct FlatSpan {
 
 struct TraceQueryBuilder {
     df: DataFrame,
+    endpoint: &'static str,
+    table_name: &'static str,
 }
 
 impl TraceQueryBuilder {
     async fn set_table(
         ctx: Arc<SessionContext>,
         table_name: &str,
+        endpoint: &'static str,
     ) -> Result<Self, TraceEngineError> {
         let df = ctx
             .table(table_name)
+            .instrument(span!(
+                Level::INFO,
+                phase0::spans::DF_TABLE_RESOLVE,
+                endpoint,
+                table = table_name
+            ))
             .await
             .inspect_err(|e| error!("Failed to load table {}: {}", table_name, e))?;
-        Ok(Self { df })
+        Ok(Self {
+            df,
+            endpoint,
+            table_name: SPAN_TABLE_NAME,
+        })
     }
 
     fn select_columns(mut self, columns: &[&str]) -> Result<Self, TraceEngineError> {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = self.endpoint,
+            table = self.table_name,
+            phase = "select_columns"
+        )
+        .entered();
         self.df = self.df.select_columns(columns)?;
         Ok(self)
     }
 
     fn add_filter(mut self, expr: Expr) -> Result<Self, TraceEngineError> {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = self.endpoint,
+            table = self.table_name,
+            phase = "filter"
+        )
+        .entered();
         self.df = self.df.filter(expr)?;
         Ok(self)
     }
 
     fn add_sort(mut self, sort: Vec<SortExpr>) -> Result<Self, TraceEngineError> {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = self.endpoint,
+            table = self.table_name,
+            phase = "sort"
+        )
+        .entered();
         self.df = self.df.sort(sort)?;
         Ok(self)
     }
 
     fn with_limit(mut self, n: Option<usize>) -> Result<Self, TraceEngineError> {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = self.endpoint,
+            table = self.table_name,
+            phase = "limit"
+        )
+        .entered();
         self.df = self.df.limit(0, n)?;
         Ok(self)
     }
 
     async fn execute(self) -> Result<Vec<RecordBatch>, TraceEngineError> {
-        let batches = self
-            .df
-            .collect()
-            .await
-            .inspect_err(|e| error!("Failed to collect query results: {}", e))?;
+        let batches = collect_with_phase0(self.df, self.endpoint, self.table_name).await?;
         Ok(batches)
     }
 }
 
+async fn collect_with_phase0(
+    df: DataFrame,
+    endpoint: &'static str,
+    table_name: &'static str,
+) -> Result<Vec<RecordBatch>, TraceEngineError> {
+    df.clone()
+        .create_physical_plan()
+        .instrument(span!(
+            Level::INFO,
+            phase0::spans::DF_PHYSICAL_PLAN,
+            endpoint,
+            table = table_name
+        ))
+        .await
+        .map_err(TraceEngineError::DatafusionError)?;
+
+    df.collect()
+        .instrument(span!(
+            Level::INFO,
+            phase0::spans::DF_COLLECT,
+            endpoint,
+            table = table_name
+        ))
+        .await
+        .inspect_err(|e| error!("Failed to collect query results: {}", e))
+        .map_err(TraceEngineError::DatafusionError)
+}
+
 /// Extract attributes from a MapArray at a given row index.
 fn extract_attributes(map_array: &MapArray, row_idx: usize) -> Vec<Attribute> {
     if map_array.is_null(row_idx) {
@@ -822,7 +904,7 @@ impl TraceQueries {
     ///
     /// When `trace_id_bytes` is 16 bytes, results are cached for 5 minutes — repeat detail
     /// clicks (common in the UI) return in <1µs without hitting Delta Lake.
-    #[instrument(skip_all)]
+    #[instrument(skip_all, name = "scouter.trace.query.spans")]
     #[allow(clippy::too_many_arguments)]
     pub async fn get_trace_spans(
         &self,
@@ -890,7 +972,12 @@ impl TraceQueries {
         end_time: Option<&DateTime<Utc>>,
         limit: Option<usize>,
     ) -> Result<Vec<TraceSpan>, TraceEngineError> {
-        let mut builder = TraceQueryBuilder::set_table(self.ctx.clone(), SPAN_TABLE_NAME).await?;
+        let mut builder = TraceQueryBuilder::set_table(
+            self.ctx.clone(),
+            SPAN_TABLE_NAME,
+            phase0::spans::TRACE_QUERY_SPANS,
+        )
+        .await?;
 
         // Partition filters FIRST — eliminates whole partition_date=YYYY-MM-DD/ directories
         // at directory level before any file metadata or Parquet statistics are read.
@@ -941,8 +1028,26 @@ impl TraceQueries {
             batches.len()
         );
 
-        let flat_spans = batches_to_flat_spans(batches)?;
-        Ok(build_span_tree(flat_spans))
+        let flat_spans = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::ARROW_CONVERT,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS,
+                table = SPAN_TABLE_NAME
+            )
+            .entered();
+            batches_to_flat_spans(batches)?
+        };
+        let spans = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::TRACE_TREE_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS
+            )
+            .entered();
+            build_span_tree(flat_spans)
+        };
+        Ok(spans)
     }
 
     /// Find committed anchor spans for awaiting eval rows.
@@ -991,8 +1096,12 @@ impl TraceQueries {
                 .map(|span_id| lit(ScalarValue::Binary(Some(span_id.as_bytes().to_vec()))))
                 .collect();
 
-            let mut builder =
-                TraceQueryBuilder::set_table(self.ctx.clone(), SPAN_TABLE_NAME).await?;
+            let mut builder = TraceQueryBuilder::set_table(
+                self.ctx.clone(),
+                SPAN_TABLE_NAME,
+                phase0::spans::TRACE_QUERY_SPANS,
+            )
+            .await?;
             builder = builder.add_filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&window_start)))?;
             builder = builder.add_filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&window_end)))?;
             builder = builder.add_filter(col(END_TIME_COL).gt_eq(ts_lit(&window_start)))?;
@@ -1099,7 +1208,7 @@ impl TraceQueries {
     /// where `parent_span_id IS NULL`. Service filter applies to root spans only.
     ///
     /// `entity_trace_ids` is an optional pre-resolved list of binary trace IDs (16 bytes each).
-    #[instrument(skip_all)]
+    #[instrument(skip_all, name = "scouter.trace.query.metrics")]
     pub async fn get_trace_metrics(
         &self,
         request: &scouter_types::TraceMetricsRequest,
@@ -1125,18 +1234,36 @@ impl TraceQueries {
         let mut spans_df = self
             .ctx
             .table(SPAN_TABLE_NAME)
+            .instrument(span!(
+                Level::INFO,
+                phase0::spans::DF_TABLE_RESOLVE,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME
+            ))
             .await
             .map_err(TraceEngineError::DatafusionError)?;
 
-        // Partition directory pruning — eliminates whole YYYY-MM-DD/ directories before
-        // DataFusion reads a single file's metadata or Parquet column statistics.
-        spans_df = spans_df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&request.start_time)))?;
-        spans_df = spans_df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&request.end_time)))?;
-
-        // Row-group pruning — typed Timestamp(Microsecond, UTC) literals let DataFusion
-        // use Parquet column min/max stats within the surviving partition directories.
-        spans_df = spans_df.filter(col(START_TIME_COL).gt_eq(ts_lit(&request.start_time)))?;
-        spans_df = spans_df.filter(col(START_TIME_COL).lt(ts_lit(&request.end_time)))?;
+        {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME,
+                phase = "time_filters"
+            )
+            .entered();
+            // Partition directory pruning — eliminates whole YYYY-MM-DD/ directories before
+            // DataFusion reads a single file's metadata or Parquet column statistics.
+            spans_df =
+                spans_df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&request.start_time)))?;
+            spans_df =
+                spans_df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&request.end_time)))?;
+
+            // Row-group pruning — typed Timestamp(Microsecond, UTC) literals let DataFusion
+            // use Parquet column min/max stats within the surviving partition directories.
+            spans_df = spans_df.filter(col(START_TIME_COL).gt_eq(ts_lit(&request.start_time)))?;
+            spans_df = spans_df.filter(col(START_TIME_COL).lt(ts_lit(&request.end_time)))?;
+        }
 
         // ── Phase 3: trace_level — aggregate per-trace ───────────────────────
         //
@@ -1188,7 +1315,17 @@ impl TraceQueries {
             max(error_count_case).alias(ERROR_COUNT_COL),
         ];
 
-        let trace_level_df = spans_df.aggregate(vec![col(TRACE_ID_COL)], agg_exprs)?;
+        let trace_level_df = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME,
+                phase = "trace_level_aggregate"
+            )
+            .entered();
+            spans_df.aggregate(vec![col(TRACE_ID_COL)], agg_exprs)?
+        };
 
         // ── Phase 4: service_filtered — duration_ms, null guard, service filter ──
         //
@@ -1201,9 +1338,19 @@ impl TraceQueries {
             - df_cast(col(START_TIME_COL), DataType::Int64))
             / lit(1000i64);
 
-        let mut service_filtered_df = trace_level_df
-            .filter(col("trace_end").is_not_null())?
-            .with_column("duration_ms", duration_expr)?;
+        let mut service_filtered_df = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME,
+                phase = "service_filter"
+            )
+            .entered();
+            trace_level_df
+                .filter(col("trace_end").is_not_null())?
+                .with_column("duration_ms", duration_expr)?
+        };
 
         if let Some(clause) = &request.clause {
             let summary_view_seq = METRICS_SUMMARY_VIEW_SEQ.fetch_add(1, Ordering::Relaxed);
@@ -1258,7 +1405,17 @@ impl TraceQueries {
         // Replaces the `bucketed` CTE.
         // date_trunc(precision_literal, timestamp_expr) — precision is a Utf8 scalar.
         let bucket_expr = date_trunc(lit(bucket_interval), col(START_TIME_COL));
-        let bucketed_df = service_filtered_df.with_column("bucket_start", bucket_expr)?;
+        let bucketed_df = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME,
+                phase = "bucket"
+            )
+            .entered();
+            service_filtered_df.with_column("bucket_start", bucket_expr)?
+        };
 
         // ── Phase 6: Final bucketed aggregation ─────────────────────────────
         let duration_f64 = df_cast(col("duration_ms"), DataType::Float64);
@@ -1267,115 +1424,138 @@ impl TraceQueries {
 
         // approx_percentile_cont in DataFusion 52: (SortExpr, percentile, limit: Option<Expr>)
         // SortExpr is col.sort(asc, nulls_first); None limit = no row-count cap.
-        let final_df = bucketed_df
-            .aggregate(
-                vec![col("bucket_start")],
-                vec![
-                    count(lit(1i64)).alias("trace_count"),
-                    avg(duration_f64.clone()).alias("avg_duration_ms"),
-                    approx_percentile_cont(
-                        duration_f64.clone().sort(true, false),
-                        lit(0.50f64),
-                        None,
-                    )
-                    .alias("p50_duration_ms"),
-                    approx_percentile_cont(
-                        duration_f64.clone().sort(true, false),
-                        lit(0.95f64),
-                        None,
-                    )
-                    .alias("p95_duration_ms"),
-                    approx_percentile_cont(duration_f64.sort(true, false), lit(0.99f64), None)
-                        .alias("p99_duration_ms"),
-                    avg(error_rate_case).alias("error_rate"),
-                ],
-            )?
-            .sort(vec![col("bucket_start").sort(true, true)])?;
+        let final_df = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME,
+                phase = "final_aggregate"
+            )
+            .entered();
+            bucketed_df
+                .aggregate(
+                    vec![col("bucket_start")],
+                    vec![
+                        count(lit(1i64)).alias("trace_count"),
+                        avg(duration_f64.clone()).alias("avg_duration_ms"),
+                        approx_percentile_cont(
+                            duration_f64.clone().sort(true, false),
+                            lit(0.50f64),
+                            None,
+                        )
+                        .alias("p50_duration_ms"),
+                        approx_percentile_cont(
+                            duration_f64.clone().sort(true, false),
+                            lit(0.95f64),
+                            None,
+                        )
+                        .alias("p95_duration_ms"),
+                        approx_percentile_cont(duration_f64.sort(true, false), lit(0.99f64), None)
+                            .alias("p99_duration_ms"),
+                        avg(error_rate_case).alias("error_rate"),
+                    ],
+                )?
+                .sort(vec![col("bucket_start").sort(true, true)])?
+        };
 
-        let batches = final_df
-            .collect()
-            .await
-            .map_err(TraceEngineError::DatafusionError)?;
+        let batches = collect_with_phase0(
+            final_df,
+            phase0::spans::TRACE_QUERY_METRICS,
+            SPAN_TABLE_NAME,
+        )
+        .await?;
 
         let mut metrics = Vec::new();
-        for batch in &batches {
-            let schema = batch.schema();
-
-            // DATE_TRUNC may return Timestamp(Nanosecond) when string literals in the WHERE
-            // clause cause DataFusion to upcast the column. Cast explicitly to
-            // Timestamp(Microsecond, UTC) so Arrow handles the ns→µs division correctly,
-            // regardless of the sub-type returned by the query plan.
-            let raw_bucket = batch.column(schema.index_of("bucket_start").unwrap());
-            let bucket_arr = arrow::compute::cast(
-                raw_bucket,
-                &arrow::datatypes::DataType::Timestamp(
-                    arrow::datatypes::TimeUnit::Microsecond,
-                    Some("UTC".into()),
-                ),
+        {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::ARROW_CONVERT,
+                endpoint = phase0::spans::TRACE_QUERY_METRICS,
+                table = SPAN_TABLE_NAME
             )
-            .map_err(|e| TraceEngineError::BatchConversion(format!("bucket_start cast: {}", e)))?;
-            let bucket_col = bucket_arr
-                .as_any()
-                .downcast_ref::<TimestampMicrosecondArray>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("bucket_start".into()))?;
-            let count_col = batch
-                .column(schema.index_of("trace_count").unwrap())
-                .as_any()
-                .downcast_ref::<Int64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("trace_count".into()))?;
-            let avg_col = batch
-                .column(schema.index_of("avg_duration_ms").unwrap())
-                .as_any()
-                .downcast_ref::<arrow::array::Float64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("avg_duration_ms".into()))?;
-            let p50_col = batch
-                .column(schema.index_of("p50_duration_ms").unwrap())
-                .as_any()
-                .downcast_ref::<arrow::array::Float64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("p50_duration_ms".into()))?;
-            let p95_col = batch
-                .column(schema.index_of("p95_duration_ms").unwrap())
-                .as_any()
-                .downcast_ref::<arrow::array::Float64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("p95_duration_ms".into()))?;
-            let p99_col = batch
-                .column(schema.index_of("p99_duration_ms").unwrap())
-                .as_any()
-                .downcast_ref::<arrow::array::Float64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("p99_duration_ms".into()))?;
-            let err_col = batch
-                .column(schema.index_of("error_rate").unwrap())
-                .as_any()
-                .downcast_ref::<arrow::array::Float64Array>()
-                .ok_or_else(|| TraceEngineError::BatchConversion("error_rate".into()))?;
-
-            for i in 0..batch.num_rows() {
-                let micros = bucket_col.value(i);
-                let bucket_start = DateTime::from_timestamp_micros(micros)
-                    .unwrap_or_default()
-                    .with_timezone(&Utc);
-
-                metrics.push(TraceMetricBucket {
-                    bucket_start,
-                    trace_count: count_col.value(i),
-                    avg_duration_ms: avg_col.value(i),
-                    p50_duration_ms: if p50_col.is_null(i) {
-                        None
-                    } else {
-                        Some(p50_col.value(i))
-                    },
-                    p95_duration_ms: if p95_col.is_null(i) {
-                        None
-                    } else {
-                        Some(p95_col.value(i))
-                    },
-                    p99_duration_ms: if p99_col.is_null(i) {
-                        None
-                    } else {
-                        Some(p99_col.value(i))
-                    },
-                    error_rate: err_col.value(i),
-                });
+            .entered();
+            for batch in &batches {
+                let schema = batch.schema();
+
+                // DATE_TRUNC may return Timestamp(Nanosecond) when string literals in the WHERE
+                // clause cause DataFusion to upcast the column. Cast explicitly to
+                // Timestamp(Microsecond, UTC) so Arrow handles the ns→µs division correctly,
+                // regardless of the sub-type returned by the query plan.
+                let raw_bucket = batch.column(schema.index_of("bucket_start").unwrap());
+                let bucket_arr = arrow::compute::cast(
+                    raw_bucket,
+                    &arrow::datatypes::DataType::Timestamp(
+                        arrow::datatypes::TimeUnit::Microsecond,
+                        Some("UTC".into()),
+                    ),
+                )
+                .map_err(|e| {
+                    TraceEngineError::BatchConversion(format!("bucket_start cast: {}", e))
+                })?;
+                let bucket_col = bucket_arr
+                    .as_any()
+                    .downcast_ref::<TimestampMicrosecondArray>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("bucket_start".into()))?;
+                let count_col = batch
+                    .column(schema.index_of("trace_count").unwrap())
+                    .as_any()
+                    .downcast_ref::<Int64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("trace_count".into()))?;
+                let avg_col = batch
+                    .column(schema.index_of("avg_duration_ms").unwrap())
+                    .as_any()
+                    .downcast_ref::<arrow::array::Float64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("avg_duration_ms".into()))?;
+                let p50_col = batch
+                    .column(schema.index_of("p50_duration_ms").unwrap())
+                    .as_any()
+                    .downcast_ref::<arrow::array::Float64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("p50_duration_ms".into()))?;
+                let p95_col = batch
+                    .column(schema.index_of("p95_duration_ms").unwrap())
+                    .as_any()
+                    .downcast_ref::<arrow::array::Float64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("p95_duration_ms".into()))?;
+                let p99_col = batch
+                    .column(schema.index_of("p99_duration_ms").unwrap())
+                    .as_any()
+                    .downcast_ref::<arrow::array::Float64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("p99_duration_ms".into()))?;
+                let err_col = batch
+                    .column(schema.index_of("error_rate").unwrap())
+                    .as_any()
+                    .downcast_ref::<arrow::array::Float64Array>()
+                    .ok_or_else(|| TraceEngineError::BatchConversion("error_rate".into()))?;
+
+                for i in 0..batch.num_rows() {
+                    let micros = bucket_col.value(i);
+                    let bucket_start = DateTime::from_timestamp_micros(micros)
+                        .unwrap_or_default()
+                        .with_timezone(&Utc);
+
+                    metrics.push(TraceMetricBucket {
+                        bucket_start,
+                        trace_count: count_col.value(i),
+                        avg_duration_ms: avg_col.value(i),
+                        p50_duration_ms: if p50_col.is_null(i) {
+                            None
+                        } else {
+                            Some(p50_col.value(i))
+                        },
+                        p95_duration_ms: if p95_col.is_null(i) {
+                            None
+                        } else {
+                            Some(p95_col.value(i))
+                        },
+                        p99_duration_ms: if p99_col.is_null(i) {
+                            None
+                        } else {
+                            Some(p99_col.value(i))
+                        },
+                        error_rate: err_col.value(i),
+                    });
+                }
             }
         }
 
@@ -1427,39 +1607,82 @@ impl TraceQueries {
         let mut spans_df = self
             .ctx
             .table(SPAN_TABLE_NAME)
+            .instrument(span!(
+                Level::INFO,
+                phase0::spans::DF_TABLE_RESOLVE,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS,
+                table = SPAN_TABLE_NAME
+            ))
             .await
             .map_err(TraceEngineError::DatafusionError)?;
 
-        if let Some(start) = filters.start_time {
-            spans_df = spans_df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&start)))?;
-            spans_df = spans_df.filter(col(START_TIME_COL).gt_eq(ts_lit(&start)))?;
-        }
-        if let Some(end) = filters.end_time {
-            spans_df = spans_df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&end)))?;
-            spans_df = spans_df.filter(col(START_TIME_COL).lt(ts_lit(&end)))?;
+        {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS,
+                table = SPAN_TABLE_NAME,
+                phase = "filter_trace_spans"
+            )
+            .entered();
+            if let Some(start) = filters.start_time {
+                spans_df = spans_df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&start)))?;
+                spans_df = spans_df.filter(col(START_TIME_COL).gt_eq(ts_lit(&start)))?;
+            }
+            if let Some(end) = filters.end_time {
+                spans_df = spans_df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&end)))?;
+                spans_df = spans_df.filter(col(START_TIME_COL).lt(ts_lit(&end)))?;
+            }
+            spans_df = spans_df.select_columns(SPAN_COLUMNS)?;
+            spans_df = spans_df.sort(vec![col(START_TIME_COL).sort(true, true)])?;
         }
-        spans_df = spans_df.select_columns(SPAN_COLUMNS)?;
-        spans_df = spans_df.sort(vec![col(START_TIME_COL).sort(true, true)])?;
 
         // ── Phase 4: Inner join — spans filtered to the single matching trace ─
-        let result_df = spans_df.join(
-            first_trace_df,
-            JoinType::Inner,
-            &[TRACE_ID_COL],
-            &["_match_tid"],
-            None,
-        )?;
-
-        let batches = result_df
-            .collect()
-            .await
-            .map_err(TraceEngineError::DatafusionError)?;
+        let result_df = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS,
+                table = SPAN_TABLE_NAME,
+                phase = "join_matching_trace"
+            )
+            .entered();
+            spans_df.join(
+                first_trace_df,
+                JoinType::Inner,
+                &[TRACE_ID_COL],
+                &["_match_tid"],
+                None,
+            )?
+        };
+
+        let batches =
+            collect_with_phase0(result_df, phase0::spans::TRACE_QUERY_SPANS, SPAN_TABLE_NAME)
+                .await?;
 
         if batches.is_empty() || batches.iter().all(|b| b.num_rows() == 0) {
             return Ok(Vec::new());
         }
 
-        let flat_spans = batches_to_flat_spans(batches)?;
-        Ok(build_span_tree(flat_spans))
+        let flat_spans = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::ARROW_CONVERT,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS,
+                table = SPAN_TABLE_NAME
+            )
+            .entered();
+            batches_to_flat_spans(batches)?
+        };
+        let spans = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::TRACE_TREE_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_SPANS
+            )
+            .entered();
+            build_span_tree(flat_spans)
+        };
+        Ok(spans)
     }
 }
diff --git a/crates/scouter_dataframe/src/parquet/tracing/summary.rs b/crates/scouter_dataframe/src/parquet/tracing/summary.rs
index 0f0cba91..840aa9c0 100644
--- a/crates/scouter_dataframe/src/parquet/tracing/summary.rs
+++ b/crates/scouter_dataframe/src/parquet/tracing/summary.rs
@@ -28,7 +28,7 @@ use std::sync::Arc;
 use tokio::sync::oneshot;
 use tokio::sync::{RwLock as AsyncRwLock, mpsc};
 use tokio::time::{Duration, interval};
-use tracing::{debug, error, info, instrument};
+use tracing::{Instrument, Level, debug, error, info, instrument, span};
 use url::Url;
 
 /// Days from CE epoch to Unix epoch (1970-01-01).
@@ -40,6 +40,17 @@ const SUMMARY_TABLE_NAME: &str = "trace_summaries";
 /// Control table task name for summary compaction coordination.
 const TASK_SUMMARY_OPTIMIZE: &str = "summary_optimize";
 
+mod phase0 {
+    pub mod spans {
+        pub const TRACE_QUERY_PAGINATED: &str = "scouter.trace.query.paginated";
+        pub const DF_TABLE_RESOLVE: &str = "df.table.resolve";
+        pub const DF_LOGICAL_BUILD: &str = "df.logical.build";
+        pub const DF_PHYSICAL_PLAN: &str = "df.physical.plan";
+        pub const DF_COLLECT: &str = "df.collect";
+        pub const ARROW_CONVERT: &str = "arrow.convert";
+    }
+}
+
 // ── Column name constants ────────────────────────────────────────────────────
 const TRACE_ID_COL: &str = "trace_id";
 const SERVICE_NAME_COL: &str = "service_name";
@@ -783,6 +794,33 @@ pub struct TraceSummaryQueries {
 
 const MAX_PAGE_LIMIT: usize = 500;
 
+async fn collect_with_phase0(
+    df: DataFrame,
+    endpoint: &'static str,
+    table_name: &'static str,
+) -> Result<Vec<RecordBatch>, TraceEngineError> {
+    df.clone()
+        .create_physical_plan()
+        .instrument(span!(
+            Level::INFO,
+            phase0::spans::DF_PHYSICAL_PLAN,
+            endpoint,
+            table = table_name
+        ))
+        .await
+        .map_err(TraceEngineError::DatafusionError)?;
+
+    df.collect()
+        .instrument(span!(
+            Level::INFO,
+            phase0::spans::DF_COLLECT,
+            endpoint,
+            table = table_name
+        ))
+        .await
+        .map_err(TraceEngineError::DatafusionError)
+}
+
 /// Build one summary row per trace over the requested time window.
 ///
 /// The summary table can contain multiple rows for a trace as late spans arrive.
@@ -796,17 +834,35 @@ pub(crate) async fn deduped_summary_df(
     use crate::parquet::tracing::queries::{date_lit, ts_lit};
     use datafusion::functions_aggregate::expr_fn::{first_value, max, min, sum};
 
-    let mut df = ctx.table(SUMMARY_TABLE_NAME).await?;
+    let mut df = ctx
+        .table(SUMMARY_TABLE_NAME)
+        .instrument(span!(
+            Level::INFO,
+            phase0::spans::DF_TABLE_RESOLVE,
+            endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+            table = SUMMARY_TABLE_NAME
+        ))
+        .await?;
 
-    // Time predicates stay first so Delta Lake can prune partitions and Parquet
-    // row groups before the aggregation merges summary fragments per trace.
-    if let Some(start) = time_window.start {
-        df = df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&start)))?;
-        df = df.filter(col(START_TIME_COL).gt_eq(ts_lit(&start)))?;
-    }
-    if let Some(end) = time_window.end {
-        df = df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&end)))?;
-        df = df.filter(col(START_TIME_COL).lt(ts_lit(&end)))?;
+    {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+            table = SUMMARY_TABLE_NAME,
+            phase = "time_filters"
+        )
+        .entered();
+        // Time predicates stay first so Delta Lake can prune partitions and Parquet
+        // row groups before the aggregation merges summary fragments per trace.
+        if let Some(start) = time_window.start {
+            df = df.filter(col(PARTITION_DATE_COL).gt_eq(date_lit(&start)))?;
+            df = df.filter(col(START_TIME_COL).gt_eq(ts_lit(&start)))?;
+        }
+        if let Some(end) = time_window.end {
+            df = df.filter(col(PARTITION_DATE_COL).lt_eq(date_lit(&end)))?;
+            df = df.filter(col(START_TIME_COL).lt(ts_lit(&end)))?;
+        }
     }
 
     let by_span_end: Vec<SortExpr> = vec![
@@ -820,8 +876,16 @@ pub(crate) async fn deduped_summary_df(
 
     // Duration is derived after aggregation because DataFusion cannot reuse two
     // aggregate outputs inside another aggregate expression in the same slot.
-    let df = df
-        .aggregate(
+    let df = {
+        let _span = span!(
+            Level::INFO,
+            phase0::spans::DF_LOGICAL_BUILD,
+            endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+            table = SUMMARY_TABLE_NAME,
+            phase = "dedupe_aggregate"
+        )
+        .entered();
+        df.aggregate(
             vec![col(TRACE_ID_COL)],
             vec![
                 min(col(START_TIME_COL)).alias(START_TIME_COL),
@@ -850,7 +914,8 @@ pub(crate) async fn deduped_summary_df(
             DURATION_MS_COL,
             (col("_max_end_us") - col("_min_start_us")) / lit(1000i64),
         )?
-        .drop_columns(&["_max_end_us", "_min_start_us"])?;
+        .drop_columns(&["_max_end_us", "_min_start_us"])?
+    };
 
     Ok(df)
 }
@@ -870,6 +935,7 @@ impl TraceSummaryQueries {
     /// Time filters are pushed into the SQL WHERE clause for partition pruning.
     ///
     /// Secondary filters (service, errors, cursor) apply to the deduplicated DataFrame.
+    #[instrument(skip_all, name = "scouter.trace.query.paginated")]
     pub async fn get_paginated_traces(
         &self,
         filters: &TraceFilters,
@@ -896,6 +962,14 @@ impl TraceSummaryQueries {
                 })
                 .collect::<Result<_, _>>()?;
             if !binary_ids.is_empty() {
+                let _span = span!(
+                    Level::INFO,
+                    phase0::spans::DF_LOGICAL_BUILD,
+                    endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+                    table = SUMMARY_TABLE_NAME,
+                    phase = "trace_id_filter"
+                )
+                .entered();
                 df = df.filter(col(TRACE_ID_COL).in_list(binary_ids, false))?;
             }
         }
@@ -927,6 +1001,14 @@ impl TraceSummaryQueries {
                         .eq(cursor_ts)
                         .and(col(TRACE_ID_COL).lt(cursor_tid)))
             };
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+                table = SUMMARY_TABLE_NAME,
+                phase = "cursor_filter"
+            )
+            .entered();
             df = df.filter(cursor_expr)?;
         }
 
@@ -948,23 +1030,44 @@ impl TraceSummaryQueries {
         // ── Sort: DESC for "next", ASC for "previous" ────────────────────────
         // "previous" direction fetches the oldest limit+1 items newer than the cursor,
         // which matches the original Rust post-reversal behavior.
-        df = if direction == "previous" {
-            df.sort(vec![
-                col(START_TIME_COL).sort(true, true),
-                col(TRACE_ID_COL).sort(true, true),
-            ])?
-        } else {
-            df.sort(vec![
-                col(START_TIME_COL).sort(false, false),
-                col(TRACE_ID_COL).sort(false, false),
-            ])?
-        };
+        {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::DF_LOGICAL_BUILD,
+                endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+                table = SUMMARY_TABLE_NAME,
+                phase = "sort_limit"
+            )
+            .entered();
+            df = if direction == "previous" {
+                df.sort(vec![
+                    col(START_TIME_COL).sort(true, true),
+                    col(TRACE_ID_COL).sort(true, true),
+                ])?
+            } else {
+                df.sort(vec![
+                    col(START_TIME_COL).sort(false, false),
+                    col(TRACE_ID_COL).sort(false, false),
+                ])?
+            };
 
-        // ── LIMIT pushed into DataFusion (fetch limit+1 to detect next page) ─
-        df = df.limit(0, Some(limit + 1))?;
+            // ── LIMIT pushed into DataFusion (fetch limit+1 to detect next page) ─
+            df = df.limit(0, Some(limit + 1))?;
+        }
 
-        let batches = df.collect().await?;
-        let mut items = batches_to_trace_list_items(batches)?;
+        let batches =
+            collect_with_phase0(df, phase0::spans::TRACE_QUERY_PAGINATED, SUMMARY_TABLE_NAME)
+                .await?;
+        let mut items = {
+            let _span = span!(
+                Level::INFO,
+                phase0::spans::ARROW_CONVERT,
+                endpoint = phase0::spans::TRACE_QUERY_PAGINATED,
+                table = SUMMARY_TABLE_NAME
+            )
+            .entered();
+            batches_to_trace_list_items(batches)?
+        };
 
         let has_more = items.len() > limit;
         if has_more {
diff --git a/crates/scouter_server/src/api/routes/trace/route.rs b/crates/scouter_server/src/api/routes/trace/route.rs
index 31f7192b..1d39abe8 100644
--- a/crates/scouter_server/src/api/routes/trace/route.rs
+++ b/crates/scouter_server/src/api/routes/trace/route.rs
@@ -31,8 +31,91 @@ use scouter_types::{
 use std::collections::HashSet;
 use std::panic::{AssertUnwindSafe, catch_unwind};
 use std::sync::Arc;
+use tracing::field::Empty;
 use tracing::instrument;
-use tracing::{debug, error};
+use tracing::{Span, debug, error, info_span};
+
+mod phase0 {
+    #[allow(dead_code)]
+    pub mod attrs {
+        pub const TRACE_QUERY_ENDPOINT: &str = "trace.query.endpoint";
+        pub const TRACE_QUERY_KIND: &str = "trace.query.kind";
+        pub const TRACE_QUERY_HAS_START_TIME: &str = "trace.query.has_start_time";
+        pub const TRACE_QUERY_HAS_END_TIME: &str = "trace.query.has_end_time";
+        pub const TRACE_QUERY_WINDOW_MS: &str = "trace.query.window_ms";
+        pub const TRACE_QUERY_LIMIT: &str = "trace.query.limit";
+        pub const TRACE_QUERY_OFFSET: &str = "trace.query.offset";
+        pub const TRACE_QUERY_TRACE_ID_PRESENT: &str = "trace.query.trace_id_present";
+        pub const TRACE_QUERY_UNBOUNDED: &str = "trace.query.unbounded";
+        pub const TRACE_QUERY_CACHE_HIT: &str = "trace.query.cache.hit";
+        pub const TRACE_QUERY_CACHE_NAME: &str = "trace.query.cache.name";
+        pub const TRACE_QUERY_RESULT_ROWS: &str = "trace.query.result.rows";
+        pub const TRACE_QUERY_RESULT_BYTES_ESTIMATE: &str = "trace.query.result.bytes_estimate";
+        pub const TRACE_QUERY_TABLE_VERSION: &str = "trace.query.table_version";
+        pub const TRACE_QUERY_STORAGE_BACKEND: &str = "trace.query.storage_backend";
+        pub const TRACE_QUERY_REFRESH_ORIGIN: &str = "trace.query.refresh_origin";
+    }
+
+    pub mod routes {
+        pub const TRACE_PAGINATED_PATH: &str = "{prefix}/trace/paginated";
+        pub const TRACE_SPANS_PATH: &str = "{prefix}/trace/spans";
+        pub const TRACE_METRICS_PATH: &str = "{prefix}/trace/metrics";
+        pub const V1_TRACE_SPANS_PATH: &str = "{prefix}/v1/traces/{id}/spans";
+        pub const V1_TRACES_PATH: &str = "{prefix}/v1/traces";
+    }
+}
+
+fn window_ms(
+    start_time: Option<chrono::DateTime<chrono::Utc>>,
+    end_time: Option<chrono::DateTime<chrono::Utc>>,
+) -> Option<i64> {
+    match (start_time, end_time) {
+        (Some(start), Some(end)) => Some((end - start).num_milliseconds()),
+        _ => None,
+    }
+}
+
+struct TraceQueryAttrs {
+    endpoint: &'static str,
+    kind: &'static str,
+    has_start_time: bool,
+    has_end_time: bool,
+    window_ms: Option<i64>,
+    limit: Option<i64>,
+    offset: Option<i64>,
+    trace_id_present: bool,
+    unbounded: bool,
+}
+
+fn record_trace_query_common(attrs: TraceQueryAttrs) {
+    let span = Span::current();
+    span.record(phase0::attrs::TRACE_QUERY_ENDPOINT, attrs.endpoint);
+    span.record(phase0::attrs::TRACE_QUERY_KIND, attrs.kind);
+    span.record(
+        phase0::attrs::TRACE_QUERY_HAS_START_TIME,
+        attrs.has_start_time,
+    );
+    span.record(phase0::attrs::TRACE_QUERY_HAS_END_TIME, attrs.has_end_time);
+    if let Some(window_ms) = attrs.window_ms {
+        span.record(phase0::attrs::TRACE_QUERY_WINDOW_MS, window_ms);
+    }
+    if let Some(limit) = attrs.limit {
+        span.record(phase0::attrs::TRACE_QUERY_LIMIT, limit);
+    }
+    if let Some(offset) = attrs.offset {
+        span.record(phase0::attrs::TRACE_QUERY_OFFSET, offset);
+    }
+    span.record(
+        phase0::attrs::TRACE_QUERY_TRACE_ID_PRESENT,
+        attrs.trace_id_present,
+    );
+    span.record(phase0::attrs::TRACE_QUERY_UNBOUNDED, attrs.unbounded);
+    span.record(phase0::attrs::TRACE_QUERY_STORAGE_BACKEND, "delta");
+}
+
+fn record_trace_query_result(row_count: usize) {
+    Span::current().record(phase0::attrs::TRACE_QUERY_RESULT_ROWS, row_count as i64);
+}
 
 fn invalid_search_query(err: impl std::fmt::Display) -> (StatusCode, Json<ScouterServerError>) {
     (
@@ -203,13 +286,45 @@ pub async fn get_trace_baggage(
     tag = "traces",
     security(("bearer_token" = []))
 )]
-#[instrument(skip_all)]
+#[instrument(
+    skip_all,
+    name = "paginated_traces",
+    fields(
+        trace.query.endpoint = Empty,
+        trace.query.kind = Empty,
+        trace.query.has_start_time = Empty,
+        trace.query.has_end_time = Empty,
+        trace.query.window_ms = Empty,
+        trace.query.limit = Empty,
+        trace.query.offset = Empty,
+        trace.query.trace_id_present = Empty,
+        trace.query.unbounded = Empty,
+        trace.query.cache.hit = Empty,
+        trace.query.cache.name = Empty,
+        trace.query.result.rows = Empty,
+        trace.query.result.bytes_estimate = Empty,
+        trace.query.table_version = Empty,
+        trace.query.storage_backend = Empty,
+        trace.query.refresh_origin = Empty,
+    )
+)]
 pub async fn paginated_traces(
     State(data): State<Arc<AppState>>,
     Json(body): Json<TraceFilters>,
 ) -> Result<Json<TracePaginationResponse>, (StatusCode, Json<ScouterServerError>)> {
     let body = normalize_trace_filters(body)?;
     validate_filters(&body)?;
+    record_trace_query_common(TraceQueryAttrs {
+        endpoint: phase0::routes::TRACE_PAGINATED_PATH,
+        kind: "paginated",
+        has_start_time: body.start_time.is_some(),
+        has_end_time: body.end_time.is_some(),
+        window_ms: window_ms(body.start_time, body.end_time),
+        limit: body.limit.map(i64::from),
+        offset: None,
+        trace_id_present: body.trace_ids.as_ref().is_some_and(|ids| !ids.is_empty()),
+        unbounded: body.start_time.is_none() && body.end_time.is_none(),
+    });
     debug!(
         "paginated_traces: limit={:?} start={:?} end={:?}",
         body.limit, body.start_time, body.end_time
@@ -239,6 +354,8 @@ pub async fn paginated_traces(
         pagination_response.items.len()
     );
 
+    record_trace_query_result(pagination_response.items.len());
+    let _response_span = info_span!("response.serialize").entered();
     Ok(Json(pagination_response))
 }
 
@@ -256,12 +373,44 @@ pub async fn paginated_traces(
     tag = "traces",
     security(("bearer_token" = []))
 )]
-#[instrument(skip_all)]
+#[instrument(
+    skip_all,
+    name = "get_trace_spans_by_id",
+    fields(
+        trace.query.endpoint = Empty,
+        trace.query.kind = Empty,
+        trace.query.has_start_time = Empty,
+        trace.query.has_end_time = Empty,
+        trace.query.window_ms = Empty,
+        trace.query.limit = Empty,
+        trace.query.offset = Empty,
+        trace.query.trace_id_present = Empty,
+        trace.query.unbounded = Empty,
+        trace.query.cache.hit = Empty,
+        trace.query.cache.name = Empty,
+        trace.query.result.rows = Empty,
+        trace.query.result.bytes_estimate = Empty,
+        trace.query.table_version = Empty,
+        trace.query.storage_backend = Empty,
+        trace.query.refresh_origin = Empty,
+    )
+)]
 pub async fn get_trace_spans_by_id(
     State(data): State<Arc<AppState>>,
     Extension(perms): Extension<UserPermissions>,
     Path(id): Path<String>,
 ) -> Result<Json<TraceSpansResponse>, (StatusCode, Json<ScouterServerError>)> {
+    record_trace_query_common(TraceQueryAttrs {
+        endpoint: phase0::routes::V1_TRACE_SPANS_PATH,
+        kind: "spans_by_id",
+        has_start_time: false,
+        has_end_time: false,
+        window_ms: None,
+        limit: None,
+        offset: None,
+        trace_id_present: true,
+        unbounded: true,
+    });
     debug!("Getting trace spans for trace_id: {}", id);
     let trace_id_bytes = TraceId::hex_to_bytes(&id).map_err(|e| {
         error!("Invalid trace_id hex: {:?}", e);
@@ -293,6 +442,8 @@ pub async fn get_trace_spans_by_id(
             )
         })?;
 
+    record_trace_query_result(spans.len());
+    let _response_span = info_span!("response.serialize").entered();
     Ok(Json(TraceSpansResponse {
         spans: redact_trace_spans_for_permissions(spans, &perms),
     }))
@@ -310,12 +461,44 @@ pub async fn get_trace_spans_by_id(
     tag = "traces",
     security(("bearer_token" = []))
 )]
-#[instrument(skip_all)]
+#[instrument(
+    skip_all,
+    name = "get_trace_spans",
+    fields(
+        trace.query.endpoint = Empty,
+        trace.query.kind = Empty,
+        trace.query.has_start_time = Empty,
+        trace.query.has_end_time = Empty,
+        trace.query.window_ms = Empty,
+        trace.query.limit = Empty,
+        trace.query.offset = Empty,
+        trace.query.trace_id_present = Empty,
+        trace.query.unbounded = Empty,
+        trace.query.cache.hit = Empty,
+        trace.query.cache.name = Empty,
+        trace.query.result.rows = Empty,
+        trace.query.result.bytes_estimate = Empty,
+        trace.query.table_version = Empty,
+        trace.query.storage_backend = Empty,
+        trace.query.refresh_origin = Empty,
+    )
+)]
 pub async fn get_trace_spans(
     State(data): State<Arc<AppState>>,
     Extension(perms): Extension<UserPermissions>,
     Query(params): Query<TraceRequest>,
 ) -> Result<Json<TraceSpansResponse>, (StatusCode, Json<ScouterServerError>)> {
+    record_trace_query_common(TraceQueryAttrs {
+        endpoint: phase0::routes::TRACE_SPANS_PATH,
+        kind: "spans",
+        has_start_time: params.start_time.is_some(),
+        has_end_time: params.end_time.is_some(),
+        window_ms: None,
+        limit: None,
+        offset: None,
+        trace_id_present: true,
+        unbounded: params.start_time.is_none() && params.end_time.is_none(),
+    });
     debug!(
         "Getting trace spans for trace_id: {}, service_name: {:?}",
         params.trace_id, params.service_name,
@@ -366,6 +549,8 @@ pub async fn get_trace_spans(
             )
         })?;
 
+    record_trace_query_result(spans.len());
+    let _response_span = info_span!("response.serialize").entered();
     Ok(Json(TraceSpansResponse {
         spans: redact_trace_spans_for_permissions(spans, &perms),
     }))
@@ -466,12 +651,44 @@ pub async fn query_trace_spans_from_tags(
     tag = "traces",
     security(("bearer_token" = []))
 )]
-#[instrument(skip_all)]
+#[instrument(
+    skip_all,
+    name = "trace_metrics",
+    fields(
+        trace.query.endpoint = Empty,
+        trace.query.kind = Empty,
+        trace.query.has_start_time = Empty,
+        trace.query.has_end_time = Empty,
+        trace.query.window_ms = Empty,
+        trace.query.limit = Empty,
+        trace.query.offset = Empty,
+        trace.query.trace_id_present = Empty,
+        trace.query.unbounded = Empty,
+        trace.query.cache.hit = Empty,
+        trace.query.cache.name = Empty,
+        trace.query.result.rows = Empty,
+        trace.query.result.bytes_estimate = Empty,
+        trace.query.table_version = Empty,
+        trace.query.storage_backend = Empty,
+        trace.query.refresh_origin = Empty,
+    )
+)]
 pub async fn trace_metrics(
     State(data): State<Arc<AppState>>,
     Json(body): Json<TraceMetricsRequest>,
 ) -> Result<Json<TraceMetricsResponse>, (StatusCode, Json<ScouterServerError>)> {
     let body = normalize_metrics_request(body)?;
+    record_trace_query_common(TraceQueryAttrs {
+        endpoint: phase0::routes::TRACE_METRICS_PATH,
+        kind: "metrics",
+        has_start_time: true,
+        has_end_time: true,
+        window_ms: Some((body.end_time - body.start_time).num_milliseconds()),
+        limit: None,
+        offset: None,
+        trace_id_present: false,
+        unbounded: false,
+    });
     if let Some(clause) = &body.clause {
         validate_clause(clause)
             .map_err(|msg| (StatusCode::BAD_REQUEST, Json(ScouterServerError::new(msg))))?;
@@ -509,6 +726,8 @@ pub async fn trace_metrics(
             )
         })?;
 
+    record_trace_query_result(metrics.len());
+    let _response_span = info_span!("response.serialize").entered();
     Ok(Json(TraceMetricsResponse { metrics }))
 }
 
@@ -611,12 +830,44 @@ pub async fn query_spans_from_filters(
     ),
     tag = "traces"
 )]
-#[instrument(skip_all)]
+#[instrument(
+    skip_all,
+    name = "v1_otel_traces",
+    fields(
+        trace.query.endpoint = Empty,
+        trace.query.kind = Empty,
+        trace.query.has_start_time = Empty,
+        trace.query.has_end_time = Empty,
+        trace.query.window_ms = Empty,
+        trace.query.limit = Empty,
+        trace.query.offset = Empty,
+        trace.query.trace_id_present = Empty,
+        trace.query.unbounded = Empty,
+        trace.query.cache.hit = Empty,
+        trace.query.cache.name = Empty,
+        trace.query.result.rows = Empty,
+        trace.query.result.bytes_estimate = Empty,
+        trace.query.table_version = Empty,
+        trace.query.storage_backend = Empty,
+        trace.query.refresh_origin = Empty,
+    )
+)]
 pub async fn v1_otel_traces(
     State(data): State<Arc<AppState>>,
     headers: HeaderMap,
     body: Bytes,
 ) -> Result<axum::response::Response, (StatusCode, Json<ScouterServerError>)> {
+    record_trace_query_common(TraceQueryAttrs {
+        endpoint: phase0::routes::V1_TRACES_PATH,
+        kind: "otel_ingest",
+        has_start_time: false,
+        has_end_time: false,
+        window_ms: None,
+        limit: None,
+        offset: None,
+        trace_id_present: false,
+        unbounded: false,
+    });
     let content_type = headers
         .get(axum::http::header::CONTENT_TYPE)
         .and_then(|v| v.to_str().ok())
@@ -640,6 +891,12 @@ pub async fn v1_otel_traces(
             ))),
         )
     })?;
+    let span_count = request
+        .resource_spans
+        .iter()
+        .flat_map(|resource| &resource.scope_spans)
+        .map(|scope| scope.spans.len())
+        .sum::<usize>();
 
     data.trace_record_tx
         .try_send(TraceServerRecord { request })
@@ -658,6 +915,12 @@ pub async fn v1_otel_traces(
         })?;
 
     let response_bytes = ExportTraceServiceResponse::default().encode_to_vec();
+    record_trace_query_result(span_count);
+    Span::current().record(
+        phase0::attrs::TRACE_QUERY_RESULT_BYTES_ESTIMATE,
+        response_bytes.len() as i64,
+    );
+    let _response_span = info_span!("response.serialize").entered();
     Ok((
         StatusCode::OK,
         [(axum::http::header::CONTENT_TYPE, "application/x-protobuf")],

From 411693235a19c2dc7680102042d9a5f062f8e1d7 Mon Sep 17 00:00:00 2001
From: Thorrester <sjforrester32@gmail.com>
Date: Wed, 13 May 2026 18:29:53 -0400
Subject: [PATCH 3/5] Add object store observability wrapper (#298)

---
 crates/scouter_dataframe/src/caching_store.rs | 215 ++++++-
 crates/scouter_dataframe/src/parquet/utils.rs | 582 ++++++++++++++++++
 2 files changed, 788 insertions(+), 9 deletions(-)

diff --git a/crates/scouter_dataframe/src/caching_store.rs b/crates/scouter_dataframe/src/caching_store.rs
index fc2177c1..21fd6268 100644
--- a/crates/scouter_dataframe/src/caching_store.rs
+++ b/crates/scouter_dataframe/src/caching_store.rs
@@ -1,3 +1,9 @@
+use crate::parquet::utils::{
+    OBJECT_STORE_OPERATION_COPY, OBJECT_STORE_OPERATION_DELETE, OBJECT_STORE_OPERATION_GET_RANGE,
+    OBJECT_STORE_OPERATION_LIST, OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER,
+    OBJECT_STORE_OPERATION_PUT, ObjectStoreRequestTelemetry, get_options_range,
+    observe_object_meta_stream, observed_get_result_bytes,
+};
 use async_trait::async_trait;
 use bytes::Bytes;
 use futures::StreamExt;
@@ -12,6 +18,7 @@ use object_store::{
 use std::fmt;
 use std::sync::Arc;
 use std::time::Duration;
+use tracing::Instrument;
 
 /// Cache key for range reads: (path, start, end).
 #[derive(Clone, Debug, Hash, Eq, PartialEq)]
@@ -25,6 +32,7 @@ struct RangeCacheKey {
 /// Parquet footers are typically well under this; column data reads are larger
 /// and will pass through uncached.
 const MAX_CACHEABLE_BYTES: u64 = 2 * 1024 * 1024;
+const CACHING_STORE_BACKEND: &str = "cache";
 
 /// An `ObjectStore` wrapper that caches `head()` and small `get_range()` responses.
 ///
@@ -99,7 +107,25 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
         payload: PutPayload,
         opts: PutOptions,
     ) -> Result<PutResult> {
-        self.inner.put_opts(location, payload, opts).await
+        let bytes = payload.content_length() as u64;
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            OBJECT_STORE_OPERATION_PUT,
+            Some(location),
+            None,
+            Some(bytes),
+            None,
+        );
+        let result = self
+            .inner
+            .put_opts(location, payload, opts)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(bytes),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
     }
 
     async fn put_multipart_opts(
@@ -107,14 +133,48 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
         location: &Path,
         opts: PutMultipartOptions,
     ) -> Result<Box<dyn MultipartUpload>> {
-        self.inner.put_multipart_opts(location, opts).await
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            OBJECT_STORE_OPERATION_PUT,
+            Some(location),
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .put_multipart_opts(location, opts)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(0),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
     }
 
     async fn get_opts(&self, location: &Path, options: GetOptions) -> Result<GetResult> {
         let key: Arc<str> = location.to_string().into();
+        let operation = if options.head && options.range.is_none() {
+            crate::parquet::utils::OBJECT_STORE_OPERATION_HEAD
+        } else if options.range.is_some() {
+            OBJECT_STORE_OPERATION_GET_RANGE
+        } else {
+            crate::parquet::utils::OBJECT_STORE_OPERATION_GET
+        };
+        let (range_start, range_len) = get_options_range(&options);
 
         if options.head && options.range.is_none() && is_plain_request(&options) {
             if let Some(meta) = self.head_cache.get(&key) {
+                let telemetry = ObjectStoreRequestTelemetry::new(
+                    CACHING_STORE_BACKEND,
+                    operation,
+                    Some(location),
+                    range_start,
+                    range_len,
+                    Some(true),
+                );
+                telemetry.finish_success(0);
                 return Ok(GetResult {
                     payload: GetResultPayload::Stream(futures::stream::empty().boxed()),
                     meta,
@@ -123,7 +183,26 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
                 });
             }
 
-            let result = self.inner.get_opts(location, options).await?;
+            let telemetry = ObjectStoreRequestTelemetry::new(
+                CACHING_STORE_BACKEND,
+                operation,
+                Some(location),
+                range_start,
+                range_len,
+                Some(false),
+            );
+            let result = self
+                .inner
+                .get_opts(location, options)
+                .instrument(telemetry.span())
+                .await;
+            match &result {
+                Ok(result) => {
+                    telemetry.finish_success(observed_get_result_bytes(operation, result))
+                }
+                Err(error) => telemetry.finish_error(error),
+            }
+            let result = result?;
             self.head_cache.insert(key, result.meta.clone());
             return Ok(result);
         }
@@ -134,7 +213,24 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
                 let meta = match self.head_cache.get(&key) {
                     Some(meta) => meta,
                     None => {
-                        let meta = self.inner.head(location).await?;
+                        let head_telemetry = ObjectStoreRequestTelemetry::new(
+                            CACHING_STORE_BACKEND,
+                            crate::parquet::utils::OBJECT_STORE_OPERATION_HEAD,
+                            Some(location),
+                            None,
+                            None,
+                            Some(false),
+                        );
+                        let meta = self
+                            .inner
+                            .head(location)
+                            .instrument(head_telemetry.span())
+                            .await;
+                        match &meta {
+                            Ok(_) => head_telemetry.finish_success(0),
+                            Err(error) => head_telemetry.finish_error(error),
+                        }
+                        let meta = meta?;
                         self.head_cache.insert(key.clone(), meta.clone());
                         meta
                     }
@@ -148,6 +244,15 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
                     };
 
                     if let Some(bytes) = self.range_cache.get(&range_key) {
+                        let telemetry = ObjectStoreRequestTelemetry::new(
+                            CACHING_STORE_BACKEND,
+                            operation,
+                            Some(location),
+                            range_start,
+                            range_len,
+                            Some(true),
+                        );
+                        telemetry.finish_success(bytes.len() as u64);
                         return Ok(GetResult {
                             payload: GetResultPayload::Stream(
                                 futures::stream::once(async move { Ok(bytes) }).boxed(),
@@ -158,7 +263,24 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
                         });
                     }
 
-                    let bytes = self.inner.get_range(location, range.clone()).await?;
+                    let telemetry = ObjectStoreRequestTelemetry::new(
+                        CACHING_STORE_BACKEND,
+                        operation,
+                        Some(location),
+                        range_start,
+                        range_len,
+                        Some(false),
+                    );
+                    let bytes = self
+                        .inner
+                        .get_range(location, range.clone())
+                        .instrument(telemetry.span())
+                        .await;
+                    match &bytes {
+                        Ok(bytes) => telemetry.finish_success(bytes.len() as u64),
+                        Err(error) => telemetry.finish_error(error),
+                    }
+                    let bytes = bytes?;
                     self.range_cache.insert(range_key, bytes.clone());
                     return Ok(GetResult {
                         payload: GetResultPayload::Stream(
@@ -172,7 +294,24 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
             }
         }
 
-        self.inner.get_opts(location, options).await
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            operation,
+            Some(location),
+            range_start,
+            range_len,
+            Some(false),
+        );
+        let result = self
+            .inner
+            .get_opts(location, options)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(result) => telemetry.finish_success(observed_get_result_bytes(operation, result)),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
     }
 
     fn delete_stream(
@@ -185,6 +324,16 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
             .delete_stream(locations)
             .map(move |result| {
                 if let Ok(location) = &result {
+                    let telemetry = ObjectStoreRequestTelemetry::new(
+                        CACHING_STORE_BACKEND,
+                        OBJECT_STORE_OPERATION_DELETE,
+                        Some(location),
+                        None,
+                        None,
+                        None,
+                    );
+                    let _entered = telemetry.enter();
+                    telemetry.finish_success(0);
                     let key: Arc<str> = location.to_string().into();
                     head_cache.invalidate(&key);
                     range_cache.invalidate_all();
@@ -195,15 +344,63 @@ impl<T: ObjectStore> ObjectStore for CachingStore<T> {
     }
 
     fn list(&self, prefix: Option<&Path>) -> BoxStream<'static, Result<ObjectMeta>> {
-        self.inner.list(prefix)
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            OBJECT_STORE_OPERATION_LIST,
+            prefix,
+            None,
+            None,
+            None,
+        );
+        observe_object_meta_stream(self.inner.list(prefix), telemetry)
     }
 
     async fn list_with_delimiter(&self, prefix: Option<&Path>) -> Result<ListResult> {
-        self.inner.list_with_delimiter(prefix).await
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER,
+            prefix,
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .list_with_delimiter(prefix)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(result) => {
+                let object_bytes = result
+                    .objects
+                    .iter()
+                    .fold(0_u64, |bytes, meta| bytes.saturating_add(meta.size));
+                telemetry.finish_success(object_bytes);
+            }
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
     }
 
     async fn copy_opts(&self, from: &Path, to: &Path, options: CopyOptions) -> Result<()> {
-        self.inner.copy_opts(from, to, options).await?;
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            CACHING_STORE_BACKEND,
+            OBJECT_STORE_OPERATION_COPY,
+            Some(from),
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .copy_opts(from, to, options)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(0),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result?;
         let to_key: Arc<str> = to.to_string().into();
         self.head_cache.invalidate(&to_key);
         self.range_cache.invalidate_all();
diff --git a/crates/scouter_dataframe/src/parquet/utils.rs b/crates/scouter_dataframe/src/parquet/utils.rs
index 59fdb92a..849b0c8b 100644
--- a/crates/scouter_dataframe/src/parquet/utils.rs
+++ b/crates/scouter_dataframe/src/parquet/utils.rs
@@ -8,6 +8,7 @@ use arrow_array::RecordBatch;
 use arrow_array::StringViewArray;
 use arrow_array::types::Float64Type;
 use arrow_array::types::TimestampNanosecondType;
+use async_trait::async_trait;
 use chrono::{DateTime, TimeZone, Utc};
 use datafusion::error::{DataFusionError, Result};
 use datafusion::logical_expr::ScalarFunctionArgs;
@@ -20,8 +21,24 @@ use deltalake::DeltaResult;
 use deltalake::logstore::{
     LogStore, LogStoreFactory, ObjectStoreRef, StorageConfig, default_logstore, logstore_factories,
 };
+use futures::Stream;
+use futures::StreamExt;
+use futures::stream::BoxStream;
+use object_store::path::Path;
+use object_store::{
+    CopyOptions, Error as ObjectStoreError, GetOptions, GetRange, GetResult, ListResult,
+    MultipartUpload, ObjectMeta, ObjectStore, PutMultipartOptions, PutOptions, PutPayload,
+    PutResult, Result as ObjectStoreResult,
+};
 use scouter_types::{BinnedMetric, BinnedMetricStats, BinnedMetrics};
+use std::collections::hash_map::DefaultHasher;
+use std::fmt;
+use std::hash::{Hash, Hasher};
+use std::pin::Pin;
 use std::sync::Arc;
+use std::task::{Context, Poll};
+use std::time::Instant;
+use tracing::{Instrument, Span, field};
 use tracing::{debug, error, instrument};
 use url::Url;
 
@@ -192,6 +209,481 @@ impl BinnedMetricsExtractor {
     }
 }
 
+pub(crate) const OBJECT_STORE_SPAN_NAME: &str = "object_store.request";
+pub(crate) const OBJECT_STORE_STATUS_ATTR: &str = "object_store.status";
+pub(crate) const OBJECT_STORE_ERROR_KIND_ATTR: &str = "object_store.error.kind";
+
+pub(crate) const OBJECT_STORE_OPERATION_LIST: &str = "list";
+pub(crate) const OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER: &str = "list_with_delimiter";
+pub(crate) const OBJECT_STORE_OPERATION_HEAD: &str = "head";
+pub(crate) const OBJECT_STORE_OPERATION_GET: &str = "get";
+pub(crate) const OBJECT_STORE_OPERATION_GET_RANGE: &str = "get_range";
+pub(crate) const OBJECT_STORE_OPERATION_PUT: &str = "put";
+pub(crate) const OBJECT_STORE_OPERATION_DELETE: &str = "delete";
+pub(crate) const OBJECT_STORE_OPERATION_COPY: &str = "copy";
+
+pub(crate) const OBJECT_STORE_PATH_KIND_DELTA_LOG: &str = "delta_log";
+pub(crate) const OBJECT_STORE_PATH_KIND_PARQUET_DATA: &str = "parquet_data";
+pub(crate) const OBJECT_STORE_PATH_KIND_CHECKPOINT: &str = "checkpoint";
+pub(crate) const OBJECT_STORE_PATH_KIND_UNKNOWN: &str = "unknown";
+
+const TRACE_OBJECT_STORE_REQUESTS_TOTAL: &str = "scouter_trace_object_store_requests_total";
+const TRACE_OBJECT_STORE_REQUEST_DURATION_MS: &str =
+    "scouter_trace_object_store_request_duration_ms";
+const TRACE_OBJECT_STORE_BYTES_TOTAL: &str = "scouter_trace_object_store_bytes_total";
+const CACHE_HIT_UNKNOWN: &str = "unknown";
+const STATUS_OK: &str = "ok";
+const STATUS_ERROR: &str = "error";
+const STATUS_DROPPED: &str = "dropped";
+const PARQUET_FOOTER_CANDIDATE_MAX_BYTES: u64 = 2 * 1024 * 1024;
+
+pub(crate) fn classify_object_path(location: &Path) -> &'static str {
+    let path = location.as_ref();
+    let file_name = path.rsplit('/').next().unwrap_or(path);
+
+    if path.ends_with("_delta_log/_last_checkpoint") || file_name.contains(".checkpoint.") {
+        OBJECT_STORE_PATH_KIND_CHECKPOINT
+    } else if path.split('/').any(|segment| segment == "_delta_log") {
+        OBJECT_STORE_PATH_KIND_DELTA_LOG
+    } else if path.ends_with(".parquet") {
+        OBJECT_STORE_PATH_KIND_PARQUET_DATA
+    } else {
+        OBJECT_STORE_PATH_KIND_UNKNOWN
+    }
+}
+
+fn path_kind(location: Option<&Path>) -> &'static str {
+    location
+        .map(classify_object_path)
+        .unwrap_or(OBJECT_STORE_PATH_KIND_UNKNOWN)
+}
+
+fn path_hash(location: Option<&Path>) -> String {
+    let mut hasher = DefaultHasher::new();
+    location.map(Path::as_ref).unwrap_or("").hash(&mut hasher);
+    format!("{:016x}", hasher.finish())
+}
+
+fn backend_from_url(location: &Url) -> &'static str {
+    match location.scheme() {
+        "file" => "local",
+        "gs" => "gcs",
+        "s3" | "s3a" => "s3",
+        "az" | "abfs" | "abfss" => "azure",
+        _ => "unknown",
+    }
+}
+
+fn get_operation(options: &GetOptions) -> &'static str {
+    if options.head && options.range.is_none() {
+        OBJECT_STORE_OPERATION_HEAD
+    } else if options.range.is_some() {
+        OBJECT_STORE_OPERATION_GET_RANGE
+    } else {
+        OBJECT_STORE_OPERATION_GET
+    }
+}
+
+pub(crate) fn get_options_range(options: &GetOptions) -> (Option<u64>, Option<u64>) {
+    match options.range.as_ref() {
+        Some(GetRange::Bounded(range)) => (
+            Some(range.start),
+            Some(range.end.saturating_sub(range.start)),
+        ),
+        Some(GetRange::Offset(start)) => (Some(*start), None),
+        Some(GetRange::Suffix(len)) => (None, Some(*len)),
+        None => (None, None),
+    }
+}
+
+pub(crate) fn is_parquet_footer_candidate(location: &Path, range_len: Option<u64>) -> bool {
+    classify_object_path(location) == OBJECT_STORE_PATH_KIND_PARQUET_DATA
+        && range_len
+            .map(|len| len <= PARQUET_FOOTER_CANDIDATE_MAX_BYTES)
+            .unwrap_or(false)
+}
+
+fn object_store_error_kind(error: &ObjectStoreError) -> &'static str {
+    match error {
+        ObjectStoreError::Generic { .. } => "generic",
+        ObjectStoreError::NotFound { .. } => "not_found",
+        ObjectStoreError::InvalidPath { .. } => "invalid_path",
+        ObjectStoreError::JoinError { .. } => "join_error",
+        ObjectStoreError::NotSupported { .. } => "not_supported",
+        ObjectStoreError::AlreadyExists { .. } => "already_exists",
+        ObjectStoreError::Precondition { .. } => "precondition",
+        ObjectStoreError::NotModified { .. } => "not_modified",
+        ObjectStoreError::NotImplemented { .. } => "not_implemented",
+        ObjectStoreError::PermissionDenied { .. } => "permission_denied",
+        ObjectStoreError::Unauthenticated { .. } => "unauthenticated",
+        ObjectStoreError::UnknownConfigurationKey { .. } => "unknown_configuration_key",
+        _ => "unknown",
+    }
+}
+
+#[derive(Clone, Debug)]
+pub(crate) struct ObjectStoreRequestTelemetry {
+    backend: Arc<str>,
+    operation: &'static str,
+    path_kind: &'static str,
+    span: Span,
+    start: Instant,
+}
+
+impl ObjectStoreRequestTelemetry {
+    pub(crate) fn new(
+        backend: impl Into<Arc<str>>,
+        operation: &'static str,
+        location: Option<&Path>,
+        range_start: Option<u64>,
+        range_len: Option<u64>,
+        cache_hit: Option<bool>,
+    ) -> Self {
+        let backend = backend.into();
+        let path_kind = path_kind(location);
+        let path_hash = path_hash(location);
+        let cache_hit_value = cache_hit
+            .map(|hit| hit.to_string())
+            .unwrap_or_else(|| CACHE_HIT_UNKNOWN.to_string());
+        let parquet_footer_candidate = location
+            .map(|path| is_parquet_footer_candidate(path, range_len))
+            .unwrap_or(false);
+
+        let span = tracing::info_span!(
+            OBJECT_STORE_SPAN_NAME,
+            "object_store.backend" = %backend,
+            "object_store.operation" = operation,
+            "object_store.path_kind" = path_kind,
+            "object_store.path_hash" = %path_hash,
+            "object_store.range_start" = range_start.map(|value| value as i64),
+            "object_store.range_len" = range_len.map(|value| value as i64),
+            "object_store.cache.hit" = %cache_hit_value,
+            "object_store.status" = field::Empty,
+            "object_store.error.kind" = field::Empty,
+            "parquet_footer_candidate" = parquet_footer_candidate,
+        );
+
+        Self {
+            backend,
+            operation,
+            path_kind,
+            span,
+            start: Instant::now(),
+        }
+    }
+
+    pub(crate) fn span(&self) -> Span {
+        self.span.clone()
+    }
+
+    pub(crate) fn enter(&self) -> tracing::span::Entered<'_> {
+        self.span.enter()
+    }
+
+    pub(crate) fn finish_success(&self, bytes: u64) {
+        self.finish(STATUS_OK, None, bytes);
+    }
+
+    pub(crate) fn finish_error(&self, error: &ObjectStoreError) {
+        self.finish(STATUS_ERROR, Some(object_store_error_kind(error)), 0);
+    }
+
+    fn finish_dropped(&self, bytes: u64) {
+        self.finish(STATUS_DROPPED, None, bytes);
+    }
+
+    fn finish(&self, status: &'static str, error_kind: Option<&'static str>, bytes: u64) {
+        self.span.record(OBJECT_STORE_STATUS_ATTR, status);
+        if let Some(error_kind) = error_kind {
+            self.span.record(OBJECT_STORE_ERROR_KIND_ATTR, error_kind);
+        }
+
+        let duration_ms = self.start.elapsed().as_secs_f64() * 1000.0;
+        metrics::counter!(
+            TRACE_OBJECT_STORE_REQUESTS_TOTAL,
+            "backend" => self.backend.to_string(),
+            "operation" => self.operation,
+            "path_kind" => self.path_kind,
+            "status" => status,
+        )
+        .increment(1);
+        metrics::histogram!(
+            TRACE_OBJECT_STORE_REQUEST_DURATION_MS,
+            "backend" => self.backend.to_string(),
+            "operation" => self.operation,
+            "path_kind" => self.path_kind,
+            "status" => status,
+        )
+        .record(duration_ms);
+
+        if bytes > 0 {
+            metrics::counter!(
+                TRACE_OBJECT_STORE_BYTES_TOTAL,
+                "backend" => self.backend.to_string(),
+                "operation" => self.operation,
+                "path_kind" => self.path_kind,
+            )
+            .increment(bytes);
+        }
+    }
+}
+
+pub(crate) fn observed_get_result_bytes(operation: &str, result: &GetResult) -> u64 {
+    if operation == OBJECT_STORE_OPERATION_HEAD {
+        0
+    } else if operation == OBJECT_STORE_OPERATION_GET_RANGE {
+        result.range.end.saturating_sub(result.range.start)
+    } else {
+        result.meta.size
+    }
+}
+
+struct ObservedObjectMetaStream {
+    inner: BoxStream<'static, ObjectStoreResult<ObjectMeta>>,
+    telemetry: ObjectStoreRequestTelemetry,
+    bytes: u64,
+    complete: bool,
+}
+
+impl Stream for ObservedObjectMetaStream {
+    type Item = ObjectStoreResult<ObjectMeta>;
+
+    fn poll_next(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<Option<Self::Item>> {
+        let this = self.get_mut();
+        let _entered = this.telemetry.enter();
+        match this.inner.as_mut().poll_next(cx) {
+            Poll::Ready(Some(Ok(meta))) => {
+                this.bytes = this.bytes.saturating_add(meta.size);
+                Poll::Ready(Some(Ok(meta)))
+            }
+            Poll::Ready(Some(Err(error))) => {
+                this.complete = true;
+                this.telemetry.finish_error(&error);
+                Poll::Ready(Some(Err(error)))
+            }
+            Poll::Ready(None) => {
+                this.complete = true;
+                this.telemetry.finish_success(this.bytes);
+                Poll::Ready(None)
+            }
+            Poll::Pending => Poll::Pending,
+        }
+    }
+}
+
+impl Drop for ObservedObjectMetaStream {
+    fn drop(&mut self) {
+        if !self.complete {
+            self.telemetry.finish_dropped(self.bytes);
+        }
+    }
+}
+
+pub(crate) fn observe_object_meta_stream(
+    stream: BoxStream<'static, ObjectStoreResult<ObjectMeta>>,
+    telemetry: ObjectStoreRequestTelemetry,
+) -> BoxStream<'static, ObjectStoreResult<ObjectMeta>> {
+    Box::pin(ObservedObjectMetaStream {
+        inner: stream,
+        telemetry,
+        bytes: 0,
+        complete: false,
+    })
+}
+
+#[derive(Debug, Clone)]
+pub(crate) struct ObjectStoreSpanLayer {
+    inner: ObjectStoreRef,
+    backend: Arc<str>,
+}
+
+impl ObjectStoreSpanLayer {
+    pub(crate) fn new(inner: ObjectStoreRef, backend: impl Into<Arc<str>>) -> Self {
+        Self {
+            inner,
+            backend: backend.into(),
+        }
+    }
+}
+
+impl fmt::Display for ObjectStoreSpanLayer {
+    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
+        write!(f, "ObjectStoreSpanLayer({}, {})", self.backend, self.inner)
+    }
+}
+
+#[async_trait]
+impl ObjectStore for ObjectStoreSpanLayer {
+    async fn put_opts(
+        &self,
+        location: &Path,
+        payload: PutPayload,
+        opts: PutOptions,
+    ) -> ObjectStoreResult<PutResult> {
+        let bytes = payload.content_length() as u64;
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            OBJECT_STORE_OPERATION_PUT,
+            Some(location),
+            None,
+            Some(bytes),
+            None,
+        );
+        let result = self
+            .inner
+            .put_opts(location, payload, opts)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(bytes),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
+    }
+
+    async fn put_multipart_opts(
+        &self,
+        location: &Path,
+        opts: PutMultipartOptions,
+    ) -> ObjectStoreResult<Box<dyn MultipartUpload>> {
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            OBJECT_STORE_OPERATION_PUT,
+            Some(location),
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .put_multipart_opts(location, opts)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(0),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
+    }
+
+    async fn get_opts(&self, location: &Path, options: GetOptions) -> ObjectStoreResult<GetResult> {
+        let operation = get_operation(&options);
+        let (range_start, range_len) = get_options_range(&options);
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            operation,
+            Some(location),
+            range_start,
+            range_len,
+            None,
+        );
+        let result = self
+            .inner
+            .get_opts(location, options)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(result) => telemetry.finish_success(observed_get_result_bytes(operation, result)),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
+    }
+
+    fn delete_stream(
+        &self,
+        locations: BoxStream<'static, ObjectStoreResult<Path>>,
+    ) -> BoxStream<'static, ObjectStoreResult<Path>> {
+        let backend = self.backend.clone();
+        self.inner
+            .delete_stream(locations)
+            .map(move |result| {
+                if let Ok(location) = &result {
+                    let telemetry = ObjectStoreRequestTelemetry::new(
+                        backend.clone(),
+                        OBJECT_STORE_OPERATION_DELETE,
+                        Some(location),
+                        None,
+                        None,
+                        None,
+                    );
+                    let _entered = telemetry.enter();
+                    telemetry.finish_success(0);
+                }
+                result
+            })
+            .boxed()
+    }
+
+    fn list(&self, prefix: Option<&Path>) -> BoxStream<'static, ObjectStoreResult<ObjectMeta>> {
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            OBJECT_STORE_OPERATION_LIST,
+            prefix,
+            None,
+            None,
+            None,
+        );
+        observe_object_meta_stream(self.inner.list(prefix), telemetry)
+    }
+
+    async fn list_with_delimiter(&self, prefix: Option<&Path>) -> ObjectStoreResult<ListResult> {
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            OBJECT_STORE_OPERATION_LIST_WITH_DELIMITER,
+            prefix,
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .list_with_delimiter(prefix)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(result) => {
+                let object_bytes = result
+                    .objects
+                    .iter()
+                    .fold(0_u64, |bytes, meta| bytes.saturating_add(meta.size));
+                telemetry.finish_success(object_bytes);
+            }
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
+    }
+
+    async fn copy_opts(
+        &self,
+        from: &Path,
+        to: &Path,
+        options: CopyOptions,
+    ) -> ObjectStoreResult<()> {
+        let telemetry = ObjectStoreRequestTelemetry::new(
+            self.backend.clone(),
+            OBJECT_STORE_OPERATION_COPY,
+            Some(from),
+            None,
+            None,
+            None,
+        );
+        let result = self
+            .inner
+            .copy_opts(from, to, options)
+            .instrument(telemetry.span())
+            .await;
+        match &result {
+            Ok(_) => telemetry.finish_success(0),
+            Err(error) => telemetry.finish_error(error),
+        }
+        result
+    }
+}
+
+fn object_store_with_spans(store: ObjectStoreRef, backend: &'static str) -> ObjectStoreRef {
+    Arc::new(ObjectStoreSpanLayer::new(store, backend)) as ObjectStoreRef
+}
+
 pub(crate) struct PassthroughLogStoreFactory;
 
 impl LogStoreFactory for PassthroughLogStoreFactory {
@@ -225,6 +717,9 @@ impl LogStoreFactory for PassthroughLogStoreFactory {
         } else {
             prefixed_store
         };
+        let backend = backend_from_url(location);
+        let store = object_store_with_spans(store, backend);
+        let root_store = object_store_with_spans(root_store, backend);
         Ok(default_logstore(store, root_store, location, options))
     }
 }
@@ -439,3 +934,90 @@ pub fn create_attr_match_udf() -> ScalarUDF {
 pub fn match_attr_expr(search_blob: Expr, pattern: Expr) -> Expr {
     create_attr_match_udf().call(vec![search_blob, pattern])
 }
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+    use futures::TryStreamExt;
+    use object_store::ObjectStoreExt;
+    use object_store::memory::InMemory;
+
+    #[test]
+    fn classify_object_paths_by_delta_and_parquet_kind() {
+        assert_eq!(
+            classify_object_path(&Path::from("traces/_delta_log/00000000000000000001.json")),
+            OBJECT_STORE_PATH_KIND_DELTA_LOG
+        );
+        assert_eq!(
+            classify_object_path(&Path::from("traces/_delta_log/_last_checkpoint")),
+            OBJECT_STORE_PATH_KIND_CHECKPOINT
+        );
+        assert_eq!(
+            classify_object_path(&Path::from(
+                "traces/_delta_log/00000000000000000010.checkpoint.parquet"
+            )),
+            OBJECT_STORE_PATH_KIND_CHECKPOINT
+        );
+        assert_eq!(
+            classify_object_path(&Path::from("traces/partition_date=2026-05-13/part.parquet")),
+            OBJECT_STORE_PATH_KIND_PARQUET_DATA
+        );
+        assert_eq!(
+            classify_object_path(&Path::from("traces/readme.txt")),
+            OBJECT_STORE_PATH_KIND_UNKNOWN
+        );
+    }
+
+    #[test]
+    fn identifies_small_parquet_ranges_as_footer_candidates() {
+        let path = Path::from("traces/partition_date=2026-05-13/part.parquet");
+
+        assert!(is_parquet_footer_candidate(&path, Some(64 * 1024)));
+        assert!(!is_parquet_footer_candidate(&path, Some(4 * 1024 * 1024)));
+        assert!(!is_parquet_footer_candidate(
+            &Path::from("traces/_delta_log/00000000000000000001.json"),
+            Some(64 * 1024)
+        ));
+    }
+
+    #[tokio::test]
+    async fn object_store_span_layer_delegates_core_operations() {
+        let inner = Arc::new(InMemory::new()) as ObjectStoreRef;
+        let store = ObjectStoreSpanLayer::new(inner, "memory");
+        let path = Path::from("traces/partition_date=2026-05-13/part.parquet");
+        let copy_path = Path::from("traces/partition_date=2026-05-13/part-copy.parquet");
+
+        store
+            .put(&path, PutPayload::from_static(b"0123456789abcdef"))
+            .await
+            .unwrap();
+
+        let meta = store.head(&path).await.unwrap();
+        assert_eq!(meta.size, 16);
+
+        let all_bytes = store.get(&path).await.unwrap().bytes().await.unwrap();
+        assert_eq!(&all_bytes[..], b"0123456789abcdef");
+
+        let range_bytes = store.get_range(&path, 4..10).await.unwrap();
+        assert_eq!(&range_bytes[..], b"456789");
+
+        let listed = store
+            .list(Some(&Path::from("traces")))
+            .try_collect::<Vec<_>>()
+            .await
+            .unwrap();
+        assert_eq!(listed.len(), 1);
+
+        let delimited = store
+            .list_with_delimiter(Some(&Path::from("traces")))
+            .await
+            .unwrap();
+        assert!(!delimited.common_prefixes.is_empty() || !delimited.objects.is_empty());
+
+        store.copy(&path, &copy_path).await.unwrap();
+        assert_eq!(store.head(&copy_path).await.unwrap().size, 16);
+
+        store.delete(&copy_path).await.unwrap();
+        assert!(store.head(&copy_path).await.is_err());
+    }
+}

From 553a607685000971ef06678e913db7429d263148 Mon Sep 17 00:00:00 2001
From: Thorrester <sjforrester32@gmail.com>
Date: Wed, 13 May 2026 18:42:37 -0400
Subject: [PATCH 4/5] Add tiered OLAP benchmark harness

---
 crates/scouter_dataframe/Cargo.toml           |  12 +
 .../scouter_dataframe/bench_metrics/README.md |   5 +
 .../bench_metrics/t0_bifrost_smoke.json       |  40 ++
 .../bench_metrics/t0_cold_query_smoke.json    |  40 ++
 .../t0_hot_path_cold_query_smoke.json         |  40 ++
 .../t0_refresh_origin_sentinel.json           |  40 ++
 .../benches/counting_object_store.rs          | 199 ++++++
 .../benches/dataset_benchmark.rs              |  99 ++-
 .../benches/hot_path_bench.rs                 | 141 +++-
 .../benches/planner_bench.rs                  |   6 +
 .../benches/session_config_bench.rs           |   5 +
 .../scouter_dataframe/benches/stress_test.rs  |   5 +
 crates/scouter_dataframe/benches/tiers.rs     | 672 ++++++++++++++++++
 .../benches/trace_service_benchmark.rs        | 179 +++++
 crates/scouter_dataframe/benches/utils.rs     | 291 +++++++-
 makefile                                      |  21 +
 16 files changed, 1791 insertions(+), 4 deletions(-)
 create mode 100644 crates/scouter_dataframe/bench_metrics/README.md
 create mode 100644 crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
 create mode 100644 crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
 create mode 100644 crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
 create mode 100644 crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
 create mode 100644 crates/scouter_dataframe/benches/counting_object_store.rs
 create mode 100644 crates/scouter_dataframe/benches/tiers.rs

diff --git a/crates/scouter_dataframe/Cargo.toml b/crates/scouter_dataframe/Cargo.toml
index e2c64505..69f7b405 100644
--- a/crates/scouter_dataframe/Cargo.toml
+++ b/crates/scouter_dataframe/Cargo.toml
@@ -8,10 +8,14 @@ authors = [
 ]
 license = "MIT"
 description = "DataFusion client for long-term storage of scouter data"
+autobenches = false
 
 [lib]
 doctest = false
 
+[features]
+bench-jaeger = []
+
 [dependencies]
 scouter-settings = { workspace = true }
 scouter-types = { workspace = true }
@@ -79,3 +83,11 @@ harness = false
 [[bench]]
 name = "hot_path_bench"
 harness = false
+
+[[bin]]
+name = "bench_tier_filter"
+path = "benches/tiers.rs"
+
+[[bin]]
+name = "bench_compare"
+path = "benches/tiers.rs"
diff --git a/crates/scouter_dataframe/bench_metrics/README.md b/crates/scouter_dataframe/bench_metrics/README.md
new file mode 100644
index 00000000..362b43e2
--- /dev/null
+++ b/crates/scouter_dataframe/bench_metrics/README.md
@@ -0,0 +1,5 @@
+Tier 0 baseline JSON artifacts live in this directory after `make bench.core`
+has been proven to complete under the 15 minute Phase 0.6 budget.
+
+Benchmark runs write fresh artifacts to `target/bench_metrics/`; CI must not
+write into this directory.
diff --git a/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
new file mode 100644
index 00000000..592df24f
--- /dev/null
+++ b/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
@@ -0,0 +1,40 @@
+{
+  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "bench_group": "t0_bifrost_smoke",
+  "tier": 0,
+  "blocking": true,
+  "scenario_class": "bifrost_smoke",
+  "runtime_budget_secs": 120,
+  "actual_runtime_secs": 1.5295609589999999,
+  "fixture_rows": 1000,
+  "fixture_spans": 0,
+  "storage_profile": "P1_local_nvme",
+  "spans": {
+    "delta.snapshot.refresh": {
+      "count": 0,
+      "p50_us": 0,
+      "p95_us": 0,
+      "p99_us": 0,
+      "sum_us": 0
+    },
+    "df.collect": {
+      "count": 1,
+      "p50_us": 2807,
+      "p95_us": 2807,
+      "p99_us": 2807,
+      "sum_us": 2807
+    }
+  },
+  "object_store_counts": {
+    "list": 0,
+    "list_with_delimiter": 0,
+    "head": 0,
+    "get": 0,
+    "get_range": 0,
+    "put": 0,
+    "delete": 0,
+    "copy": 0,
+    "bytes": 0
+  },
+  "refresh_on_request_path_total": 0
+}
diff --git a/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
new file mode 100644
index 00000000..37aa642d
--- /dev/null
+++ b/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
@@ -0,0 +1,40 @@
+{
+  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "bench_group": "t0_cold_query_smoke",
+  "tier": 0,
+  "blocking": true,
+  "scenario_class": "cold_query",
+  "runtime_budget_secs": 120,
+  "actual_runtime_secs": 1.55367525,
+  "fixture_rows": 10080,
+  "fixture_spans": 10080,
+  "storage_profile": "P1_local_nvme",
+  "spans": {
+    "delta.snapshot.refresh": {
+      "count": 0,
+      "p50_us": 0,
+      "p95_us": 0,
+      "p99_us": 0,
+      "sum_us": 0
+    },
+    "df.collect": {
+      "count": 1,
+      "p50_us": 6572,
+      "p95_us": 6572,
+      "p99_us": 6572,
+      "sum_us": 6572
+    }
+  },
+  "object_store_counts": {
+    "list": 0,
+    "list_with_delimiter": 0,
+    "head": 0,
+    "get": 0,
+    "get_range": 0,
+    "put": 0,
+    "delete": 0,
+    "copy": 0,
+    "bytes": 0
+  },
+  "refresh_on_request_path_total": 0
+}
diff --git a/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
new file mode 100644
index 00000000..7fd1aa0d
--- /dev/null
+++ b/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
@@ -0,0 +1,40 @@
+{
+  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "bench_group": "t0_hot_path_cold_query_smoke",
+  "tier": 0,
+  "blocking": true,
+  "scenario_class": "cold_query",
+  "runtime_budget_secs": 120,
+  "actual_runtime_secs": 0.132162208,
+  "fixture_rows": 10000,
+  "fixture_spans": 10000,
+  "storage_profile": "P1_local_nvme",
+  "spans": {
+    "delta.snapshot.refresh": {
+      "count": 0,
+      "p50_us": 0,
+      "p95_us": 0,
+      "p99_us": 0,
+      "sum_us": 0
+    },
+    "df.collect": {
+      "count": 1,
+      "p50_us": 5425,
+      "p95_us": 5425,
+      "p99_us": 5425,
+      "sum_us": 5425
+    }
+  },
+  "object_store_counts": {
+    "list": 0,
+    "list_with_delimiter": 0,
+    "head": 0,
+    "get": 0,
+    "get_range": 0,
+    "put": 0,
+    "delete": 0,
+    "copy": 0,
+    "bytes": 0
+  },
+  "refresh_on_request_path_total": 0
+}
diff --git a/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json b/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
new file mode 100644
index 00000000..ba487e72
--- /dev/null
+++ b/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
@@ -0,0 +1,40 @@
+{
+  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "bench_group": "t0_refresh_origin_sentinel",
+  "tier": 0,
+  "blocking": true,
+  "scenario_class": "refresh_origin_sentinel",
+  "runtime_budget_secs": 30,
+  "actual_runtime_secs": 4.59e-7,
+  "fixture_rows": 0,
+  "fixture_spans": 0,
+  "storage_profile": "P1_local_nvme",
+  "spans": {
+    "delta.snapshot.refresh": {
+      "count": 0,
+      "p50_us": 0,
+      "p95_us": 0,
+      "p99_us": 0,
+      "sum_us": 0
+    },
+    "df.collect": {
+      "count": 0,
+      "p50_us": 0,
+      "p95_us": 0,
+      "p99_us": 0,
+      "sum_us": 0
+    }
+  },
+  "object_store_counts": {
+    "list": 0,
+    "list_with_delimiter": 0,
+    "head": 0,
+    "get": 0,
+    "get_range": 0,
+    "put": 0,
+    "delete": 0,
+    "copy": 0,
+    "bytes": 0
+  },
+  "refresh_on_request_path_total": 0
+}
diff --git a/crates/scouter_dataframe/benches/counting_object_store.rs b/crates/scouter_dataframe/benches/counting_object_store.rs
new file mode 100644
index 00000000..470f7181
--- /dev/null
+++ b/crates/scouter_dataframe/benches/counting_object_store.rs
@@ -0,0 +1,199 @@
+#![allow(dead_code)]
+
+use crate::tiers::ObjectStoreCountSnapshot;
+use async_trait::async_trait;
+use bytes::Bytes;
+use futures::StreamExt;
+use futures::stream::BoxStream;
+use object_store::path::Path;
+use object_store::{
+    CopyOptions, GetOptions, GetRange, GetResult, ListResult, MultipartUpload, ObjectMeta,
+    ObjectStore, PutMultipartOptions, PutOptions, PutPayload, PutResult, Result,
+};
+use std::fmt;
+use std::ops::Range;
+use std::sync::Arc;
+use std::sync::atomic::{AtomicU64, Ordering};
+
+#[derive(Debug, Default)]
+pub struct ObjectStoreCounts {
+    pub list: AtomicU64,
+    pub list_with_delimiter: AtomicU64,
+    pub head: AtomicU64,
+    pub get: AtomicU64,
+    pub get_range: AtomicU64,
+    pub put: AtomicU64,
+    pub delete: AtomicU64,
+    pub copy: AtomicU64,
+    pub bytes: AtomicU64,
+}
+
+impl ObjectStoreCounts {
+    pub fn snapshot(&self) -> ObjectStoreCountSnapshot {
+        ObjectStoreCountSnapshot {
+            list: self.list.load(Ordering::Relaxed),
+            list_with_delimiter: self.list_with_delimiter.load(Ordering::Relaxed),
+            head: self.head.load(Ordering::Relaxed),
+            get: self.get.load(Ordering::Relaxed),
+            get_range: self.get_range.load(Ordering::Relaxed),
+            put: self.put.load(Ordering::Relaxed),
+            delete: self.delete.load(Ordering::Relaxed),
+            copy: self.copy.load(Ordering::Relaxed),
+            bytes: self.bytes.load(Ordering::Relaxed),
+        }
+    }
+}
+
+#[derive(Debug)]
+pub struct CountingObjectStore<S> {
+    inner: S,
+    counts: Arc<ObjectStoreCounts>,
+}
+
+impl<S> CountingObjectStore<S> {
+    pub fn new(inner: S) -> Self {
+        Self {
+            inner,
+            counts: Arc::new(ObjectStoreCounts::default()),
+        }
+    }
+
+    pub fn counts(&self) -> Arc<ObjectStoreCounts> {
+        Arc::clone(&self.counts)
+    }
+
+    pub fn into_inner(self) -> S {
+        self.inner
+    }
+}
+
+impl<S: ObjectStore> fmt::Display for CountingObjectStore<S> {
+    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
+        write!(f, "CountingObjectStore({})", self.inner)
+    }
+}
+
+#[async_trait]
+impl<S: ObjectStore> ObjectStore for CountingObjectStore<S> {
+    async fn put_opts(
+        &self,
+        location: &Path,
+        payload: PutPayload,
+        opts: PutOptions,
+    ) -> Result<PutResult> {
+        self.counts.put.fetch_add(1, Ordering::Relaxed);
+        self.counts
+            .bytes
+            .fetch_add(payload.content_length() as u64, Ordering::Relaxed);
+        self.inner.put_opts(location, payload, opts).await
+    }
+
+    async fn put_multipart_opts(
+        &self,
+        location: &Path,
+        opts: PutMultipartOptions,
+    ) -> Result<Box<dyn MultipartUpload>> {
+        self.counts.put.fetch_add(1, Ordering::Relaxed);
+        self.inner.put_multipart_opts(location, opts).await
+    }
+
+    async fn get_opts(&self, location: &Path, options: GetOptions) -> Result<GetResult> {
+        if options.head {
+            self.counts.head.fetch_add(1, Ordering::Relaxed);
+        } else if options.range.is_some() {
+            self.counts.get_range.fetch_add(1, Ordering::Relaxed);
+        } else {
+            self.counts.get.fetch_add(1, Ordering::Relaxed);
+        }
+
+        let requested_range = options.range.clone();
+        let result = self.inner.get_opts(location, options).await?;
+        let bytes = match requested_range {
+            Some(GetRange::Bounded(range)) => range.end.saturating_sub(range.start),
+            Some(GetRange::Offset(offset)) => result.meta.size.saturating_sub(offset),
+            Some(GetRange::Suffix(suffix)) => suffix.min(result.meta.size),
+            None if !result.range.is_empty() => result.range.end.saturating_sub(result.range.start),
+            None => result.meta.size,
+        };
+        self.counts.bytes.fetch_add(bytes, Ordering::Relaxed);
+        Ok(result)
+    }
+
+    async fn get_ranges(&self, location: &Path, ranges: &[Range<u64>]) -> Result<Vec<Bytes>> {
+        self.counts
+            .get_range
+            .fetch_add(ranges.len() as u64, Ordering::Relaxed);
+        self.counts.bytes.fetch_add(
+            ranges
+                .iter()
+                .map(|range| range.end.saturating_sub(range.start))
+                .sum(),
+            Ordering::Relaxed,
+        );
+        self.inner.get_ranges(location, ranges).await
+    }
+
+    fn delete_stream(
+        &self,
+        locations: BoxStream<'static, Result<Path>>,
+    ) -> BoxStream<'static, Result<Path>> {
+        let counts = Arc::clone(&self.counts);
+        self.inner
+            .delete_stream(locations)
+            .map(move |result| {
+                if result.is_ok() {
+                    counts.delete.fetch_add(1, Ordering::Relaxed);
+                }
+                result
+            })
+            .boxed()
+    }
+
+    fn list(&self, prefix: Option<&Path>) -> BoxStream<'static, Result<ObjectMeta>> {
+        self.counts.list.fetch_add(1, Ordering::Relaxed);
+        self.inner.list(prefix)
+    }
+
+    async fn list_with_delimiter(&self, prefix: Option<&Path>) -> Result<ListResult> {
+        self.counts
+            .list_with_delimiter
+            .fetch_add(1, Ordering::Relaxed);
+        self.inner.list_with_delimiter(prefix).await
+    }
+
+    async fn copy_opts(&self, from: &Path, to: &Path, options: CopyOptions) -> Result<()> {
+        self.counts.copy.fetch_add(1, Ordering::Relaxed);
+        self.inner.copy_opts(from, to, options).await
+    }
+}
+
+#[cfg(test)]
+#[allow(unused_imports)]
+mod tests {
+    use super::*;
+    use object_store::ObjectStoreExt;
+    use object_store::memory::InMemory;
+
+    #[tokio::test]
+    async fn counts_basic_operations() {
+        let store = CountingObjectStore::new(InMemory::new());
+        let path = Path::from("bench/counts.txt");
+
+        store
+            .put(&path, PutPayload::from_static(b"abcdef"))
+            .await
+            .unwrap();
+        let _ = store.head(&path).await.unwrap();
+        let _ = store.get_range(&path, 1..3).await.unwrap();
+        let _ = store.list(None).collect::<Vec<_>>().await;
+        store.delete(&path).await.unwrap();
+
+        let snapshot = store.counts().snapshot();
+        assert_eq!(snapshot.put, 1);
+        assert_eq!(snapshot.head, 1);
+        assert_eq!(snapshot.get_range, 1);
+        assert_eq!(snapshot.list, 1);
+        assert_eq!(snapshot.delete, 1);
+        assert!(snapshot.bytes >= 8);
+    }
+}
diff --git a/crates/scouter_dataframe/benches/dataset_benchmark.rs b/crates/scouter_dataframe/benches/dataset_benchmark.rs
index 2f792f2d..4f475a1f 100644
--- a/crates/scouter_dataframe/benches/dataset_benchmark.rs
+++ b/crates/scouter_dataframe/benches/dataset_benchmark.rs
@@ -1,3 +1,6 @@
+mod tiers;
+mod utils;
+
 use arrow::array::{Date32Array, Float64Array, StringArray, TimestampMicrosecondArray};
 use arrow::datatypes::{DataType, Field, Schema, TimeUnit};
 use arrow_array::RecordBatch;
@@ -7,11 +10,16 @@ use scouter_dataframe::parquet::bifrost::manager::DatasetEngineManager;
 use scouter_settings::ObjectStorageSettings;
 use scouter_types::StorageType;
 use scouter_types::dataset::{DatasetFingerprint, DatasetNamespace, DatasetRegistration};
+use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
-use std::time::Duration;
+use std::time::{Duration, Instant};
+use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
 
+const DF_COLLECT_SPAN: &str = "df.collect";
+const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
+
 fn bench_schema() -> Schema {
     Schema::new(vec![
         Field::new("user_id", DataType::Utf8, false),
@@ -73,6 +81,10 @@ fn make_storage_settings(dir: &tempfile::TempDir) -> ObjectStorageSettings {
 }
 
 fn bench_write_throughput(c: &mut Criterion) {
+    if !tiers::tier_guard_for("dataset_benchmark", "dataset_write") {
+        return;
+    }
+
     let mut group = c.benchmark_group("dataset_write");
     group.sample_size(10);
     group.measurement_time(Duration::from_secs(30));
@@ -113,6 +125,10 @@ fn bench_write_throughput(c: &mut Criterion) {
 }
 
 fn bench_query(c: &mut Criterion) {
+    if !tiers::tier_guard_for("dataset_benchmark", "dataset_query") {
+        return;
+    }
+
     let rt = Runtime::new().unwrap();
     let dir = tempfile::tempdir().unwrap();
     let schema = bench_schema();
@@ -178,5 +194,84 @@ fn bench_query(c: &mut Criterion) {
     });
 }
 
-criterion_group!(benches, bench_write_throughput, bench_query);
+fn span_metric(duration: Duration) -> tiers::SpanMetric {
+    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
+    tiers::SpanMetric {
+        count: 1,
+        p50_us: micros,
+        p95_us: micros,
+        p99_us: micros,
+        sum_us: micros,
+    }
+}
+
+fn bench_t0_bifrost_smoke(c: &mut Criterion) {
+    const GROUP: &str = "t0_bifrost_smoke";
+    if !tiers::tier_guard_for("dataset_benchmark", GROUP) {
+        return;
+    }
+
+    let setup_start = Instant::now();
+    let rt = Runtime::new().unwrap();
+    let dir = tempfile::tempdir().unwrap();
+    let schema = bench_schema();
+    let (manager, namespace) = rt.block_on(async {
+        let settings = make_storage_settings(&dir);
+        let manager = DatasetEngineManager::with_config(&settings, 1800, 10, 1, 50_000, 30)
+            .await
+            .unwrap();
+        let reg = make_registration(&schema);
+        manager.register_dataset(&reg).await.unwrap();
+        manager
+            .insert_batch(&reg.namespace, &reg.fingerprint, make_batch(&schema, 1_000))
+            .await
+            .unwrap();
+        tokio::time::sleep(Duration::from_millis(1500)).await;
+        (Arc::new(manager), reg.namespace.clone())
+    });
+    let fqn = namespace.fqn();
+    let sql = format!("SELECT COUNT(*) as cnt FROM {fqn}");
+
+    let smoke_start = Instant::now();
+    rt.block_on(async {
+        let _ = manager.query(&sql).await.unwrap();
+    });
+    let smoke_runtime = smoke_start.elapsed();
+
+    let mut spans = BTreeMap::new();
+    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
+    spans.insert(
+        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
+        tiers::SpanMetric::default(),
+    );
+    utils::write_bench_artifact(
+        "dataset_benchmark",
+        GROUP,
+        setup_start.elapsed(),
+        spans,
+        ObjectStoreCountSnapshot::default(),
+        0,
+    );
+
+    c.bench_function(GROUP, |b| {
+        let mgr = Arc::clone(&manager);
+        let sql = sql.clone();
+        b.to_async(&rt)
+            .iter(|| async { black_box(mgr.query(&sql).await.unwrap()) });
+    });
+
+    rt.block_on(async {
+        Arc::try_unwrap(manager)
+            .unwrap_or_else(|_| panic!("manager still referenced"))
+            .shutdown()
+            .await;
+    });
+}
+
+criterion_group!(
+    benches,
+    bench_t0_bifrost_smoke,
+    bench_write_throughput,
+    bench_query
+);
 criterion_main!(benches);
diff --git a/crates/scouter_dataframe/benches/hot_path_bench.rs b/crates/scouter_dataframe/benches/hot_path_bench.rs
index f83e35f5..f80405a6 100644
--- a/crates/scouter_dataframe/benches/hot_path_bench.rs
+++ b/crates/scouter_dataframe/benches/hot_path_bench.rs
@@ -1,3 +1,6 @@
+mod tiers;
+mod utils;
+
 use chrono::{DateTime, Utc};
 use criterion::{BenchmarkId, Criterion, criterion_group, criterion_main};
 use scouter_dataframe::parquet::tracing::queries::TraceQueries;
@@ -7,9 +10,11 @@ use scouter_types::{
     Attribute, FilterClause, SpanId, StorageType, TraceId, TraceMetricsRequest, TraceSpanRecord,
 };
 use serde_json::json;
+use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
 use std::time::{Duration, Instant};
+use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
 
 const TOTAL_SPANS: usize = 1_000_000;
@@ -17,6 +22,8 @@ const SPANS_PER_TRACE: usize = 5;
 const WRITE_CHUNK_SPANS: usize = 50_000;
 const SERVICE_COUNT: usize = 20;
 const HOT_SERVICE: &str = "service_03";
+const DF_COLLECT_SPAN: &str = "df.collect";
+const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
 
 #[derive(Clone)]
 struct HotFixture {
@@ -161,6 +168,35 @@ async fn seed_fixture(settings: &ObjectStorageSettings) -> HotFixture {
     }
 }
 
+async fn seed_small_fixture(settings: &ObjectStorageSettings, total_spans: usize) -> HotFixture {
+    let service = TraceSpanService::new(settings, 999, Some(1), None, 10, None)
+        .await
+        .unwrap();
+    let base_time = Utc::now() - chrono::Duration::hours(24);
+
+    for start in (0..total_spans).step_by(2_000) {
+        let end = (start + 2_000).min(total_spans);
+        service
+            .write_spans_direct(span_chunk(start, end, base_time))
+            .await
+            .unwrap();
+    }
+    service.optimize().await.unwrap();
+
+    let trace_idx = 24 * 100 + 3;
+    let trace_start = base_time
+        + chrono::Duration::hours((trace_idx % 24) as i64)
+        + chrono::Duration::milliseconds(((trace_idx / 24) % 3_600_000) as i64);
+
+    HotFixture {
+        service: Arc::new(service),
+        trace_id: Arc::new(trace_id(trace_idx).as_bytes().to_vec()),
+        trace_start,
+        window_start: base_time + chrono::Duration::hours(3),
+        window_end: base_time + chrono::Duration::hours(4),
+    }
+}
+
 fn metrics_request(
     start_time: DateTime<Utc>,
     end_time: DateTime<Utc>,
@@ -177,6 +213,12 @@ fn metrics_request(
 }
 
 fn benchmark_trace_hot_paths(c: &mut Criterion) {
+    let run_trace_group = tiers::tier_guard_for("hot_path_bench", "trace_hot_paths_1m");
+    let run_metrics_group = tiers::tier_guard_for("hot_path_bench", "metrics_hot_paths_1m");
+    if !run_trace_group && !run_metrics_group {
+        return;
+    }
+
     let rt = Runtime::new().unwrap();
     let tmp_dir = tempfile::tempdir().unwrap();
     let settings = storage_settings(tmp_dir.path().to_string_lossy().to_string());
@@ -423,5 +465,102 @@ fn benchmark_trace_hot_paths(c: &mut Criterion) {
     drop(tmp_dir);
 }
 
-criterion_group!(benches, benchmark_trace_hot_paths);
+fn span_metric(duration: Duration) -> tiers::SpanMetric {
+    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
+    tiers::SpanMetric {
+        count: 1,
+        p50_us: micros,
+        p95_us: micros,
+        p99_us: micros,
+        sum_us: micros,
+    }
+}
+
+fn benchmark_t0_cold_query_smoke(c: &mut Criterion) {
+    const GROUP: &str = "t0_hot_path_cold_query_smoke";
+    if !tiers::tier_guard_for("hot_path_bench", GROUP) {
+        return;
+    }
+
+    let setup_start = Instant::now();
+    let rt = Runtime::new().unwrap();
+    let tmp_dir = tempfile::tempdir().unwrap();
+    let settings = storage_settings(tmp_dir.path().to_string_lossy().to_string());
+    let fixture = rt.block_on(seed_small_fixture(&settings, 10_000));
+
+    let smoke_start = Instant::now();
+    rt.block_on(async {
+        let _ = fixture
+            .service
+            .query_service
+            .query_spans(
+                Some(&fixture.trace_id),
+                None,
+                None,
+                None,
+                None,
+                Some(&fixture.trace_start),
+                Some(&(fixture.trace_start + chrono::Duration::minutes(1))),
+                None,
+            )
+            .await
+            .unwrap();
+    });
+    let smoke_runtime = smoke_start.elapsed();
+
+    let mut spans = BTreeMap::new();
+    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
+    spans.insert(
+        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
+        tiers::SpanMetric::default(),
+    );
+    utils::write_bench_artifact(
+        "hot_path_bench",
+        GROUP,
+        setup_start.elapsed(),
+        spans,
+        ObjectStoreCountSnapshot::default(),
+        0,
+    );
+
+    c.bench_function(GROUP, |b| {
+        b.to_async(&rt).iter_custom(|iters| {
+            let fixture = fixture.clone();
+            async move {
+                let start = Instant::now();
+                for _ in 0..iters {
+                    let _ = black_box(
+                        fixture
+                            .service
+                            .query_service
+                            .query_spans(
+                                Some(&fixture.trace_id),
+                                None,
+                                None,
+                                None,
+                                None,
+                                Some(&fixture.trace_start),
+                                Some(&(fixture.trace_start + chrono::Duration::minutes(1))),
+                                None,
+                            )
+                            .await
+                            .unwrap(),
+                    );
+                }
+                start.elapsed()
+            }
+        });
+    });
+
+    let service = Arc::try_unwrap(fixture.service)
+        .unwrap_or_else(|_| panic!("Arc still has multiple owners"));
+    rt.block_on(async { service.shutdown().await.unwrap() });
+    drop(tmp_dir);
+}
+
+criterion_group!(
+    benches,
+    benchmark_t0_cold_query_smoke,
+    benchmark_trace_hot_paths
+);
 criterion_main!(benches);
diff --git a/crates/scouter_dataframe/benches/planner_bench.rs b/crates/scouter_dataframe/benches/planner_bench.rs
index 752fbaea..5d291f25 100644
--- a/crates/scouter_dataframe/benches/planner_bench.rs
+++ b/crates/scouter_dataframe/benches/planner_bench.rs
@@ -1,3 +1,5 @@
+mod tiers;
+
 use chrono::Utc;
 use criterion::{BenchmarkId, Criterion, criterion_group, criterion_main};
 use scouter_dataframe::parquet::tracing::queries::TraceQueries;
@@ -105,6 +107,10 @@ fn metrics_request(clause: FilterClause) -> TraceMetricsRequest {
 }
 
 fn benchmark_planner_queries(c: &mut Criterion) {
+    if !tiers::tier_guard_for("planner_bench", "planner_queries") {
+        return;
+    }
+
     let mut group = c.benchmark_group("planner_queries");
     group.sample_size(10);
     group.measurement_time(Duration::from_secs(3));
diff --git a/crates/scouter_dataframe/benches/session_config_bench.rs b/crates/scouter_dataframe/benches/session_config_bench.rs
index 87da31d5..af32aebe 100644
--- a/crates/scouter_dataframe/benches/session_config_bench.rs
+++ b/crates/scouter_dataframe/benches/session_config_bench.rs
@@ -10,6 +10,7 @@
 //! SCOUTER_STORAGE_URI=gs://your-bucket cargo bench -p scouter-dataframe --bench session_config_bench
 //! ```
 
+mod tiers;
 mod utils;
 
 use chrono::Utc;
@@ -26,6 +27,10 @@ const QUERY_ITERS: usize = 200;
 
 #[tokio::main]
 async fn main() -> Result<(), Box<dyn std::error::Error>> {
+    if !tiers::tier_guard_for("session_config_bench", "session_config_bench") {
+        return Ok(());
+    }
+
     tracing_subscriber::fmt()
         .with_max_level(tracing::Level::WARN)
         .init();
diff --git a/crates/scouter_dataframe/benches/stress_test.rs b/crates/scouter_dataframe/benches/stress_test.rs
index 3024504a..35d2eb8e 100644
--- a/crates/scouter_dataframe/benches/stress_test.rs
+++ b/crates/scouter_dataframe/benches/stress_test.rs
@@ -1,3 +1,4 @@
+mod tiers;
 mod utils;
 
 use chrono::Utc;
@@ -16,6 +17,10 @@ const ENTITY_TRACES: usize = 50;
 
 #[tokio::main]
 async fn main() -> Result<(), Box<dyn std::error::Error>> {
+    if !tiers::tier_guard_for("stress_test", "stress_test") {
+        return Ok(());
+    }
+
     tracing_subscriber::fmt()
         .with_max_level(tracing::Level::WARN)
         .init();
diff --git a/crates/scouter_dataframe/benches/tiers.rs b/crates/scouter_dataframe/benches/tiers.rs
new file mode 100644
index 00000000..2dd3f2fb
--- /dev/null
+++ b/crates/scouter_dataframe/benches/tiers.rs
@@ -0,0 +1,672 @@
+#![allow(dead_code)]
+
+use serde::{Deserialize, Serialize};
+use std::collections::{BTreeMap, BTreeSet};
+use std::env;
+use std::fs;
+use std::path::{Path, PathBuf};
+use std::process;
+
+#[derive(Clone, Copy, Debug, Eq, PartialEq, Serialize, Deserialize)]
+#[repr(u8)]
+pub enum BenchTier {
+    Tier0 = 0,
+    Tier1 = 1,
+    Tier2 = 2,
+}
+
+impl BenchTier {
+    pub fn from_u8(value: u8) -> Option<Self> {
+        match value {
+            0 => Some(Self::Tier0),
+            1 => Some(Self::Tier1),
+            2 => Some(Self::Tier2),
+            _ => None,
+        }
+    }
+
+    pub fn as_u8(self) -> u8 {
+        self as u8
+    }
+}
+
+#[derive(Clone, Copy, Debug, Eq, PartialEq)]
+pub struct BenchRegistration {
+    pub bench_binary: &'static str,
+    pub group_name: &'static str,
+    pub tier: BenchTier,
+    pub runtime_budget_secs: u64,
+    pub fixture_rows: u64,
+    pub fixture_spans: u64,
+    pub storage_profile: &'static str,
+    pub scenario_class: &'static str,
+}
+
+#[derive(Clone, Debug, Default, Serialize, Deserialize)]
+pub struct SpanMetric {
+    pub count: u64,
+    pub p50_us: u64,
+    pub p95_us: u64,
+    pub p99_us: u64,
+    pub sum_us: u64,
+}
+
+#[derive(Clone, Debug, Default, Serialize, Deserialize)]
+pub struct ObjectStoreCountSnapshot {
+    pub list: u64,
+    pub list_with_delimiter: u64,
+    pub head: u64,
+    pub get: u64,
+    pub get_range: u64,
+    pub put: u64,
+    pub delete: u64,
+    pub copy: u64,
+    pub bytes: u64,
+}
+
+#[derive(Clone, Debug, Serialize, Deserialize)]
+pub struct BenchArtifact {
+    pub commit: String,
+    pub bench_group: String,
+    pub tier: u8,
+    pub blocking: bool,
+    pub scenario_class: String,
+    pub runtime_budget_secs: u64,
+    pub actual_runtime_secs: f64,
+    pub fixture_rows: u64,
+    pub fixture_spans: u64,
+    pub storage_profile: String,
+    pub spans: BTreeMap<String, SpanMetric>,
+    pub object_store_counts: ObjectStoreCountSnapshot,
+    #[serde(default)]
+    pub refresh_on_request_path_total: u64,
+}
+
+pub const P1_LOCAL_NVME: &str = "P1_local_nvme";
+pub const P2_OBJECT_WARM: &str = "P2_object_warm";
+pub const P2_OBJECT_COLD: &str = "P2_object_cold";
+
+pub const REGISTRY: &[BenchRegistration] = &[
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "t0_cold_query_smoke",
+        tier: BenchTier::Tier0,
+        runtime_budget_secs: 120,
+        fixture_rows: 10_080,
+        fixture_spans: 10_080,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "cold_query",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "t0_refresh_origin_sentinel",
+        tier: BenchTier::Tier0,
+        runtime_budget_secs: 30,
+        fixture_rows: 0,
+        fixture_spans: 0,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "refresh_origin_sentinel",
+    },
+    BenchRegistration {
+        bench_binary: "hot_path_bench",
+        group_name: "t0_hot_path_cold_query_smoke",
+        tier: BenchTier::Tier0,
+        runtime_budget_secs: 120,
+        fixture_rows: 10_000,
+        fixture_spans: 10_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "cold_query",
+    },
+    BenchRegistration {
+        bench_binary: "dataset_benchmark",
+        group_name: "t0_bifrost_smoke",
+        tier: BenchTier::Tier0,
+        runtime_budget_secs: 120,
+        fixture_rows: 1_000,
+        fixture_spans: 0,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "bifrost_smoke",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "write_throughput",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 1800,
+        fixture_rows: 50_000,
+        fixture_spans: 50_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "write_throughput",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "concurrent_writes",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 1800,
+        fixture_rows: 200,
+        fixture_spans: 200,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "write_throughput",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "query_performance",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 1800,
+        fixture_rows: 100_000,
+        fixture_spans: 100_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "cold_query",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "sustained_load",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 1800,
+        fixture_rows: 1_000,
+        fixture_spans: 1_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "write_throughput",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "query_at_scale",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 3600,
+        fixture_rows: 100_000,
+        fixture_spans: 100_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "selective_lookup",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "cold_query",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 1800,
+        fixture_rows: 10_080,
+        fixture_spans: 10_080,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "cold_query",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "at_scale_1m",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 7200,
+        fixture_rows: 1_000_000,
+        fixture_spans: 1_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "selective_lookup",
+    },
+    BenchRegistration {
+        bench_binary: "trace_service_benchmark",
+        group_name: "at_scale_10m",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 21_600,
+        fixture_rows: 10_000_000,
+        fixture_spans: 10_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "selective_lookup",
+    },
+    BenchRegistration {
+        bench_binary: "dataset_benchmark",
+        group_name: "dataset_write",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 3600,
+        fixture_rows: 10_000,
+        fixture_spans: 0,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "dataset_write",
+    },
+    BenchRegistration {
+        bench_binary: "dataset_benchmark",
+        group_name: "dataset_query",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 3600,
+        fixture_rows: 10_000,
+        fixture_spans: 0,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "bifrost_query",
+    },
+    BenchRegistration {
+        bench_binary: "hot_path_bench",
+        group_name: "trace_hot_paths_1m",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 7200,
+        fixture_rows: 1_000_000,
+        fixture_spans: 1_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "selective_lookup",
+    },
+    BenchRegistration {
+        bench_binary: "hot_path_bench",
+        group_name: "metrics_hot_paths_1m",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 7200,
+        fixture_rows: 1_000_000,
+        fixture_spans: 1_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "dashboard",
+    },
+    BenchRegistration {
+        bench_binary: "planner_bench",
+        group_name: "planner_queries",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 3600,
+        fixture_rows: 1_000_000,
+        fixture_spans: 1_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "planner",
+    },
+    BenchRegistration {
+        bench_binary: "session_config_bench",
+        group_name: "session_config_bench",
+        tier: BenchTier::Tier1,
+        runtime_budget_secs: 3600,
+        fixture_rows: 100_000,
+        fixture_spans: 100_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "session_config",
+    },
+    BenchRegistration {
+        bench_binary: "stress_test",
+        group_name: "stress_test",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 21_600,
+        fixture_rows: 1_000_000,
+        fixture_spans: 1_000_000,
+        storage_profile: P1_LOCAL_NVME,
+        scenario_class: "soak",
+    },
+    BenchRegistration {
+        bench_binary: "cloud_backed_runs",
+        group_name: "p2_object_warm",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 21_600,
+        fixture_rows: 0,
+        fixture_spans: 0,
+        storage_profile: P2_OBJECT_WARM,
+        scenario_class: "cloud_object_store",
+    },
+    BenchRegistration {
+        bench_binary: "cloud_backed_runs",
+        group_name: "p2_object_cold",
+        tier: BenchTier::Tier2,
+        runtime_budget_secs: 21_600,
+        fixture_rows: 0,
+        fixture_spans: 0,
+        storage_profile: P2_OBJECT_COLD,
+        scenario_class: "cloud_object_store",
+    },
+];
+
+pub fn current_tier() -> BenchTier {
+    env::var("SCOUTER_BENCH_TIER")
+        .ok()
+        .and_then(|value| value.parse::<u8>().ok())
+        .and_then(BenchTier::from_u8)
+        .unwrap_or(BenchTier::Tier0)
+}
+
+pub fn tier_for(group_name: &str) -> BenchTier {
+    REGISTRY
+        .iter()
+        .find(|entry| entry.group_name == group_name)
+        .map(|entry| entry.tier)
+        .unwrap_or(BenchTier::Tier1)
+}
+
+pub fn registration_for(
+    bench_binary: &str,
+    group_name: &str,
+) -> Option<&'static BenchRegistration> {
+    REGISTRY
+        .iter()
+        .find(|entry| entry.bench_binary == bench_binary && entry.group_name == group_name)
+}
+
+pub fn registration_or_default(
+    bench_binary: &'static str,
+    group_name: &'static str,
+) -> BenchRegistration {
+    registration_for(bench_binary, group_name)
+        .copied()
+        .unwrap_or(BenchRegistration {
+            bench_binary,
+            group_name,
+            tier: BenchTier::Tier1,
+            runtime_budget_secs: 3600,
+            fixture_rows: 0,
+            fixture_spans: 0,
+            storage_profile: P1_LOCAL_NVME,
+            scenario_class: "unregistered",
+        })
+}
+
+pub fn tier_guard(group_name: &'static str) -> bool {
+    guard_registration(&registration_or_default("unknown", group_name))
+}
+
+pub fn tier_guard_for(bench_binary: &'static str, group_name: &'static str) -> bool {
+    guard_registration(&registration_or_default(bench_binary, group_name))
+}
+
+fn guard_registration(registration: &BenchRegistration) -> bool {
+    let requested = current_tier();
+    if requested == registration.tier {
+        return true;
+    }
+
+    eprintln!(
+        "skipping {}::{}: registered tier {} does not match SCOUTER_BENCH_TIER={}",
+        registration.bench_binary,
+        registration.group_name,
+        registration.tier.as_u8(),
+        requested.as_u8()
+    );
+    false
+}
+
+pub fn filter_for(tier: BenchTier, bench_binary: &str) -> Result<String, String> {
+    let groups: Vec<&str> = REGISTRY
+        .iter()
+        .filter(|entry| entry.bench_binary == bench_binary && entry.tier == tier)
+        .map(|entry| entry.group_name)
+        .collect::<BTreeSet<_>>()
+        .into_iter()
+        .collect();
+
+    if groups.is_empty() {
+        return Err(format!(
+            "no tier {} groups registered for {bench_binary}",
+            tier.as_u8()
+        ));
+    }
+
+    Ok(format!("^({})$", groups.join("|")))
+}
+
+fn repo_root() -> PathBuf {
+    PathBuf::from(env!("CARGO_MANIFEST_DIR"))
+        .parent()
+        .and_then(Path::parent)
+        .map(Path::to_path_buf)
+        .unwrap_or_else(|| PathBuf::from("."))
+}
+
+fn run_metrics_dir() -> PathBuf {
+    repo_root().join("target").join("bench_metrics")
+}
+
+fn baseline_metrics_dir() -> PathBuf {
+    PathBuf::from(env!("CARGO_MANIFEST_DIR")).join("bench_metrics")
+}
+
+fn read_artifact(path: &Path) -> Result<BenchArtifact, String> {
+    let contents = fs::read_to_string(path)
+        .map_err(|err| format!("failed to read {}: {err}", path.display()))?;
+    serde_json::from_str(&contents)
+        .map_err(|err| format!("failed to parse {}: {err}", path.display()))
+}
+
+fn regression_percent(run: u64, baseline: u64) -> Option<f64> {
+    if baseline == 0 {
+        return (run > 0).then_some(f64::INFINITY);
+    }
+    (run > baseline).then(|| ((run - baseline) as f64 / baseline as f64) * 100.0)
+}
+
+fn compare_count(
+    failures: &mut Vec<String>,
+    label: &str,
+    run: u64,
+    baseline: u64,
+    tier: BenchTier,
+) {
+    if let Some(percent) = regression_percent(run, baseline)
+        && percent > 10.0
+        && tier == BenchTier::Tier0
+    {
+        failures.push(format!(
+            "{label} regressed by {percent:.1}%: run={run}, baseline={baseline}"
+        ));
+    }
+}
+
+fn compare_span(
+    failures: &mut Vec<String>,
+    name: &str,
+    run: &BenchArtifact,
+    baseline: &BenchArtifact,
+    tier: BenchTier,
+) {
+    let Some(run_span) = run.spans.get(name) else {
+        return;
+    };
+    let Some(base_span) = baseline.spans.get(name) else {
+        return;
+    };
+    if run_span.count < 10 || base_span.count < 10 {
+        return;
+    }
+    compare_count(
+        failures,
+        &format!("spans[{name}].p95_us"),
+        run_span.p95_us,
+        base_span.p95_us,
+        tier,
+    );
+}
+
+fn compare_artifact(run_path: &Path, requested_tier: BenchTier) -> Result<Vec<String>, String> {
+    let run = read_artifact(run_path)?;
+    let Some(run_tier) = BenchTier::from_u8(run.tier) else {
+        return Err(format!(
+            "{} has invalid tier {}",
+            run_path.display(),
+            run.tier
+        ));
+    };
+
+    if run_tier != requested_tier {
+        return Ok(vec![format!(
+            "skipped {} because artifact tier {} does not match requested tier {}",
+            run.bench_group,
+            run.tier,
+            requested_tier.as_u8()
+        )]);
+    }
+
+    if run.blocking != (run_tier == BenchTier::Tier0) {
+        return Err(format!(
+            "{} has blocking={} but tier={}",
+            run.bench_group, run.blocking, run.tier
+        ));
+    }
+
+    let mut failures = Vec::new();
+    let mut notes = Vec::new();
+
+    if run.actual_runtime_secs > run.runtime_budget_secs as f64 && run_tier == BenchTier::Tier0 {
+        failures.push(format!(
+            "{} exceeded runtime budget: {:.2}s > {}s",
+            run.bench_group, run.actual_runtime_secs, run.runtime_budget_secs
+        ));
+    }
+
+    if run.refresh_on_request_path_total > 0 && run_tier == BenchTier::Tier0 {
+        failures.push(format!(
+            "{} recorded refresh-on-request count {}",
+            run.bench_group, run.refresh_on_request_path_total
+        ));
+    }
+
+    let baseline_path = baseline_metrics_dir().join(format!("{}.json", run.bench_group));
+    if !baseline_path.exists() {
+        notes.push(format!(
+            "no committed baseline for {}; comparator did not hard-fail",
+            run.bench_group
+        ));
+    } else {
+        let baseline = read_artifact(&baseline_path)?;
+        compare_count(
+            &mut failures,
+            "object_store_counts.get_range",
+            run.object_store_counts.get_range,
+            baseline.object_store_counts.get_range,
+            run_tier,
+        );
+        compare_count(
+            &mut failures,
+            "object_store_counts.head",
+            run.object_store_counts.head,
+            baseline.object_store_counts.head,
+            run_tier,
+        );
+        compare_count(
+            &mut failures,
+            "object_store_counts.list",
+            run.object_store_counts.list,
+            baseline.object_store_counts.list,
+            run_tier,
+        );
+        compare_span(&mut failures, "df.collect", &run, &baseline, run_tier);
+        compare_span(
+            &mut failures,
+            "delta.snapshot.refresh",
+            &run,
+            &baseline,
+            run_tier,
+        );
+    }
+
+    if run_tier != BenchTier::Tier0 && !failures.is_empty() {
+        notes.push(format!(
+            "{} is tier {}; comparator refuses to hard-fail non-Tier-0 artifacts",
+            run.bench_group, run.tier
+        ));
+        failures.clear();
+    }
+
+    if failures.is_empty() {
+        Ok(notes)
+    } else {
+        Err(failures.join("\n"))
+    }
+}
+
+fn compare_requested_tier(tier: BenchTier) -> Result<(), String> {
+    let dir = run_metrics_dir();
+    if !dir.exists() {
+        return Ok(());
+    }
+
+    let mut notes = Vec::new();
+    let mut compared = 0usize;
+    for entry in fs::read_dir(&dir).map_err(|err| format!("failed to read {dir:?}: {err}"))? {
+        let entry = entry.map_err(|err| format!("failed to read dir entry: {err}"))?;
+        let path = entry.path();
+        if path.extension().and_then(|ext| ext.to_str()) != Some("json") {
+            continue;
+        }
+        let Some(stem) = path.file_stem().and_then(|stem| stem.to_str()) else {
+            continue;
+        };
+        if !REGISTRY
+            .iter()
+            .any(|entry| entry.group_name == stem && entry.tier == tier)
+        {
+            notes.push(format!(
+                "skipped {} because it is not registered for tier {}",
+                path.display(),
+                tier.as_u8()
+            ));
+            continue;
+        }
+        compared += 1;
+        match compare_artifact(&path, tier) {
+            Ok(artifact_notes) => notes.extend(artifact_notes),
+            Err(err) if tier != BenchTier::Tier0 => notes.push(format!(
+                "advisory tier ignored comparator error for {}: {err}",
+                path.display()
+            )),
+            Err(err) => return Err(err),
+        }
+    }
+
+    for note in notes {
+        eprintln!("{note}");
+    }
+    eprintln!(
+        "bench comparator examined {compared} artifact(s) for tier {}",
+        tier.as_u8()
+    );
+    Ok(())
+}
+
+fn parse_tier_arg(args: &[String]) -> Result<BenchTier, String> {
+    let tier = args
+        .windows(2)
+        .find_map(|window| (window[0] == "--tier").then(|| window[1].clone()))
+        .unwrap_or_else(|| "0".to_string());
+    tier.parse::<u8>()
+        .ok()
+        .and_then(BenchTier::from_u8)
+        .ok_or_else(|| format!("invalid --tier value {tier}; expected 0, 1, or 2"))
+}
+
+fn parse_bench_arg(args: &[String]) -> Result<String, String> {
+    args.windows(2)
+        .find_map(|window| (window[0] == "--bench").then(|| window[1].clone()))
+        .ok_or_else(|| "--bench is required".to_string())
+}
+
+fn main() {
+    let args: Vec<String> = env::args().collect();
+    let invoked = Path::new(
+        args.first()
+            .map(String::as_str)
+            .unwrap_or("bench_tier_filter"),
+    )
+    .file_name()
+    .and_then(|name| name.to_str())
+    .unwrap_or("bench_tier_filter");
+
+    let result = if invoked.contains("bench_compare") {
+        parse_tier_arg(&args).and_then(compare_requested_tier)
+    } else {
+        parse_tier_arg(&args).and_then(|tier| {
+            let bench = parse_bench_arg(&args)?;
+            filter_for(tier, &bench).map(|filter| {
+                println!("{filter}");
+            })
+        })
+    };
+
+    if let Err(err) = result {
+        eprintln!("{err}");
+        process::exit(1);
+    }
+}
+
+#[cfg(test)]
+#[allow(unused_imports)]
+mod tests {
+    use super::*;
+
+    #[test]
+    fn tier0_filter_is_exactly_anchored() {
+        let filter = filter_for(BenchTier::Tier0, "trace_service_benchmark").unwrap();
+        assert_eq!(filter, "^(t0_cold_query_smoke|t0_refresh_origin_sentinel)$");
+    }
+
+    #[test]
+    fn missing_tier_filter_refuses_empty_output() {
+        let err = filter_for(BenchTier::Tier0, "stress_test").unwrap_err();
+        assert!(err.contains("no tier 0 groups"));
+    }
+
+    #[test]
+    fn unknown_groups_default_to_tier1() {
+        assert_eq!(tier_for("not_registered"), BenchTier::Tier1);
+    }
+}
diff --git a/crates/scouter_dataframe/benches/trace_service_benchmark.rs b/crates/scouter_dataframe/benches/trace_service_benchmark.rs
index 48c84e28..75216293 100644
--- a/crates/scouter_dataframe/benches/trace_service_benchmark.rs
+++ b/crates/scouter_dataframe/benches/trace_service_benchmark.rs
@@ -1,12 +1,21 @@
+mod counting_object_store;
+mod tiers;
+mod utils;
+
 use criterion::{BenchmarkId, Criterion, Throughput, criterion_group, criterion_main};
 use scouter_dataframe::parquet::tracing::service::TraceSpanService;
 use scouter_settings::ObjectStorageSettings;
 use scouter_types::{StorageType, TraceId, TraceSpanRecord};
+use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
 use std::time::{Duration, Instant};
+use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
 
+const DF_COLLECT_SPAN: &str = "df.collect";
+const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
+
 fn generate_trace_batch(num_traces: usize, spans_per_trace: usize) -> Vec<TraceSpanRecord> {
     use scouter_mocks::generate_trace_with_spans;
     (0..num_traces)
@@ -18,6 +27,10 @@ fn generate_trace_batch(num_traces: usize, spans_per_trace: usize) -> Vec<TraceS
 }
 
 fn bench_write_throughput(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "write_throughput") {
+        return;
+    }
+
     let mut group = c.benchmark_group("write_throughput");
     group.sample_size(10);
     group.measurement_time(Duration::from_secs(20));
@@ -61,6 +74,10 @@ fn bench_write_throughput(c: &mut Criterion) {
 }
 
 fn bench_concurrent_writes(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "concurrent_writes") {
+        return;
+    }
+
     let mut group = c.benchmark_group("concurrent_writes");
     group.sample_size(10);
     group.measurement_time(Duration::from_secs(20));
@@ -114,6 +131,10 @@ fn bench_concurrent_writes(c: &mut Criterion) {
 }
 
 fn bench_query_performance(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "query_performance") {
+        return;
+    }
+
     let mut group = c.benchmark_group("query_performance");
     group.sample_size(20);
 
@@ -185,6 +206,10 @@ fn bench_query_performance(c: &mut Criterion) {
 }
 
 fn bench_sustained_load(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "sustained_load") {
+        return;
+    }
+
     let mut group = c.benchmark_group("sustained_load");
     group.measurement_time(Duration::from_secs(30));
     group.sample_size(10);
@@ -224,6 +249,10 @@ fn bench_sustained_load(c: &mut Criterion) {
 }
 
 fn bench_query_at_scale(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "query_at_scale") {
+        return;
+    }
+
     let mut group = c.benchmark_group("query_at_scale");
     // Sizes are intentionally moderate: the scaling curve (linear vs sub-linear)
     // is visible at [10K, 50K, 100K]. For absolute 1M-span latency numbers,
@@ -387,6 +416,10 @@ fn bench_query_at_scale(c: &mut Criterion) {
 /// - `by_id_with_time_bounds` — same traces but a 1-hour window per trace; proves ts_lit pruning
 /// - `by_entity`              — entity_id column predicate with a 1-hour window
 fn bench_cold_query(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "cold_query") {
+        return;
+    }
+
     const HOURS: usize = 24;
     const SPANS_PER_HOUR: usize = 420; // ~10 080 total; 84 traces × 5 spans per hour
 
@@ -553,6 +586,10 @@ fn bench_cold_query(c: &mut Criterion) {
 /// Results are stored in `target/criterion/at_scale_1m/` and tracked across commits.
 /// Run with: `cargo bench -p scouter-dataframe --bench trace_service_benchmark at_scale_1m`
 fn bench_at_scale_1m(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "at_scale_1m") {
+        return;
+    }
+
     use scouter_mocks::generate_trace_with_spans;
     use scouter_types::StorageType;
 
@@ -713,6 +750,10 @@ fn bench_at_scale_1m(c: &mut Criterion) {
 /// Results are stored in `target/criterion/at_scale_10m/` and tracked across commits.
 /// Run with: `cargo bench -p scouter-dataframe --bench trace_service_benchmark at_scale_10m`
 fn bench_at_scale_10m(c: &mut Criterion) {
+    if !tiers::tier_guard_for("trace_service_benchmark", "at_scale_10m") {
+        return;
+    }
+
     use chrono::Utc;
     use scouter_mocks::generate_trace_with_spans;
     use scouter_types::StorageType;
@@ -847,8 +888,146 @@ fn bench_at_scale_10m(c: &mut Criterion) {
     drop(tmp_dir);
 }
 
+fn span_metric(duration: Duration) -> tiers::SpanMetric {
+    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
+    tiers::SpanMetric {
+        count: 1,
+        p50_us: micros,
+        p95_us: micros,
+        p99_us: micros,
+        sum_us: micros,
+    }
+}
+
+fn bench_t0_cold_query_smoke(c: &mut Criterion) {
+    const GROUP: &str = "t0_cold_query_smoke";
+    if !tiers::tier_guard_for("trace_service_benchmark", GROUP) {
+        return;
+    }
+
+    use scouter_mocks::generate_trace_with_spans;
+
+    const HOURS: usize = 24;
+    const SPANS_PER_HOUR: usize = 420;
+    let setup_start = Instant::now();
+    let rt = Runtime::new().unwrap();
+    let tmp_dir = tempfile::tempdir().unwrap();
+    let storage_settings = ObjectStorageSettings {
+        storage_uri: tmp_dir.path().to_str().unwrap().to_string(),
+        storage_type: StorageType::Local,
+        region: "us-east-1".to_string(),
+        trace_compaction_interval_hours: 999,
+        trace_flush_interval_secs: 1,
+        trace_refresh_interval_secs: 10,
+    };
+
+    let (service, ids) = rt.block_on(async {
+        let service = TraceSpanService::new(&storage_settings, 999, Some(1), None, 10, None)
+            .await
+            .unwrap();
+        let mut ids = Vec::new();
+        for hour in 0..HOURS {
+            let minutes_offset = (hour as i64) * 60;
+            let mut hour_spans = Vec::new();
+            for _ in 0..SPANS_PER_HOUR / 5 {
+                let (_record, spans, _tags) = generate_trace_with_spans(5, minutes_offset);
+                if let Some(first) = spans.first()
+                    && let Ok(id_bytes) = TraceId::hex_to_bytes(&first.trace_id.to_hex())
+                {
+                    ids.push(id_bytes);
+                }
+                hour_spans.extend(spans);
+            }
+            service.write_spans(hour_spans).await.unwrap();
+        }
+        tokio::time::sleep(Duration::from_millis(1500)).await;
+        service.optimize().await.unwrap();
+        (Arc::new(service), Arc::new(ids))
+    });
+
+    let smoke_start = Instant::now();
+    rt.block_on(async {
+        let id = &ids[0];
+        let _ = service
+            .query_service
+            .query_spans(Some(id), None, None, None, None, None, None, None)
+            .await
+            .unwrap();
+    });
+    let smoke_runtime = smoke_start.elapsed();
+
+    let mut spans = BTreeMap::new();
+    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
+    spans.insert(
+        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
+        tiers::SpanMetric::default(),
+    );
+    utils::write_bench_artifact(
+        "trace_service_benchmark",
+        GROUP,
+        setup_start.elapsed(),
+        spans,
+        ObjectStoreCountSnapshot::default(),
+        0,
+    );
+
+    c.bench_function(GROUP, |b| {
+        b.to_async(&rt).iter_custom(|iters| {
+            let svc = Arc::clone(&service);
+            let ids = Arc::clone(&ids);
+            async move {
+                let start = Instant::now();
+                for i in 0..iters {
+                    let id = &ids[i as usize % ids.len()];
+                    let _ = black_box(
+                        svc.query_service
+                            .query_spans(Some(id), None, None, None, None, None, None, None)
+                            .await
+                            .unwrap(),
+                    );
+                }
+                start.elapsed()
+            }
+        });
+    });
+
+    let service =
+        Arc::try_unwrap(service).unwrap_or_else(|_| panic!("Arc still has multiple owners"));
+    rt.block_on(async { service.shutdown().await.unwrap() });
+    drop(tmp_dir);
+}
+
+fn bench_t0_refresh_origin_sentinel(c: &mut Criterion) {
+    const GROUP: &str = "t0_refresh_origin_sentinel";
+    if !tiers::tier_guard_for("trace_service_benchmark", GROUP) {
+        return;
+    }
+
+    let start = Instant::now();
+    let mut spans = BTreeMap::new();
+    spans.insert(DF_COLLECT_SPAN.to_string(), tiers::SpanMetric::default());
+    spans.insert(
+        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
+        tiers::SpanMetric::default(),
+    );
+    utils::write_bench_artifact(
+        "trace_service_benchmark",
+        GROUP,
+        start.elapsed(),
+        spans,
+        ObjectStoreCountSnapshot::default(),
+        0,
+    );
+
+    c.bench_function(GROUP, |b| {
+        b.iter(|| black_box(0_u64));
+    });
+}
+
 criterion_group!(
     benches,
+    bench_t0_cold_query_smoke,
+    bench_t0_refresh_origin_sentinel,
     bench_write_throughput,
     bench_concurrent_writes,
     bench_query_performance,
diff --git a/crates/scouter_dataframe/benches/utils.rs b/crates/scouter_dataframe/benches/utils.rs
index 4c66a2e3..483bd732 100644
--- a/crates/scouter_dataframe/benches/utils.rs
+++ b/crates/scouter_dataframe/benches/utils.rs
@@ -1,8 +1,20 @@
 #![allow(dead_code)]
 
+use crate::tiers::{BenchArtifact, ObjectStoreCountSnapshot, SpanMetric, registration_or_default};
 use scouter_mocks::{generate_trace_with_entity, generate_trace_with_spans};
 use scouter_types::TraceSpanRecord;
-use std::time::Duration;
+use std::collections::BTreeMap;
+use std::fs;
+use std::path::PathBuf;
+use std::process::Command;
+use std::sync::{Arc, Mutex};
+use std::time::{Duration, Instant};
+use tracing::field::{Field, Visit};
+use tracing::span::{Attributes, Id, Record};
+use tracing::{Subscriber, warn};
+use tracing_subscriber::Layer;
+use tracing_subscriber::layer::Context;
+use tracing_subscriber::registry::LookupSpan;
 
 /// Create a simple 3-span trace as ingest records (ready for `write_spans()`).
 pub fn _create_simple_trace() -> Vec<TraceSpanRecord> {
@@ -75,3 +87,280 @@ pub fn print_percentiles(label: &str, p: &Percentiles) {
         mean = p.mean.as_secs_f64() * 1000.0,
     );
 }
+
+#[derive(Clone, Debug)]
+pub struct BenchSpanCollector {
+    records: Arc<Mutex<Vec<SpanRecord>>>,
+}
+
+#[derive(Clone, Debug)]
+pub struct SpanRecord {
+    pub name: String,
+    pub attrs: Vec<(String, String)>,
+    pub duration_ns: u64,
+}
+
+#[derive(Debug)]
+struct SpanTiming {
+    name: String,
+    attrs: Vec<(String, String)>,
+    start: Instant,
+}
+
+#[derive(Default)]
+struct AttrVisitor {
+    attrs: Vec<(String, String)>,
+}
+
+impl Visit for AttrVisitor {
+    fn record_debug(&mut self, field: &Field, value: &dyn std::fmt::Debug) {
+        self.attrs
+            .push((field.name().to_string(), format!("{value:?}")));
+    }
+
+    fn record_str(&mut self, field: &Field, value: &str) {
+        self.attrs
+            .push((field.name().to_string(), value.to_string()));
+    }
+
+    fn record_bool(&mut self, field: &Field, value: bool) {
+        self.attrs
+            .push((field.name().to_string(), value.to_string()));
+    }
+
+    fn record_i64(&mut self, field: &Field, value: i64) {
+        self.attrs
+            .push((field.name().to_string(), value.to_string()));
+    }
+
+    fn record_u64(&mut self, field: &Field, value: u64) {
+        self.attrs
+            .push((field.name().to_string(), value.to_string()));
+    }
+
+    fn record_f64(&mut self, field: &Field, value: f64) {
+        self.attrs
+            .push((field.name().to_string(), value.to_string()));
+    }
+}
+
+impl BenchSpanCollector {
+    pub fn new() -> Self {
+        Self {
+            records: Arc::new(Mutex::new(Vec::new())),
+        }
+    }
+
+    pub fn records(&self) -> Vec<SpanRecord> {
+        self.records
+            .lock()
+            .expect("bench span collector mutex poisoned")
+            .clone()
+    }
+
+    pub fn summary(&self) -> BTreeMap<String, SpanMetric> {
+        summarize_spans(&self.records())
+    }
+}
+
+impl<S> Layer<S> for BenchSpanCollector
+where
+    S: Subscriber,
+    S: for<'lookup> LookupSpan<'lookup>,
+{
+    fn on_new_span(&self, attrs: &Attributes<'_>, id: &Id, ctx: Context<'_, S>) {
+        let Some(span) = ctx.span(id) else {
+            return;
+        };
+
+        let mut visitor = AttrVisitor::default();
+        attrs.record(&mut visitor);
+        span.extensions_mut().insert(SpanTiming {
+            name: span.metadata().name().to_string(),
+            attrs: visitor.attrs,
+            start: Instant::now(),
+        });
+    }
+
+    fn on_record(&self, id: &Id, values: &Record<'_>, ctx: Context<'_, S>) {
+        let Some(span) = ctx.span(id) else {
+            return;
+        };
+
+        let mut extensions = span.extensions_mut();
+        let Some(timing) = extensions.get_mut::<SpanTiming>() else {
+            return;
+        };
+
+        let mut visitor = AttrVisitor::default();
+        values.record(&mut visitor);
+        timing.attrs.extend(visitor.attrs);
+    }
+
+    fn on_close(&self, id: Id, ctx: Context<'_, S>) {
+        let Some(span) = ctx.span(&id) else {
+            return;
+        };
+
+        let Some(timing) = span.extensions_mut().remove::<SpanTiming>() else {
+            return;
+        };
+
+        let duration_ns = timing.start.elapsed().as_nanos().min(u64::MAX as u128) as u64;
+        self.records
+            .lock()
+            .expect("bench span collector mutex poisoned")
+            .push(SpanRecord {
+                name: timing.name,
+                attrs: timing.attrs,
+                duration_ns,
+            });
+    }
+}
+
+pub fn summarize_spans(records: &[SpanRecord]) -> BTreeMap<String, SpanMetric> {
+    let mut by_name: BTreeMap<String, Vec<u64>> = BTreeMap::new();
+    for record in records {
+        by_name
+            .entry(record.name.clone())
+            .or_default()
+            .push(record.duration_ns / 1_000);
+    }
+
+    by_name
+        .into_iter()
+        .map(|(name, mut values)| {
+            values.sort_unstable();
+            let count = values.len() as u64;
+            let p50_us = percentile_u64(&values, 50.0);
+            let p95_us = percentile_u64(&values, 95.0);
+            let p99_us = percentile_u64(&values, 99.0);
+            let sum_us = values.iter().sum();
+            (
+                name,
+                SpanMetric {
+                    count,
+                    p50_us,
+                    p95_us,
+                    p99_us,
+                    sum_us,
+                },
+            )
+        })
+        .collect()
+}
+
+fn percentile_u64(values: &[u64], percentile: f64) -> u64 {
+    if values.is_empty() {
+        return 0;
+    }
+    let index = ((percentile / 100.0) * values.len() as f64) as usize;
+    values[index.min(values.len() - 1)]
+}
+
+pub fn write_bench_artifact(
+    bench_binary: &'static str,
+    group_name: &'static str,
+    actual_runtime: Duration,
+    spans: BTreeMap<String, SpanMetric>,
+    object_store_counts: ObjectStoreCountSnapshot,
+    refresh_on_request_path_total: u64,
+) {
+    let registration = registration_or_default(bench_binary, group_name);
+    let artifact = BenchArtifact {
+        commit: current_commit(),
+        bench_group: group_name.to_string(),
+        tier: registration.tier.as_u8(),
+        blocking: registration.tier.as_u8() == 0,
+        scenario_class: registration.scenario_class.to_string(),
+        runtime_budget_secs: registration.runtime_budget_secs,
+        actual_runtime_secs: actual_runtime.as_secs_f64(),
+        fixture_rows: registration.fixture_rows,
+        fixture_spans: registration.fixture_spans,
+        storage_profile: registration.storage_profile.to_string(),
+        spans,
+        object_store_counts,
+        refresh_on_request_path_total,
+    };
+
+    if let Err(err) = write_artifact(group_name, &artifact) {
+        warn!(error = %err, bench_group = group_name, "failed to write bench artifact");
+    }
+}
+
+fn write_artifact(group_name: &str, artifact: &BenchArtifact) -> Result<(), String> {
+    let dir = target_metrics_dir();
+    fs::create_dir_all(&dir).map_err(|err| format!("failed to create {}: {err}", dir.display()))?;
+    let path = dir.join(format!("{group_name}.json"));
+    let json = serde_json::to_string_pretty(artifact)
+        .map_err(|err| format!("failed to serialize bench artifact: {err}"))?;
+    fs::write(&path, format!("{json}\n"))
+        .map_err(|err| format!("failed to write {}: {err}", path.display()))
+}
+
+fn target_metrics_dir() -> PathBuf {
+    PathBuf::from(env!("CARGO_MANIFEST_DIR"))
+        .parent()
+        .and_then(std::path::Path::parent)
+        .map(|root| root.join("target").join("bench_metrics"))
+        .unwrap_or_else(|| PathBuf::from("target").join("bench_metrics"))
+}
+
+fn current_commit() -> String {
+    Command::new("git")
+        .args(["rev-parse", "HEAD"])
+        .output()
+        .ok()
+        .and_then(|output| {
+            output
+                .status
+                .success()
+                .then(|| String::from_utf8_lossy(&output.stdout).trim().to_string())
+        })
+        .filter(|sha| !sha.is_empty())
+        .unwrap_or_else(|| "unknown".to_string())
+}
+
+#[cfg(test)]
+#[allow(unused_imports)]
+mod tests {
+    use super::*;
+    use tracing_subscriber::layer::SubscriberExt;
+    use tracing_subscriber::registry::Registry;
+
+    #[test]
+    fn span_collector_summarizes_closed_spans() {
+        let collector = BenchSpanCollector::new();
+        let subscriber = Registry::default().with(collector.clone());
+
+        tracing::subscriber::with_default(subscriber, || {
+            let span = tracing::info_span!("df.collect", rows = 10_u64);
+            let _guard = span.enter();
+        });
+
+        let summary = collector.summary();
+        let metric = summary.get("df.collect").unwrap();
+        assert_eq!(metric.count, 1);
+        assert!(metric.sum_us <= metric.p99_us || metric.count == 1);
+    }
+
+    #[test]
+    fn span_summary_percentiles_are_stable() {
+        let records = [1_u64, 2, 3, 4, 5]
+            .into_iter()
+            .map(|duration_us| SpanRecord {
+                name: "delta.snapshot.refresh".to_string(),
+                attrs: Vec::new(),
+                duration_ns: duration_us * 1_000,
+            })
+            .collect::<Vec<_>>();
+
+        let summary = summarize_spans(&records);
+        let metric = summary.get("delta.snapshot.refresh").unwrap();
+        assert_eq!(metric.count, 5);
+        assert_eq!(metric.p50_us, 3);
+        assert_eq!(metric.p95_us, 5);
+        assert_eq!(metric.p99_us, 5);
+        assert_eq!(metric.sum_us, 15);
+    }
+}
diff --git a/makefile b/makefile
index f0cdb3ea..e35554a2 100644
--- a/makefile
+++ b/makefile
@@ -120,6 +120,27 @@ test.dataframe.cloud.azure:
 	cargo test -p scouter-dataframe test_trace_service_azure_integration \
 	  --all-features -- --nocapture --test-threads=1
 
+.PHONY: bench.core
+bench.core:
+	SCOUTER_BENCH_TIER=0 cargo bench -p scouter-dataframe \
+		--bench trace_service_benchmark -- "$$(cargo run -q -p scouter-dataframe --bin bench_tier_filter -- --tier 0 --bench trace_service_benchmark)"
+	SCOUTER_BENCH_TIER=0 cargo bench -p scouter-dataframe \
+		--bench hot_path_bench -- "$$(cargo run -q -p scouter-dataframe --bin bench_tier_filter -- --tier 0 --bench hot_path_bench)"
+	SCOUTER_BENCH_TIER=0 cargo bench -p scouter-dataframe \
+		--bench dataset_benchmark -- "$$(cargo run -q -p scouter-dataframe --bin bench_tier_filter -- --tier 0 --bench dataset_benchmark)"
+	cargo run -q -p scouter-dataframe --bin bench_compare -- --tier 0
+
+.PHONY: bench.extended
+bench.extended:
+	SCOUTER_BENCH_TIER=1 cargo bench -p scouter-dataframe
+	cargo run -q -p scouter-dataframe --bin bench_compare -- --tier 1
+
+.PHONY: bench.certification
+bench.certification:
+	SCOUTER_BENCH_TIER=2 SCOUTER_BENCH_STORAGE_PROFILE=$${SCOUTER_BENCH_STORAGE_PROFILE:-P2_object_warm} \
+		cargo bench -p scouter-dataframe --bench stress_test --bench trace_service_benchmark
+	cargo run -q -p scouter-dataframe --bin bench_compare -- --tier 2
+
 
 .PHONY: test
 test: build.all_backends test.needs_sql test.unit build.shutdown

From 420df65ada7cd60f772d36337d7a9265408ec0b6 Mon Sep 17 00:00:00 2001
From: Thorrester <sjforrester32@gmail.com>
Date: Wed, 13 May 2026 21:54:48 -0400
Subject: [PATCH 5/5] updating bench

---
 .../scouter_dataframe/bench_metrics/README.md |  44 +-
 .../bench_metrics/t0_bifrost_smoke.json       |  48 +-
 .../bench_metrics/t0_cold_query_smoke.json    | 153 +++++-
 .../t0_hot_path_cold_query_smoke.json         |  72 ++-
 .../t0_refresh_origin_sentinel.json           |  21 +-
 .../benches/dataset_benchmark.rs              |  76 +--
 .../benches/hot_path_bench.rs                 |  67 ++-
 crates/scouter_dataframe/benches/tiers.rs     | 463 ++++++++++++++++--
 .../benches/trace_service_benchmark.rs        |  83 ++--
 crates/scouter_dataframe/benches/utils.rs     | 122 ++++-
 crates/scouter_events/src/queue/py_queue.rs   |   9 +-
 crates/scouter_events/src/queue/types.rs      |   4 +
 crates/scouter_types/src/agent/profile.rs     |   7 +
 13 files changed, 945 insertions(+), 224 deletions(-)

diff --git a/crates/scouter_dataframe/bench_metrics/README.md b/crates/scouter_dataframe/bench_metrics/README.md
index 362b43e2..2fcdb9f0 100644
--- a/crates/scouter_dataframe/bench_metrics/README.md
+++ b/crates/scouter_dataframe/bench_metrics/README.md
@@ -1,5 +1,41 @@
-Tier 0 baseline JSON artifacts live in this directory after `make bench.core`
-has been proven to complete under the 15 minute Phase 0.6 budget.
+# Tier 0 Benchmark Baselines
 
-Benchmark runs write fresh artifacts to `target/bench_metrics/`; CI must not
-write into this directory.
+This directory contains the committed Tier 0 artifacts produced by `make bench.core`.
+
+Tier 0 is the blocking OLAP smoke baseline. It is intentionally small enough for PR verification,
+but it must still prove the measured path ran:
+
+- every registered Tier 0 group must write an artifact;
+- non-sentinel groups must report measured `bench.query.end_to_end` iterations, not a single
+  setup probe;
+- non-sentinel groups must report `query_entrypoint` and `result_rows`;
+- non-sentinel groups must report object-store operations observed through the production
+  object-store spans;
+- `t0_refresh_origin_sentinel` is allowed to report zero workload metrics, because it only guards
+  that refresh-on-request accounting stays at zero.
+
+## End-to-end measurement boundary
+
+`bench.query.end_to_end` is the primary Tier 0 metric. It wraps the public in-process query
+entry point and includes the returned batches or domain objects, so future phases can catch
+regressions in planning, metadata lookup, snapshot freshness, DataFusion execution, and result
+assembly.
+
+Every non-sentinel Tier 0 artifact must include:
+
+- `query_entrypoint`: the in-process boundary being measured.
+- `result_rows`: the number of returned rows or spans from the probe query.
+- `spans["bench.query.end_to_end"]`: at least 10 measured iterations with non-zero total time.
+
+`df.collect` is diagnostic only. An improvement in `df.collect` cannot mask a
+`bench.query.end_to_end.p95_us` regression, though diagnostic regressions still fail Tier 0 when
+both baseline and run artifacts carry the span.
+
+`t0_refresh_origin_sentinel` does not execute a query, so it may omit
+`bench.query.end_to_end`, `query_entrypoint`, and `result_rows`.
+
+Baseline JSON files are refreshed by an explicit reviewer-visible PR after a corrected Tier 0
+Criterion run. CI compares artifacts but never writes committed baselines.
+
+The comparator hard-fails only Tier 0 artifacts. Tier 1 and Tier 2 artifacts are advisory and are
+intended for extended or release certification runs.
diff --git a/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
index 592df24f..d3875a84 100644
--- a/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
+++ b/crates/scouter_dataframe/bench_metrics/t0_bifrost_smoke.json
@@ -1,36 +1,52 @@
 {
-  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "commit": "553a607685000971ef06678e913db7429d263148",
   "bench_group": "t0_bifrost_smoke",
   "tier": 0,
   "blocking": true,
   "scenario_class": "bifrost_smoke",
   "runtime_budget_secs": 120,
-  "actual_runtime_secs": 1.5295609589999999,
+  "actual_runtime_secs": 51.151038333,
   "fixture_rows": 1000,
   "fixture_spans": 0,
   "storage_profile": "P1_local_nvme",
+  "query_entrypoint": "dataset_engine_manager.query",
+  "result_rows": 256,
   "spans": {
-    "delta.snapshot.refresh": {
-      "count": 0,
-      "p50_us": 0,
-      "p95_us": 0,
-      "p99_us": 0,
-      "sum_us": 0
+    "bench.query.end_to_end": {
+      "count": 23341,
+      "p50_us": 927,
+      "p95_us": 5301,
+      "p99_us": 27795,
+      "sum_us": 49786477
     },
-    "df.collect": {
+    "log.list": {
       "count": 1,
-      "p50_us": 2807,
-      "p95_us": 2807,
-      "p99_us": 2807,
-      "sum_us": 2807
+      "p50_us": 212,
+      "p95_us": 212,
+      "p99_us": 212,
+      "sum_us": 212
+    },
+    "object_store.request": {
+      "count": 23343,
+      "p50_us": 2,
+      "p95_us": 6,
+      "p99_us": 12,
+      "sum_us": 119172
+    },
+    "snap.build": {
+      "count": 1,
+      "p50_us": 221,
+      "p95_us": 221,
+      "p99_us": 221,
+      "sum_us": 221
     }
   },
   "object_store_counts": {
-    "list": 0,
+    "list": 1,
     "list_with_delimiter": 0,
     "head": 0,
-    "get": 0,
-    "get_range": 0,
+    "get": 1,
+    "get_range": 23341,
     "put": 0,
     "delete": 0,
     "copy": 0,
diff --git a/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
index 37aa642d..9f60ed83 100644
--- a/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
+++ b/crates/scouter_dataframe/bench_metrics/t0_cold_query_smoke.json
@@ -1,37 +1,158 @@
 {
-  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "commit": "553a607685000971ef06678e913db7429d263148",
   "bench_group": "t0_cold_query_smoke",
   "tier": 0,
   "blocking": true,
   "scenario_class": "cold_query",
   "runtime_budget_secs": 120,
-  "actual_runtime_secs": 1.55367525,
+  "actual_runtime_secs": 8.955178292,
   "fixture_rows": 10080,
   "fixture_spans": 10080,
   "storage_profile": "P1_local_nvme",
+  "query_entrypoint": "trace_query_service.query_spans",
+  "result_rows": 5,
   "spans": {
+    "arrow.convert": {
+      "count": 2423,
+      "p50_us": 44,
+      "p95_us": 57,
+      "p99_us": 98,
+      "sum_us": 113536
+    },
+    "bench.query.end_to_end": {
+      "count": 2423,
+      "p50_us": 3498,
+      "p95_us": 4237,
+      "p99_us": 4898,
+      "sum_us": 8610882
+    },
+    "create_checkpoint_for": {
+      "count": 1,
+      "p50_us": 4545,
+      "p95_us": 4545,
+      "p99_us": 4545,
+      "sum_us": 4545
+    },
+    "delta.catalog.swap": {
+      "count": 1,
+      "p50_us": 2,
+      "p95_us": 2,
+      "p99_us": 2,
+      "sum_us": 2
+    },
     "delta.snapshot.refresh": {
-      "count": 0,
-      "p50_us": 0,
-      "p95_us": 0,
-      "p99_us": 0,
-      "sum_us": 0
+      "count": 1,
+      "p50_us": 4791,
+      "p95_us": 4791,
+      "p99_us": 4791,
+      "sum_us": 4791
     },
     "df.collect": {
+      "count": 2423,
+      "p50_us": 2406,
+      "p95_us": 3024,
+      "p99_us": 3417,
+      "sum_us": 5971006
+    },
+    "df.logical.build": {
+      "count": 9692,
+      "p50_us": 5,
+      "p95_us": 37,
+      "p99_us": 42,
+      "sum_us": 109562
+    },
+    "df.physical.plan": {
+      "count": 2423,
+      "p50_us": 884,
+      "p95_us": 1115,
+      "p99_us": 1337,
+      "sum_us": 2206267
+    },
+    "df.table.resolve": {
+      "count": 2423,
+      "p50_us": 22,
+      "p95_us": 33,
+      "p99_us": 52,
+      "sum_us": 57510
+    },
+    "last_checkpoint.read": {
+      "count": 1,
+      "p50_us": 172,
+      "p95_us": 172,
+      "p99_us": 172,
+      "sum_us": 172
+    },
+    "log.list": {
+      "count": 2,
+      "p50_us": 456,
+      "p95_us": 456,
+      "p99_us": 456,
+      "sum_us": 742
+    },
+    "log_seg.for_snap": {
+      "count": 1,
+      "p50_us": 465,
+      "p95_us": 465,
+      "p99_us": 465,
+      "sum_us": 465
+    },
+    "log_seg.load_p_m": {
+      "count": 2,
+      "p50_us": 1535,
+      "p95_us": 1535,
+      "p99_us": 1535,
+      "sum_us": 2427
+    },
+    "object_store.request": {
+      "count": 9691,
+      "p50_us": 1,
+      "p95_us": 2,
+      "p99_us": 4,
+      "sum_us": 13708
+    },
+    "snap": {
+      "count": 6,
+      "p50_us": 3435,
+      "p95_us": 10894,
+      "p99_us": 10894,
+      "sum_us": 24550
+    },
+    "snap.build": {
+      "count": 2,
+      "p50_us": 2064,
+      "p95_us": 2064,
+      "p99_us": 2064,
+      "sum_us": 3670
+    },
+    "snap.checkpoint": {
+      "count": 1,
+      "p50_us": 3425,
+      "p95_us": 3425,
+      "p99_us": 3425,
+      "sum_us": 3425
+    },
+    "trace.tree.build": {
+      "count": 2423,
+      "p50_us": 10,
+      "p95_us": 14,
+      "p99_us": 20,
+      "sum_us": 24851
+    },
+    "update_incremental": {
       "count": 1,
-      "p50_us": 6572,
-      "p95_us": 6572,
-      "p99_us": 6572,
-      "sum_us": 6572
+      "p50_us": 4749,
+      "p95_us": 4749,
+      "p99_us": 4749,
+      "sum_us": 4749
     }
   },
   "object_store_counts": {
-    "list": 0,
+    "list": 3,
     "list_with_delimiter": 0,
-    "head": 0,
-    "get": 0,
-    "get_range": 0,
-    "put": 0,
+    "head": 1,
+    "get": 4,
+    "get_range": 9681,
+    "put": 2,
     "delete": 0,
     "copy": 0,
     "bytes": 0
diff --git a/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json b/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
index 7fd1aa0d..ec6a306e 100644
--- a/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
+++ b/crates/scouter_dataframe/bench_metrics/t0_hot_path_cold_query_smoke.json
@@ -1,28 +1,72 @@
 {
-  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "commit": "553a607685000971ef06678e913db7429d263148",
   "bench_group": "t0_hot_path_cold_query_smoke",
   "tier": 0,
   "blocking": true,
   "scenario_class": "cold_query",
   "runtime_budget_secs": 120,
-  "actual_runtime_secs": 0.132162208,
+  "actual_runtime_secs": 9.834912333,
   "fixture_rows": 10000,
   "fixture_spans": 10000,
   "storage_profile": "P1_local_nvme",
+  "query_entrypoint": "trace_query_service.query_spans",
+  "result_rows": 5,
   "spans": {
-    "delta.snapshot.refresh": {
-      "count": 0,
-      "p50_us": 0,
-      "p95_us": 0,
-      "p99_us": 0,
-      "sum_us": 0
+    "arrow.convert": {
+      "count": 2223,
+      "p50_us": 43,
+      "p95_us": 57,
+      "p99_us": 97,
+      "sum_us": 101569
+    },
+    "bench.query.end_to_end": {
+      "count": 2223,
+      "p50_us": 4059,
+      "p95_us": 4956,
+      "p99_us": 7507,
+      "sum_us": 9469517
     },
     "df.collect": {
-      "count": 1,
-      "p50_us": 5425,
-      "p95_us": 5425,
-      "p99_us": 5425,
-      "sum_us": 5425
+      "count": 2223,
+      "p50_us": 2797,
+      "p95_us": 3462,
+      "p99_us": 4834,
+      "sum_us": 6512581
+    },
+    "df.logical.build": {
+      "count": 17784,
+      "p50_us": 1,
+      "p95_us": 33,
+      "p99_us": 39,
+      "sum_us": 108283
+    },
+    "df.physical.plan": {
+      "count": 2223,
+      "p50_us": 1050,
+      "p95_us": 1392,
+      "p99_us": 2041,
+      "sum_us": 2530619
+    },
+    "df.table.resolve": {
+      "count": 2223,
+      "p50_us": 22,
+      "p95_us": 34,
+      "p99_us": 67,
+      "sum_us": 52642
+    },
+    "object_store.request": {
+      "count": 8892,
+      "p50_us": 1,
+      "p95_us": 2,
+      "p99_us": 3,
+      "sum_us": 6310
+    },
+    "trace.tree.build": {
+      "count": 2223,
+      "p50_us": 10,
+      "p95_us": 14,
+      "p99_us": 22,
+      "sum_us": 23339
     }
   },
   "object_store_counts": {
@@ -30,7 +74,7 @@
     "list_with_delimiter": 0,
     "head": 0,
     "get": 0,
-    "get_range": 0,
+    "get_range": 8892,
     "put": 0,
     "delete": 0,
     "copy": 0,
diff --git a/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json b/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
index ba487e72..f7e57ecb 100644
--- a/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
+++ b/crates/scouter_dataframe/bench_metrics/t0_refresh_origin_sentinel.json
@@ -1,30 +1,15 @@
 {
-  "commit": "411693235a19c2dc7680102042d9a5f062f8e1d7",
+  "commit": "553a607685000971ef06678e913db7429d263148",
   "bench_group": "t0_refresh_origin_sentinel",
   "tier": 0,
   "blocking": true,
   "scenario_class": "refresh_origin_sentinel",
   "runtime_budget_secs": 30,
-  "actual_runtime_secs": 4.59e-7,
+  "actual_runtime_secs": 9.58e-7,
   "fixture_rows": 0,
   "fixture_spans": 0,
   "storage_profile": "P1_local_nvme",
-  "spans": {
-    "delta.snapshot.refresh": {
-      "count": 0,
-      "p50_us": 0,
-      "p95_us": 0,
-      "p99_us": 0,
-      "sum_us": 0
-    },
-    "df.collect": {
-      "count": 0,
-      "p50_us": 0,
-      "p95_us": 0,
-      "p99_us": 0,
-      "sum_us": 0
-    }
-  },
+  "spans": {},
   "object_store_counts": {
     "list": 0,
     "list_with_delimiter": 0,
diff --git a/crates/scouter_dataframe/benches/dataset_benchmark.rs b/crates/scouter_dataframe/benches/dataset_benchmark.rs
index 4f475a1f..3c376427 100644
--- a/crates/scouter_dataframe/benches/dataset_benchmark.rs
+++ b/crates/scouter_dataframe/benches/dataset_benchmark.rs
@@ -10,15 +10,11 @@ use scouter_dataframe::parquet::bifrost::manager::DatasetEngineManager;
 use scouter_settings::ObjectStorageSettings;
 use scouter_types::StorageType;
 use scouter_types::dataset::{DatasetFingerprint, DatasetNamespace, DatasetRegistration};
-use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
 use std::time::{Duration, Instant};
-use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
-
-const DF_COLLECT_SPAN: &str = "df.collect";
-const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
+use tracing::Instrument;
 
 fn bench_schema() -> Schema {
     Schema::new(vec![
@@ -194,24 +190,13 @@ fn bench_query(c: &mut Criterion) {
     });
 }
 
-fn span_metric(duration: Duration) -> tiers::SpanMetric {
-    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
-    tiers::SpanMetric {
-        count: 1,
-        p50_us: micros,
-        p95_us: micros,
-        p99_us: micros,
-        sum_us: micros,
-    }
-}
-
 fn bench_t0_bifrost_smoke(c: &mut Criterion) {
     const GROUP: &str = "t0_bifrost_smoke";
     if !tiers::tier_guard_for("dataset_benchmark", GROUP) {
         return;
     }
 
-    let setup_start = Instant::now();
+    let collector = utils::install_bench_span_collector();
     let rt = Runtime::new().unwrap();
     let dir = tempfile::tempdir().unwrap();
     let schema = bench_schema();
@@ -230,36 +215,53 @@ fn bench_t0_bifrost_smoke(c: &mut Criterion) {
         (Arc::new(manager), reg.namespace.clone())
     });
     let fqn = namespace.fqn();
-    let sql = format!("SELECT COUNT(*) as cnt FROM {fqn}");
+    let sql = format!("SELECT * FROM {fqn} LIMIT 256");
 
-    let smoke_start = Instant::now();
-    rt.block_on(async {
-        let _ = manager.query(&sql).await.unwrap();
+    // Probe once so fixture or query failures fail before Criterion starts measuring.
+    let probe_rows = rt.block_on(async {
+        let batches = manager.query(&sql).await.unwrap();
+        batches.iter().map(|batch| batch.num_rows()).sum::<usize>() as u64
     });
-    let smoke_runtime = smoke_start.elapsed();
 
-    let mut spans = BTreeMap::new();
-    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
-    spans.insert(
-        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
-        tiers::SpanMetric::default(),
-    );
+    let object_store_start = collector.records_len();
+    let collector_start = collector.records_len();
+    let bench_start = Instant::now();
+    let manager_for_bench = Arc::clone(&manager);
+    let sql_for_bench = sql.clone();
+    c.bench_function(GROUP, |b| {
+        b.to_async(&rt).iter_custom(|iters| {
+            let mgr = Arc::clone(&manager_for_bench);
+            let sql = sql_for_bench.clone();
+            async move {
+                let start = Instant::now();
+                for _ in 0..iters {
+                    let _ = black_box(
+                        mgr.query(&sql)
+                            .instrument(tracing::info_span!(tiers::END_TO_END_SPAN))
+                            .await
+                            .unwrap(),
+                    );
+                }
+                start.elapsed()
+            }
+        });
+    });
+
+    let actual_runtime = bench_start.elapsed();
+    let spans = utils::summarize_spans(&collector.records_since(collector_start));
+    let object_store_counts = collector.object_store_counts_since(object_store_start);
     utils::write_bench_artifact(
         "dataset_benchmark",
         GROUP,
-        setup_start.elapsed(),
+        actual_runtime,
         spans,
-        ObjectStoreCountSnapshot::default(),
+        object_store_counts,
         0,
+        Some("dataset_engine_manager.query"),
+        Some(probe_rows),
     );
 
-    c.bench_function(GROUP, |b| {
-        let mgr = Arc::clone(&manager);
-        let sql = sql.clone();
-        b.to_async(&rt)
-            .iter(|| async { black_box(mgr.query(&sql).await.unwrap()) });
-    });
-
+    drop(manager_for_bench);
     rt.block_on(async {
         Arc::try_unwrap(manager)
             .unwrap_or_else(|_| panic!("manager still referenced"))
diff --git a/crates/scouter_dataframe/benches/hot_path_bench.rs b/crates/scouter_dataframe/benches/hot_path_bench.rs
index f80405a6..e820e2e8 100644
--- a/crates/scouter_dataframe/benches/hot_path_bench.rs
+++ b/crates/scouter_dataframe/benches/hot_path_bench.rs
@@ -10,20 +10,17 @@ use scouter_types::{
     Attribute, FilterClause, SpanId, StorageType, TraceId, TraceMetricsRequest, TraceSpanRecord,
 };
 use serde_json::json;
-use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
 use std::time::{Duration, Instant};
-use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
+use tracing::Instrument;
 
 const TOTAL_SPANS: usize = 1_000_000;
 const SPANS_PER_TRACE: usize = 5;
 const WRITE_CHUNK_SPANS: usize = 50_000;
 const SERVICE_COUNT: usize = 20;
 const HOT_SERVICE: &str = "service_03";
-const DF_COLLECT_SPAN: &str = "df.collect";
-const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
 
 #[derive(Clone)]
 struct HotFixture {
@@ -183,7 +180,7 @@ async fn seed_small_fixture(settings: &ObjectStorageSettings, total_spans: usize
     }
     service.optimize().await.unwrap();
 
-    let trace_idx = 24 * 100 + 3;
+    let trace_idx = 24 * 50 + 3;
     let trace_start = base_time
         + chrono::Duration::hours((trace_idx % 24) as i64)
         + chrono::Duration::milliseconds(((trace_idx / 24) % 3_600_000) as i64);
@@ -465,32 +462,21 @@ fn benchmark_trace_hot_paths(c: &mut Criterion) {
     drop(tmp_dir);
 }
 
-fn span_metric(duration: Duration) -> tiers::SpanMetric {
-    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
-    tiers::SpanMetric {
-        count: 1,
-        p50_us: micros,
-        p95_us: micros,
-        p99_us: micros,
-        sum_us: micros,
-    }
-}
-
 fn benchmark_t0_cold_query_smoke(c: &mut Criterion) {
     const GROUP: &str = "t0_hot_path_cold_query_smoke";
     if !tiers::tier_guard_for("hot_path_bench", GROUP) {
         return;
     }
 
-    let setup_start = Instant::now();
+    let collector = utils::install_bench_span_collector();
     let rt = Runtime::new().unwrap();
     let tmp_dir = tempfile::tempdir().unwrap();
     let settings = storage_settings(tmp_dir.path().to_string_lossy().to_string());
     let fixture = rt.block_on(seed_small_fixture(&settings, 10_000));
 
-    let smoke_start = Instant::now();
-    rt.block_on(async {
-        let _ = fixture
+    // Probe once so fixture or query failures fail before Criterion starts measuring.
+    let probe_rows = rt.block_on(async {
+        fixture
             .service
             .query_service
             .query_spans(
@@ -504,28 +490,17 @@ fn benchmark_t0_cold_query_smoke(c: &mut Criterion) {
                 None,
             )
             .await
-            .unwrap();
+            .unwrap()
+            .len() as u64
     });
-    let smoke_runtime = smoke_start.elapsed();
-
-    let mut spans = BTreeMap::new();
-    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
-    spans.insert(
-        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
-        tiers::SpanMetric::default(),
-    );
-    utils::write_bench_artifact(
-        "hot_path_bench",
-        GROUP,
-        setup_start.elapsed(),
-        spans,
-        ObjectStoreCountSnapshot::default(),
-        0,
-    );
 
+    let object_store_start = collector.records_len();
+    let collector_start = collector.records_len();
+    let bench_start = Instant::now();
+    let fixture_for_bench = fixture.clone();
     c.bench_function(GROUP, |b| {
         b.to_async(&rt).iter_custom(|iters| {
-            let fixture = fixture.clone();
+            let fixture = fixture_for_bench.clone();
             async move {
                 let start = Instant::now();
                 for _ in 0..iters {
@@ -543,6 +518,7 @@ fn benchmark_t0_cold_query_smoke(c: &mut Criterion) {
                                 Some(&(fixture.trace_start + chrono::Duration::minutes(1))),
                                 None,
                             )
+                            .instrument(tracing::info_span!(tiers::END_TO_END_SPAN))
                             .await
                             .unwrap(),
                     );
@@ -552,6 +528,21 @@ fn benchmark_t0_cold_query_smoke(c: &mut Criterion) {
         });
     });
 
+    let actual_runtime = bench_start.elapsed();
+    let spans = utils::summarize_spans(&collector.records_since(collector_start));
+    let object_store_counts = collector.object_store_counts_since(object_store_start);
+    utils::write_bench_artifact(
+        "hot_path_bench",
+        GROUP,
+        actual_runtime,
+        spans,
+        object_store_counts,
+        0,
+        Some("trace_query_service.query_spans"),
+        Some(probe_rows),
+    );
+
+    drop(fixture_for_bench);
     let service = Arc::try_unwrap(fixture.service)
         .unwrap_or_else(|_| panic!("Arc still has multiple owners"));
     rt.block_on(async { service.shutdown().await.unwrap() });
diff --git a/crates/scouter_dataframe/benches/tiers.rs b/crates/scouter_dataframe/benches/tiers.rs
index 2dd3f2fb..c527c01e 100644
--- a/crates/scouter_dataframe/benches/tiers.rs
+++ b/crates/scouter_dataframe/benches/tiers.rs
@@ -64,6 +64,19 @@ pub struct ObjectStoreCountSnapshot {
     pub bytes: u64,
 }
 
+impl ObjectStoreCountSnapshot {
+    pub fn total_operations(&self) -> u64 {
+        self.list
+            + self.list_with_delimiter
+            + self.head
+            + self.get
+            + self.get_range
+            + self.put
+            + self.delete
+            + self.copy
+    }
+}
+
 #[derive(Clone, Debug, Serialize, Deserialize)]
 pub struct BenchArtifact {
     pub commit: String,
@@ -76,12 +89,20 @@ pub struct BenchArtifact {
     pub fixture_rows: u64,
     pub fixture_spans: u64,
     pub storage_profile: String,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub query_entrypoint: Option<String>,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub result_rows: Option<u64>,
     pub spans: BTreeMap<String, SpanMetric>,
     pub object_store_counts: ObjectStoreCountSnapshot,
     #[serde(default)]
     pub refresh_on_request_path_total: u64,
 }
 
+pub const END_TO_END_SPAN: &str = "bench.query.end_to_end";
+pub const DF_COLLECT_SPAN: &str = "df.collect";
+pub const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
+
 pub const P1_LOCAL_NVME: &str = "P1_local_nvme";
 pub const P2_OBJECT_WARM: &str = "P2_object_warm";
 pub const P2_OBJECT_COLD: &str = "P2_object_cold";
@@ -432,6 +453,46 @@ fn compare_count(
     }
 }
 
+fn end_to_end_count(artifact: &BenchArtifact) -> Option<u64> {
+    artifact
+        .spans
+        .get(END_TO_END_SPAN)
+        .map(|metric| metric.count)
+}
+
+fn compare_rate(
+    failures: &mut Vec<String>,
+    label: &str,
+    run: u64,
+    run_denominator: u64,
+    baseline: u64,
+    baseline_denominator: u64,
+    tier: BenchTier,
+) {
+    if run_denominator == 0 || baseline_denominator == 0 {
+        compare_count(failures, label, run, baseline, tier);
+        return;
+    }
+
+    let run_rate = run as f64 / run_denominator as f64;
+    let baseline_rate = baseline as f64 / baseline_denominator as f64;
+    if baseline_rate == 0.0 {
+        if run_rate > 0.0 && tier == BenchTier::Tier0 {
+            failures.push(format!(
+                "{label} rate regressed from zero: run={run_rate:.4}, baseline=0.0000"
+            ));
+        }
+        return;
+    }
+
+    let percent = ((run_rate - baseline_rate) / baseline_rate) * 100.0;
+    if percent > 10.0 && tier == BenchTier::Tier0 {
+        failures.push(format!(
+            "{label} rate regressed by {percent:.1}%: run={run_rate:.4}, baseline={baseline_rate:.4}"
+        ));
+    }
+}
+
 fn compare_span(
     failures: &mut Vec<String>,
     name: &str,
@@ -457,6 +518,54 @@ fn compare_span(
     );
 }
 
+fn compare_artifacts(
+    failures: &mut Vec<String>,
+    run: &BenchArtifact,
+    baseline: &BenchArtifact,
+    tier: BenchTier,
+) {
+    if baseline.spans.contains_key(END_TO_END_SPAN) && !run.spans.contains_key(END_TO_END_SPAN) {
+        failures.push(format!(
+            "{} missing primary {END_TO_END_SPAN} metric present in baseline",
+            run.bench_group
+        ));
+    }
+
+    compare_span(failures, END_TO_END_SPAN, run, baseline, tier);
+
+    let run_end_to_end_count = end_to_end_count(run).unwrap_or(0);
+    let baseline_end_to_end_count = end_to_end_count(baseline).unwrap_or(0);
+    compare_span(failures, DELTA_SNAPSHOT_REFRESH_SPAN, run, baseline, tier);
+    compare_span(failures, DF_COLLECT_SPAN, run, baseline, tier);
+    compare_rate(
+        failures,
+        "object_store_counts.get_range",
+        run.object_store_counts.get_range,
+        run_end_to_end_count,
+        baseline.object_store_counts.get_range,
+        baseline_end_to_end_count,
+        tier,
+    );
+    compare_rate(
+        failures,
+        "object_store_counts.head",
+        run.object_store_counts.head,
+        run_end_to_end_count,
+        baseline.object_store_counts.head,
+        baseline_end_to_end_count,
+        tier,
+    );
+    compare_rate(
+        failures,
+        "object_store_counts.list",
+        run.object_store_counts.list,
+        run_end_to_end_count,
+        baseline.object_store_counts.list,
+        baseline_end_to_end_count,
+        tier,
+    );
+}
+
 fn compare_artifact(run_path: &Path, requested_tier: BenchTier) -> Result<Vec<String>, String> {
     let run = read_artifact(run_path)?;
     let Some(run_tier) = BenchTier::from_u8(run.tier) else {
@@ -486,6 +595,8 @@ fn compare_artifact(run_path: &Path, requested_tier: BenchTier) -> Result<Vec<St
     let mut failures = Vec::new();
     let mut notes = Vec::new();
 
+    validate_artifact_execution(&run, run_tier, &mut failures);
+
     if run.actual_runtime_secs > run.runtime_budget_secs as f64 && run_tier == BenchTier::Tier0 {
         failures.push(format!(
             "{} exceeded runtime budget: {:.2}s > {}s",
@@ -508,35 +619,7 @@ fn compare_artifact(run_path: &Path, requested_tier: BenchTier) -> Result<Vec<St
         ));
     } else {
         let baseline = read_artifact(&baseline_path)?;
-        compare_count(
-            &mut failures,
-            "object_store_counts.get_range",
-            run.object_store_counts.get_range,
-            baseline.object_store_counts.get_range,
-            run_tier,
-        );
-        compare_count(
-            &mut failures,
-            "object_store_counts.head",
-            run.object_store_counts.head,
-            baseline.object_store_counts.head,
-            run_tier,
-        );
-        compare_count(
-            &mut failures,
-            "object_store_counts.list",
-            run.object_store_counts.list,
-            baseline.object_store_counts.list,
-            run_tier,
-        );
-        compare_span(&mut failures, "df.collect", &run, &baseline, run_tier);
-        compare_span(
-            &mut failures,
-            "delta.snapshot.refresh",
-            &run,
-            &baseline,
-            run_tier,
-        );
+        compare_artifacts(&mut failures, &run, &baseline, run_tier);
     }
 
     if run_tier != BenchTier::Tier0 && !failures.is_empty() {
@@ -554,14 +637,115 @@ fn compare_artifact(run_path: &Path, requested_tier: BenchTier) -> Result<Vec<St
     }
 }
 
+fn validate_artifact_execution(
+    run: &BenchArtifact,
+    run_tier: BenchTier,
+    failures: &mut Vec<String>,
+) {
+    if run_tier != BenchTier::Tier0 {
+        return;
+    }
+
+    let Some(registration) = REGISTRY
+        .iter()
+        .find(|entry| entry.group_name == run.bench_group && entry.tier == BenchTier::Tier0)
+    else {
+        failures.push(format!(
+            "{} is not registered as a Tier 0 benchmark group",
+            run.bench_group
+        ));
+        return;
+    };
+
+    if run.fixture_rows != registration.fixture_rows {
+        failures.push(format!(
+            "{} reported fixture_rows={} but registry expects {}",
+            run.bench_group, run.fixture_rows, registration.fixture_rows
+        ));
+    }
+
+    if run.fixture_spans != registration.fixture_spans {
+        failures.push(format!(
+            "{} reported fixture_spans={} but registry expects {}",
+            run.bench_group, run.fixture_spans, registration.fixture_spans
+        ));
+    }
+
+    if run.scenario_class != registration.scenario_class {
+        failures.push(format!(
+            "{} reported scenario_class={} but registry expects {}",
+            run.bench_group, run.scenario_class, registration.scenario_class
+        ));
+    }
+
+    if run.storage_profile != registration.storage_profile {
+        failures.push(format!(
+            "{} reported storage_profile={} but registry expects {}",
+            run.bench_group, run.storage_profile, registration.storage_profile
+        ));
+    }
+
+    if run.bench_group == "t0_refresh_origin_sentinel" {
+        if run.refresh_on_request_path_total != 0 {
+            failures.push(format!(
+                "{} recorded refresh_on_request_path_total={}",
+                run.bench_group, run.refresh_on_request_path_total
+            ));
+        }
+        return;
+    }
+
+    if run.query_entrypoint.is_none() {
+        failures.push(format!("{} missing query_entrypoint", run.bench_group));
+    }
+
+    match run.result_rows {
+        Some(rows) if rows > 0 => {}
+        _ => failures.push(format!("{} missing or zero result_rows", run.bench_group)),
+    }
+
+    match run.spans.get(END_TO_END_SPAN) {
+        Some(metric) if metric.count >= 10 && metric.sum_us > 0 => {}
+        Some(metric) => failures.push(format!(
+            "{} did not record a measured {END_TO_END_SPAN} workload: count={}, sum_us={}",
+            run.bench_group, metric.count, metric.sum_us
+        )),
+        None => failures.push(format!(
+            "{} did not record required {END_TO_END_SPAN} span metrics",
+            run.bench_group
+        )),
+    }
+
+    if run.actual_runtime_secs <= 0.0 {
+        failures.push(format!(
+            "{} reported non-positive actual_runtime_secs={}",
+            run.bench_group, run.actual_runtime_secs
+        ));
+    }
+
+    if run.object_store_counts.total_operations() == 0 {
+        failures.push(format!(
+            "{} did not record any object-store operations; this is a smoke artifact, not a baseline",
+            run.bench_group
+        ));
+    }
+}
+
 fn compare_requested_tier(tier: BenchTier) -> Result<(), String> {
     let dir = run_metrics_dir();
     if !dir.exists() {
+        if tier == BenchTier::Tier0 {
+            return Err(format!(
+                "missing Tier 0 bench artifacts directory {}; run make bench.core before comparing",
+                dir.display()
+            ));
+        }
         return Ok(());
     }
 
     let mut notes = Vec::new();
     let mut compared = 0usize;
+    let mut seen = BTreeSet::new();
     for entry in fs::read_dir(&dir).map_err(|err| format!("failed to read {dir:?}: {err}"))? {
         let entry = entry.map_err(|err| format!("failed to read dir entry: {err}"))?;
         let path = entry.path();
@@ -583,6 +767,7 @@ fn compare_requested_tier(tier: BenchTier) -> Result<(), String> {
             continue;
         }
         compared += 1;
+        seen.insert(stem.to_string());
         match compare_artifact(&path, tier) {
             Ok(artifact_notes) => notes.extend(artifact_notes),
             Err(err) if tier != BenchTier::Tier0 => notes.push(format!(
@@ -593,6 +778,21 @@ fn compare_requested_tier(tier: BenchTier) -> Result<(), String> {
         }
     }
 
+    if tier == BenchTier::Tier0 {
+        let missing = REGISTRY
+            .iter()
+            .filter(|entry| entry.tier == BenchTier::Tier0)
+            .map(|entry| entry.group_name)
+            .filter(|group_name| !seen.contains(*group_name))
+            .collect::<Vec<_>>();
+        if !missing.is_empty() {
+            return Err(format!(
+                "missing Tier 0 bench artifact(s): {}",
+                missing.join(", ")
+            ));
+        }
+    }
+
     for note in notes {
         eprintln!("{note}");
     }
@@ -653,6 +853,44 @@ fn main() {
 mod tests {
     use super::*;
 
+    fn tier0_artifact(group_name: &str) -> BenchArtifact {
+        let registration = REGISTRY
+            .iter()
+            .find(|entry| entry.group_name == group_name && entry.tier == BenchTier::Tier0)
+            .unwrap();
+        let mut spans = BTreeMap::new();
+        spans.insert(
+            END_TO_END_SPAN.to_string(),
+            SpanMetric {
+                count: 10,
+                p50_us: 100,
+                p95_us: 150,
+                p99_us: 200,
+                sum_us: 1_200,
+            },
+        );
+        BenchArtifact {
+            commit: "test".to_string(),
+            bench_group: group_name.to_string(),
+            tier: BenchTier::Tier0.as_u8(),
+            blocking: true,
+            scenario_class: registration.scenario_class.to_string(),
+            runtime_budget_secs: registration.runtime_budget_secs,
+            actual_runtime_secs: 1.0,
+            fixture_rows: registration.fixture_rows,
+            fixture_spans: registration.fixture_spans,
+            storage_profile: registration.storage_profile.to_string(),
+            query_entrypoint: Some("test_entrypoint".to_string()),
+            result_rows: Some(10),
+            spans,
+            object_store_counts: ObjectStoreCountSnapshot {
+                list: 1,
+                ..ObjectStoreCountSnapshot::default()
+            },
+            refresh_on_request_path_total: 0,
+        }
+    }
+
     #[test]
     fn tier0_filter_is_exactly_anchored() {
         let filter = filter_for(BenchTier::Tier0, "trace_service_benchmark").unwrap();
@@ -669,4 +907,171 @@ mod tests {
     fn unknown_groups_default_to_tier1() {
         assert_eq!(tier_for("not_registered"), BenchTier::Tier1);
     }
+
+    #[test]
+    fn tier0_artifact_rejects_single_end_to_end_probe() {
+        let mut artifact = tier0_artifact("t0_hot_path_cold_query_smoke");
+        artifact.spans.insert(
+            END_TO_END_SPAN.to_string(),
+            SpanMetric {
+                count: 1,
+                p50_us: 5,
+                p95_us: 5,
+                p99_us: 5,
+                sum_us: 5,
+            },
+        );
+
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+
+        assert!(
+            failures.iter().any(|failure| failure
+                .contains("did not record a measured bench.query.end_to_end workload")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn tier0_artifact_rejects_missing_bench_query_end_to_end() {
+        let mut artifact = tier0_artifact("t0_hot_path_cold_query_smoke");
+        artifact.spans.remove(END_TO_END_SPAN);
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+        assert!(
+            failures
+                .iter()
+                .any(|failure| failure.contains("bench.query.end_to_end")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn tier0_artifact_rejects_missing_query_entrypoint() {
+        let mut artifact = tier0_artifact("t0_hot_path_cold_query_smoke");
+        artifact.query_entrypoint = None;
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+        assert!(
+            failures
+                .iter()
+                .any(|failure| failure.contains("query_entrypoint")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn tier0_artifact_rejects_missing_result_rows() {
+        let mut artifact = tier0_artifact("t0_hot_path_cold_query_smoke");
+        artifact.result_rows = None;
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+        assert!(
+            failures
+                .iter()
+                .any(|failure| failure.contains("result_rows")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn tier0_artifact_rejects_missing_object_store_counts() {
+        let mut artifact = tier0_artifact("t0_hot_path_cold_query_smoke");
+        artifact.object_store_counts = ObjectStoreCountSnapshot::default();
+
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+
+        assert!(
+            failures
+                .iter()
+                .any(|failure| failure.contains("did not record any object-store operations")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn tier0_refresh_origin_sentinel_allows_zero_workload_metrics() {
+        let mut artifact = tier0_artifact("t0_refresh_origin_sentinel");
+        artifact.spans.clear();
+        artifact.object_store_counts = ObjectStoreCountSnapshot::default();
+
+        let mut failures = Vec::new();
+        validate_artifact_execution(&artifact, BenchTier::Tier0, &mut failures);
+
+        assert!(failures.is_empty(), "{failures:?}");
+    }
+
+    #[test]
+    fn tier0_end_to_end_regression_fails_even_if_df_collect_improves() {
+        let mut baseline = tier0_artifact("t0_hot_path_cold_query_smoke");
+        baseline.spans.insert(
+            END_TO_END_SPAN.to_string(),
+            SpanMetric {
+                count: 10,
+                p50_us: 100,
+                p95_us: 100,
+                p99_us: 100,
+                sum_us: 1_000,
+            },
+        );
+        baseline.spans.insert(
+            DF_COLLECT_SPAN.to_string(),
+            SpanMetric {
+                count: 10,
+                p50_us: 80,
+                p95_us: 80,
+                p99_us: 80,
+                sum_us: 800,
+            },
+        );
+
+        let mut run = baseline.clone();
+        run.spans.insert(
+            END_TO_END_SPAN.to_string(),
+            SpanMetric {
+                count: 10,
+                p50_us: 130,
+                p95_us: 130,
+                p99_us: 130,
+                sum_us: 1_300,
+            },
+        );
+        run.spans.insert(
+            DF_COLLECT_SPAN.to_string(),
+            SpanMetric {
+                count: 10,
+                p50_us: 40,
+                p95_us: 40,
+                p99_us: 40,
+                sum_us: 400,
+            },
+        );
+
+        let mut failures = Vec::new();
+        compare_artifacts(&mut failures, &run, &baseline, BenchTier::Tier0);
+
+        assert!(
+            failures
+                .iter()
+                .any(|failure| failure.contains("bench.query.end_to_end")),
+            "{failures:?}"
+        );
+    }
+
+    #[test]
+    fn object_store_comparison_uses_rate_per_end_to_end() {
+        let mut failures = Vec::new();
+        compare_rate(
+            &mut failures,
+            "object_store_counts.get_range",
+            2_000,
+            1_000,
+            1_000,
+            500,
+            BenchTier::Tier0,
+        );
+
+        assert!(failures.is_empty(), "{failures:?}");
+    }
 }
diff --git a/crates/scouter_dataframe/benches/trace_service_benchmark.rs b/crates/scouter_dataframe/benches/trace_service_benchmark.rs
index 75216293..84f196d9 100644
--- a/crates/scouter_dataframe/benches/trace_service_benchmark.rs
+++ b/crates/scouter_dataframe/benches/trace_service_benchmark.rs
@@ -6,15 +6,11 @@ use criterion::{BenchmarkId, Criterion, Throughput, criterion_group, criterion_m
 use scouter_dataframe::parquet::tracing::service::TraceSpanService;
 use scouter_settings::ObjectStorageSettings;
 use scouter_types::{StorageType, TraceId, TraceSpanRecord};
-use std::collections::BTreeMap;
 use std::hint::black_box;
 use std::sync::Arc;
 use std::time::{Duration, Instant};
-use tiers::ObjectStoreCountSnapshot;
 use tokio::runtime::Runtime;
-
-const DF_COLLECT_SPAN: &str = "df.collect";
-const DELTA_SNAPSHOT_REFRESH_SPAN: &str = "delta.snapshot.refresh";
+use tracing::Instrument;
 
 fn generate_trace_batch(num_traces: usize, spans_per_trace: usize) -> Vec<TraceSpanRecord> {
     use scouter_mocks::generate_trace_with_spans;
@@ -888,28 +884,17 @@ fn bench_at_scale_10m(c: &mut Criterion) {
     drop(tmp_dir);
 }
 
-fn span_metric(duration: Duration) -> tiers::SpanMetric {
-    let micros = duration.as_micros().min(u64::MAX as u128) as u64;
-    tiers::SpanMetric {
-        count: 1,
-        p50_us: micros,
-        p95_us: micros,
-        p99_us: micros,
-        sum_us: micros,
-    }
-}
-
 fn bench_t0_cold_query_smoke(c: &mut Criterion) {
     const GROUP: &str = "t0_cold_query_smoke";
     if !tiers::tier_guard_for("trace_service_benchmark", GROUP) {
         return;
     }
 
+    let collector = utils::install_bench_span_collector();
     use scouter_mocks::generate_trace_with_spans;
 
     const HOURS: usize = 24;
     const SPANS_PER_HOUR: usize = 420;
-    let setup_start = Instant::now();
     let rt = Runtime::new().unwrap();
     let tmp_dir = tempfile::tempdir().unwrap();
     let storage_settings = ObjectStorageSettings {
@@ -945,36 +930,26 @@ fn bench_t0_cold_query_smoke(c: &mut Criterion) {
         (Arc::new(service), Arc::new(ids))
     });
 
-    let smoke_start = Instant::now();
-    rt.block_on(async {
+    // Probe once so setup failures fail before Criterion starts measuring.
+    let probe_rows = rt.block_on(async {
         let id = &ids[0];
-        let _ = service
+        service
             .query_service
             .query_spans(Some(id), None, None, None, None, None, None, None)
             .await
-            .unwrap();
+            .unwrap()
+            .len() as u64
     });
-    let smoke_runtime = smoke_start.elapsed();
-
-    let mut spans = BTreeMap::new();
-    spans.insert(DF_COLLECT_SPAN.to_string(), span_metric(smoke_runtime));
-    spans.insert(
-        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
-        tiers::SpanMetric::default(),
-    );
-    utils::write_bench_artifact(
-        "trace_service_benchmark",
-        GROUP,
-        setup_start.elapsed(),
-        spans,
-        ObjectStoreCountSnapshot::default(),
-        0,
-    );
 
+    let object_store_start = collector.records_len();
+    let collector_start = collector.records_len();
+    let bench_start = Instant::now();
+    let service_for_bench = Arc::clone(&service);
+    let ids_for_bench = Arc::clone(&ids);
     c.bench_function(GROUP, |b| {
         b.to_async(&rt).iter_custom(|iters| {
-            let svc = Arc::clone(&service);
-            let ids = Arc::clone(&ids);
+            let svc = Arc::clone(&service_for_bench);
+            let ids = Arc::clone(&ids_for_bench);
             async move {
                 let start = Instant::now();
                 for i in 0..iters {
@@ -982,6 +957,7 @@ fn bench_t0_cold_query_smoke(c: &mut Criterion) {
                     let _ = black_box(
                         svc.query_service
                             .query_spans(Some(id), None, None, None, None, None, None, None)
+                            .instrument(tracing::info_span!(tiers::END_TO_END_SPAN))
                             .await
                             .unwrap(),
                     );
@@ -991,6 +967,22 @@ fn bench_t0_cold_query_smoke(c: &mut Criterion) {
         });
     });
 
+    let actual_runtime = bench_start.elapsed();
+    let spans = utils::summarize_spans(&collector.records_since(collector_start));
+    let object_store_counts = collector.object_store_counts_since(object_store_start);
+    utils::write_bench_artifact(
+        "trace_service_benchmark",
+        GROUP,
+        actual_runtime,
+        spans,
+        object_store_counts,
+        0,
+        Some("trace_query_service.query_spans"),
+        Some(probe_rows),
+    );
+
+    drop(service_for_bench);
+    drop(ids_for_bench);
     let service =
         Arc::try_unwrap(service).unwrap_or_else(|_| panic!("Arc still has multiple owners"));
     rt.block_on(async { service.shutdown().await.unwrap() });
@@ -1003,20 +995,19 @@ fn bench_t0_refresh_origin_sentinel(c: &mut Criterion) {
         return;
     }
 
+    let collector = utils::install_bench_span_collector();
+    let object_store_start = collector.records_len();
     let start = Instant::now();
-    let mut spans = BTreeMap::new();
-    spans.insert(DF_COLLECT_SPAN.to_string(), tiers::SpanMetric::default());
-    spans.insert(
-        DELTA_SNAPSHOT_REFRESH_SPAN.to_string(),
-        tiers::SpanMetric::default(),
-    );
+    let spans = utils::summarize_spans(&collector.records_since(object_store_start));
     utils::write_bench_artifact(
         "trace_service_benchmark",
         GROUP,
         start.elapsed(),
         spans,
-        ObjectStoreCountSnapshot::default(),
+        collector.object_store_counts_since(object_store_start),
         0,
+        None,
+        None,
     );
 
     c.bench_function(GROUP, |b| {
diff --git a/crates/scouter_dataframe/benches/utils.rs b/crates/scouter_dataframe/benches/utils.rs
index 483bd732..662a6d21 100644
--- a/crates/scouter_dataframe/benches/utils.rs
+++ b/crates/scouter_dataframe/benches/utils.rs
@@ -7,14 +7,21 @@ use std::collections::BTreeMap;
 use std::fs;
 use std::path::PathBuf;
 use std::process::Command;
-use std::sync::{Arc, Mutex};
+use std::sync::{Arc, Mutex, OnceLock};
 use std::time::{Duration, Instant};
 use tracing::field::{Field, Visit};
 use tracing::span::{Attributes, Id, Record};
 use tracing::{Subscriber, warn};
 use tracing_subscriber::Layer;
 use tracing_subscriber::layer::Context;
+use tracing_subscriber::layer::SubscriberExt;
 use tracing_subscriber::registry::LookupSpan;
+use tracing_subscriber::util::SubscriberInitExt;
+
+const OBJECT_STORE_SPAN_NAME: &str = "object_store.request";
+const OBJECT_STORE_OPERATION_ATTR: &str = "object_store.operation";
+
+static BENCH_SPAN_COLLECTOR: OnceLock<BenchSpanCollector> = OnceLock::new();
 
 /// Create a simple 3-span trace as ingest records (ready for `write_spans()`).
 pub fn _create_simple_trace() -> Vec<TraceSpanRecord> {
@@ -158,9 +165,42 @@ impl BenchSpanCollector {
             .clone()
     }
 
+    pub fn records_len(&self) -> usize {
+        self.records
+            .lock()
+            .expect("bench span collector mutex poisoned")
+            .len()
+    }
+
+    pub fn records_since(&self, start: usize) -> Vec<SpanRecord> {
+        self.records
+            .lock()
+            .expect("bench span collector mutex poisoned")
+            .iter()
+            .skip(start)
+            .cloned()
+            .collect()
+    }
+
     pub fn summary(&self) -> BTreeMap<String, SpanMetric> {
         summarize_spans(&self.records())
     }
+
+    pub fn object_store_counts_since(&self, start: usize) -> ObjectStoreCountSnapshot {
+        object_store_counts(&self.records_since(start))
+    }
+}
+
+pub fn install_bench_span_collector() -> BenchSpanCollector {
+    BENCH_SPAN_COLLECTOR
+        .get_or_init(|| {
+            let collector = BenchSpanCollector::new();
+            let _ = tracing_subscriber::registry()
+                .with(collector.clone())
+                .try_init();
+            collector
+        })
+        .clone()
 }
 
 impl<S> Layer<S> for BenchSpanCollector
@@ -250,6 +290,51 @@ pub fn summarize_spans(records: &[SpanRecord]) -> BTreeMap<String, SpanMetric> {
         .collect()
 }
 
+pub fn span_metric_from_samples(samples_us: &[u64]) -> SpanMetric {
+    if samples_us.is_empty() {
+        return SpanMetric::default();
+    }
+
+    let mut values = samples_us.to_vec();
+    values.sort_unstable();
+    SpanMetric {
+        count: values.len() as u64,
+        p50_us: percentile_u64(&values, 50.0),
+        p95_us: percentile_u64(&values, 95.0),
+        p99_us: percentile_u64(&values, 99.0),
+        sum_us: values.iter().sum(),
+    }
+}
+
+pub fn object_store_counts(records: &[SpanRecord]) -> ObjectStoreCountSnapshot {
+    let mut counts = ObjectStoreCountSnapshot::default();
+    for record in records
+        .iter()
+        .filter(|record| record.name == OBJECT_STORE_SPAN_NAME)
+    {
+        match attr_value(record, OBJECT_STORE_OPERATION_ATTR).as_deref() {
+            Some("list") => counts.list += 1,
+            Some("list_with_delimiter") => counts.list_with_delimiter += 1,
+            Some("head") => counts.head += 1,
+            Some("get") => counts.get += 1,
+            Some("get_range") => counts.get_range += 1,
+            Some("put") => counts.put += 1,
+            Some("delete") => counts.delete += 1,
+            Some("copy") => counts.copy += 1,
+            _ => {}
+        }
+    }
+    counts
+}
+
+fn attr_value(record: &SpanRecord, key: &str) -> Option<String> {
+    record
+        .attrs
+        .iter()
+        .find(|(name, _)| name == key)
+        .map(|(_, value)| value.trim_matches('"').to_string())
+}
+
 fn percentile_u64(values: &[u64], percentile: f64) -> u64 {
     if values.is_empty() {
         return 0;
@@ -258,6 +343,7 @@ fn percentile_u64(values: &[u64], percentile: f64) -> u64 {
     values[index.min(values.len() - 1)]
 }
 
+#[allow(clippy::too_many_arguments)]
 pub fn write_bench_artifact(
     bench_binary: &'static str,
     group_name: &'static str,
@@ -265,6 +351,8 @@ pub fn write_bench_artifact(
     spans: BTreeMap<String, SpanMetric>,
     object_store_counts: ObjectStoreCountSnapshot,
     refresh_on_request_path_total: u64,
+    query_entrypoint: Option<&'static str>,
+    result_rows: Option<u64>,
 ) {
     let registration = registration_or_default(bench_binary, group_name);
     let artifact = BenchArtifact {
@@ -278,6 +366,8 @@ pub fn write_bench_artifact(
         fixture_rows: registration.fixture_rows,
         fixture_spans: registration.fixture_spans,
         storage_profile: registration.storage_profile.to_string(),
+        query_entrypoint: query_entrypoint.map(str::to_string),
+        result_rows,
         spans,
         object_store_counts,
         refresh_on_request_path_total,
@@ -363,4 +453,34 @@ mod tests {
         assert_eq!(metric.p99_us, 5);
         assert_eq!(metric.sum_us, 15);
     }
+
+    #[test]
+    fn object_store_counts_are_derived_from_span_attrs() {
+        let records = vec![
+            SpanRecord {
+                name: "object_store.request".to_string(),
+                attrs: vec![("object_store.operation".to_string(), "list".to_string())],
+                duration_ns: 1_000,
+            },
+            SpanRecord {
+                name: "object_store.request".to_string(),
+                attrs: vec![(
+                    "object_store.operation".to_string(),
+                    "\"get_range\"".to_string(),
+                )],
+                duration_ns: 1_000,
+            },
+            SpanRecord {
+                name: "df.collect".to_string(),
+                attrs: Vec::new(),
+                duration_ns: 1_000,
+            },
+        ];
+
+        let counts = object_store_counts(&records);
+
+        assert_eq!(counts.list, 1);
+        assert_eq!(counts.get_range, 1);
+        assert_eq!(counts.total_operations(), 2);
+    }
 }
diff --git a/crates/scouter_events/src/queue/py_queue.rs b/crates/scouter_events/src/queue/py_queue.rs
index 9b73014f..4ef79a54 100644
--- a/crates/scouter_events/src/queue/py_queue.rs
+++ b/crates/scouter_events/src/queue/py_queue.rs
@@ -545,15 +545,14 @@ impl ScouterQueue {
     ) -> Result<Py<QueueBus>, PyEventError> {
         let settings = if let DriftProfile::Agent(genai_profile) = &drift_profile {
             let mut profile = genai_profile.clone();
-            if let Some(workflow) = &mut profile.workflow
-                && std::env::var("SCOUTER_OFFLINE").as_deref() == Ok("1")
-                && let Err(e) = app_state()
+            if config.is_mock()
+                && let Err(error) = app_state()
                     .handle()
-                    .block_on(async { workflow.reset_agents().await })
+                    .block_on(async { profile.reset_workflow_agents().await })
             {
                 error!(
                     "Failed to reset workflow agents for profile {}: {:?}",
-                    id, e
+                    id, error
                 );
             }
             registry
diff --git a/crates/scouter_events/src/queue/types.rs b/crates/scouter_events/src/queue/types.rs
index 10a98f21..d0541c1e 100644
--- a/crates/scouter_events/src/queue/types.rs
+++ b/crates/scouter_events/src/queue/types.rs
@@ -49,6 +49,10 @@ impl TransportConfig {
         })
     }
 
+    pub fn is_mock(&self) -> bool {
+        matches!(self, TransportConfig::Mock(_))
+    }
+
     /// Create a TransportConfig from a python config object.
     /// Function will extract the transport type and then extract the corresponding config
     /// before returning the TransportConfig.
diff --git a/crates/scouter_types/src/agent/profile.rs b/crates/scouter_types/src/agent/profile.rs
index da87c936..e827441c 100644
--- a/crates/scouter_types/src/agent/profile.rs
+++ b/crates/scouter_types/src/agent/profile.rs
@@ -843,6 +843,13 @@ impl Default for AgentEvalProfile {
 }
 
 impl AgentEvalProfile {
+    pub async fn reset_workflow_agents(&mut self) -> Result<(), ProfileError> {
+        if let Some(workflow) = &mut self.workflow {
+            workflow.reset_agents().await?;
+        }
+        Ok(())
+    }
+
     /// Helper method to build profile from given tasks
     pub fn build_from_parts(
         config: AgentEvalConfig,