diff --git a/.gitignore b/.gitignore
index b84c72a..5c7663b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -34,3 +34,7 @@ backend/repos/
 # MCP Server
 mcp-server/__pycache__/
 *.code-workspace
+
+# Validation experiments
+validation-experiment/
+exp-2/
diff --git a/backend/dependencies.py b/backend/dependencies.py
index 9521a24..6dd84e5 100644
--- a/backend/dependencies.py
+++ b/backend/dependencies.py
@@ -14,6 +14,7 @@
 from services.dependency_analyzer import DependencyAnalyzer
 from services.style_analyzer import StyleAnalyzer
 from services.performance_metrics import PerformanceMetrics
+from services.dna_extractor import DNAExtractor
 from services.rate_limiter import RateLimiter, APIKeyManager
 from services.supabase_service import get_supabase_service
 from services.input_validator import InputValidator, CostController
@@ -26,6 +27,7 @@
 repo_manager = RepositoryManager()
 dependency_analyzer = DependencyAnalyzer()
 style_analyzer = StyleAnalyzer()
+dna_extractor = DNAExtractor()
 metrics = PerformanceMetrics()
 
 # Rate limiting and API key management
diff --git a/backend/routes/analysis.py b/backend/routes/analysis.py
index 2d194fb..37a74c2 100644
--- a/backend/routes/analysis.py
+++ b/backend/routes/analysis.py
@@ -3,7 +3,7 @@
 from pydantic import BaseModel
 
 from dependencies import (
-    dependency_analyzer, style_analyzer,
+    dependency_analyzer, style_analyzer, dna_extractor,
     get_repo_or_404
 )
 from services.input_validator import InputValidator
@@ -133,3 +133,50 @@ async def get_style_analysis(
         return {**style_data, "cached": False}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+
+
+
+@router.get("/{repo_id}/dna")
+async def get_codebase_dna(
+    repo_id: str,
+    format: str = "json",
+    auth: AuthContext = Depends(require_auth)
+):
+    """
+    Extract codebase DNA - architectural patterns, conventions, and constraints.
+    
+    This endpoint analyzes your codebase and returns a DNA profile that helps
+    AI assistants understand how to write code consistent with your patterns.
+    
+    Args:
+        repo_id: Repository identifier
+        format: Output format - 'json' or 'markdown' (default: json)
+    
+    Returns:
+        DNA profile with auth patterns, service patterns, database patterns, etc.
+    """
+    try:
+        repo = get_repo_or_404(repo_id, auth.user_id)
+        
+        # Try cache first
+        cached_dna = dna_extractor.load_from_cache(repo_id)
+        if cached_dna:
+            logger.debug("Using cached DNA", repo_id=repo_id)
+            if format == "markdown":
+                return {"dna": cached_dna.to_markdown(), "cached": True}
+            return {**cached_dna.to_dict(), "cached": True}
+        
+        # Extract fresh DNA
+        logger.info("Extracting codebase DNA", repo_id=repo_id)
+        metrics.increment("dna_extractions")
+        
+        dna = dna_extractor.extract_dna(repo["local_path"], repo_id)
+        dna_extractor.save_to_cache(repo_id, dna)
+        
+        if format == "markdown":
+            return {"dna": dna.to_markdown(), "cached": False}
+        return {**dna.to_dict(), "cached": False}
+        
+    except Exception as e:
+        logger.error("Error extracting DNA", repo_id=repo_id, error=str(e))
+        raise HTTPException(status_code=500, detail=str(e))
diff --git a/backend/services/dna_extractor.py b/backend/services/dna_extractor.py
new file mode 100644
index 0000000..5d3e830
--- /dev/null
+++ b/backend/services/dna_extractor.py
@@ -0,0 +1,1018 @@
+"""
+CodeDNA Extractor
+Extracts architectural patterns, conventions, and constraints from a codebase.
+Generates a DNA document that helps AI understand how to write consistent code.
+"""
+from pathlib import Path
+from typing import Dict, List, Set, Optional, Any
+from collections import defaultdict, Counter
+from dataclasses import dataclass, field, asdict
+import re
+import json
+
+import tree_sitter_python as tspython
+import tree_sitter_javascript as tsjavascript
+from tree_sitter import Language, Parser
+
+from services.observability import logger
+from services.supabase_service import get_supabase_service
+
+
+@dataclass
+class AuthPattern:
+    """Detected authentication patterns"""
+    middleware_used: List[str] = field(default_factory=list)
+    auth_decorators: List[str] = field(default_factory=list)
+    ownership_checks: List[str] = field(default_factory=list)
+    auth_context_type: Optional[str] = None
+
+
+@dataclass
+class ServicePattern:
+    """Detected service layer patterns"""
+    singleton_services: List[str] = field(default_factory=list)
+    dependencies_file: Optional[str] = None
+    service_base_classes: List[str] = field(default_factory=list)
+    injection_pattern: Optional[str] = None
+
+
+@dataclass 
+class DatabasePattern:
+    """Detected database patterns"""
+    orm_used: Optional[str] = None
+    connection_pattern: Optional[str] = None
+    has_rls: bool = False
+    id_type: str = "unknown"
+    timestamp_type: str = "unknown"
+    cascade_deletes: bool = False
+
+
+@dataclass
+class ErrorPattern:
+    """Detected error handling patterns"""
+    exception_classes: List[str] = field(default_factory=list)
+    http_exception_usage: bool = False
+    error_response_format: Optional[str] = None
+    logging_on_error: bool = False
+
+
+@dataclass
+class LoggingPattern:
+    """Detected logging patterns"""
+    logger_import: Optional[str] = None
+    log_levels_used: List[str] = field(default_factory=list)
+    structured_logging: bool = False
+    metrics_tracking: bool = False
+
+
+@dataclass
+class NamingConventions:
+    """Detected naming conventions"""
+    function_style: str = "unknown"
+    class_style: str = "unknown"
+    constant_style: str = "unknown"
+    file_style: str = "unknown"
+
+
+@dataclass
+class TestPattern:
+    """Detected testing patterns"""
+    framework: Optional[str] = None  # pytest, unittest, nose
+    fixture_style: Optional[str] = None  # pytest fixtures, setUp/tearDown
+    mock_library: Optional[str] = None  # unittest.mock, pytest-mock, responses
+    test_file_pattern: str = "test_*.py"
+    has_conftest: bool = False
+    has_factories: bool = False  # factory_boy, faker
+    coverage_config: bool = False
+
+
+@dataclass
+class ConfigPattern:
+    """Detected configuration patterns"""
+    env_loading: Optional[str] = None  # python-dotenv, environs, django-environ
+    settings_pattern: Optional[str] = None  # single file, split by env, pydantic
+    secrets_handling: Optional[str] = None  # env vars, vault, AWS secrets
+    config_validation: bool = False  # pydantic Settings, dynaconf
+
+
+@dataclass
+class CodebaseDNA:
+    """Complete DNA profile of a codebase"""
+    repo_id: str
+    detected_framework: Optional[str] = None
+    language_distribution: Dict[str, int] = field(default_factory=dict)
+    auth_patterns: AuthPattern = field(default_factory=AuthPattern)
+    service_patterns: ServicePattern = field(default_factory=ServicePattern)
+    database_patterns: DatabasePattern = field(default_factory=DatabasePattern)
+    error_patterns: ErrorPattern = field(default_factory=ErrorPattern)
+    logging_patterns: LoggingPattern = field(default_factory=LoggingPattern)
+    naming_conventions: NamingConventions = field(default_factory=NamingConventions)
+    test_patterns: TestPattern = field(default_factory=TestPattern)
+    config_patterns: ConfigPattern = field(default_factory=ConfigPattern)
+    middleware_patterns: List[str] = field(default_factory=list)
+    common_imports: List[str] = field(default_factory=list)
+    skip_directories: List[str] = field(default_factory=list)
+    api_versioning: Optional[str] = None
+    router_pattern: Optional[str] = None
+    
+    def to_dict(self) -> Dict:
+        return asdict(self)
+    
+    def to_markdown(self) -> str:
+        """Generate markdown DNA document for AI consumption"""
+        md = f"# Codebase DNA\n\n"
+        
+        # Framework detection
+        if self.detected_framework:
+            md += f"**Detected Framework:** {self.detected_framework}\n\n"
+        
+        # Language distribution
+        md += "## Language Distribution\n"
+        for lang, count in sorted(self.language_distribution.items(), key=lambda x: -x[1]):
+            md += f"- {lang}: {count} files\n"
+        md += "\n"
+        
+        # Middleware patterns
+        if self.middleware_patterns:
+            md += "## Middleware Patterns\n"
+            for mw in self.middleware_patterns:
+                md += f"- `{mw}`\n"
+            md += "\n"
+        
+        # Auth patterns
+        md += "## Authentication Patterns\n"
+        if self.auth_patterns.middleware_used:
+            md += f"**Middleware:** `{', '.join(self.auth_patterns.middleware_used)}`\n"
+        if self.auth_patterns.auth_decorators:
+            md += f"**Decorators:** `{', '.join(self.auth_patterns.auth_decorators)}`\n"
+        if self.auth_patterns.ownership_checks:
+            md += f"**Ownership Checks:** `{', '.join(self.auth_patterns.ownership_checks)}`\n"
+        if self.auth_patterns.auth_context_type:
+            md += f"**Auth Context:** `{self.auth_patterns.auth_context_type}`\n"
+        md += "\n"
+        
+        # Service patterns
+        md += "## Service Layer Patterns\n"
+        if self.service_patterns.singleton_services:
+            md += f"**Singletons:** `{', '.join(self.service_patterns.singleton_services)}`\n"
+        if self.service_patterns.dependencies_file:
+            md += f"**Dependencies File:** `{self.service_patterns.dependencies_file}`\n"
+        if self.service_patterns.injection_pattern:
+            md += f"**Injection Pattern:** {self.service_patterns.injection_pattern}\n"
+        md += "\n"
+        
+        # Database patterns
+        md += "## Database Patterns\n"
+        if self.database_patterns.orm_used:
+            md += f"**ORM:** {self.database_patterns.orm_used}\n"
+        md += f"**ID Type:** `{self.database_patterns.id_type}`\n"
+        md += f"**Timestamp Type:** `{self.database_patterns.timestamp_type}`\n"
+        md += f"**RLS Enabled:** {self.database_patterns.has_rls}\n"
+        md += f"**Cascade Deletes:** {self.database_patterns.cascade_deletes}\n"
+        md += "\n"
+        
+        # Error handling
+        md += "## Error Handling\n"
+        if self.error_patterns.exception_classes:
+            md += f"**Exception Classes:** `{', '.join(self.error_patterns.exception_classes)}`\n"
+        md += f"**HTTP Exception:** {self.error_patterns.http_exception_usage}\n"
+        md += f"**Logs Errors:** {self.error_patterns.logging_on_error}\n"
+        md += "\n"
+        
+        # Logging
+        md += "## Logging Patterns\n"
+        if self.logging_patterns.logger_import:
+            md += f"**Import:** `{self.logging_patterns.logger_import}`\n"
+        if self.logging_patterns.log_levels_used:
+            md += f"**Levels Used:** `{', '.join(self.logging_patterns.log_levels_used)}`\n"
+        md += f"**Structured:** {self.logging_patterns.structured_logging}\n"
+        md += f"**Metrics:** {self.logging_patterns.metrics_tracking}\n"
+        md += "\n"
+        
+        # Naming
+        md += "## Naming Conventions\n"
+        md += f"- Functions: `{self.naming_conventions.function_style}`\n"
+        md += f"- Classes: `{self.naming_conventions.class_style}`\n"
+        md += f"- Constants: `{self.naming_conventions.constant_style}`\n"
+        md += f"- Files: `{self.naming_conventions.file_style}`\n"
+        md += "\n"
+        
+        # Common imports
+        if self.common_imports:
+            md += "## Common Imports\n"
+            md += "```python\n"
+            for imp in self.common_imports[:15]:
+                md += f"{imp}\n"
+            md += "```\n\n"
+        
+        # API patterns
+        if self.api_versioning or self.router_pattern:
+            md += "## API Patterns\n"
+            if self.api_versioning:
+                md += f"**Versioning:** `{self.api_versioning}`\n"
+            if self.router_pattern:
+                md += f"**Router:** `{self.router_pattern}`\n"
+            md += "\n"
+        
+        # Test patterns
+        if self.test_patterns.framework:
+            md += "## Testing Patterns\n"
+            md += f"**Framework:** {self.test_patterns.framework}\n"
+            if self.test_patterns.fixture_style:
+                md += f"**Fixture Style:** {self.test_patterns.fixture_style}\n"
+            if self.test_patterns.mock_library:
+                md += f"**Mock Library:** {self.test_patterns.mock_library}\n"
+            md += f"**Test File Pattern:** `{self.test_patterns.test_file_pattern}`\n"
+            if self.test_patterns.has_conftest:
+                md += "**Has conftest.py:** Yes\n"
+            if self.test_patterns.has_factories:
+                md += "**Uses Factories:** Yes\n"
+            md += "\n"
+        
+        # Config patterns
+        if self.config_patterns.env_loading or self.config_patterns.settings_pattern:
+            md += "## Configuration Patterns\n"
+            if self.config_patterns.env_loading:
+                md += f"**Env Loading:** {self.config_patterns.env_loading}\n"
+            if self.config_patterns.settings_pattern:
+                md += f"**Settings Pattern:** {self.config_patterns.settings_pattern}\n"
+            if self.config_patterns.secrets_handling:
+                md += f"**Secrets Handling:** {self.config_patterns.secrets_handling}\n"
+            if self.config_patterns.config_validation:
+                md += "**Config Validation:** Yes (Pydantic/dynaconf)\n"
+            md += "\n"
+        
+        # Skip directories
+        if self.skip_directories:
+            md += "## Skip Directories\n"
+            md += f"`{', '.join(self.skip_directories)}`\n\n"
+        
+        return md
+
+
+class DNAExtractor:
+    """Extracts architectural DNA from a codebase"""
+    
+    SKIP_DIRS = {'node_modules', '.git', '__pycache__', 'venv', 'env', 'dist', 'build', '.next', 'coverage', '.venv', 'site-packages'}
+    MAX_FILE_SIZE = 1024 * 1024  # 1MB
+    MAX_FILES = 5000
+    
+    def __init__(self):
+        self.parsers = {
+            'python': Parser(Language(tspython.language())),
+            'javascript': Parser(Language(tsjavascript.language())),
+            'typescript': Parser(Language(tsjavascript.language())),
+        }
+        self._supabase = None
+        self._file_cache: Dict[Path, str] = {}
+        self._stats = {'files_read': 0, 'files_skipped': 0, 'read_errors': 0}
+        logger.info("DNAExtractor initialized")
+    
+    @property
+    def supabase(self):
+        if self._supabase is None:
+            self._supabase = get_supabase_service()
+        return self._supabase
+    
+    def _reset_cache(self):
+        """Clear file cache between extractions"""
+        self._file_cache.clear()
+        self._stats = {'files_read': 0, 'files_skipped': 0, 'read_errors': 0}
+    
+    def _safe_read_file(self, file_path: Path) -> Optional[str]:
+        """Safely read file with caching, size limits, and error handling"""
+        if file_path in self._file_cache:
+            return self._file_cache[file_path]
+        
+        try:
+            # size check
+            if file_path.stat().st_size > self.MAX_FILE_SIZE:
+                self._stats['files_skipped'] += 1
+                return None
+            
+            # read with fallback encodings
+            content = None
+            for encoding in ['utf-8', 'latin-1', 'cp1252']:
+                try:
+                    content = file_path.read_text(encoding=encoding)
+                    break
+                except UnicodeDecodeError:
+                    continue
+            
+            if content is None:
+                self._stats['read_errors'] += 1
+                return None
+            
+            # check for binary content (null bytes)
+            if '\x00' in content[:1024]:
+                self._stats['files_skipped'] += 1
+                return None
+            
+            self._file_cache[file_path] = content
+            self._stats['files_read'] += 1
+            return content
+            
+        except Exception as e:
+            logger.debug(f"Error reading {file_path}: {e}")
+            self._stats['read_errors'] += 1
+            return None
+    
+    def _detect_language(self, file_path: str) -> str:
+        ext = Path(file_path).suffix.lower()
+        return {
+            '.py': 'python',
+            '.js': 'javascript', 
+            '.jsx': 'javascript',
+            '.ts': 'typescript',
+            '.tsx': 'typescript',
+        }.get(ext, 'unknown')
+    
+    def _discover_files(self, repo_path: Path) -> List[Path]:
+        """Find all code files, skipping irrelevant directories and symlinks"""
+        files = []
+        extensions = {'.py', '.js', '.jsx', '.ts', '.tsx', '.sql'}
+        
+        try:
+            for item in repo_path.rglob('*'):
+                if item.is_symlink():
+                    continue
+                if item.is_file() and item.suffix in extensions:
+                    if not any(skip in item.parts for skip in self.SKIP_DIRS):
+                        files.append(item)
+                        if len(files) >= self.MAX_FILES:
+                            logger.warning(f"Hit max file limit ({self.MAX_FILES})")
+                            break
+        except Exception as e:
+            logger.error(f"Error discovering files: {e}")
+        
+        return files
+
+    def _detect_framework(self, files: List[Path]) -> Optional[str]:
+        """Detect the primary framework used in the codebase"""
+        framework_indicators = {
+            'fastapi': ['from fastapi', 'FastAPI()', 'APIRouter', 'fastapi.routing'],
+            'django-rest-framework': ['from rest_framework', 'rest_framework.views', 'APIView', 'ViewSet', 'serializers.Serializer'],
+            'django': ['from django', 'django.conf', 'INSTALLED_APPS', 'django.urls', 'django.views'],
+            'starlette': ['from starlette', 'Starlette()', 'starlette.routing'],
+            'flask': ['from flask', 'Flask(__name__)', '@app.route', 'flask.Blueprint'],
+            'aiohttp': ['from aiohttp', 'aiohttp.web', 'web.Application'],
+            'tornado': ['from tornado', 'tornado.web', 'RequestHandler'],
+            'express': ['require("express")', 'express()', 'app.use(', 'express.Router'],
+            'nextjs': ['from next', 'getServerSideProps', 'getStaticProps', 'next/router'],
+            'nestjs': ['@Module(', '@Injectable(', '@Controller(', 'NestFactory'],
+        }
+        
+        scores = Counter()
+        for file_path in files:
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                for framework, indicators in framework_indicators.items():
+                    for indicator in indicators:
+                        if indicator in content:
+                            scores[framework] += 1
+            except:
+                pass
+        
+        if scores:
+            top_framework = scores.most_common(1)[0][0]
+            # DRF is always used WITH Django, so note both
+            if top_framework == 'django-rest-framework':
+                return 'django + DRF'
+            return top_framework
+        return None
+
+    def _extract_middleware_patterns(self, files: List[Path], framework: Optional[str]) -> List[str]:
+        """Extract middleware patterns based on framework"""
+        patterns = []
+        
+        for file_path in files:
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Starlette/ASGI middleware
+                if 'class' in content and 'Middleware' in content:
+                    middlewares = re.findall(r'class\s+(\w*Middleware\w*)', content)
+                    patterns.extend(middlewares)
+                if 'Middleware(' in content:
+                    patterns.append('Middleware(cls)')
+                if 'app.add_middleware' in content:
+                    patterns.append('app.add_middleware()')
+                
+                # FastAPI Depends
+                if 'Depends(' in content:
+                    deps = re.findall(r'Depends\((\w+)\)', content)
+                    for dep in deps:
+                        patterns.append(f'Depends({dep})')
+                
+                # Django middleware
+                if 'MIDDLEWARE' in content and ('django' in content or '.middleware' in content):
+                    patterns.append('Django MIDDLEWARE setting')
+                if 'MiddlewareMixin' in content:
+                    patterns.append('MiddlewareMixin')
+                if 'process_request' in content or 'process_response' in content:
+                    patterns.append('Django middleware hooks')
+                
+                # DRF middleware/permissions
+                if 'permission_classes' in content:
+                    perms = re.findall(r'permission_classes\s*=\s*\[([^\]]+)\]', content)
+                    for perm in perms:
+                        patterns.append(f'DRF permission_classes: {perm.strip()}')
+                if 'authentication_classes' in content:
+                    patterns.append('DRF authentication_classes')
+                
+                # Express middleware
+                if 'app.use(' in content:
+                    patterns.append('app.use(middleware)')
+                
+                # Flask decorators
+                if '@app.before_request' in content:
+                    patterns.append('@app.before_request')
+                if '@app.after_request' in content:
+                    patterns.append('@app.after_request')
+                    
+            except:
+                pass
+        
+        return list(set(patterns))
+
+    def _extract_auth_patterns(self, files: List[Path], repo_path: Path, framework: Optional[str] = None) -> AuthPattern:
+        """Extract authentication patterns from codebase"""
+        pattern = AuthPattern()
+        
+        for file_path in files:
+            if file_path.suffix != '.py':
+                continue
+                
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # FastAPI patterns
+                if 'require_auth' in content:
+                    pattern.middleware_used.append('require_auth')
+                if 'public_auth' in content:
+                    pattern.middleware_used.append('public_auth')
+                if 'Depends(' in content and 'auth' in content.lower():
+                    pattern.auth_decorators.append('Depends(require_auth)')
+                
+                # Starlette patterns
+                if 'AuthenticationMiddleware' in content:
+                    pattern.middleware_used.append('AuthenticationMiddleware')
+                if 'AuthCredentials' in content:
+                    pattern.auth_context_type = 'AuthCredentials'
+                if 'AuthenticationBackend' in content:
+                    pattern.middleware_used.append('AuthenticationBackend')
+                if 'requires(' in content:
+                    scopes = re.findall(r'requires\([\'"](\w+)[\'"]\)', content)
+                    for scope in scopes:
+                        pattern.auth_decorators.append(f'@requires("{scope}")')
+                
+                # Flask patterns
+                if 'login_required' in content:
+                    pattern.auth_decorators.append('@login_required')
+                if 'flask_login' in content:
+                    pattern.middleware_used.append('flask_login')
+                if 'current_user' in content:
+                    pattern.auth_context_type = 'current_user'
+                
+                # Django patterns
+                if '@login_required' in content:
+                    pattern.auth_decorators.append('@login_required')
+                if 'permission_required' in content:
+                    pattern.auth_decorators.append('@permission_required')
+                if 'request.user' in content:
+                    pattern.auth_context_type = 'request.user'
+                
+                # Detect ownership checks
+                if 'get_repo_or_404' in content:
+                    pattern.ownership_checks.append('get_repo_or_404(repo_id, auth.user_id)')
+                if 'verify_ownership' in content:
+                    pattern.ownership_checks.append('verify_ownership')
+                if 'user_id' in content and ('==' in content or '.filter(' in content):
+                    pattern.ownership_checks.append('user_id check')
+                
+                # Detect AuthContext
+                if 'AuthContext' in content:
+                    pattern.auth_context_type = 'AuthContext'
+                    
+            except Exception as e:
+                logger.debug(f"Error reading {file_path}: {e}")
+        
+        pattern.middleware_used = list(set(pattern.middleware_used))
+        pattern.auth_decorators = list(set(pattern.auth_decorators))
+        pattern.ownership_checks = list(set(pattern.ownership_checks))
+        return pattern
+    
+    def _extract_service_patterns(self, files: List[Path], repo_path: Path) -> ServicePattern:
+        """Extract service layer patterns"""
+        pattern = ServicePattern()
+        
+        # Check for dependencies.py
+        deps_file = repo_path / 'dependencies.py'
+        if deps_file.exists():
+            pattern.dependencies_file = 'dependencies.py'
+            try:
+                content = deps_file.read_text(encoding='utf-8', errors='ignore')
+                
+                # Find singleton instantiations
+                singleton_pattern = re.findall(r'^(\w+)\s*=\s*(\w+)\(\)', content, re.MULTILINE)
+                for var_name, class_name in singleton_pattern:
+                    pattern.singleton_services.append(f"{var_name} = {class_name}()")
+                
+                pattern.injection_pattern = "Singleton in dependencies.py"
+            except Exception as e:
+                logger.debug(f"Error reading dependencies.py: {e}")
+        
+        # Check services directory structure
+        services_dir = repo_path / 'services'
+        if services_dir.exists():
+            for service_file in services_dir.glob('*.py'):
+                if service_file.name.startswith('_'):
+                    continue
+                try:
+                    content = service_file.read_text(encoding='utf-8', errors='ignore')
+                    classes = re.findall(r'^class\s+(\w+)', content, re.MULTILINE)
+                    pattern.service_base_classes.extend(classes)
+                except:
+                    pass
+        
+        return pattern
+    
+    def _extract_database_patterns(self, files: List[Path], repo_path: Path) -> DatabasePattern:
+        """Extract database patterns from migrations and code"""
+        pattern = DatabasePattern()
+        
+        for file_path in files:
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Check for Supabase
+                if 'supabase' in content.lower() and not pattern.orm_used:
+                    pattern.orm_used = 'Supabase'
+                
+                # Check for Django ORM
+                if 'from django.db import models' in content or 'models.Model' in content:
+                    pattern.orm_used = 'Django ORM'
+                    if 'models.UUIDField' in content:
+                        pattern.id_type = 'UUID (Django UUIDField)'
+                    elif 'models.AutoField' in content or 'models.BigAutoField' in content:
+                        pattern.id_type = 'AutoField (Django)'
+                    if 'models.DateTimeField' in content:
+                        pattern.timestamp_type = 'DateTimeField (Django)'
+                    if 'on_delete=models.CASCADE' in content:
+                        pattern.cascade_deletes = True
+                
+                # Check for SQLAlchemy
+                if 'from sqlalchemy' in content or 'sqlalchemy' in content:
+                    pattern.orm_used = 'SQLAlchemy'
+                    if 'UUID' in content:
+                        pattern.id_type = 'UUID (SQLAlchemy)'
+                    if 'DateTime' in content:
+                        pattern.timestamp_type = 'DateTime (SQLAlchemy)'
+                
+                # Check for Prisma (JS/TS)
+                if 'prisma' in content.lower() or '@prisma/client' in content:
+                    pattern.orm_used = 'Prisma'
+                
+                # Check for Tortoise ORM
+                if 'from tortoise' in content or 'tortoise.models' in content:
+                    pattern.orm_used = 'Tortoise ORM'
+                    
+                # Check SQL files for patterns
+                if file_path.suffix == '.sql':
+                    if 'gen_random_uuid()' in content:
+                        pattern.id_type = 'UUID (gen_random_uuid())'
+                    elif 'SERIAL' in content:
+                        pattern.id_type = 'SERIAL'
+                    
+                    if 'TIMESTAMPTZ' in content:
+                        pattern.timestamp_type = 'TIMESTAMPTZ'
+                    elif 'TIMESTAMP' in content:
+                        pattern.timestamp_type = 'TIMESTAMP'
+                    
+                    if 'ENABLE ROW LEVEL SECURITY' in content:
+                        pattern.has_rls = True
+                    
+                    if 'ON DELETE CASCADE' in content:
+                        pattern.cascade_deletes = True
+                
+                # Check Python for connection patterns
+                if file_path.suffix == '.py':
+                    if 'get_supabase_service()' in content:
+                        pattern.connection_pattern = 'Singleton: get_supabase_service()'
+                    elif 'create_client(' in content:
+                        pattern.connection_pattern = 'Direct: create_client()'
+                    elif 'DATABASES' in content and 'django' in content.lower():
+                        pattern.connection_pattern = 'Django DATABASES setting'
+                    elif 'create_engine(' in content:
+                        pattern.connection_pattern = 'SQLAlchemy: create_engine()'
+                        
+            except Exception as e:
+                logger.debug(f"Error reading {file_path}: {e}")
+        
+        return pattern
+    
+    def _extract_error_patterns(self, files: List[Path]) -> ErrorPattern:
+        """Extract error handling patterns"""
+        pattern = ErrorPattern()
+        
+        for file_path in files:
+            if file_path.suffix != '.py':
+                continue
+            
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                if 'HTTPException' in content:
+                    pattern.http_exception_usage = True
+                    
+                if 'logger.error' in content and ('except' in content or 'Exception' in content):
+                    pattern.logging_on_error = True
+                
+                # Find custom exception classes
+                custom_exceptions = re.findall(r'class\s+(\w*(?:Error|Exception)\w*)', content)
+                pattern.exception_classes.extend(custom_exceptions)
+                
+            except Exception as e:
+                logger.debug(f"Error reading {file_path}: {e}")
+        
+        pattern.exception_classes = list(set(pattern.exception_classes))
+        return pattern
+    
+    def _extract_logging_patterns(self, files: List[Path]) -> LoggingPattern:
+        """Extract logging patterns"""
+        pattern = LoggingPattern()
+        log_levels = set()
+        
+        for file_path in files:
+            if file_path.suffix != '.py':
+                continue
+            
+            content = self._safe_read_file(file_path)
+            if not content:
+                continue
+            
+            # Detect logger import/setup
+            if 'from services.observability import logger' in content:
+                pattern.logger_import = 'from services.observability import logger'
+                pattern.structured_logging = True
+            elif 'logging.getLogger' in content:
+                pattern.logger_import = 'logging.getLogger(__name__)'
+            elif 'import logging' in content and not pattern.logger_import:
+                pattern.logger_import = 'import logging'
+            
+            # Detect log levels (both logger.X and logging.X)
+            for level in ['debug', 'info', 'warning', 'error', 'critical']:
+                if f'logger.{level}' in content or f'logging.{level}' in content or f'.{level}(' in content:
+                    log_levels.add(level)
+            
+            # Detect metrics
+            if 'metrics.increment' in content or 'metrics.gauge' in content:
+                pattern.metrics_tracking = True
+            
+            # Detect structlog
+            if 'structlog' in content:
+                pattern.structured_logging = True
+                pattern.logger_import = 'structlog'
+        
+        pattern.log_levels_used = list(log_levels)
+        return pattern
+    
+    def _extract_naming_conventions(self, files: List[Path]) -> NamingConventions:
+        """Extract naming conventions from code"""
+        conventions = NamingConventions()
+        
+        function_styles = Counter()
+        class_styles = Counter()
+        
+        for file_path in files:
+            if file_path.suffix != '.py':
+                continue
+            
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Extract function names
+                functions = re.findall(r'def\s+(\w+)\s*\(', content)
+                for func in functions:
+                    if func.startswith('_'):
+                        continue
+                    if '_' in func:
+                        function_styles['snake_case'] += 1
+                    elif func[0].islower() and any(c.isupper() for c in func):
+                        function_styles['camelCase'] += 1
+                
+                # Extract class names
+                classes = re.findall(r'class\s+(\w+)', content)
+                for cls in classes:
+                    if cls[0].isupper() and '_' not in cls:
+                        class_styles['PascalCase'] += 1
+                        
+            except:
+                pass
+        
+        # File naming
+        py_files = [f for f in files if f.suffix == '.py']
+        snake_files = sum(1 for f in py_files if '_' in f.stem and f.stem.islower())
+        if snake_files > len(py_files) * 0.5:
+            conventions.file_style = 'snake_case'
+        
+        if function_styles:
+            conventions.function_style = function_styles.most_common(1)[0][0]
+        if class_styles:
+            conventions.class_style = class_styles.most_common(1)[0][0]
+        
+        conventions.constant_style = 'UPPER_SNAKE_CASE'
+        
+        return conventions
+    
+    def _extract_common_imports(self, files: List[Path]) -> List[str]:
+        """Extract most common import patterns"""
+        import_counter = Counter()
+        
+        for file_path in files:
+            if file_path.suffix != '.py':
+                continue
+            
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Find all imports
+                imports = re.findall(r'^(?:from\s+[\w.]+\s+)?import\s+.+$', content, re.MULTILINE)
+                for imp in imports:
+                    imp = imp.strip()
+                    if imp and not imp.startswith('#'):
+                        import_counter[imp] += 1
+                        
+            except:
+                pass
+        
+        # Return most common imports
+        return [imp for imp, count in import_counter.most_common(20) if count >= 2]
+    
+    def _extract_api_patterns(self, files: List[Path], repo_path: Path) -> tuple:
+        """Extract API versioning and router patterns"""
+        api_versioning = None
+        router_pattern = None
+        
+        # Check config for API versioning
+        config_file = repo_path / 'config' / 'api.py'
+        if config_file.exists():
+            try:
+                content = config_file.read_text(encoding='utf-8', errors='ignore')
+                if 'API_PREFIX' in content or 'API_VERSION' in content:
+                    api_versioning = '/api/v1 (from config/api.py)'
+            except:
+                pass
+        
+        # Check for router patterns in routes
+        routes_dir = repo_path / 'routes'
+        if routes_dir.exists():
+            for route_file in routes_dir.glob('*.py'):
+                try:
+                    content = route_file.read_text(encoding='utf-8', errors='ignore')
+                    if 'APIRouter(' in content:
+                        match = re.search(r'APIRouter\(prefix=["\']([^"\']+)["\']', content)
+                        if match:
+                            router_pattern = f'APIRouter(prefix="{match.group(1)}", tags=[...])'
+                            break
+                except:
+                    pass
+        
+        return api_versioning, router_pattern
+
+    def _extract_test_patterns(self, files: List[Path], repo_path: Path) -> TestPattern:
+        """Extract testing patterns from codebase"""
+        pattern = TestPattern()
+        
+        # Check for conftest.py (pytest)
+        conftest_files = list(repo_path.rglob('conftest.py'))
+        pattern.has_conftest = len(conftest_files) > 0
+        
+        # Check for test directory structure
+        test_dirs = [d for d in ['tests', 'test'] if (repo_path / d).exists()]
+        
+        for file_path in files:
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Detect test framework
+                if 'import pytest' in content or '@pytest' in content:
+                    pattern.framework = 'pytest'
+                    if '@pytest.fixture' in content:
+                        pattern.fixture_style = 'pytest fixtures'
+                elif 'from unittest' in content or 'import unittest' in content:
+                    if not pattern.framework:
+                        pattern.framework = 'unittest'
+                    if 'def setUp(' in content or 'def tearDown(' in content:
+                        pattern.fixture_style = 'setUp/tearDown'
+                elif 'from django.test' in content:
+                    pattern.framework = 'django.test'
+                    pattern.fixture_style = 'Django TestCase'
+                
+                # Detect mock library
+                if 'from unittest.mock import' in content or 'from unittest import mock' in content:
+                    pattern.mock_library = 'unittest.mock'
+                elif 'import responses' in content:
+                    pattern.mock_library = 'responses'
+                elif 'pytest_mock' in content or 'mocker' in content:
+                    pattern.mock_library = 'pytest-mock'
+                elif '@patch(' in content:
+                    pattern.mock_library = 'unittest.mock (decorator)'
+                
+                # Detect factories
+                if 'factory_boy' in content or 'factory.Factory' in content:
+                    pattern.has_factories = True
+                if 'from faker import' in content:
+                    pattern.has_factories = True
+                    
+            except:
+                pass
+        
+        # Check for coverage config
+        if (repo_path / '.coveragerc').exists() or (repo_path / 'pyproject.toml').exists():
+            pattern.coverage_config = True
+        
+        return pattern
+
+    def _extract_config_patterns(self, files: List[Path], repo_path: Path) -> ConfigPattern:
+        """Extract configuration patterns from codebase"""
+        pattern = ConfigPattern()
+        
+        for file_path in files:
+            try:
+                content = file_path.read_text(encoding='utf-8', errors='ignore')
+                
+                # Detect env loading
+                if 'from dotenv import' in content or 'load_dotenv' in content:
+                    pattern.env_loading = 'python-dotenv'
+                elif 'from environs import' in content:
+                    pattern.env_loading = 'environs'
+                elif 'import environ' in content or 'django-environ' in content:
+                    pattern.env_loading = 'django-environ'
+                elif 'from decouple import' in content:
+                    pattern.env_loading = 'python-decouple'
+                
+                # Detect settings pattern
+                if 'pydantic' in content and ('BaseSettings' in content or 'BaseModel' in content):
+                    pattern.settings_pattern = 'Pydantic Settings'
+                    pattern.config_validation = True
+                elif 'dynaconf' in content:
+                    pattern.settings_pattern = 'Dynaconf'
+                    pattern.config_validation = True
+                elif 'DJANGO_SETTINGS_MODULE' in content:
+                    pattern.settings_pattern = 'Django settings'
+                
+                # Detect secrets handling
+                if 'boto3' in content and 'secretsmanager' in content:
+                    pattern.secrets_handling = 'AWS Secrets Manager'
+                elif 'hvac' in content or 'vault' in content.lower():
+                    pattern.secrets_handling = 'HashiCorp Vault'
+                elif 'os.getenv(' in content or 'os.environ' in content:
+                    pattern.secrets_handling = 'Environment variables'
+                    
+            except:
+                pass
+        
+        # Check for specific config files
+        if (repo_path / 'settings.py').exists():
+            pattern.settings_pattern = 'Single settings file'
+        elif (repo_path / 'settings').is_dir():
+            pattern.settings_pattern = 'Split settings (by environment)'
+        elif (repo_path / 'config').is_dir():
+            pattern.settings_pattern = 'Config directory'
+        
+        return pattern
+
+    def extract_dna(self, repo_path: str, repo_id: str) -> CodebaseDNA:
+        """Extract complete DNA profile from a codebase"""
+        import time
+        start_time = time.time()
+        
+        repo_path = Path(repo_path)
+        
+        # validate path
+        if not repo_path.exists():
+            logger.error(f"Repo path does not exist: {repo_path}")
+            raise ValueError(f"Repository path does not exist: {repo_path}")
+        if not repo_path.is_dir():
+            logger.error(f"Repo path is not a directory: {repo_path}")
+            raise ValueError(f"Repository path is not a directory: {repo_path}")
+        
+        # reset cache for fresh extraction
+        self._reset_cache()
+        
+        logger.info("Extracting codebase DNA", repo_id=repo_id, path=str(repo_path))
+        
+        # Discover files
+        files = self._discover_files(repo_path)
+        logger.info(f"Found {len(files)} code files")
+        
+        # Detect framework first
+        detected_framework = self._detect_framework(files)
+        logger.info(f"Detected framework: {detected_framework}")
+        
+        # Language distribution
+        lang_dist = Counter()
+        for f in files:
+            lang = self._detect_language(str(f))
+            if lang != 'unknown':
+                lang_dist[lang] += 1
+        
+        # Extract all patterns (pass framework where needed)
+        auth_patterns = self._extract_auth_patterns(files, repo_path, detected_framework)
+        middleware_patterns = self._extract_middleware_patterns(files, detected_framework)
+        service_patterns = self._extract_service_patterns(files, repo_path)
+        database_patterns = self._extract_database_patterns(files, repo_path)
+        error_patterns = self._extract_error_patterns(files)
+        logging_patterns = self._extract_logging_patterns(files)
+        naming_conventions = self._extract_naming_conventions(files)
+        test_patterns = self._extract_test_patterns(files, repo_path)
+        config_patterns = self._extract_config_patterns(files, repo_path)
+        common_imports = self._extract_common_imports(files)
+        api_versioning, router_pattern = self._extract_api_patterns(files, repo_path)
+        
+        dna = CodebaseDNA(
+            repo_id=repo_id,
+            detected_framework=detected_framework,
+            language_distribution=dict(lang_dist),
+            auth_patterns=auth_patterns,
+            service_patterns=service_patterns,
+            database_patterns=database_patterns,
+            error_patterns=error_patterns,
+            logging_patterns=logging_patterns,
+            naming_conventions=naming_conventions,
+            test_patterns=test_patterns,
+            config_patterns=config_patterns,
+            middleware_patterns=middleware_patterns,
+            common_imports=common_imports,
+            skip_directories=list(self.SKIP_DIRS),
+            api_versioning=api_versioning,
+            router_pattern=router_pattern,
+        )
+        
+        elapsed = time.time() - start_time
+        logger.info(
+            "DNA extraction complete",
+            repo_id=repo_id,
+            duration_sec=round(elapsed, 2),
+            files_read=self._stats['files_read'],
+            files_skipped=self._stats['files_skipped'],
+            read_errors=self._stats['read_errors']
+        )
+        return dna
+    
+    def save_to_cache(self, repo_id: str, dna: CodebaseDNA) -> bool:
+        """Save DNA to database cache using architecture_patterns column"""
+        try:
+            # Store DNA in the architecture_patterns JSONB column
+            dna_data = {'codebase_dna': dna.to_dict()}
+            
+            self.supabase.client.table('repository_insights').upsert(
+                {
+                    'repo_id': repo_id,
+                    'architecture_patterns': dna_data,
+                },
+                on_conflict='repo_id'
+            ).execute()
+            
+            logger.info("DNA saved to cache", repo_id=repo_id)
+            return True
+        except Exception as e:
+            logger.error("Failed to save DNA to cache", error=str(e))
+            return False
+    
+    def load_from_cache(self, repo_id: str) -> Optional[CodebaseDNA]:
+        """Load DNA from database cache"""
+        try:
+            result = self.supabase.client.table('repository_insights').select(
+                'architecture_patterns'
+            ).eq('repo_id', repo_id).execute()
+            
+            if result.data and result.data[0].get('architecture_patterns'):
+                arch_patterns = result.data[0]['architecture_patterns']
+                data = arch_patterns.get('codebase_dna')
+                
+                if not data:
+                    return None
+                
+                # Reconstruct CodebaseDNA from dict
+                dna = CodebaseDNA(
+                    repo_id=data['repo_id'],
+                    language_distribution=data.get('language_distribution', {}),
+                    auth_patterns=AuthPattern(**data.get('auth_patterns', {})),
+                    service_patterns=ServicePattern(**data.get('service_patterns', {})),
+                    database_patterns=DatabasePattern(**data.get('database_patterns', {})),
+                    error_patterns=ErrorPattern(**data.get('error_patterns', {})),
+                    logging_patterns=LoggingPattern(**data.get('logging_patterns', {})),
+                    naming_conventions=NamingConventions(**data.get('naming_conventions', {})),
+                    common_imports=data.get('common_imports', []),
+                    skip_directories=data.get('skip_directories', []),
+                    api_versioning=data.get('api_versioning'),
+                    router_pattern=data.get('router_pattern'),
+                )
+                logger.debug("DNA loaded from cache", repo_id=repo_id)
+                return dna
+        except Exception as e:
+            logger.debug(f"No cached DNA found: {e}")
+        
+        return None
diff --git a/mcp-server/server.py b/mcp-server/server.py
index 30e187e..e356f10 100644
--- a/mcp-server/server.py
+++ b/mcp-server/server.py
@@ -123,6 +123,20 @@ async def handle_list_tools() -> list[types.Tool]:
                 },
                 "required": ["repo_id"]
             }
+        ),
+        types.Tool(
+            name="get_codebase_dna",
+            description="Extract the architectural DNA of a codebase. Returns patterns, conventions, and constraints that define how code should be written. Use this BEFORE generating any code to understand: authentication patterns, service layer structure, database conventions (UUID vs SERIAL, RLS policies), error handling, logging patterns, naming conventions, and common imports. This ensures generated code matches existing architecture.",
+            inputSchema={
+                "type": "object",
+                "properties": {
+                    "repo_id": {
+                        "type": "string",
+                        "description": "Repository identifier"
+                    }
+                },
+                "required": ["repo_id"]
+            }
         )
     ]
 
@@ -300,6 +314,35 @@ async def handle_call_tool(
                 
                 return [types.TextContent(type="text", text=formatted)]
             
+            elif name == "get_codebase_dna":
+                response = await client.get(
+                    f"{BACKEND_API_URL}/repos/{arguments['repo_id']}/dna?format=markdown",
+                    headers=headers
+                )
+                response.raise_for_status()
+                result = response.json()
+                
+                # DNA is already formatted as markdown by the backend
+                dna_markdown = result.get('dna', '')
+                
+                formatted = "# Codebase DNA\n\n"
+                formatted += "**Use this information to write code that matches the existing patterns.**\n\n"
+                
+                if result.get('cached'):
+                    formatted += "_(⚡ cached)_\n\n"
+                
+                formatted += dna_markdown
+                
+                formatted += "\n---\n"
+                formatted += "**Instructions:** When generating code for this codebase:\n"
+                formatted += "1. Follow the auth patterns shown above\n"
+                formatted += "2. Use the service layer structure (singletons in dependencies.py)\n"
+                formatted += "3. Match the database conventions (ID types, timestamps, RLS)\n"
+                formatted += "4. Use the logging patterns shown\n"
+                formatted += "5. Follow the naming conventions\n"
+                
+                return [types.TextContent(type="text", text=formatted)]
+            
             else:
                 raise ValueError(f"Unknown tool: {name}")