LLM Router

Implementation Example

# Dynamic query routing based on query attributes
class LLMRouter:
    def __init__(self, fast_cheap_model, advanced_heavy_model):
        self.fast_model = fast_cheap_model
        self.heavy_model = advanced_heavy_model

    def route(self, query):
        # Check query complexity or keywords
        is_complex = len(query) > 50 or "code" in query.lower() or "explain" in query.lower()
        
        if is_complex:
            print("Routing to ADVANCED HEAVY model...")
            return self.heavy_model.generate(query)
        else:
            print("Routing to FAST CHEAP model...")
            return self.fast_model.generate(query)

class Model:
    def __init__(self, name):
        self.name = name
    def generate(self, q):
        return f"[{self.name}] Response to: {q}"

# Usage
router = LLMRouter(Model("GPT-4o-mini"), Model("GPT-4o"))
print(router.route("Hi there"))
print(router.route("Write a thread-safe Singleton in C++ and explain memory barriers"))

Intent & Description

Real-world Use Case

Advantages

Disadvantages