Temperature and Sampling Trade-offs

Implementation Example

# Temperature and Sampling Trade-offs

import openai

# Deterministic output (code generation, factual Q&A)
deterministic_response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": "Write a Python function to sort a list"}],
    temperature=0,  # Completely deterministic
    top_p=1.0,
)

# Creative output (creative writing, brainstorming)
creative_response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": "Write a short story about AI"}],
    temperature=0.8,  # More creative and varied
    top_p=0.9,  # Nucleus sampling
)

# Balanced output (general assistant, explanations)
balanced_response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": "Explain quantum computing"}],
    temperature=0.3,  # Low temperature for accuracy
    top_p=0.9,
)

# Best-of-N sampling for higher quality
def best_of_n_sampling(prompt, n=5, temperature=0.7):
    responses = []
    for _ in range(n):
        response = openai.ChatCompletion.create(
            model="gpt-4",
            messages=[{"role": "user", "content": prompt}],
            temperature=temperature,
        )
        responses.append(response)

    # Score and rank responses (simplified)
    scored_responses = [(r, score_response(r)) for r in responses]
    return max(scored_responses, key=lambda x: x[1])[0]

def score_response(response):
    # Implement scoring logic (length, coherence, etc.)
    return len(response.choices[0].message.content)

Temperature and Sampling Trade-offs

Intent & Description

🎯 Intent

📋 Context

💡 Solution

Real-world Use Case

📌 TL;DR

Advantages

Disadvantages