LangChain vs. LlamaIndex vs. Custom Pipelines

Implementation Example

# LangChain vs. LlamaIndex vs. Custom Pipeline

# LangChain: High-level abstraction for rapid prototyping
from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# Quick setup with built-in abstractions
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(documents, embeddings)
qa_chain = RetrievalQA.from_chain_type(
    llm=OpenAI(),
    chain_type="stuff",
    retriever=vectorstore.as_retriever()
)

result = qa_chain.run("What is the document about?")

# Custom Pipeline: Full control, no framework lock-in
import openai
import pinecone

class CustomRAGPipeline:
    def __init__(self, openai_api_key, pinecone_api_key):
        self.openai_client = openai.OpenAI(api_key=openai_api_key)
        self.pinecone_client = pinecone.Pinecone(api_key=pinecone_api_key)

    def embed_query(self, text):
        response = self.openai_client.embeddings.create(
            model="text-embedding-3-small",
            input=text
        )
        return response.data[0].embedding

    def retrieve_documents(self, query_embedding, top_k=5):
        results = self.pinecone_client.query(
            vector=query_embedding,
            top_k=top_k,
            include_metadata=True
        )
        return [match.metadata['text'] for match in results['matches']]

    def generate_answer(self, query, context):
        messages = [
            {"role": "system", "content": "Answer based on context."},
            {"role": "user", "content": f"Context: {context}\n\nQuestion: {query}"}
        ]
        response = self.openai_client.chat.completions.create(
            model="gpt-4",
            messages=messages
        )
        return response.choices[0].message.content

    def query(self, question):
        # Custom retrieval and generation logic
        query_embedding = self.embed_query(question)
        retrieved_docs = self.retrieve_documents(query_embedding)
        context = "\n".join(retrieved_docs)
        answer = self.generate_answer(question, context)
        return answer

# LlamaIndex: Alternative high-level framework
from llama_index import VectorStoreIndex, SimpleDirectoryReader

documents = SimpleDirectoryReader('data').load_data()
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
response = query_engine.query("What is the main topic?")

# Production migration: Custom pipeline advantages
# - No framework upgrade risk
# - Full control over retrieval logic
# - Easier debugging and monitoring
# - Better performance optimization
# - Simplified dependency management

LangChain vs. LlamaIndex vs. Custom Pipelines

Intent & Description

🎯 Intent

📋 Context

💡 Solution

Real-world Use Case

📌 TL;DR

Advantages

Disadvantages