beginner 15 min

Chatbot RAG z baza wektorowa

Od zera do produkcyjnego chatbota RAG w 15 minut — wybierz baze wektorowa, zaimportuj dokumenty, rozmawiaj

ragchatbotvector-storedocuments

Problem

Budowanie chatbota RAG wymaga wyboru i konfiguracji bazy wektorowej, ustawienia ingestii dokumentow, implementacji wyszukiwania podobienstwa i polaczenia tego wszystkiego z interfejsem czatu ze streamingiem — dziesiatki decyzji, zanim napiszesz jakakolwiek logike AI.

Rozwiązanie

Full-Stack AI Agent Template generuje kompletny pipeline RAG z wybranym przez Ciebie magazynem wektorowym (Milvus, Qdrant, ChromaDB, pgvector), ingestia dokumentow (PDF, Google Drive, S3, ponad 130 formatow przez LlamaParse) i interfejsem czatu Next.js ze streamingiem WebSocket — wszystko jednym poleceniem.

Działający kod

# Generated by: fastapi-fullstack new --preset ai-agent

# backend/app/agent/rag.py
from pydantic_ai import Agent
from app.core.vectorstore import get_vector_store
from app.core.config import settings

agent = Agent(
    model=settings.LLM_MODEL,
    system_prompt="Answer questions using the provided context. Cite sources.",
)

@agent.tool
async def search_documents(ctx, query: str, top_k: int = 5) -> str:
    """Search the knowledge base for relevant documents."""
    store = get_vector_store()  # Milvus, Qdrant, ChromaDB, or pgvector
    results = await store.similarity_search(query, k=top_k)
    return "\n\n".join([f"[{r.metadata['source']}]: {r.page_content}" for r in results])

Krok po kroku

Wybierz swoj stos technologiczny (konfigurator)

Uruchom konfigurator CLI lub uzyj interaktywnego narzedzia webowego, aby wybrac baze wektorowa, zrodla dokumentow, dostawce LLM i opcje wdrozenia. Szablon obsluguje ponad 75 opcji konfiguracji.

Zaimportuj dokumenty

Przeslij pliki PDF, polacz Google Drive lub wskaaz zasobnik S3. Szablon automatycznie obsluguje dzielenie na fragmenty, tworzenie embeddingov i indeksowanie w wybranej bazie wektorowej.

Rozmawiaj ze swoimi danymi

Otworz interfejs czatu Next.js ze streamingiem WebSocket w czasie rzeczywistym. Zadawaj pytania o swoje dokumenty i otrzymuj odpowiedzi z cytatami i odwolaniami do zrodel.

Wdroz za pomoca Dockera

Uruchom `docker compose up`, aby wystartowac kompletny stos: backend FastAPI, frontend Next.js, baze wektorowa i PostgreSQL — wszystko wstepnie skonfigurowane i gotowe do produkcji.

Powiązane przypadki użycia

intermediate 20 min

Agent badawczy z podagentami

Zbuduj agenta badawczego, ktory rozbija zlozoone tematy na podzadania, deleguje je do wyspecjalizowanych podagentow, przeszukuje internet i syntetyzuje wyniki w ustrukturyzowany raport.

intermediate 15 min

Agent Text-to-SQL z pamiecia

Zbuduj agenta, ktory konwertuje pytania w jezyku naturalnym na zapytania SQL, eksploruje schematy baz danych i uczy sie z poprzednich interakcji dzieki trwalej pamieci opartej na systemie plikow.

Gotowy to zbudować?

Zacznij z open-source'owymi narzędziami Vstorm — przetestowanymi w produkcji, w pełni udokumentowanymi i darmowymi.

Rozpocznij

Gotowy, żeby zbudować swojego pierwszego agenta AI?

Open-source'owe narzędzia, sprawdzone wzorce, zero boilerplate'u. Skonfiguruj swój stos i wyślij w minuty — nie miesiące.

Zbuduj swoją aplikację AI