Skip to content
beginner 15 min

Chatbot RAG z baza wektorowa

Od zera do produkcyjnego chatbota RAG w 15 minut — wybierz baze wektorowa, zaimportuj dokumenty, rozmawiaj

ragchatbotvector-storedocuments

Problem

Budowanie chatbota RAG wymaga wyboru i konfiguracji bazy wektorowej, ustawienia ingestii dokumentow, implementacji wyszukiwania podobienstwa i polaczenia tego wszystkiego z interfejsem czatu ze streamingiem — dziesiatki decyzji, zanim napiszesz jakakolwiek logike AI.

Rozwiązanie

Full-Stack AI Agent Template generuje kompletny pipeline RAG z wybranym przez Ciebie magazynem wektorowym (Milvus, Qdrant, ChromaDB, pgvector), ingestia dokumentow (PDF, Google Drive, S3, ponad 130 formatow przez LlamaParse) i interfejsem czatu Next.js ze streamingiem WebSocket — wszystko jednym poleceniem.

Działający kod

rag.py
# Generated by: fastapi-fullstack new --preset ai-agent
# backend/app/agent/rag.py
from pydantic_ai import Agent
from app.core.vectorstore import get_vector_store
from app.core.config import settings
agent = Agent(
model=settings.LLM_MODEL,
system_prompt="Answer questions using the provided context. Cite sources.",
)
@agent.tool
async def search_documents(ctx, query: str, top_k: int = 5) -> str:
"""Search the knowledge base for relevant documents."""
store = get_vector_store() # Milvus, Qdrant, ChromaDB, or pgvector
results = await store.similarity_search(query, k=top_k)
return "\n\n".join([f"[{r.metadata['source']}]: {r.page_content}" for r in results])

Krok po kroku

1

Wybierz swoj stos technologiczny (konfigurator)

Uruchom konfigurator CLI lub uzyj interaktywnego narzedzia webowego, aby wybrac baze wektorowa, zrodla dokumentow, dostawce LLM i opcje wdrozenia. Szablon obsluguje ponad 75 opcji konfiguracji.

2

Zaimportuj dokumenty

Przeslij pliki PDF, polacz Google Drive lub wskaaz zasobnik S3. Szablon automatycznie obsluguje dzielenie na fragmenty, tworzenie embeddingov i indeksowanie w wybranej bazie wektorowej.

3

Rozmawiaj ze swoimi danymi

Otworz interfejs czatu Next.js ze streamingiem WebSocket w czasie rzeczywistym. Zadawaj pytania o swoje dokumenty i otrzymuj odpowiedzi z cytatami i odwolaniami do zrodel.

4

Wdroz za pomoca Dockera

Uruchom `docker compose up`, aby wystartowac kompletny stos: backend FastAPI, frontend Next.js, baze wektorowa i PostgreSQL — wszystko wstepnie skonfigurowane i gotowe do produkcji.

Gotowy to zbudować?

Zacznij z open-source'owymi narzędziami Vstorm — przetestowanymi w produkcji, w pełni udokumentowanymi i darmowymi.

Rozpocznij

Gotowy, żeby zbudować swojego pierwszego agenta AI?

Open-source'owe narzędzia, sprawdzone wzorce, zero boilerplate'u. Skonfiguruj swój stos i wyślij w minuty — nie miesiące.