Chatbot RAG z baza wektorowa
Od zera do produkcyjnego chatbota RAG w 15 minut — wybierz baze wektorowa, zaimportuj dokumenty, rozmawiaj
Problem
Budowanie chatbota RAG wymaga wyboru i konfiguracji bazy wektorowej, ustawienia ingestii dokumentow, implementacji wyszukiwania podobienstwa i polaczenia tego wszystkiego z interfejsem czatu ze streamingiem — dziesiatki decyzji, zanim napiszesz jakakolwiek logike AI.
Rozwiązanie
Full-Stack AI Agent Template generuje kompletny pipeline RAG z wybranym przez Ciebie magazynem wektorowym (Milvus, Qdrant, ChromaDB, pgvector), ingestia dokumentow (PDF, Google Drive, S3, ponad 130 formatow przez LlamaParse) i interfejsem czatu Next.js ze streamingiem WebSocket — wszystko jednym poleceniem.
Działający kod
# Generated by: fastapi-fullstack new --preset ai-agent
# backend/app/agent/rag.pyfrom pydantic_ai import Agentfrom app.core.vectorstore import get_vector_storefrom app.core.config import settings
agent = Agent( model=settings.LLM_MODEL, system_prompt="Answer questions using the provided context. Cite sources.",)
@agent.toolasync def search_documents(ctx, query: str, top_k: int = 5) -> str: """Search the knowledge base for relevant documents.""" store = get_vector_store() # Milvus, Qdrant, ChromaDB, or pgvector results = await store.similarity_search(query, k=top_k) return "\n\n".join([f"[{r.metadata['source']}]: {r.page_content}" for r in results])Krok po kroku
Wybierz swoj stos technologiczny (konfigurator)
Uruchom konfigurator CLI lub uzyj interaktywnego narzedzia webowego, aby wybrac baze wektorowa, zrodla dokumentow, dostawce LLM i opcje wdrozenia. Szablon obsluguje ponad 75 opcji konfiguracji.
Zaimportuj dokumenty
Przeslij pliki PDF, polacz Google Drive lub wskaaz zasobnik S3. Szablon automatycznie obsluguje dzielenie na fragmenty, tworzenie embeddingov i indeksowanie w wybranej bazie wektorowej.
Rozmawiaj ze swoimi danymi
Otworz interfejs czatu Next.js ze streamingiem WebSocket w czasie rzeczywistym. Zadawaj pytania o swoje dokumenty i otrzymuj odpowiedzi z cytatami i odwolaniami do zrodel.
Wdroz za pomoca Dockera
Uruchom `docker compose up`, aby wystartowac kompletny stos: backend FastAPI, frontend Next.js, baze wektorowa i PostgreSQL — wszystko wstepnie skonfigurowane i gotowe do produkcji.
Powiązane przypadki użycia
Agent badawczy z podagentami
Zbuduj agenta badawczego, ktory rozbija zlozoone tematy na podzadania, deleguje je do wyspecjalizowanych podagentow, przeszukuje internet i syntetyzuje wyniki w ustrukturyzowany raport.
Agent Text-to-SQL z pamiecia
Zbuduj agenta, ktory konwertuje pytania w jezyku naturalnym na zapytania SQL, eksploruje schematy baz danych i uczy sie z poprzednich interakcji dzieki trwalej pamieci opartej na systemie plikow.
Gotowy to zbudować?
Zacznij z open-source'owymi narzędziami Vstorm — przetestowanymi w produkcji, w pełni udokumentowanymi i darmowymi.
RozpocznijGotowy, żeby zbudować swojego pierwszego agenta AI?
Open-source'owe narzędzia, sprawdzone wzorce, zero boilerplate'u. Skonfiguruj swój stos i wyślij w minuty — nie miesiące.