LangGraph
Agent web scraping z LangGraph
Zbuduj inteligentnego agenta web scraping, który pobiera strony, wyodrębnia strukturalne dane i obsługuje paginację — z LangGraph.
web scrapingdata extractionHTTPparsing
Działający kod
from langchain_openai import ChatOpenAIfrom langchain_core.tools import toolfrom langgraph.prebuilt import create_react_agent
@tooldef fetch_url(url: str) -> str: """Fetch a webpage and return its content as markdown.""" import httpx from markdownify import markdownify response = httpx.get(url, headers={"User-Agent": "Mozilla/5.0"}, timeout=15) return markdownify(response.text)[:5000]
@tooldef extract_data(text: str, instruction: str) -> str: """Extract structured data from text based on instruction.""" # Uses the LLM itself to parse — no regex needed return f"Extracting from {len(text)} chars: {instruction}"
agent = create_react_agent( ChatOpenAI(model="gpt-4o"), tools=[fetch_url, extract_data], prompt="You are a web scraping agent. Fetch pages, extract the requested data, and return it in structured format. Respect robots.txt.",)
result = await agent.ainvoke({ "messages": [("user", "Scrape the pricing page at example.com/pricing and extract all plan names and prices")]})print(result["messages"][-1].content)Krok po kroku
1
Zainstaluj zależności
Zainstaluj LangGraph i wymagane narzędzia do tego przypadku użycia.
2
Zdefiniuj narzędzia
Stwórz specyficzne dla domeny funkcje narzędzi, których agent będzie używał do interakcji z zewnętrznymi serwisami.
3
Stwórz agenta i uruchom
Zainicjalizuj agenta LangGraph z narzędziami, ustaw prompt systemowy i wykonaj zapytanie.
Zbuduj z innymi frameworkami
Więcej poradników z LangGraph
Gotowy do budowania z LangGraph?
Wygeneruj gotowy do produkcji projekt z LangGraph — FastAPI + Next.js, autoryzacja, streaming i więcej.
RozpocznijGotowy, żeby zbudować swojego pierwszego agenta AI?
Open-source'owe narzędzia, sprawdzone wzorce, zero boilerplate'u. Skonfiguruj swój stos i wyślij w minuty — nie miesiące.