Skip to content
Deep Agents

Web-Scraping-Agent mit Deep Agents

Erstellen Sie einen intelligenten Web-Scraping-Agenten, der Seiten abruft, strukturierte Daten extrahiert und Paginierung verarbeitet — mit Deep Agents.

web scrapingdata extractionHTTPparsing

Funktionierender Code

Deep Agents
from deepagents import create_deep_agent
from langchain_core.tools import tool
@tool
def fetch_url(url: str) -> str:
"""Fetch a webpage and return its content as markdown."""
import httpx
from markdownify import markdownify
response = httpx.get(url, headers={"User-Agent": "Mozilla/5.0"}, timeout=15)
return markdownify(response.text)[:5000]
@tool
def extract_data(text: str, instruction: str) -> str:
"""Extract structured data from text based on instruction."""
# Uses the LLM itself to parse — no regex needed
return f"Extracting from {len(text)} chars: {instruction}"
agent = create_deep_agent(
model="anthropic:claude-sonnet-4-5-20250929",
tools=[fetch_url, extract_data],
system_prompt="You are a web scraping agent. Fetch pages, extract the requested data, and return it in structured format. Respect robots.txt.",
)
result = agent.invoke({
"messages": [("user", "Scrape the pricing page at example.com/pricing and extract all plan names and prices")]
})
print(result["messages"][-1].content)

Schritt für Schritt

1

Abhängigkeiten installieren

Installieren Sie Deep Agents und die benötigten Tools für diesen Anwendungsfall.

2

Tools definieren

Erstellen Sie domänenspezifische Tool-Funktionen, die Ihr Agent zur Interaktion mit externen Diensten verwenden wird.

3

Agent erstellen und ausführen

Initialisieren Sie den Deep Agents-Agenten mit Ihren Tools, setzen Sie den System-Prompt und führen Sie eine Abfrage aus.

Bereit, mit Deep Agents zu bauen?

Generieren Sie ein produktionsbereites Projekt mit vorkonfiguriertem Deep Agents — FastAPI + Next.js, Auth, Streaming und mehr.

Loslegen

Bereit, deinen ersten Produktions-KI-Agenten zu bauen?

Open-Source-Tools, kampferprobte Patterns, null Boilerplate. Konfiguriere deinen Stack und shippe in Minuten — nicht Monaten.