KI-Agenten mit Web-Suche: AWS Strands Agents SDK integriert Exa
Herkömmliche Such-APIs liefern oft HTML-lastige Inhalte und kurze Snippets, die für menschliches Browsing optimiert sind. KI-Agenten benötigen jedoch strukturierte, semantisch relevante Daten. Dies erzeugt erheblichen zusätzlichen Entwicklungsaufwand beim Parsen.
Die Lösung: Strands Agents SDK und Exa
Das AWS Strands Agents SDK ist ein Open-Source-Framework, das einen modellgesteuerten Ansatz verfolgt. Das Large Language Model entscheidet autonom, wann und wie Tools basierend auf Kontext und Aufgabe aufgerufen werden.
Es unterstützt Modelle von Amazon Bedrock, Anthropic, Ollama und Meta und bringt über 40 vorgefertigte Tools mit. Das SDK wird bereits produktiv bei AWS-Teams eingesetzt, unter anderem für Amazon Q Developer.
Exa (ehemals Metaphor) ist eine KI-native semantische Suchmaschine. Sie indiziert das Web mittels neuronaler Embeddings, um Bedeutung, Beziehungen und Absichten zu verstehen. Die Ergebnisse werden als saubere, strukturierte Inhalte ohne Werbung oder SEO-Rauschen geliefert und sind direkt für LLMs nutzbar.
Die Integration von Exa in das Strands Agents SDK stellt eine KI-native Such- und Retrieval-Ebene bereit.
Kern-Tools der Integration
exa_search: Führt semantische Websuchen in Modi wie Instant, Fast, Auto (empfohlen) oder Deep durch. Unterstützt Filter nach Kategorie (Nachrichten, Forschungsarbeiten, Repositories), Domain, Datum und Inhalt. Kann Zusammenfassungen und Highlights direkt liefern.exa_get_contents: Ruft den vollständigen Inhalt ausgewählter URLs ab. Nutzt einen Inhalts-Cache für Geschwindigkeit und greift bei Bedarf auf Live-Crawling zurück. Die Textlänge ist konfigurierbar.
Beispiel: Deep Research Agent
Ein Beispiel-Workflow zeigt einen autonomen sechsstufigen Forschungsprozess. Der Agent nutzt exa_search für gezielte Abfragen über Nachrichten, wissenschaftliche Arbeiten und GitHub-Repositories sowie exa_get_contents für detaillierte Extraktion, inklusive Live-Crawling und Verfolgen von Unterseiten.
Das Ergebnis ist ein strukturiertes Forschungsbriefing mit direkter Rückverfolgbarkeit jeder Aussage zu einer Quell-URL. Dies reduziert Halluzinationen, optimiert die Token-Nutzung durch Zusammenfassungen und ermöglicht autonome Recherche über verschiedene Quelltypen.
Voraussetzungen und Observability
Für die Nutzung sind Python 3.10+, ein AWS-Konto mit Amazon Bedrock-Zugriff und ein Exa API-Schlüssel erforderlich. Die Pakete strands-agents und strands-agents-tools werden installiert. Der Exa-Schlüssel wird als EXA_API_KEY gesetzt.
Die Integration nutzt Amazon Bedrock AgentCore Observability auf Basis von OpenTelemetry. Jeder Tool-Call und jede LLM-Invocation wird als Span erfasst. Dies ermöglicht detaillierte Nachverfolgung über CloudWatch-Dashboards mit Metriken zu Token-Nutzung, Latenz, Tool-Aufrufen und Fehlerraten.
Quelle: AWS AI Blog
FAQ
Welches Problem löst die Exa-Integration im Strands Agents SDK?
Sie ersetzt für KI-Agenten ungeeignete, HTML-lastige Suchergebnisse durch direkt verwendbare, strukturierte und semantisch angereicherte Inhalte.
Welche zwei zentralen Tools stellt die Integration bereit?
exa_search für semantische Suche mit verschiedenen Modi und Filtern sowie exa_get_contents für die strukturierte Abfrage vollständiger Webseiteninhalte.
Welchen Vorteil bietet die Integration für die Observability von Agenten?
Durch OpenTelemetry-basierte Spans und CloudWatch-Dashboards wird der gesamte nicht-deterministische Agentenlauf transparent und debugbar.