DSC Original Logo

Claude Sonnet Update – KI übernimmt jetzt Deinen Computer

Ein lächelnder Mann in Freizeitkleidung mit einer Baseballmütze und einer grauen Kapuzenjacke, umgeben von einem orangefarbenen Kreis.

Zum ersten Mal kann eine KI-Engine nicht nur Antworten geben, sondern auch den PC bedienen. Trotz begeistertem Feedback gibt es allerdings noch Tücken.

Ein Computermonitor mit menschenähnlichen Armen, möglicherweise ein KI Wunder, tippt auf einer Tastatur in einem schwach beleuchteten Schlafzimmer. Auf dem Bildschirm flimmert der neueste Codierungstext des Claude Sonnet Update. Im Hintergrund schläft eine Person im Bett, während ein Poster und Vorhänge teilweise sichtbar sind.
November 20, 2024

Das kalifornische KI-Unternehmen Anthropic hat kürzlich das Claude 3.5 Update veröffentlicht. Mit dem neuen „Computer Use“-Feature kann Claude Sonnet 3.5 erstmals direkt mit der Benutzeroberfläche deines Computers interagieren. Die Vision dahinter: Wiederkehrende Aufgaben automatisieren und den Arbeitsalltag erleichtern. Doch ist die KI schon bereit, um wirklich produktiv zu sein?

Automatisierte Interaktion mit dem Computer – Was ist möglich?

Mit dem „Computer Use“-Feature kann Claude einfache Aufgaben wie das Navigieren durch Apps, das Bewegen des Cursors, das Anklicken von Schaltflächen und sogar das Tippen von Text erledigen. Nutzer können einfach einen Textbefehl eingeben und Claude erledigt den Rest – ideal für wiederholende oder komplexe Aufgaben, bei denen verschiedene Anwendungen oder Dokumente durchsucht und ausgefüllt werden müssen. Ein Beispiel wäre das Ausfüllen eines Formulars mit Daten, die über verschiedene Dokumente verstreut sind.

Durch diese Funktion soll Claude Sonnet nicht nur vordefinierte Aufgaben erledigen, sondern flexibel auf standardmäßige Softwareanwendungen zugreifen können. Die Idee: Mithilfe einer API können Entwickler nun Prozesse im Arbeitsalltag automatisieren und die KI an bestimmte Applikationen anpassen.

Die Technik hinter „Computer Use“

Claude „sieht“, was auf dem Bildschirm passiert, indem er Screenshots analysiert und anhand dieser Pixel-genau berechnet, wo er den Cursor platzieren oder klicken muss. Auch kann die KI auf eine Serie von Screenshots zugreifen, um so mehrere Schritte nacheinander auszuführen und gegebenenfalls sogar Fehler selbst zu korrigieren. Replit, eine Plattform für Softwareentwicklung, plant bereits, diese Technologie für das Testen und die Qualitätskontrolle von Anwendungen zu nutzen.

Grenzen der Funktion: Claude bleibt fehleranfällig und kostspielig

Die Technologie ist jedoch noch nicht perfekt: Claude tut sich schwer mit Scrollen, Drag-and-Drop-Bewegungen und dem Zooming. Tests zeigen, dass die KI nur in etwa 46 % der Fälle erfolgreich war, zum Beispiel beim Buchen von Flügen. Zudem ist die KI kostspielig – einfache Aufgaben können mehrere Dollar an Token-Verbrauch verursachen. Ein Benutzer berichtete, dass das Öffnen und Kategorisieren einer URL ihn etwa 1,30 USD gekostet hat.

Claude erreicht derzeit nur 14,9 % der menschlichen Leistung bei Screenshot-basierten Aufgaben auf der Testplattform OSWorld, während die menschliche Leistung etwa bei 70 % liegt. Doch Anthropic sieht diese Beta-Phase als eine Möglichkeit, das Feature durch das Feedback der Nutzerweiter zu verbessern.

Sicherheitsmaßnahmen zum Schutz vor Missbrauch

Anthropic hat Sicherheitsvorkehrungen eingeführt, um die Risiken der neuen Funktionalitäten zu minimieren. Claude 3.5 Sonnet verwendet weder Benutzerdaten noch Screenshots für sein Training. Zum Schutz vor missbräuchlichen Aktivitäten gibt es außerdem Systeme, die potenziell schädliche Eingaben erkennen sollen. Prompt-Injection-Angriffe – bei denen manipulative Befehle der KI schaden könnten – werden durch Klassifikatoren erkannt und verhindert.

Fazit: Ein großer Schritt, aber noch kein Quantensprung

Das „Computer Use“-Feature von Claude 3.5 Sonnet markiert einen wichtigen Meilenstein in der KI-Entwicklung. Die Möglichkeit, dass KIs direkt mit unseren Computern interagieren, öffnet Türen für zahlreiche Anwendungsfälle, die über klassische Sprachassistenten hinausgehen. Doch Claude zeigt in seiner aktuellen Beta-Version noch Schwächen in Geschwindigkeit und Präzision. Die Technologie bleibt spannend und vielversprechend, jedoch ist ein vollständig verlässlicher KI-Assistent, der unseren Arbeitsalltag übernehmen kann, noch Zukunftsmusik.

Mehr dazu auf TechRepublic.com

Moritz Grumbach's avatar

Moritz Grumbach

Newsletter erhalten

Möchtest Du neue Inhalte aktuell in Deiner Inbox haben? Dann hinterlasse Deine Email und erhalte laufend Neuigkeiten über die Startup-Szene.

Hier findest Du weitere Startup-News
Büro München

Luise-Ullrich-Str. 20
D-80636 München
Tel 089-2488 61 370
Email

Büro Bochum

Kortumstr. 56
D-44787 Bochum
Tel 0234-68709823
Email

Förderbar durch
DSC-Footer-Logos
Gesetzliche Angaben
1
Step 1
2
Step 2

Hi, hier ist Moritz!

Ich würde gerne alle offenen Fragen zu Deinem Projekt 🚀 beantworten - eine ganze Stunde ⏰ lang, und völlig kostenlos!

Hättest Du Lust?

Ich freue mich drauf! Wie kann ich Dich erreichen?

Kontaktiere mich über WhatsApp
Scan the code