Chrome, Google

Chrome 149: Google integriert Select from screen in Gemini

25.06.2026 - 00:34:52 | boerse-global.de

Google erweitert Gemini um Desktop-Bildschirmauswahl, KI-Agenten für Programmsteuerung und Sprachdiktat-Funktionen.

Google stattet Gemini mit Bildschirmauswahl und KI-Agenten aus
Chrome - A stylized computer screen showing an AI interface with a glowing cursor selecting content on a webpage. 25.06.2026 - Bild: über boerse-global.de

Google rüstet seine KI-Plattform Gemini mit mächtigen neuen Werkzeugen auf. Ab sofort können Nutzer Inhalte direkt aus dem Browser in KI-Anfragen einbinden.

Am 24. Juni 2024 veröffentlichte der US-Konzern das Update Chrome 149, das eine neue Funktion namens "Select from screen" für Gemini mitbringt. Das Tool erlaubt es Desktop-Nutzern, visuelle und textuelle Daten aus aktiven Browser-Tabs direkt in KI-Prompts zu übernehmen – ohne manuelles Kopieren oder Datei-Uploads.

So funktioniert die Bildschirmauswahl

Die neue Funktion ermöglicht es, bestimmte Bereiche eines Browser-Tabs zu markieren und an die Gemini-Seitenleiste zu senden. Per Klick auf den Button "Ask Gemini" und Auswahl der entsprechenden Option lässt sich ein Rahmen um den gewünschten Inhalt ziehen. Das System erlaubt nachträgliche Anpassungen der Auswahl.

Voraussetzung: Nutzer müssen in ihrem Google-Konto angemeldet sein und Gemini in den Browser-Einstellungen aktiviert haben. Im Inkognito-Modus steht das Tool derzeit nicht zur Verfügung. Branchenbeobachter sehen Parallelen zu bestehenden visuellen Suchwerkzeugen wie "Circle to Search" – nun für den Desktop adaptiert.

Anzeige

Wer die neuen Möglichkeiten von KI-Tools wie Gemini effizient nutzen möchte, findet in diesem kostenlosen Ratgeber die passenden Strategien für den Einstieg. Erfahren Sie, wie Sie künstliche Intelligenz sofort als praktischen Helfer in Ihren Alltag integrieren können. Kostenlosen PDF-Report mit Beispiel-Prompts jetzt herunterladen

Computer Use: KI-Agenten steuern Programme

Parallel dazu kündigte Google an, dass "Computer Use" nun ein fest integriertes Werkzeug im Modell Gemini 3.5 Flash ist. Die Funktion ersetzt das bisherige Gemini 2.5-Framework und ist über die Gemini-API sowie die Gemini Enterprise Agent Platform verfügbar.

Entwickler können damit KI-Agenten erschaffen, die grafische Benutzeroberflächen navigieren. Diese Agenten führen mehrstufige Arbeitsabläufe aus: Sie klicken Buttons, scrollen durch Seiten und füllen Formulare aus – über Web-, Mobil- und Desktop-Anwendungen hinweg. Google betont, dass das Modell speziell für langfristige Aufgaben optimiert ist: Die KI analysiert Screenshots und gibt konkrete Aktionen zur Ausführung zurück.

Sicherheitsbedenken begegnet Google mit mehreren Schutzmechanismen auf Unternehmensebene. Dazu gehören eine zwingende Benutzerbestätigung für sensible Aktionen sowie eine automatische Stopp-Funktion bei erkannten Prompt-Injection-Versuchen.

Sprachsteuerung und Canvas für Abonnenten

Ebenfalls am 24. Juni 2024 führte Google die Funktion "Speak to Window" für die Gemini-Desktop-App ein. Dieses Sprachdiktat-Werkzeug erlaubt es, durch Gedrückthalten einer Taste Befehle in jeder geöffneten Anwendung zu geben. Die verwandte Funktion "Magic Pointer" kombiniert Bildschirmzeiger mit Sprach- oder Texteingaben – Nutzer können Informationen markieren, die die KI dann zusammenfassen, bearbeiten oder umwandeln soll.

Anzeige

Die rasante Entwicklung von KI-Assistenten bietet enorme Chancen, erfordert aber auch das Wissen um die richtige Anwendung der Befehle. Dieser Gratis-Report enthüllt die praktischsten Tricks für Einsteiger, um alltägliche Aufgaben in Sekunden zu erledigen. Einfache KI-Befehle für den Alltag hier gratis entdecken

Zudem startete Google die US-Beta von Canvas. Diese Plattform richtet sich an Pro- und Ultra-Abonnenten und wandelt Suchergebnisse in strukturierte Ausgaben um – etwa Studienführer, Quizze oder Anwendungen. Canvas nutzt das Gemini-3-Modell mit seinem Kontextfenster von 1 Million Tokens.

Die Neuerungen reihen sich in eine Serie von Chrome-Features ein, die bereits Anfang des Jahres veröffentlicht wurden: ein "Save to Drive"-Button für PDF-Viewer, ein Vollbild-Lesemodus und vertikale Tabs. Die gebündelten Veröffentlichungen unterstreichen den Trend in der KI-Entwicklung hin zu Echtzeit-Aufgabenmanagement und tieferer Browser-Integration.

de | wissenschaft | 69620634 |