Baidu OCR-Rekord: 96,33 Prozent Genauigkeit bei Texterkennung
30.05.2026 - 01:48:19 | boerse-global.deGoogle, Epson und Baidu haben in der letzten Maiwoche 2026 gleich mehrere Innovationen vorgestellt, die das Scannen und Verarbeiten von Dokumenten grundlegend verändern werden. Der Trend geht klar zu KI-gestützten Workflows und immer schnellerer Hardware.
Google Drive bekommt KI-Scanner für Android
Am 29. Mai 2026 präsentierte Google eine komplett überarbeitete Dokumentenscanner-Funktion für die Android-Version von Google Drive. Die Neuerung hat einen Haken: Sie benötigt ein Smartphone mit mindestens 8 Gigabyte Arbeitsspeicher. Die Verarbeitung erfolgt direkt auf dem Gerät über Google Play Services – ein klarer Vorteil für den Datenschutz und die Offline-Nutzung.
Während moderne KI-Scanner die Dokumentenverwaltung im Alltag revolutionieren, bietet ChatGPT noch weitaus vielseitigere Unterstützung. Dieser kostenlose PDF-Report zeigt Ihnen, wie Sie die KI für Ihre Organisation und tägliche Aufgaben effektiv nutzen. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden
Die wichtigsten neuen Features: Smart Batch Scanning erlaubt es, mehrere Seiten zu erfassen, indem man das Gerät einfach darüber hält. Auto-Best Frame ersetzt automatisch unscharfe Aufnahmen durch schärfere. Und ein neuer Duplikaterkennung verhindert, dass dieselbe Seite versehentlich zweimal gespeichert wird.
Parallel dazu kündigte Superace am selben Tag eine globale Offensive für sein UPDF-Ökosystem an. Mit Nomostar bringt das Unternehmen eine KI-gestützte Scan- und Übersetzungs-App auf den Markt. Die Anwendung übersetzt Texte aus Dokumenten in zwölf Sprachen und kommt ganz ohne Werbung aus. Sie kombiniert optische Zeichenerkennung (OCR) mit plattformübergreifender Synchronisation – für Windows, Mac und Mobilgeräte.
Baidu stellt neuen OCR-Weltrekord auf
Bei der Texterkennung hat chinesische Technologie die Nase vorn. Am 28. Mai 2026 meldete Baidu einen neuen Rekord: Sein Modell PaddleOCR-VL-1.6 erreichte auf dem OmniDocBench v1.6-Benchmark satte 96,33 Prozent. Das Modell mit einer Milliarde Parametern meistert selbst komplexe Tabellen, Diagramme und seltene Schriftzeichen.
Für Unternehmen wird die KI-gestützte Rechnungsverarbeitung zunehmend interessant. Moderne OCR-Systeme erzielen heute Genauigkeitsraten zwischen 95 und 99 Prozent – traditionelle Systeme kommen gerade einmal auf 85 bis 90 Prozent. Die Bearbeitungszeit für Dokumenten-Workflows sank dadurch von zehn auf zwei bis drei Tage.
Die Enterprise-Plattform Grooper von Business Imaging Systems setzt dabei auf Vision Language Models (VLM). In einem Bericht vom 28. Mai 2026 zeigt das Unternehmen, wie automatisierte Dokumentenerfassung in Kombination mit RAG-gestützter Suche die Antwortzeiten bei komplexen Anfragen drastisch verkürzt – etwa bei Ausschreibungen.
Die rasanten Fortschritte bei KI-Tools wie ChatGPT werfen oft Fragen nach der richtigen Anwendung im privaten und beruflichen Umfeld auf. Ein neuer Gratis-Report enthüllt die praktischsten Tricks für Einsteiger und liefert sofort nutzbare Befehle für den Alltag. Diese einfachen ChatGPT-Befehle kennen die wenigsten – dabei erleichtern sie den Alltag enorm
Epson und APPLE TREE bringen neue Scanner
Auch die Hardware-Hersteller ziehen nach. Epson launchte am 28. Mai 2026 den WorkForce DS-530III, einen kompakten A4-Duplexscanner für hohe Volumen. Das Gerät schafft 40 Seiten pro Minute und ist für bis zu 6.500 Seiten täglich ausgelegt. Spezielle Schutzmechanismen verhindern Papierschäden und Doppeleinzüge.
Im Bereich der 3D-Erfassung sorgt das japanische Unternehmen APPLE TREE für Aufsehen. Der Raven 3D-Scanner nutzt LiDAR-Technologie und SLAM-Verfahren, um farbige Punktwolken zu erstellen. Mit einer 12-Megapixel-Kamera, einem Gewicht von rund 1,1 Kilogramm und einer Reichweite von 50 Metern ist das Gerät für industrielle Anwendungen konzipiert.
App-Updates und Markttrends
Der Markt für spezialisierte Scan-Apps bleibt in Bewegung:
- Docfila erhielt am 26. Mai ein Update mit Stabilitätsverbesserungen für seinen Dokumentengenerator und den sicheren Tresor.
- SwiftScan bietet aktuell eine lebenslange VIP-Lizenz für 47,97 Euro an – eine Alternative zu Abo-Modellen für mobiles OCR und Cloud-Organisation.
- AI PDF Scanner von finetuneapps aktualisierte sein Interface und den Dark Mode für Windows 10 und 11 und bietet nun ein „Rewrite Lab“ und „Doc Insights“.
- PDF Export von LiveBird Technologies erschien am 21. Mai in Version 13.2.2 – weiterhin mit einmaliger Zahlung für iOS-Nutzer.
Die Entwicklung hin zu hochauflösendem mobilen Scannen stellt zunehmend die Notwendigkeit klassischer Flachbettscanner infrage. Branchenbeobachter sehen in den 48-Megapixel-Kameras moderner Smartphones, kombiniert mit Funktionen wie Live Text (iOS) oder den neuen KI-Tools in Google Drive, eine ernstzunehmende Alternative für die meisten professionellen Dokumentationsanforderungen.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
