Die OCR-Software Tesseract wurde heute von Google als Open Source freigegeben. Die aus dem Hause Hewlett-Packard stammende Software ist allerdings noch eine Baustelle, so fehlt zum Beispiel eine Benutzeroberfläche. Google plant Tesseract weiter zu verbessern.
Ich könnte wetten, viele der SEOs denken jetzt, Google will das nur dazu nutzen das Impressum von Webseiten welches als Bild gespeichert wurde damit auszulesen, stimmts?
Kommentare
3 Kommentare zu „Google bringt kostenlose OCR Software“
Sie könnten es auch sinnvollerweise dafür nutzen, um den verstärkt auftretenden Image Spam bei GMail auszufiltern.
Da ausser in Deutschland kein Land dieses Impressumswahn und die damit verbundenen Bildchen hat, halte ich das für unwahrscheinlich.
OCR? Mhmmm … hat bestimmt was mit Google-Books zu tun. Da gibt es eine Menge PDF umzuwandeln.