Die OCR-Software Tesseract wurde heute von Google als Open Source freigegeben. Die aus dem Hause Hewlett-Packard stammende Software ist allerdings noch eine Baustelle, so fehlt zum Beispiel eine Benutzeroberfläche. Google plant Tesseract weiter zu verbessern.
Ich könnte wetten, viele der SEOs denken jetzt, Google will das nur dazu nutzen das Impressum von Webseiten welches als Bild gespeichert wurde damit auszulesen, stimmts?
Verwandte Beiträge
Google BugAuch interessant: code Jerome’s Keywords funktioniert, Jerome’s Keywords code funktioniert nicht.
Simply GoogleMal ne nette Übersicht aller Google Dienste auf einer Seite, bei durchsuchbaren Diensten gleich mit…
Google MobileGoogle Mobile ist mal wieder gut unterwegs in den Serps, wer sich fürs Schwimmen interessiert…
Google downVielleicht lesen hier ja noch einige bevor sie mich per ICQ oder Skype fragen (das…
Kommentare
3 Antworten zu „Google bringt kostenlose OCR Software“
Sie könnten es auch sinnvollerweise dafür nutzen, um den verstärkt auftretenden Image Spam bei GMail auszufiltern.
Da ausser in Deutschland kein Land dieses Impressumswahn und die damit verbundenen Bildchen hat, halte ich das für unwahrscheinlich.
OCR? Mhmmm … hat bestimmt was mit Google-Books zu tun. Da gibt es eine Menge PDF umzuwandeln.