Veranstaltung/OCR-Vortrag
Facts
- Was: Vorstellung eines neuartigen OCR-Programms
- Wann: Di, 28.06.2010, 18:00 Uhr
- Wer: Hardy Falk
- Wo: Labor
Folienvortrag über die Ideen von http://www.learning-by-glueing.com/hf.pdf.
Danach wird ein OCR-Programm ( QT4, Linux ) vorgeführt, das die etwas abgehobenen, abstrakten Ideen in überaus simplen C++ - Code umsetzt. Die Ideen scheinen neu zu sein, so etwas sieht man auf diesem steinigen Acker nur selten. Der Code ist so simpel, dass man an eine Hardwareimplementierung aus gewöhnlichem DRAM denken kann.
Die Pioniere der Kybernetik waren in den sechziger Jahren des vergangenen Jahrhundert der Meinung, das Geheimnis des Geistes stünde kurz vor seiner endgültigen Aufklärung. Dieser Optimismus hatte zwei Quellen, die rasante Entwicklung der Computertechnik und die neuen Erkenntnisse der Biologie und Biochemie. Ihr Optimismus war nicht unbegründet, die Verarbeitungskapazität der Computer ist seitdem um mindestens 11 Zehnerpotenzen gestiegen. Die Untersuchung der Hirnfunktion entwickelte immer bessere experimentelle Techniken, Nervenzellen können heute auf molekularer Ebene beobachtet und verstanden werden, bildgebende Verfahren erlauben es, ein menschliches Gehirn buchstäblich beim Denken zu beobachten. Der Weg vom Photon, über die Photorezeptoren der Netzhaut, Ganglienzellen, die Schaltstationen des CGL, bis zu den verschiedenen bildverarbeitenden Arealen der Großhirnrinde ist in großer Detailfülle geklärt.
Und trotzdem blieb der große Durchbruch aus. Keine Maschine kann so gut sehen oder hören wie ein Hund kein Roboter kann sehen,hören,riechen,laufen,greifen wie eine Ratte. Es gibt zwar Software, die gedruckten Text lesen oder gesprochene Worte in Text umwandeln kann, aber diese Entwicklungen sind nicht so neu, erste, halbwegs brauchbare Ansätze sind z.T. Jahrzehnte alt. Der hardwaretechnische Fortschritt hat alte Ideen praktikabler gemacht, die Unzulänglichkeiten sind geblieben. Schon verschmutzte Druckseiten,alte Bücher mit Bleisatz und die Vielfalt alter Schrifttypen bringen die kommerziellen Schrifterkennungsprogramme an ihre Grenzen.
Voraussetzungen
Von der ganzen Ingenieursmathematik wird nichts benutzt, keine lineare Algebra, keine Differenzialrechnung, keine Wahrscheinlichkeitsrechnung. Verbindungen zu aktuellen Themen der Neuroinformatik gibt es, aber sie werden nicht benötigt, um die Funktionsweise des OCR-Programms zu verstehen.