Veranstaltung/OCR-Vortrag: Unterschied zwischen den Versionen

Aus LaborWiki
Wechseln zu: Navigation, Suche
K (hat „Ocr-Vortrag“ nach „OCR-Vortrag“ verschoben)
Zeile 60: Zeile 60:


http://michaelbach.de/ot/fcs_mosaic/index-de.html
http://michaelbach.de/ot/fcs_mosaic/index-de.html
und natürlich *der* Klassiker:
http://hubel.med.harvard.edu/book/bcontex.htm


[[Category:Veranstaltung]]
[[Category:Veranstaltung]]

Version vom 27. Mai 2011, 11:19 Uhr


Facts

  • Was: Vorstellung eines neuartigen OCR-Programms
  • Wann: Di, 28.06.2010, 18:00 Uhr
  • Wer: Hardy Falk
  • Wo: Labor

Folienvortrag über die Ideen von http://www.learning-by-glueing.com/hf.pdf.
Speziell wird gezeigt, wie eine genaue Betrachtung des Phänomens der Überauflösung beim Sehen zu einem neuartigen Verständnis der Funktionsweise einer kortikalen Säule führt. ( Was, nicht wie! )

Danach wird ein OCR-Programm für Frakturschrift vorgeführt. Die etwas abgehobenen, abstrakten Ideen laufen auf überaus simplen C++ - Code hinaus. Kaum zu glauben, dass man aus einem Gewirr von gewöhnlichem Speicher, Komparatoren und Rückkopplung einen Mustererkenner bauen kann.

Teaser

Die Pioniere der Kybernetik waren in den sechziger Jahren des vergangenen Jahrhundert der Meinung, das Geheimnis des Geistes stünde kurz vor seiner endgültigen Aufklärung. Dieser Optimismus hatte zwei Quellen, die rasante Entwicklung der Computertechnik und die neuen Erkenntnisse der Biologie und Biochemie. Ihr Optimismus war nicht unbegründet, die Verarbeitungskapazität der Computer ist seitdem um mindestens 11 Zehnerpotenzen gestiegen. Die Untersuchung der Hirnfunktion entwickelte immer bessere experimentelle Techniken, Nervenzellen können heute auf molekularer Ebene beobachtet und verstanden werden, bildgebende Verfahren erlauben es, ein menschliches Gehirn buchstäblich beim Denken zu beobachten. Der Weg vom Photon, über die Photorezeptoren der Netzhaut, Ganglienzellen, die Schaltstationen des CGL, bis zu den verschiedenen bildverarbeitenden Arealen der Großhirnrinde ist in großer Detailfülle geklärt.

Und trotzdem blieb der große Durchbruch aus. Keine Maschine kann so gut sehen oder hören wie ein Hund, kein Roboter kann sehen,hören,riechen,laufen,greifen wie eine Ratte. Es gibt zwar Software, die gedruckten Text lesen oder gesprochene Worte in Text umwandeln kann, aber diese Entwicklungen sind nicht so neu, erste, halbwegs brauchbare Ansätze sind z.T. Jahrzehnte alt. Der hardwaretechnische Fortschritt hat alte Ideen praktikabler gemacht, die Unzulänglichkeiten sind geblieben. Schon verschmutzte Druckseiten,alte Bücher mit Bleisatz und die Vielfalt alter Schrifttypen bringen die kommerziellen Schrifterkennungsprogramme an ihre Grenzen.

Voraussetzungen

Von der ganzen Ingenieursmathematik wird nichts benutzt, keine lineare Algebra, keine Differenzialrechnung, keine Wahrscheinlichkeitsrechnung. Verbindungen zu aktuellen Themen der Neuroinformatik gibt es, aber sie werden nicht benötigt, um die Funktionsweise des OCR-Programms zu verstehen.

Links

http://www.learning-by-glueing.com/blog/

http://www.learning-by-glueing.com/hf.pdf

http://michaelbach.de/ot/fcs_mosaic/index-de.html

und natürlich *der* Klassiker:

http://hubel.med.harvard.edu/book/bcontex.htm