Die vielleicht größte Stärke von KI-Systemen ist ihre Fähigkeit, Muster wie Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten oder Gesetzmäßigkeiten in einem riesigen Datenwust zu erkennen, aber auch in Bildern und Tönen. Der Begriff Mustererkennung (englisch: Pattern Recognition) tauchte schon in den 30er Jahren im Zusammenhang mit statistischen Auswertungen auf, aber erst der Computer eröffnete in den 50er und 60er Jahren Anwendungsmöglichkeiten auf anderen Gebieten. In den 70er Jahre setzte sich zunächst die optische Texterkennung (Optical Character Recognition, OCR) durch, die zunächst vor allem in der Verarbeitung des Posteingangs großer Firmen Erfolge feierte. Dort kam es ja nicht so sehr auf die Inhaltsanalyse an: Es genügte meist Dinge wie das Layout von Formularen, Firmenlogos oder bestimmte Textfelder erkennen zu können. Mit der Zeit war es auch möglich, zwischen relevanten Bereichen (Texte, Bildunterschriften) und irrelevanten Bereichen (Abbildungen, Weißflächen, Linien) zu unterscheiden.
Heute bildet Mustererkennung die Grundlage vieler Funktionen in der intelligenten Datenverarbeitung, sei es in der Medizin oder Biologie, in der Spracherkennung oder bei Übersetzungssoftware, in der Objekterkennung und bei Börsenhandelssystemen, um nur ein paar Beispiele zu nennen.
Aber ist Mustererkennungs wirklich KI?
Der amerikanische Neurowissenschaftler Jeff Hawkins sagte einmal: „Vorhersage ist nicht einfach nur eines der Dinge, die dein Gehirn tut. Sie ist die Hauptfunktion des Neocortex und das Fundament der Intelligenz.“ Nach dieser Definition wäre also Mustervorhersage, eine Erweiterung der Mustererkennung, durchaus als eine Form der künstlichen Intelligenz einzustufen. Solche Systeme bieten den Vorteil, dass nicht nur ein bestimmtes Objekt in einem einzelnen Bild erkannt wird, sondern auch anhand einer Bildserie vorhergesagt werden kann, wo sich das Objekt als nächstes aufhalten wird. Andere Experten sehen in ihr nur einen, allerdings einen wichtigen Baustein in Systemen des Maschinenlernens.
Tatsächlich haben erst Fortschritte in der neuronalen Netzwerktechnologie die entscheidende Wende gebracht. Selbst sehr komplexe Strukturen und riesige Datenmengen lassen sich in Sekundenbruchteilen zuordnen und klassifizieren, also zu Klassen zusammenfassen. Diese können symbolischer Natur sein (zum Beispiel Farbe) oder numerisch (Länge, Breite, Höhe).
Nehmen wir an, der Betreiber einer Hochseefischerei möchte ein System bauen, dass ihm hilft, zwischen Seebarsch (a) und Seelachs (b) zu unterscheiden und diese voneinander zu trennen, bevor sie weiterverarbeitet werden. Er könnte eine Kamera installieren und solche Klassen aufnehmen wie die Länge der Fische – der Seebarsch ist in der Regel etwas länger als der Seelachs – oder ihre Breite, Anzahl und Form ihrer Flossen sowie die Farbe und Luminenz der Schuppen. Diese Informationen werden an einen Computer geleitet, der mit einem Sortierroboter gekoppelt ist der, basierend auf der Auswertung des Computers, die Fische auf zwei verschiedene Laufbänder verteilt.
Dabei werden unweigerlich Fehler gemacht, und ein paar Seebärsche werden bei den Seelachsen landen. Das ist aber schlecht für den Betreiber, weil die meisten Menschen der Ansicht sind, dass Seelachs besser schmeckt als Seebarsch. Sie sind deshalb auch bereit, für reinen Seelachs einen höheren Preis zu zahlen. Der Programmierer wird also bestimmte Grenzwerte eingeben: Ein Fisch unter einer bestimmten Länge, sagen wir mal, wird ebenso aussortiert wie solche, bei denen die Helligkeit der Schuppen einen bestimmten Wert über- oder unterschreitet. Dabei muss das System aber auch die Beleuchtung am Ort der Aufnahme mitberücksichtigen. Die Anzahl der Klassen und die Komplexität der Entscheidungsprozesse steigt also sehr schnell ins Astronomische – und mit ihnen die Kosten für den Betreiber.
Bis hierhin sind wir davon ausgegangen, dass die Folgen einer falschen Entscheidung immer gleich sind: Es ist genauso unerwünscht, dass Seelachs in eine Dose Seebarschfleisch gerät wie umgekehrt. Der Betreiber weiß aber aus Erfahrung, dass die Kunden eher verzeihen, wenn sie in ihrer Seebarschdose ein Stück Seelachs finden als umgekehrt. Also kann er die Grenzwerte für bestimmte Klassen so justieren, dass der Seelachsanteil in den Seebarschdosen etwas steigt, die Kosten aber sinken. Gleichzeitig kann die Anlage schneller arbeiten, weil es im wahrsten Sinne des Wortes nicht mehr so genau hinsehen muss! Der Betreiber kann also mehr Fischdosen billiger produzieren als bisher, seine Firma arbeitet insgesamt rentabler.
Ein solches Beispiel erklärt auch, warum Mustererkennung – auch wenn es im Grunde ein alter Hut ist – heute brandaktueller ist denn je sind. Dank neuronaler Netzwerke, Fortschritte in der autonomen Robotertechnik sowie im Bereich von des Machine Learning – Stichworte hier sind überwachtes versus unüberwachtes Lernen – lassen sich Systeme bauen, die immer mehr Klassen immer genauer und in immer kürzerer Zeit untersuchen und klassifizieren können. Und das freut den Unternehmer!