Maschinelles Lernen

Die leichte Verfügbarkeit großer Mengen maschinenlesbarer Daten hat zu einem starken Bedeutungszuwachs des maschinellen Lernens geführt. Große und schnell wachsende Datenmengen machen es dem Menschen in der heutigen Zeit nahezu unmöglich, diese innerhalb kurzer Zeit zu verstehen, und Wissen mit hoher Geschwindigkeit und hoher Genauigkeit zu extrahieren.
Ein Verfahren des maschinellen Lernens dient hierbei dazu, Daten zu verarbeiten und Muster in diesen Daten zu erkennen – bei dem Verfahren kann es sich entweder um einen Algorithmus oder eine sogenannte Heuristik handeln. Aus sogenannten Trainingsdaten wird so „gelernt“, welche Zusammenhänge bestehen. Aus dieser Analyse werden komplexe statistische Modelle erstellt. Diese Modelle können dann auf neue Daten angewendet werden. So kann beispielsweise aus einer Menge von Bildern, die jeweils eine schriftliche Beschreibung haben, gelernt werden, wie eine Katze aussieht. Der Computer lernt dabei, dass eine Art Kreis mit zwei dreieckigen Gebilden oben darauf eher eine Katze zeigt als eine Art Kreis mit zwei daran hängenden Ovalen, die eher auf einen Hund hindeuten. Da keine dieser Regeln für alle Fotos stimmt und es immer nur um statistische Wahrscheinlichkeiten geht, spricht man also von einem statistischen Modell.
Wenn es bei den Mustern, die durch Verfahren des maschinellen Lernens gefunden werden sollen, z.B. um menschliches Verhalten geht, ist besondere Vorsicht geboten. Insbesondere, wenn in Daten der Vergangenheit Eigenschaften gefunden sollen, die Menschen mit einem guten oder schlechten Verhalten auszeichnen, z.B. das Finden von Mustern erfolgreicher Arbeitnehmer oder schwerer Krimineller, muss die Maschine so trainiert werden, dass mit ihr faire und gute Entscheidungen getroffen werden können. Die Systeme, die solche Entscheidungen unterstützen oder sie gar automatisch treffen, nennt man algorithmische Entscheidungssysteme.