Die leichte Verfügbarkeit großer Mengen maschinenlesbarer Daten hat zu einem starken
Bedeutungszuwachs des maschinellen Lernens geführt. Große und schnell wachsende Datenmengen machen
es dem Menschen in der heutigen Zeit nahezu unmöglich, diese innerhalb kurzer Zeit zu verstehen, und
Wissen mit hoher Geschwindigkeit und hoher Genauigkeit zu extrahieren.
Ein Verfahren des maschinellen Lernens dient hierbei dazu, Daten zu verarbeiten und Muster in diesen
Daten zu erkennen – bei dem Verfahren kann es sich entweder um einen Algorithmus oder eine
sogenannte Heuristik handeln. Aus sogenannten Trainingsdaten wird so „gelernt“, welche Zusammenhänge
bestehen. Aus dieser Analyse werden komplexe statistische Modelle erstellt. Diese Modelle können
dann auf neue Daten angewendet werden. So kann beispielsweise aus einer Menge von Bildern, die
jeweils eine schriftliche Beschreibung haben, gelernt werden, wie eine Katze aussieht. Der Computer
lernt dabei, dass eine Art Kreis mit zwei dreieckigen Gebilden oben darauf eher eine Katze zeigt als
eine Art Kreis mit zwei daran hängenden Ovalen, die eher auf einen Hund hindeuten. Da keine dieser
Regeln für alle Fotos stimmt und es immer nur um statistische Wahrscheinlichkeiten geht, spricht man
also von einem statistischen Modell.
Wenn es bei den Mustern, die durch Verfahren des maschinellen Lernens gefunden werden sollen, z.B.
um menschliches Verhalten geht, ist besondere Vorsicht geboten. Insbesondere, wenn in Daten der
Vergangenheit Eigenschaften gefunden sollen, die Menschen mit einem guten oder schlechten Verhalten
auszeichnen, z.B. das Finden von Mustern erfolgreicher Arbeitnehmer oder schwerer Krimineller, muss
die Maschine so trainiert werden, dass mit ihr faire und gute Entscheidungen getroffen werden
können. Die Systeme, die solche Entscheidungen unterstützen oder sie gar automatisch treffen, nennt
man algorithmische Entscheidungssysteme.