Der nächste Nachbar als Machine Learning BeispielUm die Funktionsweise von Machine Learning verständlich zu erläutern wollen wir hier sehr kurz einen einfachen Machine Learning Algorithmus (~Verhaltensvorschrift) den „nächsten Nachbarn“ (im Original „nearest Neighbor“) vorstellen, da vermutet werden kann das ähnliche Verfahren bei Suchmaschinen eingesetzt werden, da sie sehr schnell und auch einfach umzusetzen sind und effizient Ergebnisse liefern. Um den Algorithmus zu verstehen benutzen Sie einfach folgendes gedankliches Setup: Sie kennen von 10 Personen alle Charakterlichen Eigenschaften und verteilen diese in einem Raum. Schicken Sie eine 11. Person in diesem Raum von der Sie noch nichts wissen so ist diese mit hoher Wahrscheinlichkeit so einzuordnen wie die Person die ihr (nach einer gewissen Zeit) am nächsten steht. Das Prinzip lässt sich auch sehr schnell weiter verbessern indem Sie z.B. die 3 nächsten Personen in Betracht ziehen, das entspricht dann dem k-NN Algorithmus. Natürlich ist dieses Beispiel angreifbar da sich ja zum Teil auch Gegensätze anziehen, wie man sagt. Das Prinzip ist aber einfach und klar und vor allem bei maschinellen Verarbeitungen wie Webseiten durchaus leicht einsetzbar. Zunächst erstellen Suchmaschinen eine Liste mit allen Wörtern Ihrer gesamten Webpräsenz. Dann nehmen sie die ~200 häufigsten Wörter und lassen diese die Kategorie (in unserem Beispiel den Charakter) Ihrer Webseite darstellen. Finden sie eine Webseite mit z.B. 177 übereinstimmenden Schlüsselwörtern so ist diese mit hoher Wahrscheinlichkeit nicht weit entfernt und somit in einer ähnlichen Kategorie. Durch die Anzahl der Übereinstimmungen kann man auch direkt auf den Grad der Übereinstimmung schließen. Mathematisch kann man einfach den Abstand 2er Punkte im mehrdimensionalen Raum berechnen. Natürlich ist auch dies eine vereinfachte Darstellung da noch viele andere Faktoren Einfluss nehmen werden unter anderem auch die Keyword-Häufigkeit. So oder zumindest ähnlich setzen Suchmaschinen Machine Learning für ihre Zwecke ein. Wie Sie z.B. Ihre Keyword-Listen am besten beeinflussen erfahren Sie in unserer HTML Sektion. |
||