![]() |
![]() |
|
Seite 1 von 2
Über Suchmaschinen
Was genau ist eine Suchmaschine? Das World Wide Web ist ein überdimensionaler Haufen an Daten und Informationen, die sich auf den Rechnern, Computern, in den Netzwerken und auch auf den Webseiten befinden.
Die Suchmaschine ist eine entwickelte Software, die es ermöglicht durch gezieltes Suchen nach einem oder mehreren Begriffen, diese ungeheuren Datenbanken des Internets zu durchsuchen. Wird die Suchfunktion gestartet, durchsucht dieses Programm das Internet nach Informationen und Daten oder aber auch nur nach Verweisen zu diesen Daten, wie z.B. ein Suchtext der durch Wortähnlichkeit eine Übereinstimmung aufweist, hier muss nur das Ergebnis in irgendeiner Weise mit dem Suchbegriff im Zusammenhang stehen. Die eingegebenen Suchbegriffe, bzw. die Daten, werden nach bestimmten Kriterien ausgewertet, dann folgen die Ergebnisse.
Natürlich ist es nicht möglich, innerhalb von wenigen Sekunden das ganze World Wide Web zu durchsuchen, aber je nach Suchmaschine, bekommt man deren gespeicherten Inhalt - den Index. Der Index einer Suchmaschine wird regelmäßig gepflegt und aktualisiert. Allerdings gibt es neben diesem Prinzip auch die sogenannten "Meta-Suchmaschinen", die noch über keinen eigenen Index verfügen, sondern die bestehenden Daten anderer Suchmaschinen übernehmen und in ihre Listung aufnehmen.
Wie funktioniert die Suchmaschine? Die Suchmaschine setzt sich aus folgenden Einzelelementen zusammen: Zunächst haben wir hier den URL-Server, der sich um die Internetadressen kümmert. Hier werden sämtliche URLs verwaltet, die sich noch nicht im Index befinden. Der URL-Server ist auch die erste Anlaufstelle, wenn Internetseiten neu in der Suchmaschine angemeldet wurden. Von dieser Stelle aus werden die Daten dann weiter an die sogenannten „Crawler“ übermittelt.
Diese Crawler sind nötig, um die URLs mit den Servern zu verbinden. Dies geschieht innerhalb von Hunderstelsekunden, indem sie die URL der Webseite in eine lesbare IP-Adresse umwandeln. Auch sind die Crawler so programmiert, dass sie, um die Server nicht zu überlasten, sich nicht nur an einer Verbindung orientieren müssen, sondern an Hunderten von Verbindungen. So ist gewährleistet, dass der Crawler bei negativer Verbindung gleich zur nächsten greifen kann und es somit zu keiner Überlastung und auch keinem Zeitverlust kommen kann.
Über diesen Weg kann der Robot innerhalb von einer Sekunde etwa dreißig Webseiten durchforsten und schließlich alle Daten an den Parser senden. Nun liegt es am Parser die Kette weiterzuführen, indem er von jeder einzelnen HTML-Seite eine Art Kopie erstellt – allerdings in wesentlich vereinfachter Form und Beschaffenheit - und leitet diese Daten nun zum sogenannten Store Server. Dieser kümmert sich um die Weiterleitung der Daten, indem er zunächst diese einfachen Kopien der Seiten extrahiert. Sie werden also entpackt und sortiert. Text, Tags und Suchbegriffe werden an den Index übermittelt und enthaltene Links an den zuständigen URL-Server weitergeleitet.
Wenn wir vom "Index" einer Suchmaschine sprechen, dann reden wir hier von dem Lexicon, dem Repository und natürlich den Hitlists. Im Lexicon der Suchmaschine befindet sich die Sammlung aller erfassten Begriffe, die in tabellarischer Anordnung hinterlegt sind. Es lässt sich erahnen, dass auch nur Suchergebnisse auf die Wörter erzielt werden, die sich auch im Index, bzw. im Lexicon befinden. Ebenfalls wird jedem einzelnen Begriff seine Hitlist zugeordnet, die sich bei jedem weiteren Aufruf erhöht. Gleichzeitig wird der Verweis auf die vorhandenen Seiten im Repository geliefert. Im Repository befinden sich alle gespeicherten Webseiten und auch gleich der Hinweis auf deren Hitlist, bzw. welche Kriterien die Seite erfüllt, wie sie bewertet wird und welcher Bedeutungsgrad sämtlicher Suchbegriffe vorhanden ist.
Mit einer der wichtigsten Bestandteile der Suchmaschine, ist jedoch das sogenannte "Frontend", oder aber auch "Searcher" genannt. Hierbei handelt es sich, um die sichtbare Benutzeroberfläche der Suchmaschine, sprich: das Suchfeld, in dem der Benutzer seine Anfrage stellen kann. Wird hier ein Begriff eingegeben, reagiert der Searcher und offenbart den Inhalt seines Lexicons, natürlich unter der strengen Kontrolle aller Kriterien. Der Benutzer erhält nun eine Ergebnisliste, aus denen er nun die gewünschte Information auslesen kann.
Diese Algorithmusmethode, die für alle Suchmaschinen üblich ist, ist somit der Motor und der Hauptantrieb der Suchmaschinen. Der Algorithmus, als Wächter über Kriterien, Hitlist und Suchbegriffe, wird darüber entscheiden, welches Ranking einer Webseite zusteht und welche aufgrund mangelnder Kriterien ein schlechtes Ranking erfährt.
|










