Meta-Suchmaschinen




Suchmaschinen decken nur einen Teil des Internet ab. Im Wettkampf um den weltgrössten Index gibt es zwar immer neue Rekorde, doch das Web wächst unaufhörlich, die Kluft zwischen erfassten Webseiten und Suchmaschinenindizies wird immer grösser.

Die Indizies von Suchmaschinen sind nicht deckungsgleich.

Wie aus nachstehender Illustration zu ersehen ist, werden nur Teile des Webs gleichzeitig von mehreren Suchmaschinen erfasst. Das kann jeder Websitebtreiber nachvollziehen, der weiss, dass nicht alle seiner Seiten in allen Suchdiensten erfasst ist. Die Listung von Webseiten hängt beispielsweise davon ab, ob Seiten angemeldet wurden, wie oft Suchmaschinen Seiten neu indexieren, wie tief sie indexieren, ob alle Seiten mit Links untereinander verbunden sind,...

Die Illustration stellt keine korrekten Grössenverhältnisse im WWW dar. Sie dient nur zur besseren Veranschaulichung der unterschiedlichen Erfassungsbereiche von Suchmaschinen.




Eine grössere Abdeckung können Meta-Suchmaschinen realisieren. Durch die Abfrage mehrerer Suchdienste wird ein grösserer Datenpool abgefragt. Im obigen Beispiel die Menge aller 3 Suchmaschinen.

Abgefragte Quellen
In der Regel werden Suchmaschinen und Webverzeichnisse abgefragt. Es bietet sich jedoch an, weitere Quellen wie Enzyklopädien, Wörterbücher, Newsgroups,... in die Abfrage einzubeziehen. Das sind in der Regel dynamische Webangebote die von Suchmaschinen gar nicht abgefragt werden.
Die Qualität der Ergebnisse kann in Abhängigkeit vom Suchbegriff gegenüber reinen Suchmaschinen erhöht werden.

Einfluss der Seitengestaltung
In den Ergebnislisten von Suchmaschinen werden nur Teile einer Webseite angezeigt. Das sind der Seitentitel und ein Kurztext. Der Kurztext wird generiert aus:
1. Dem Meta-Tag Description oder
2. Die ersten sichtbaren (ca. 180 bis 250) Zeichen des Seitentextes oder
3. Direkt aus dem Volltext, einige Worte vor und nach dem Suchbegriff (Beispiel: Google)

Nur Titel und Beschreibung stehen den Meta-Suchmaschinen zur Verfügung, um in akzeptabler Zeit eine eigene Liste zu erstellen.

Anfrage übersetzen
Suchdienste starten mit unterschiedlicher Syntax, Abfragen werden so übersetzt, dass sie von allen beteiligten Suchdiensten gleichermassen interpretiert werden.
Mehr Infos zur unterschiedlichen Syntax im Grundlagenartikel: Suchoptionen

Einfluss der Abfragezeit
Jeder Suchdienst hat eine interne Abfragezeit bis er die Ergebnisse für eine Anfrage bereitstellen kann.
Damit sich diese Zeiten nicht addieren, muss eine Metasuchmaschine parallel, also zeitgleiche abfragen können. Je mehr Ergebnisse abgefragt werden um so länger dauert die Verarbeitung dieser Daten.
Viele einfache Metasuchmaschinen liefern deshalb nur eine begrenzte Anzahl Treffer, es könnte sonst sein, dass die Nutzer vor Ungeduld auf den nächsten Suchdienst ausweichen. Gute Meta-Suchmaschinen können solange Ergebnisse liefern wie die abgefragten Suchdienste das können.

Ergebnisse sortieren
Nach der Abfrage müssen alle Ergebnisse in einer Liste zusammengefasst werden. Unterschiedliche Formate der Ergebnisliste sind dabei auf ein einheitliches Look and Feel zu bringen.
Dazu gehört auch die Anzeige der Fundstelle. Gute Anzeigen geben auch die jeweiligen Platzierungen in den abgefragten Suchdiensten mit aus.

Ranking der Ergebnisse
In der generierten Liste muss die Platzierung neu bestimmt werden. Das sollte in Abhängigkeit der Häufigkeit des Vorkommens in anderen Suchdiensten und den dortigen Platzierungen erfolgen.

Aussortieren doppelter Ergebnisse
Bei der Abfrage mehrerer Suchdienste können natürlich Ergebnisse mehrfach vorkommen. Diese müssen zusammengefasst und in ihrer Gesamtheit gewertet werden. Ist beispielsweise eine Seite in drei Suchdiensten auf Platz eins, dann soll sie trotzdem nur einmal angezeigt werden.

Aussortieren toter Links
Diese Aufgabe kann die Metasuchmaschine zwar theoretisch übernehmen, dieser Vorgang benötigt in der Praxis sehr viel Zeit.
Eine zusätzliche Option in der Ergebnisliste erscheint hierfür sinvoll.

Beschreibungstexte übernehmen
Alle Angaben der Originalsuchmaschine sollen in der einheitlichen Ergebnisliste der Meta-Suchmaschine erscheinen.
Wichtig ist, Angaben über den Bieterpreis wie etwa von Overture mit zu übernehmen. Die Nutzern sollen selbst entscheiden können, ob sie Ranking gegen Bezahlung als relevant erachten.