Meta-Suchmaschinen
Suchmaschinen decken nur einen Teil des Internet ab. Im Wettkampf um
den weltgrössten Index gibt es zwar immer neue Rekorde, doch das
Web wächst unaufhörlich, die Kluft zwischen erfassten
Webseiten und Suchmaschinenindizies wird immer grösser.
Die Indizies von Suchmaschinen sind nicht deckungsgleich.
Wie aus nachstehender Illustration zu ersehen ist, werden nur Teile des
Webs gleichzeitig von mehreren Suchmaschinen erfasst. Das kann jeder
Websitebtreiber nachvollziehen, der weiss, dass nicht alle seiner
Seiten in allen Suchdiensten erfasst ist. Die Listung von Webseiten
hängt beispielsweise davon ab, ob Seiten angemeldet wurden, wie
oft Suchmaschinen Seiten neu indexieren, wie tief sie indexieren, ob
alle Seiten mit Links untereinander verbunden sind,...
Die Illustration stellt keine korrekten Grössenverhältnisse
im WWW dar. Sie dient nur zur besseren Veranschaulichung der
unterschiedlichen Erfassungsbereiche von Suchmaschinen.
Eine grössere Abdeckung können Meta-Suchmaschinen
realisieren. Durch die Abfrage mehrerer Suchdienste wird ein
grösserer Datenpool abgefragt. Im obigen Beispiel die Menge aller
3 Suchmaschinen.
Abgefragte Quellen
In der Regel werden Suchmaschinen und Webverzeichnisse abgefragt. Es
bietet sich jedoch an, weitere Quellen wie Enzyklopädien,
Wörterbücher, Newsgroups,... in die Abfrage einzubeziehen.
Das sind in der Regel dynamische Webangebote die von Suchmaschinen gar
nicht abgefragt werden.
Die Qualität der Ergebnisse kann in Abhängigkeit vom
Suchbegriff gegenüber reinen Suchmaschinen erhöht werden.
Einfluss der Seitengestaltung
In den Ergebnislisten von Suchmaschinen werden nur Teile einer Webseite
angezeigt. Das sind der Seitentitel und ein Kurztext. Der Kurztext wird
generiert aus:
1. Dem Meta-Tag Description oder
2. Die ersten sichtbaren (ca. 180 bis 250) Zeichen des Seitentextes oder
3. Direkt aus dem Volltext, einige Worte vor und nach dem Suchbegriff (Beispiel: Google)
Nur Titel und Beschreibung stehen den Meta-Suchmaschinen zur
Verfügung, um in akzeptabler Zeit eine eigene Liste zu erstellen.
Anfrage übersetzen
Suchdienste starten mit unterschiedlicher Syntax, Abfragen werden so
übersetzt, dass sie von allen beteiligten Suchdiensten
gleichermassen interpretiert werden.
Mehr Infos zur unterschiedlichen Syntax im Grundlagenartikel: Suchoptionen
Einfluss der Abfragezeit
Jeder Suchdienst hat eine interne Abfragezeit bis er die Ergebnisse für eine Anfrage bereitstellen kann.
Damit sich diese Zeiten nicht addieren, muss eine Metasuchmaschine
parallel, also zeitgleiche abfragen können. Je mehr Ergebnisse
abgefragt werden um so länger dauert die Verarbeitung dieser
Daten.
Viele einfache Metasuchmaschinen liefern deshalb nur eine begrenzte
Anzahl Treffer, es könnte sonst sein, dass die Nutzer vor Ungeduld
auf den nächsten Suchdienst ausweichen. Gute Meta-Suchmaschinen
können solange Ergebnisse liefern wie die abgefragten Suchdienste
das können.
Ergebnisse sortieren
Nach der Abfrage müssen alle Ergebnisse in einer Liste
zusammengefasst werden. Unterschiedliche Formate der Ergebnisliste sind
dabei auf ein einheitliches Look and Feel zu bringen.
Dazu gehört auch die Anzeige der Fundstelle. Gute Anzeigen geben
auch die jeweiligen Platzierungen in den abgefragten Suchdiensten mit
aus.
Ranking der Ergebnisse
In der generierten Liste muss die Platzierung neu bestimmt werden. Das
sollte in Abhängigkeit der Häufigkeit des Vorkommens in
anderen Suchdiensten und den dortigen Platzierungen erfolgen.
Aussortieren doppelter Ergebnisse
Bei der Abfrage mehrerer Suchdienste können natürlich
Ergebnisse mehrfach vorkommen. Diese müssen zusammengefasst und in
ihrer Gesamtheit gewertet werden. Ist beispielsweise eine Seite in drei
Suchdiensten auf Platz eins, dann soll sie trotzdem nur einmal
angezeigt werden.
Aussortieren toter Links
Diese Aufgabe kann die Metasuchmaschine zwar theoretisch
übernehmen, dieser Vorgang benötigt in der Praxis sehr viel
Zeit.
Eine zusätzliche Option in der Ergebnisliste erscheint hierfür sinvoll.
Beschreibungstexte übernehmen
Alle Angaben der Originalsuchmaschine sollen in der einheitlichen Ergebnisliste der Meta-Suchmaschine erscheinen.
Wichtig ist, Angaben über den Bieterpreis wie etwa von Overture
mit zu übernehmen. Die Nutzern sollen selbst entscheiden
können, ob sie Ranking gegen Bezahlung als relevant erachten.