© Fotolia

Yacy

Google-Alternative: Suchen mit Sharing

Während bei Google hauptsächlich Verlinkungen über die Rangfolge der Suchergebnisse entscheiden, sind es bei Yacy die einzelnen Nutzer. Sie installieren mit einem Mausklick die Yacy-Software auf ihrem Rechner. Ein Klick auf das Desktop-Symbol und im Browser öffnet sich ein neues Fenster mit einem Suchformular, wie man es von Suchmaschinen wie Google kennt. Wenn man jetzt etwas sucht, erhält man die Treffer aus den Dokumenten, die im Yacy-Index gespeichert sind.

Im Index befinden sich derzeit 1,6 Mrd. Dokumente. Er setzt sich aus den Indizes der vielen Yacy-Nutzer zusammen, die ihren privaten Index für andere öffnen. Zurzeit gibt es über aktive 1200 Peers, die jeweils mehrere Millionen Adressen in ihrem Index führen. Sie legen selbst fest, wie viel Festplattenkapazität sie dem für den Index frei räumen wollen. Im Yacy-Index dominieren, so Michael Christen, zurzeit Linux-Themen. Einfach weil diejenigen, die Yacy installiert haben, sich vor allem für Linux interessieren.

Unabhängige Suche
Yacy gibt es schon seit acht Jahren, große Furore konnte der Dienst bislang nicht machen. Entwickler Michael Christen lässt sich mit seiner Suchmaschinen-Software Yacy Zeit, bewusst viel Zeit. Das kann er auch, da er bewusst auf jede Drittfinanzierung verzichtet. Unter anderem schrecken ihn, so sagt er, in der Start-up-Szene die üblichen „Exit-Strategien“ ab. Die Entwicklung der freien Software Yacy läuft seit mittlerweile acht Jahren, in der Freizeit. Neben Christen gibt es noch rund weitere 30 Programmierer, die immer wieder mal an der Software schrauben. Jetzt stellte er die Yacy-Software mit der Version 1.0 vor. Die Kinderkrankheiten sind ausgemerzt, das System läuft stabil.

Ihm geht es nicht um das große Geld, sondern um die große Idee: eine unbeeinflusste Suche zu bieten. Christen: „Wir werden durch Suchergebnisse beeinflusst. Unser Wissen besteht aus vernetzter Informaton, das Ranking bestimmt unsere Wissensmenge.“ Da Wissen meinungsbildend für die Gesellschaft sei, da es Normen und Werte beeinflusse, müsse auch jede Gesellschaft eine eigene Suchmaschine haben. Jede Suchmaschine hat nämlich ihre eigenen Relevanzkriterien. Yacy nimmt es hingegen mit den Relevankriterien so ernst, dass Nutzer sogar die Rankingkriterien für die Suchergebnisse selbst manipulieren können.

Yacy auf Spur setzen
Der Vorteil von Yacy ist damit nicht der eine Suchindex, der potenziell alles umfasst, was im Netz ist. Sondern ein Suchindex, der potenziell das umfasst, was die eigenen Interessen ausmacht. Wie aber lernt Yacy, was einen interessiert? Yacy hat etwas, was gewöhnliche Suchmaschinen vor ihren Nutzern verbergen: Eine Administration, über die man selbst angeben kann, in welche Richtung Yacy Webseiten erfassen und dem eigenen Index zuordnen soll. Dafür kann man beispielsweise die Internetadresse des eigenen Blogs, der eigenen Website angeben. Yacy untersucht dann alle Links, die von der eigenen Website nach außen reichen. Im Admin-Bereich kann man angeben, wie viele Knoten Yacy untersuchen soll. Alle Fundstellen werden dann dem Index zugeordnet.

Außerdem können Nutzer die eigenen Bookmarks in Yacy importieren. Die Software versteht die gängigen Formate, unter anderem das Netscape-Bookmark-Format. So lassen sich etwa die in Social-Bookmarking-Diensten wie delicious oder diigo gesammelten Bookmarks in diesem Format exportieren und in Yacy wieder in importieren. Dort können sie seit diesem Wochenende sogar den eigenen Suchindex anreichern und als Ausgangspunkt für einen weiteren Crawl genommen werden. So etwas wäre über die Social-Bookmarking-Dienste nicht möglich.

 

Ein dezentraler Peer-to-Peer-Suchindex
Es ist nicht so, dass es einen zentralen Yacy-Index gibt. Stattdessen tauscht jede Yacy-Software, die gleichzeitig ein Proxy ist, die Kontaktdaten mit anderen Proxys aus. Die Indexdaten sind außerdem nicht auf bestimmte Nutzer zurückführbar. Der Datentausch ist jedoch nicht Pflicht: Nutzer, die aufgrund von Firewall-Einstellungen den Datenzugriff nicht zulassen, können jedoch auch teilnehmen.

Eine wichtige Sub-Anwendung von Yacy ist die mögliche Indexierung von Seiten in Intranets. Im Unternehmensbereich gibt es auch eine entsprechende Google-Anwendung, doch die kostet. Michael Christen kennt hierfür die Zahlen von vor zwei Jahren: „Vor 2 Jahren kostete die Google Search Appliance für eine halbe Million Seiten 60000 US-Dollar Miete im Jahr und die FAST ESP-Software, die inzwischen von Microsoft gekauft wurde, kostete als Einzellizenz für 15 Millionen Dokumente rund 300000 Euro.“

Besser als Google?
Die zentrale Frage, der sich Yacy stellen muss, ist natürlich: Ist Yacy besser als Google? Klare Antwort: Nein. Doch Google hat in den letzten Wochen und Monaten an Qualität stark nachgelassen, da Synonyme in der Ergebnisdarstellung eine immer wichtigere Rolle Spielen. Michael Christen meint: „Überall wo technische Begriffe vorkommen korrigiert Google mittlerweile so stark, dass das Ergebnis nicht brauchbar ist. Bei kryptischen Abkürzungen, wie sie etwa in der Biologie vorkommen, findet Google nichts mehr.“

Biologie-Studenten können jedoch mit Yacy einen eigenen Index aufbauen, in dem dann kryptische Kürzel tatsächlich gefunden werden können. Denn Yacy kennt keine Synonyme. Optimal ist das Ranking jedoch trotz individueller Einstellungsmöglichkeiten nicht, gibt Christen zu: „Das ist ein großes Problem. Ich hoffe hier natürlich auf Hilfe und dass viele das Problem bearbeiten, damit das Ranking gut wird.“

Fan-Gemeinde
Im Netz hat Yacy jedenfalls schon feste Fans. Denn innerhalb der Nutzergemeinde werden Verbesserungsvorschläge diskutiert und nicht selten aufgegriffen. Yacy ist zwar nichts für diejenigen, die mit einer schnellen Google-Suche zufrieden sind. Jedoch etwas für alle jene, die ihre Interessensgebiete im Netz erforschen und dafür den Yacy-Crawl anwerfen wollen. Jeder kann selbst seine Suchmaschine administrieren. Zwar muss man sich dafür mit dem nicht immer verständlichen Fachvokabular im Admin-Bereich auseinandersetzen, doch nicht nur für Spezialisten, auch für Wissenschaftler ist Yacy damit auch ein Werkzeug, mit dem man selbstbestimmt Websuchen durchführen kann.

Hat dir der Artikel gefallen? Jetzt teilen!

Kommentare