© 2005 IT assistance GmbH  
   
 

Produkt Ansicht

   

Kurzbeschrieb zum Produkt.

Anwendung Suchmaschine
Homepage Swish-E
 
Hersteller   Swish-E Devel Team
SWISH-E (Simple Web Indexing System for Humans - Enhanced) - Interessant an Swish-E dürfte vor allem die hohe Geschwindigkeit bei der Beantwortung von Suchanfragen und die relativ geringe Größe der erzeugten Indizes sein. Diese haben lediglich 1 bis 5 % des Umfangs der zugrundeliegenden HTML-Dokumente.

Index-Erzeugung:
SWISH-E kann sowohl lokale Datei-Bäume als auch Web-Sites indizieren, wobei die Steuerung über einen Konfigurationsfile erfolgt.

Suche:
Zur Suche kann SWISH-E über die CGI-Schnittstelle eines Web-Servers oder auch lokal betrieben werden. Die WWW-Benutzeroberfläche ist selbst zu entwickeln. Die Abfrage kann Boolesche Operatoren und Klammern enthalten, Suchterme können rechtsseitig verkürzt (Wildcard:*) werden. Die Suche lässt sich auf bestimmte Teile von HTML-Files beschränken (Meta-Tags, Überschriften, Kommentare, ..).
Merkmale  
  • Feldsuche in Titel, Keywords, Description, Autor, u.s.w.
  • Unterstützt 8-Bit HTML-Code. Damit Indexierung und Suche nach Umlauten möglich.
  • Neben HTML auch Indexierung von XML, PDF, PostScript, zip-Dateien
  • Enthält einen Webspider um Seiten über HTTP zu erfassen, die nicht zur eigenen Domain gehören. Der Spider beachtet den Robots Exclusion Standard
  • Schnittstellen für weitere Spider und Programme die Datenbanken ansprechen können
  • Suchoptionen: Phrasensuche, Wordstemming, Ähnlichkeitssuche, Wildcards
  • Suche kann auf Teile der Website eingeschränkt werden.
Einsatzgebiet Web Produktion mit vielen einzelnen Informationsräumen. Einfach anpassbare Indexierungen.
Lizenz Model Open-Source
Lizenz Kosten* keine
Integrations Kosten Zwischen CHF 2'000.- und 10'000.-
Voraussetzung OS: Windows, Linux, Unix
Web-Server: Apache, IIS
Technologie C, XML, LWP, diverse Filter wie pdftotext ...

      
 
Aktualisiert: 13. Sep. 2005     Autor: Christian Hauser Druckversion
/ www / Technology / Swish-E.html
 
 
 
eWeek lobt Bricolage CMS
eWeek Artikel
Das Bricolage CMS ist wohl das umfassenste Content Management System für grosse Web Seiten und Firmen, das als Open ...
mehr
Maintenance Release von Mason-CM
sourceforge.net
Endlich ist der lange vorbereitete Maintenance und Usability Release 1.0b von Mason-CM herausgekommen. Download von:
mehr
Mod_Perl's neues Portal
perl.apache.org
Die Online Ressource von Mod_Perl ist im neuen Glanz publiziert. Mehr Übersicht, mehr Informationen!
mehr