Content Surveyor 1.0: Wissensmanagement für den Desktop

Content Surveyor 1.0 ermöglicht das schnelle Auffinden von Dokumenten auf dem Desktop-PC.

Artikel erschienen in Swiss IT Magazine 2002/05

     

Das Problem tritt früher oder später bei jedem PC-Anwender auf: Mit der Zeit "verschwinden" Dateien auch auf dem bestorganisierten Rechner irgendwo in den Tiefen des Dateisystems. Sie sind zwar noch vorhanden, aber man kennt weder ihren genauen Speicherort noch den Inhalt. Wird eine Information aus einer solchen Datei benötigt, gestaltet sich die Suche mit den Windows-Bordmitteln entsprechend langwierig und aufwendig.




Eine mögliche Lösung bietet die junge deutsche Software-Firma NeuroPower mit ihrem Produkt Content Surveyor 1.0. Das Tool bietet Wissens- und Dokumentenmanagement in zahlreichen Dateiformaten und über dreissig Sprachen.


Intuitive Bedienung mit Assistentenunterstützung

Nach der einfachen Installation von Content Surveyor startet ein Assistent, der den Anwender durch die ersten Tasks und die Konfiguration der ersten Bibliothek führt. Dabei werden zunächst die zu benützenden Sprachen definiert und anschliessend die sogenannten Quellen hinzugefügt.



Unter Quellen versteht das Programm beispielsweise Windows-Ordner, die lokal oder auf einem Server im Netzwerk lagern können. Weitere Quellentypen sind Mail-Systeme wie Outlook, Outlook Express und Netscape Messenger, ausserdem können ZIP- und RAR-Archive sowie Unix-Message-Boxes als Quelle genutzt werden. Das Hinzufügen oder Ausschliessen von Quellen zu einer Bibliothek ist sowohl per File-Browser als auch per Drag&Drop möglich.




Sind die Quellen bestimmt, werden deren Inhalte angezeigt, also die einzelnen Dateien oder Mails. Content Surveyor unterstützt neben den Office-Formaten DOC, XLS und PPT weitere Textformate wie TXT, RTF, WPD und WIR, ausserdem HTML und einige Varianten davon sowie PostScript-Dokumente (PS). Leider fehlt derzeit allerdings die Unterstützung für PDF.



In der Dateianzeige kann der Anwender auswählen, ob er alle Dokumente in einer Quelle indizieren will oder nur eine Auswahl davon. Dateien mit nicht unterstützten Formaten werden dabei schlicht ignoriert.



Schliesslich wird der Aktualisierungsmodus für die eben erstellte Bibliothek festgelegt. Zur Auswahl stehen dabei die manuelle und die automatische Aktualisierung mit Scheduler. Auf Wunsch lassen sich auch nur neu hinzugefügte oder veränderte Dokumente aktualisieren.



All diese Tasks, die sich beim Erstellen jeder Bibliothek wiederholen, werden von einem Wizard geführt; falsch machen kann man dabei nichts.




Gute Performance

Nachdem die Grundeinstellungen für die neue Bibliothek vorgenommen wurden, beginnt Content Surveyor mit der Indizierung und Klassifizierung der Daten. Ärgerlich dabei ist, dass es mitunter nicht nachvollziehbare Fehlermeldungen generiert und die Indizierung abbricht. Ein Protokoll, in dem die fehlerverursachende Datei ersichtlich wäre, fehlt leider.



Insgesamt fällt das Programm auf unserem Testsystem durch eine flotte Verarbeitungsgeschwindigkeit auf. Das Tool stellt generell recht geringe Anforderungen an die Hardware-Ausstattung: es ist bereits auf einem Pentium 133 mit 32 MB RAM lauffähig, an Festplattenplatz werden 20 MB benötigt, dazu 2-5 MB für jede installierte Sprache sowie rund 30 Prozent vom Dokumentenbestand für Indexe und Hilfsdateien.





Wissenskarten zur schnellen Übersicht

Sind die Bibliotheken erst einmal eingerichtet, lässt sich Content Surveyor wie eine Web-Suchmaschine benutzen. Die Suche nach einem oder mehreren Begriffen gleichzeitig gehört ebenso zum Standardrepertoire wie komplette Textsuche oder fehlertolerante Suche. Die Auswertung der Ergebnisse nach Relevanz hilft, schnell und effizient das gewünschte Dokument zu finden. All diese Aufgaben erledigt das Programm in Sekundenschnelle.



Eine Besonderheit von Content Surveyor sind die visuellen Darstellungsmöglichkeiten. Durch komplexe morphologische und linguistische Analysen gewonnene Schlüsselwörter können auf Wunsch in einer Wissenskarte dargestellt werden. Auf diese Weise erhält der Anwender auf einen Blick eine Übersicht über die wichtigsten Stichworte in seiner Bibliothek. Fährt man mit der Maus über diese sogenannten Klassen, wird in einem Pop-up-Fenster angezeigt, in welchen Dokumenten die entsprechenden Schlüsselwörter vorkommen.




Ähnlich funktioniert auch der SenseDetector, bei dem mit Hilfe von Modellen von neuronalen Netzen die Relevanz verschiedener Begriffe analysiert und in einem 3D-Modell visualisiert wird. Der SenseDetector zeigt damit die wichtigen Zusammenhänge zwischen den Dokumenten auf einen Blick und ermöglicht es so, schnell den wesentlichen Inhalt eines zu analysierenden Datenbestandes zu erfassen.



Darüber hinaus bietet Content Surveyor Möglichkeiten zur Inhaltsanalyse, indem Texte auf Wunsch zusammengefasst und Schlüsselwörter analysiert werden. Den Umfang der Zusammenfassung respektive die Anzahl der Schlüsselwörter kann der Anwender dabei frei wählen.



Insgesamt handelt es sich bei Content Surveyor um eine ausgezeichnete Möglichkeit, vorhandene Daten zu suchen und zu analysieren.



In der aktuellen Ausgabe eignet sich Content Surveyor allerdings vor allem für KMU und Einzelplatzsysteme. Eine Version, die den Bedürfnissen von grösseren Firmen mit umfangreichen Datenmengen gerecht wird, ist bei NeuroPower derzeit in Arbeit.



Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER