GTranslate

Open Source Projekt - Informationsagent

Im Rahmen des Open-Source-Projekts soll ein Programm zur vollautomatischen Informationsbeschaffung entstehen, das anstelle des Benutzers bestimmte Informationen auffindet. 

Falls Sie sich lieber in aller Ruhe offline über die hier beschriebene Projektidee informieren wollen, so können Sie das entsprechende PDF-Dokument zum Ausdrucken und Offline-Lesen herunterladen.


Das PDF-Dokument bzw. beliebige Textabschnitte oder Bilder dieses Dokuments können Sie mit individuellen Kommentaren versehen oder eigene Dateien/Dokumente anhängen. Dazu benötigen Sie allerdings eine aktuelle Version des kostenlosen Adobe Readers (mind. Version 7.0) oder den Foxit Reader.

Zielgruppe Bildlink-Pfeil

An dem Open-Source-Projekt können sich alle beteiligen, die mithelfen möchten, eine Software zu entwickeln, mit der die Informationsbeschaffung im Internet vereinfacht wird.

Das Entwickler-Netzwerk eines Open-Source-Projekts wird nicht von einigen wenigen Experten getragen, sondern von allen, die etwas Sinnvolles beizutragen haben, sei es die Idee eines Entwicklers, wie man eine bestimmte Funktion realisieren kann oder der Wunsch eines Anwenders, die aktuelle Software um eine bestimmte Funktion zu erweitern. 

Die Grundlage des Netzwerks ist, daß alle Teilnehmer motiviert sind, weil sie ihr gemeinsames Ziel kennen, den Weg wissen, wie sie das Ziel erreichen können und davon überzeugt sind, daß es sich lohnt, das Ziel zu erreichen. 

Dieses gemeinsame Ziel ist beispielsweise, die bestmögliche Lösung für ein Problem zu finden und das persönliche Wissen zu einem bestimmten Thema zu erweitern. Der Weg ist in der Regel die konstruktive Zusammenarbeit der betreffenden Teilnehmer, die wiederum auf offenem Wissensaustausch, gegenseitiger Anerkennung und dem Gefühl beruht, daß den einzelnen Teilnehmer die Zusammenarbeit innerlich reicher macht.

Kurzbeschreibung Bildlink-Pfeil

Die Idee:

Im Rahmen des Open-Source-Projekts soll ein Programm zur vollautomatischen Informationsbeschaffung entstehen, das anstelle des Benutzers bestimmte Informationen auffindet. 

Praxisnahe Beschreibung der Idee: 

Was muß ein Programm für die vollautomatische Informationsbeschaffung grundsätzlich können ?

Nachdem Sie als Benutzer der Maschine mitgeteilt haben, welche Informationen Sie benötigen, führt diese die Informationsbeschaffung weitestgehend selbständig an Ihrer Stelle durch. 

Das Programm greift dabei auf einen umfassenden Bestand an Informationsquellen (individuelle Internetquellensammlung, lokale auf dem Rechner gespeicherte Informationen/Quellen, externe auf einem Internet-Server gespeicherte Informationen/Quellen) zu. Das Programm muß in der Lage sein, im Sinne seines Anwenders, aber auch im entsprechenden Falle selbständig zu entscheiden, welche Informationsquellen (Datenbanken, Kataloge, Websites, Datenarchive von Newslettern oder Diskussionsforen,...) die jeweils gewünschte Information am ehesten liefern können und die betreffende Quelle dann auch dazu verwenden, um Antworten auf bestimmte Fragestellungen zu finden. Vor allem aber muß die Maschine in der Lage sein, die Relevanz und Qualität der gefundenen Information/Informationsquellen im Sinne des Benutzers zu bewerten. Am Ende der Recherche listet die Maschine die gefundenen Treffer nach Relevanz und Herkunft geordnet im Suchergebnis auf und ist darüber hinaus in der Lage, grob zu beschreiben, warum sie den Treffer für relevant bewertet hat.

Im Grunde sollte die Maschine die Internetdienste genauso effektiv und sicher nutzen können wie ein kompetenter Anwender mit Hilfe seiner Internetquellensammlung. Da dieses Programm, wie ein Agent, eine Aufgabe im Auftrag eines anderen erledigt, wird es auch als Informationsagent bezeichnet. Dieses Programm arbeitet eng mit seinem Benutzer zusammen, das bedeutet , es lernt von ihm, stellt Rückfragen, macht ihm Vorschläge und versucht, möglichst alles so zu machen, wie er es machen würde.


In der nachfolgenden Beschreibung finden Sie nur einen Ausschnitt aus der gesamten Beschreibung des Konzepts für einen Informationsagenten. Die Beschreibung des gesamten Konzepts finden Sie in der bereits am Anfang des Dokuments genannten Detail-Beschreibung des Agenten (Download), wobei natürlich auch diese nur eine grobe Beschreibung des gesamten Konzepts ist. Viele Detailideen und vor allem die Arbeit, um diese Ideen in die Tat umzusetzen, muß von Ihnen geleistet werden.  


Für die Realisierung der Maschine zur vollautomatischen Informationsbeschaffung müssen folgende Grundbedingungen erfüllt sein:

  • Der Agent muß auf den Technologien des Semantic Web basieren. Die Intelligenz muß von den Menschen erbracht werden, die den Maschinen die Inhalte ihrer Informationen verständlich und auswertbar machen. 

  • Der Benutzer kann genau vorgeben, in welchen Quellen der Agent nach den benötigten Informationen suchen und nach welchen Bewertungskriterien er die gefundenen beurteilen soll.

  • Die personenbezogenen Daten und das Nutzerprofil des Benutzers sind ausreichend geschützt (Verschlüsselung und Signierung,...). 


    Da der Quellcode bei Open-Source-Projekten allen zugänglich ist, können alle i nteressierten und fachkundigen Anwender den Code im Detail nach möglichen Sicherheitslücken überprüfen. Außerdem kann so bestmöglichst verhindert werden, daß der Agent als (globale) Zensurmaschine mißbraucht werden kann.

  • Die Funktions- und Arbeitsweise des Agenten ist für den Benutzer so transparent wie möglich.

  • Meinem Konzept entgegen steht ein hinter verschlossenen Türen programmierter Informationsagent, der ohne Mitbestimmung des Benutzers selbständig nach Informationen im "Semantic Web" sucht. Das bedeutet, der Agent entscheidet, wo gesucht wird und welche Informationen relevant und qualitativ hochwertig sind. Das birgt nicht nur die Gefahr, daß der Agent als effektive Zensurmaschine mißbraucht werden kann, sondern wäre ein Schritt mehr in eine Welt, in der Menschen ihre eigentlich vorhandenen Kompetenzen an Maschinen abgeben. Die Welt braucht aber, um ihre Probleme zu lösen, keine Maschinen, sondern selbstbestimmte und selbstorganisierte Menschen.  


    In diesem Zusammenhang empfehle ich Ihnen, den Artikel "Können Maschinen Probleme lösen ?" zu lesen.


Konkurrenzprodukte und Basistechnologien für den Informationsagenten

Bevor man ein eigenes Produkt mühsam entwickelt, ist es natürlich sinnvoll, zu überprüfen, ob es nicht schon ein fertiges Produkt, das den grundsätzlichen Anforderungen genügt, zu mieten bzw. zu kaufen gibt. Möglicherweise kann dieses Produkt dann als Basis für den Informationsagenten dienen und durch entsprechende Verbesserungen und Ergänzungen an die eigenen Vorstellungen angepaßt werden.

Bei einer Recherche (Stand: Dezember 2004) nach zum damaligen Zeitpunkt aktuell auf dem Markt befindlichen Informationsagenten konnte ich keinen Agenten finden, der sich am Markt wirklich durchsetzen konnte. Auch eine Recherche nach patentrechtlich geschützten Ideen zur Umsetzung eines Informationsagenten lieferte keine brauchbaren Ergebnisse. 
Bereits vorhandene Technologien zur Informationsbeschaffung (Natural Language Search, Phonetische Analyse, Visualisierung des Hypertextgeflechts,...) sollten soweit wie möglich in den Agenten integriert und genutzt werden (Stichwort: Module). Einige interessante Technologien, die zur Realisierung des Informationsagenten verwendet werden könnten, finden Sie in der Detail-Beschreibung des Agenten ( Download).  

Das Agentenkonzept soll so ausgelegt werden, daß neue Technologien ergänzend integriert und veraltete einfach entfernt werden können. Außerdem sollte auf Schnittstellen- und Syntaxänderungen der Suchdienstanbieter lokal ohne großen Aufwand reagiert werden können.

Die Auswahl und Entscheidung für bestimmte hierfür erforderliche Technologien wurde noch nicht getroffen. Das bedeutet, daß bisher auch keine entsprechenden Spezifikationen oder Dokumentationen von Software- und Hardware-Herstellern oder anderen Organisationen vorliegen , die wichtige, für den Informationsagenten relevante technische Standards entwickelt haben. 
Dies ist jedoch kein grundsätzliches Problem, da die Basistechnologie des Informationsagenten auf den technischen Standards des "Semantic Web" beruht und damit die grundsätzliche Entwicklung des Agenten nicht von noch unbekannten Technologien abhängig ist.


Wichtige Teilaufgaben (Funktionen) des Informationsagenten:

Für die erfolgreiche Suche muß der Informationsagent:

vor der Suche wissen:

  • was er genau sucht 

  • wo er sucht 

  • wie er mit der gewählten Informationsquelle sucht 

während und nach der Suche wissen:&nb

  • wie er auf Fehler reagieren kann, die während der Suche auftreten können  

  • wie er die Relevanz und Qualität der gefundenen Informationen/Informationsquellen richtig bewertet 

...dem Benutzer eine einfache Möglichkeit bieten, die relevanten Informationen/Informationsquellen so abzuspeichern, daß er sie später leicht wieder auffinden kann

...für eine sichere Nutzung der Internetdienste muß er weiterhin geeignete Schutzmaßnahmen treffen, um den Benutzer vor den Sicherheitsrisiken zu schützen, die mit dem Anschluß an das weltweite Netzwerk "Internet" verbunden sind

Die vorher erwähnten Fähigkeiten gehören zum Grundlagenwissen; reicht dieses aber nicht mehr aus, so muß die Maschine bzw. der Agent in der Lage sein, sich selbständig weiteres Wissen anzueignen, das notwendig ist, um die gewünschte Information zu beschaffen .  


Eine genaue Beschreibung der einzelnen Teilaufgaben, wie diese vom Agenten gelöst werden können, und eine kritische Betrachtung der jeweiligen Lösung finden Sie in der Detail-Beschreibung des Agenten ( Download).  

Wie können meine Produkte und Dienste bei der Lösung der Teilaufgaben helfen ?

Der Lehrgang bzw. die darin formulierte Wissensstruktur, insbesondere aber die dort beschriebenen Suchmethoden können als Basis für eine themen-/fachübergreifende Ontologie dienen, mit deren Hilfe ein Informationsagent, der auf den Technologien des Semantic Web basiert, vorhandene Internetquellen selbständig oder wie vom Benutzer vorgegeben auswählen und für die Recherche nutzen kann. 

Die im Lehrgang beschriebenen Bewertungsmethoden und -kriterien können ebenfalls als Basis für eine themen-/fachübergreifende Ontologie dienen, mit deren Hilfe der Agent neue Internetquellen suchen und selbständig oder wie vom Benutzer vorgegeben hinsichtlich ihrer Relevanz und Qualität bewerten kann. Für den Benutzer, der die Inhalte des Lehrgangs kennt, hat dies den Vorteil, daß er grundsätzlich weiß, was die Maschine tut. 

Als optimale Startpunkte für tiefergehende Recherchen, die der Agent anstelle seines Benutzer durchführt, dienen vielfältige und qualitativ hochwertige spezielle Such- und Bewertungsdienste, die von vielen unterschiedlichen, voneinander unabhängigen Anbietern (und letztendlich auch Anwendern) betrieben werden (siehe meine Existenzgründungsidee). Mit Hilfe gemeinsamer Web- Standards und den für den effektiven Datenaustausch geeigneten, offenen Schnittstellen (Stichwort "XML"), könnte der Informationsagent auf eine qualitativ hochwertige und mit Metadaten (Stichwort: Semantic Web) beschriebene Auswahl von Internetquellen zugreifen.

Darüber hinaus dient der in den Agenten integrierte Lehrgang dem Benutzer als Berater, beispielsweise in dem der Agent nützliche Quellen für einen bestimmten Bedarf vorschlägt und als maschinelle Gedächtnishilfe. Die Vorschläge bezüglich relevanter Internetquellen könnten dabei direkt aus meinem Lehrgang entnommen werden. 

Meine Produkte und Dienste liefern darüber hinaus weitere wichtige Erfahrungen und Erkenntnisse, die in die Entwicklung des Informationsagenten mit einfließen können.


Layout der Programmoberfläche

Es steht noch nicht fest, wie die Programmoberfläche zur Bedienung des Programms aussehen soll. Diese soll erst nach und nach während der Programmierung des Informationsagenten entwickelt werden. 


Bisher ist das grob beschriebene Konzept eines Informationsagenten nur eine Idee, die aber, wenn die entsprechenden Voraussetzungen (freiwillige und kompetente Helfer) erfüllt sind, jederzeit in die Praxis umgesetzt werden kann.

Nutzen Bildlink-Pfeil

Da das Internet bzw. die Menge der dort veröffentlichten Informationen mit hoher Geschwindigkeit weiterwächst, wird die Bedeutung von Maschinen, die den Menschen beim Auffinden von bestimmten Informationen unterstützen, ebenfalls zunehmen. Wie die kritische Betrachtung der aktuell erfolgreichsten Suchmaschine "Google" gezeigt hat, erfüllt diese keine der Teilaufgaben zur Informationsbeschaffung wirklich zufriedenstellend und einige gar nicht. Die mit der Volltextsuche und universellen Bewertungsmethoden arbeitenden Suchmaschinen können das Problem der Informationsflut offensichtlich nicht lösen, sondern verstärken es in vielen Fällen. 

Eine erfolgversprechende Alternative bieten Informationsagenten, die auf der Basis der "Semantic Web"-Technologien arbeiten. Besonders interessant wäre ein funktionierender Informationsagent für weniger versierte Anwender, die sich die benötigten Informationen dann vom Agenten beschaffen lassen können, und für die automatische Informationsbeschaffung innerhalb eines Unternehmens.  

Der Informationsagent könnte beispielsweise die Mitarbeiter automatisch mit den jeweils für sie relevanten Informationen (ausgewählt aufgrund eines individuellen Informationsbedarfsprofils) versorgen. Damit der Agent allerdings effektiv eingesetzt werden kann, bedarf es einer gemeinsamen Unternehmenssprache und -kultur (Stichwort: Wissensmanagement).  

Das eingesetzte System muss auf den Technologien des "Semantic Web" basieren. Dies hat den großen Vorteil, daß die maschinelle Informationsbeschaffung aus Quellen des lokalen Intranets, wenn das Semantic Web entsprechend weit entwickelt ist, einfach von diesen auf die relevanten Quellen des Internet ausgedehnt werden könnte. Gegebenenfalls könnte der Agent dann auch die individuelle Internetquellensammlung automatisch zusammenstellen und aktualisieren.

© Martin Glogger
www.onlinetechniker.de

Share/Save
Kommentar hinzufügen
Der Inhalt dieses Feldes wird nicht öffentlich zugänglich angezeigt.
  • Internet- und E-Mail-Adressen werden automatisch umgewandelt.
  • Zeilen und Absätze werden automatisch erzeugt.
CAPTCHA
Diese Frage hat den Zweck zu testen, ob man wirklich ein menschlicher Benutzer ist und damit automatisierten Spam vorzubeugen.
Bild-CAPTCHA
Enter the characters shown in the image.

                      


Powered by Drupal - Design by artinet