pts20030303012 Medien/Kommunikation, Technologie/Digitalisierung

OmniPaper Konsortium mit ersten Projektergebnissen

pressetext.austria in der europäischen Forschung auf Erfolgskurs


Wien (pts012/03.03.2003/08:30) Ein XML/SOAP-basierter Zugriff auf assoziierte Zeitungsarchive in mehreren Ländern stellt das erste wesentliche Teilergebnis des von der Europäischen Union (IST-Programm) geförderten Forschungsprojekts OmniPaper http://www.omnipaper.org dar, zu dem die internet-basierte Nachrichtenagentur pressetext.austria einen gewichtigen Anteil beisteuert. Das internationale Forschungskonsortium, das seit Januar 2002 an der Entwicklung eines transeuropäischen Nachrichtenarchivs arbeitet, hat somit die Möglichkeit, auf einen Testpool von mehr als 8 Millionen Dokumenten zentral zuzugreifen und diese unter Verwendung von künstlicher Intelligenz und linguistischer Ressourcen für den Endbenutzer weiter aufzubereiten.

"Für uns war es wichtig, eine universell anwendbare Lösung zu schaffen, die minimalen Eingriff in bestehende Archive bei gleichzeitiger Optimierung der Weiterverwendbarkeit der Ergebnisse bietet", erklärt Dr. Markus Schranz, technischer Direktor des Projekts und Vorstand von pressetext.austria. Als besondere Herausforderung beschreibt er die verschiedenen Strukturen und technischen Voraussetzungen der assoziierten Archive in Österreich, Spanien und Belgien.

Das jetzt entwickelte System greift unter Verwendung von SOAP auf bestehende Nachrichten zu und liefert zur elektronischen Weiterverwendung Datensätze in standardisiertem XML-Format. Enthaltener Volltext und Metainformationen zum Artikel bilden die Grundlage für die im Rahmen des Projekts zu entwickelnde automatische Kategorisierung und Beschlagwortung. Diese digitale Bearbeitung ermöglicht einen inhaltlichen Bezug zwischen Artikeln, unabhängig von der Sprache in der sie vorliegen.

Das Konsortium wird in einem nächsten Schritt für diesen Zweck entwickelte Prototypen hinsichtlich ihrer Effizienz und Treffergenauigkeit evaluieren. Es zeichnet sich ab, dass ein kombinierter Zugang aus statistischen, also auf Wortfrequenzen basierenden und linguistischen Ansätzen der künstlichen Intelligenz Verwendung finden wird.

"Der Nachrichten- und Informationsmedienbereich hat eigene Gesetze", erklärt die in die Umsetzung involvierte Prof. Ana Garcia-Serano von der Technischen Universität Madrid, "das OmniPaper System wird die vorhandene Dynamik und permanent wachsende Menge von Information in einem bisher noch nicht gekannten Ausmaß integrieren und berücksichtigen".

Hintergrundinformation:
Das OmniPaper Projekt wurde von der Katholischen Universität Leuven http://www.docarch.be ins Leben gerufen. Das Konsortium besteht aus acht Partnern in vier Ländern, Leuven ist Projektkoordinator, pressetext.austria http://www.pressetext.at verantwortlich für die technische Umsetzung. Zielsetzung ist die Entwicklung einer Internet-Portalseite, von der aus der Zugriff auf bestehende Nachrichtenarchive ermöglicht wird. Die Zeitungsartikel werden dabei unter Verwendung von Metadaten-Standards wie RDF und Topic Maps miteinander verlinkt.

Eine Besonderheit stellt die Fähigkeit des Systems dar, sich selbst durch Verwendung von Informationen aus dem laufenden Betrieb zu verbessern. So wird im Rahmen der automatischen Kategorisierung und Beschlagwortung die Aktualität von Themen in Regionen berücksichtigt und das Benutzerverhalten für eine Verbesserung der Ergebnisqualität ausgewertet.

"Für uns ist es wichtig, bei technischen Entwicklungen im Nachrichtenbereich in Europa an vorderster Front dabei zu sein", meint pressetext-Vorstand Dr. Franz Temmel. Er sieht die Investition in Innovation als wesentliche Grundlage für die Unternehmensphilosophie der Internetnachrichtenagentur, die ihre europaweiten Aktivitäten mit dem Launch des "Newsfox" Services gerade weiter ausgebaut hat.

An der Umsetzung des Projektes sind neben den Entwicklern von pressetext.austria auch die portugiesische Universität von Minho http://www.dsi.uminho.pt , die Technische Universität von Madrid http://www.isys.dia.fi.upm.es , das spanische Software-Unternehmen DAEDALUS http://www.daedalus.es , das österreichische CURE-Institut http://www.cure.at , das spanische Press Bulletin Service MyNews http://www.mynewsonline.com und der belgische Presseservice Mediargus http://www.mediargus.be beteiligt.

OmniPaper ist bereits das zweite EU-Projekt, an dem pressetext.austria beteiligt ist. Wichtige Erfahrungen im Projektmanagement sammelte das Technik-Team der Online-Nachrichtenagentur seit 1999 beim Info 2000-Projekt FIRM online, aus dem ein Prototyp für paneuropäische Unternehmensgründer hervorging.

(Ende)
Aussender: pressetext corporate news
Ansprechpartner: Christof Grossfurtner
Tel.: +43-1-811 40-304
E-Mail: grossfurtner@presstext.at
|