WWW.BOOK.DISLIB.INFO
FREE ELECTRONIC LIBRARY - Books, dissertations, abstract
 
<< HOME
CONTACTS



Pages:   || 2 | 3 | 4 | 5 |   ...   | 18 |

«Universität des Saarlandes Philosophische Fakultät III – Empirische Humanwissenschaften Fachrichtung 5.6 Informationswissenschaft Methodologie, ...»

-- [ Page 1 ] --

I

Universität des Saarlandes

Philosophische Fakultät III – Empirische Humanwissenschaften

Fachrichtung 5.6 Informationswissenschaft

Methodologie, Architektur und Umsetzung

eines webbasierten Fachinformationssystems

mit dem Beispiel Sprachtechnologie

Abschlussarbeit zur Erlangung des

akademischen Grades eines Magister Artiums (M.A.)

vorgelegt von

Brigitte Jörg

Erstgutachter: Prof. Dr. Harald H. Zimmermann

Zweitgutachter: Prof. Dr. Hans Uszkoreit

Saarbrücken, 31. Oktober 2003 II Die Magisterarbeit entstand im Rahmen eines vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projektes COLLATE – Förder-Nummer: 01 IN A01 A – am Deutschen Forschungszentrum für Künstliche Intelligenz in Saarbrücken.

III Eidesstattliche Erklärung Hiermit erkläre ich, dass ich die vorliegende Arbeit selbständig und ohne Benutzung anderer als der angegebenen Hilfsmittel angefertigt habe. Die Stellen, der Arbeit, die dem Wortlaut oder dem Sinn nach anderen Werken entnommen wurden, sind in jedem Fall unter Angabe der Quelle kenntlich gemacht. Die Arbeit ist noch nicht veröffentlicht oder in gleicher oder anderer Form an irgendeiner Stelle als Prüfungsleistung vorgelegt worden.

Saarbrücken, den 31.10.2003 IV Dank Mein ganz besonderer Dank gilt dem Leiter des Projektes, Herrn Prof. Dr. Hans Uszkoreit, der mir durch die wissenschaftliche Mitarbeit im Projekt nicht nur eine Tätigkeit in einem innovativen Forschungsgebiet, sondern auch diese Magisterarbeit überhaupt ermöglichte und mich in seiner Funktion als Betreuer fortwährend und anregend unterstützte, und damit wesentlich zum Gelingen der Arbeit beitrug.

Ebensolcher Dank gilt Herrn Prof. Dr. Harald H. Zimmermann für die Unterstützung, die wertvollen Anregungen und Gespräche zu Teilen der Arbeit, sowie die Zustimmung zur Kooperation zwischen der Sprachtechnologie und Informationswissenschaft.

Besonders danken möchte ich auch sämtlichen Kolleginnen und Kollegen für die produktive Zusammenarbeit und die zahlreichen Gespräche im Rahmen des Projektes, die nicht nur fachlich in diese Arbeit eingingen, sondern auch die Konzeption des Systems positiv beeinflussten. Für die ausführliche Beantwortung meiner Fragen zur technischen Implementierung bedanke ich mich besonders bei Witold Drozdzynski. Nicht vergessen möchte ich Tillmann Wegst, der die erste lauffähige Version des Systems realisierte. Für Informationen, welche die Aktivitäten von OLAC im Rahmen der OAI verdeutlichten, danke ich Thierry Declerck. Dank gilt auch der Infrastrukturgruppe (ISG) und insbesondere Oliver Welsch für die Bereitstellung der Shellskripte zur weitergehenden Analyse der Logfiles.

Textuelle Korrekturen verdanke ich der kompetenten Hilfe von Kerstin Klöckner.

Auch danken möchte ich den Experten, die ihre Fachkenntnisse in Form von Technologien bereitgestellt haben und damit das inhaltliche Angebot des Dienstes sehr bereicherten. Den Mitgliedern der Gruppe „LT News“, die regelmäßig Nachrichten sammlen, sei in diesem Sinne auch ein Dankeschön für die gute Zusammenarbeit ausgesprochen.

Nicht zuletzt möchte ich auch den studentischen und wissenschaftlichen Hilfskräften danken, welche die zahlreichen inhaltlicher Ressourcen in das System überführten: Elizabeth de Sousa Pinto, Mireia Farrús Cabececeran, Iris Kersten, Mirjam Kessler, Feilong Xu.

Die Arbeit wäre ohne die Hilfe der genannten Beteiligten in dieser Form und in diesem Umfang nicht zustande gekommen.

–  –  –

Inhaltsverzeichnis Abbildungsverzeichnis

Tabellenverzeichnis

Codeverzeichnis

Abkürzungsverzeichnis

1 Einleitung

1.1 Problemstellung

1.2 Motivation und Ziele

1.3 Hauptergebnisse

1.4 Aufbau der Arbeit

2 Stand der Forschung

2.1 Hintergründe und Vorarbeiten

2.1.1 Informationspolitik in der BRD

2.1.1.1 IuD-Programm 1974-1977

2.1.1.2 Fachinformationsprogramm 1985-1988

2.1.1.3 Fachinformationsprogramm 1990-1994

2.1.1.4 Information als Rohstoff für Innovation 1996-2000

2.1.1.5 Aktionsprogramm der Bundesregierung 2000-2005

2.1.2 Zusammenfassung

2.1.3 Fachinformationseinrichtungen

2.1.3.1 Fachinformationszentren

2.1.3.2 Fachinformationssysteme

2.1.3.3 Fachportale

2.1.4 Realisierte Beispiele

2.1.4.1 FIZ Karlsruhe

2.1.4.2 FIS-Bildung

2.1.4.3 multimedica – Medizin im Internet

2.1.5 Diskussion

2.2 Ordnungssysteme

2.2.1 Klassifikation

2.2.2 Thesaurus

2.2.3 Taxonomie

2.2.4 Ontologie

2.2.5 Topic Maps

2.3 Informatik-Technologien

2.3.1 Datenbanken

2.3.1.1 Relationale Datenbanksysteme

2.3.1.2 Objektorientierte Datenbanksysteme

2.3.2 Information Retrieval

2.3.3 XML

2.4 Methoden und Konzepte

2.4.1 Informationswissenschaft

2.4.2 Informatik

VI

2.4.3 Interdisziplinär

3 Bedarfsanalyse und Konzept-Entwurf

3.1 Projekt-Information

3.2 Ist-Analyse

3.2.1 ELSNET

3.2.2 HLTCentral

3.2.3 ACL…

3.2.4 Zusammenfassung

3.3 Soll-Konzept

3.3.1 Grobe Skizzierung des Systems





3.3.2 Zielgruppenbestimmung

4 Vorgehensweise

4.1 Thematisch offene Struktur und inhaltliche Beschränkung

4.1.1 Framework-Ansatz

4.1.2 Inhalte....

4.2 Konzeptuelle Systemsicht

4.2.1 Instanzen

4.2.2 Wissensbasis

4.2.3 Backend

4.2.4 Frontend

4.2.5 Schnittstellen

4.2.6 Funktionen

4.3 Datenzentrierte Systemsicht

4.3.1 Modularität

4.3.2 Daten.....

4.3.2.1 Struktur und Ordnungsprinzip

4.3.2.2 Erfassung und Pflege

4.3.2.3 Generierung der Wissensbasis

4.3.2.4 Präsentation

4.3.2.5 Identifikation

4.3.2.6 Anpassung und Erweiterung

4.3.3 Spezifikation

4.3.4 Schnittstellen

4.3.4.1 Suchmaschinen

4.3.4.2 Datenaustausch

4.3.4.3 Formate..

4.3.4.4 Validierung

4.3.4.5 Pull-Dienste

4.3.5 Funktionen

4.4 Präsentationssicht

4.4.1 Portal-Struktur

4.4.2 Layout...

4.4.3 Navigation

4.4.4 Themenspezifische Vorauswahl

4.4.5 Inhaltliche Spezifikation

4.4.6 Semantische Vernetzung

VII 4.4.7 Suchmasken

4.4.8 Portalbetrieb

4.5 Ontologische Modellierung des Systems

4.5.1 Strukturelle Elemente

4.5.1.1 Klassen

4.5.1.2 Properties

4.5.2 Immanente Prinzipien

4.5.2.1 Modularität

4.5.2.2 Identität

4.5.2.3 Vererbung

4.5.3 Repräsentations-Format

4.5.4 Weitergehende Logik

5 Umsetzung

5.1 Architektur

5.1.1 System-Spezifikation

5.1.1.1 Klassen-Systematik

5.1.1.2 Property-Systematik

5.1.2 Backend

5.1.3 Frontend

5.1.4 Funktionen

5.1.4.1 Systemimmanente-Funktionen

5.1.4.2 Support-Funktionen

5.1.5 Schnittstellen

5.1.5.1 Dublin Core Metadata Set

5.1.5.2 Open Language Archives Community

5.1.5.3 Datenaustausch

5.1.5.4 Pull-Dienst

5.2 Inhalte

5.2.1 Datensammlung

5.2.2 Erfassung und Pflege

5.3 Erfahrungen und Auswertung

5.3.1 Logfile-Analyse

5.3.2 Feedback

5.4 Übertragbarkeit

5.4.1 Methodologie

5.4.2 Systemarchitektur

5.4.3 Webbasierte Ausformung

6 Schlussfolgerungen und Ausblick

7 Anhang

–  –  –

Abbildungsverzeichnis Abbildung 1: Ordnungsprinzip Klassifikation

Abbildung 2: Ordnungsprinzip Thesaurus

Abbildung 3: Ordnungsprinzip Taxonomie gemäß Google (Ausschnitt)

Abbildung 4: Ordnungsprinzip Ontologie

Abbildung 5: Gesamt-Systemarchitektur (Graphik angelehnt an [Garshol 2002])..................32 Abbildung 6: Konzeptuelle Systemarchitektur mit dem Beispiel Sprachtechnologie..............33 Abbildung 7: Eigenschaften von Instanzen (Attribute und Relationen)

Abbildung 8: Externer Identifier

Abbildung 9: Portalstruktur

Abbildung 10: Navigationsleiste

Abbildung 11: Ontologische Klassenhierarchie (Protégé-Extrakt)

Abbildung 12: Kontrolliertes Vokabular (Protégé-Extrakt)

Abbildung 13: Semantic Web Architecture [Berners-Lee 2000]

Abbildung 14: Protégé-2000 Screenshot (Klassensicht + Slotsicht)

Abbildung 15: GUI zur Erfassung von Instanzen (Beispiel: Projekt)

Abbildung 16: Screenshot LT World (Kategorie: Projekte)

Abbildung 17: GUI zur Durchführung des URL-Checks

Abbildung 18: Ontologie-Ausschnitt (Protégé-Extrakt)

–  –  –

Tabellenverzeichnis Tabelle 1:Konzeptuelle System-Struktur [Capstick et. al. 2002]

Tabelle 2: Spezifikation zur Annotierung von Instanzen

Tabelle 3: Spezifikation der Inhalte im Webportal (Auszug)

Tabelle 4: Property-Definition für Backend_ResearchProject (Protégé-Extrakt)

Tabelle 5: LT World: Nutzungsstatistik (AWStats)

–  –  –

Codeverzeichnis Code 1: Semi-strukturierter XML-Markup (Elemente und Attribute)

Code 2: Struktur einer Instanz im XML-Format

Code 3: RDF Beschreibungslogik – Basic Abbreviated Syntax [Lassila+Swick 1999]..........42 Code 4: Dublin Core Annotierung innerhalb eines HTML Dokumentes (Quellcode).............46 Code 5: Annotierte Projekt-Instanz im XML Format (Extrakt)

Code 6: XML Schema zur Validierung von Projekt-Instanzen (Extrakt)

Code 7: RDF Schema (Extrakt)

Code 8: OWL-Syntax (Projekt-Extrakt)

Code 9: Protégé Hilfs-Präfix (über RDF Schema hinaus an OWL orientiert)

–  –  –

1 Einleitung Die Globalisierung der Wissenschaft und Technologieentwicklung erfordert für die einzelnen Disziplinen und Technologiebereiche neue Methoden im Informations- und Wissensmanagement. Letztendlich entscheidet ein schneller Technologietransfer über den Erfolg im globalen Wettbewerb. Neben den Wissenschaftlern und Technologen, die ohne entsprechende Informationsdienste die Breite ihres Faches sowie Forschungsaktivitäten auf internationaler Ebene kaum mehr überblicken können, sind es zunehmend Fachjournalisten, Analysten, Investoren, Berater und Planer in Unternehmen und Politik, sowie insbesondere Klein- und Mittelständische Unternehmen, die auf informationelle Mehrwerte angewiesen sind, und gezielt sowie zeitnah über Ereignisse, neue Entdeckungen und Entwicklungen informiert sein wollen.

Durch das Internet und besonders das WorldWideWeb ergeben sich einerseits neue Möglichkeiten zur Befriedigung des Informationsbedarfs, andererseits erfordert die optimale Nutzung des Mediums aber auch neue Konzepte für die Gestaltung der Informationsdienste. Von 50% der vernetzten Deutschen nutzen 42% das Internet täglich [@fact 2003], den Zugang zu Inhalten erhalten sie vorwiegend über Suchmaschinen [BMBF 2001]. Dabei sind sie als Nutzer mit den erzielten Ergebnissen oft nicht zufrieden. Studierende beklagen insbesondere die Unübersichtlichkeit der Angebote und sehen sich außerstande, die Qualität und Bedeutung der gefundenen Ergebnisse zu bewerten – auch Dozierende finden sich schwer zurecht [BMBF 2001, S. 4].

1.1 Problemstellung Mit dem neuen Medium kann jeder zur Verbreitung von Wissen beitragen. Das bedeutet, dass nicht nur die Menge der Publikationen ständig und rasch ansteigt, sondern auch, dass aufgrund der wachsenden Menge, die Identifikation relevanter Inhalte immer schwieriger wird. Besonders für Suchmaschinen, die einen universellen Anspruch verfolgen und sämtliche erreichbaren Inhalte ohne thematische oder fachliche Eingrenzung, vorwiegend keyword-basiert indexieren, steigt mit Zunahme der Publikationen ebenso die Schwierigkeit hinsichtlich einer Bewertung.

Darüberhinaus erzeugt die immanente Dynamik der Dokumente und Strukturen Ungewissheit auf Seiten der Nutzer.



Pages:   || 2 | 3 | 4 | 5 |   ...   | 18 |


Similar works:

«SBORNÍK PRACÍ FILOZOFICKÉ FAKULTY BRNĚNSKÉ UNIVERZITY STUDIA MINORA FACULTATIS PHILOSOPHICAE UNIVERSITATIS BRUNENSIS S 2, 1996 — BRNO STUDIES IN ENGLISH 22 STEVE HARDY PLACE AND IDENTITY IN CONTEMPORARY BRITISH FICTION 1. The construction, maintenance and even renewal of identity in relation to place would seem to be an increasingly significant aspect of thought and behaviour in Europe, if not further afield. I wish here to make a number of observations about some aspects of recent...»

«Copyright Philosophy of Science 2014 Preprint (not copyedited or formatted) Higgs Discovery and the Look Elsewhere Effect Richard Dawid Ludwig Maximilian University Munich email: Richard.dawid@univie.ac.at The discovery of the Higgs particle required a signal of five sigma significance. The rigid application of that condition is a convention that disregards more specific aspects of the given experiment. In particular, it does not account for the characteristics of the look elsewhere effect in...»

«Das westgotenzeitliche Gräberfeld von Madrona (Segovia, Spanien) Textband Inaugural-Dissertation zur Erlangung der Doktorwürde der Philosophischen Fakultät I der Julius-Maximilians-Universität zu Würzburg und der Philosophischen Fakultät der Universidad Autónoma de Madrid Vorgelegt von Antonel Jepure aus Würzburg Würzburg / Madrid Erstgutachter: Professor Dr. Wolfram Schier Zweitgutachter: Professor Dr. Erika Simon Tag des Kolloquiums: 30. Juni 2006 Das westgotenzeitliche Gräberfeld...»

«® Predictive Homoeopathy Beyond Limits Dr. Prafull Vijayakar Regensburg, May 2012 Script Renate Greißl Contents Page 17.05.2012 Greeting and Philosophy 1 Dr. Vijayakar´s journey as a Homoeopath 3 Illness is a chain 5 Development of a human being 7 How to approach different cases 14 Case 1 – Acute emergency – Stramonium 15 Differentiation – Remedies in Panic attacks 20 How to decide on a Similimum 24 Case 2 – Nephrotic Syndrome – Sulphur 26 Differentiation – Angry remedies 30 Case...»

«Étienne Balibar Friedrich A. Kittler Martin van Creveld Vom Krieg zum Terrorismus? Mosse-Lectures Winter 2002/2003 Humboldt-Universität zu Berlin Philosophische Fakultät II Institut für deutsche Literatur Die Mosse-Lectures werden gefördert von Hans K. Röder, Mosse-Zentrum Berlin und der Hilde Mosse Foundation, New York Die digitalen Ausgaben der Öffentlichen Vorlesungen sind abrufbar über den Dokumentenund Publikationsserver der Humboldt-Universität unter: http://edoc.hu-berlin.de...»

«The View from Elsewhere: Perspectives on ALife Modelling Michael Wheeler1, Seth Bullock2, Ezequiel Di Paolo3, Jason Noble4, Mark Bedau5, Philip Husbands6, Simon Kirby7, and Anil Seth8 9 Department of Philosophy, University of Dundee, UK. m.w.wheeler@dundee.ac.uk Informatics Research Institute, School of Computing, University of Leeds, UK. seth@comp.leeds.ac.uk School of Cognitive and Computing Sciences, University of Sussex, UK. ezequiel@cogs.susx.ac.uk Informatics Research Institute, School of...»

«Diplomarbeit Titel der Diplomarbeit Stifter am Throne Christi: Das Mosaik von Zoë und Konstantin IX. Monomachos auf der Empore der Hagia Sophia in Istanbul Zoë 1028 1050, Christus und Konstantin IX. Monomachos 1042 1055 Verfasserin Maria Gabriele Schreidl-Rannegger angestrebter akademischer Grad Magistra der Philosophie (Mag. Phil.) Wien, 2012 Studienkennzahl A 315 Studienrichtung Kunstgeschichte Betreuerin Univ. -Prof. Dr. Lioba Theis Seite 2 1. Vorwort 5 2. Einleitung 7 3. Die Freilegung...»

«Die literarische Problematisierung des Einflusses der christlichen Religion auf das indianische Selbstbild im Romanwerk von D'Arcy McNickle, Paula Gunn Allen, N. Scott Momaday und Louise Erdrich Inauguraldissertation zur Erlangung der Würde eines Doktors der Philosophie an der Fakultät Sprachund Literaturwissenschaften der Technischen Universität Dresden vorgelegt von Almuth Roenneke aus Halle (Saale) Halle, den 05.11.2001 Erklärungen der Kandidatin Hiermit erkläre ich, dass ich die...»

«Europäisches Festival des Debütromans 2014 Festival Européen du Premier Roman 2014 Kiel – Literaturhaus S-H 15. 18. Mai 2014 Autoren – Texte – Programm Eine Veranstaltung des Literaturhauses Schleswig-Holstein und des Centre Culturel Français de Kiel Herausgeber: Literaturhaus Schleswig-Holstein, Institut Français | Centre Culturel Français de Kiel Projektmitarbeit: Patricia Schöning und Marie Sudau Textredaktion: Patricia Schöning Umschlaggestaltung: Eckstein & Hagestedt Druck:...»

«Kosmos und Kopf Die Sichtbarkeit des Weltbildes Steffen Siegel I Die Darstellung einer Vision der heiligen Hildegard von Bingen aus dem 12. Jahrhundert; der Zodiakus-Mann aus dem Stundenbuch des Duc de Berry, gefertigt von den Brüdern Limbourg im zweiten Jahrzehnt des 15. Jahrhunderts; das Aderlassblatt aus einem in Basel gedruckten Kalender von 1499; Leonardos berühmte, nur wenige Jahre zuvor entstandene und an Vitruv anschließende Proportionszeichnung des menschliche Körpers; oder auch...»





 
<<  HOME   |    CONTACTS
2016 www.book.dislib.info - Free e-library - Books, dissertations, abstract

Materials of this site are available for review, all rights belong to their respective owners.
If you do not agree with the fact that your material is placed on this site, please, email us, we will within 1-2 business days delete him.