VO+UE 5.7 Information und Dokumentation 609019
Lektor Herwig Jobst
- 1996-10-08 Einführung, Grundlagen, Literaturempfehlungen
- 1996-10-15 Arten von Dokumenten
- 1996-10-22 (Internet-Referat)
- 1996-10-29 Folgen der digitalen Revolution
- 1996-11-05 Weitere Konsequenzen der digitalen Revolution
- 1996-11-19 Beurteilung der Qualität von Veröffentlichungen, Formale Erfassung
- 1996-11-26 Verfahren der inhaltlichen Erschließung
- 1996-12-03 Verfahren der inhaltlichen Erschließung
- 1996-12-10 Dokumentationssprache
- 1996-12-17 Auswertung der Übungsarbeiten
- 1997-01-14
- 1997-01-28 Prüfung
- 2000-01-25 Prüfung (Wintersemester 1999/2000)
Informationen zum Tutorium
Literatur:
(Hrsg.) Buder/Rehfeld/Seeger: Grundlagen der prakt. Information und Dokumentation 3. Aufl. 1990
Henzler, Rolf: Information und Dokumentation 1992
Zeitschriften:
Nachrichten für Dokumentation zweimonatl.
cogito zweimonatl.
password
FDZ - Fakten, Daten, Zitate 4mal im Jahr
VöB-Mitteilungen (Verein öst. BibliothekarInnen) Anhang: Online-Mitteilungen 4mal im Jahr
Der Weg der Informationsübermittlung zwischen Produzenten und Konsumenten
- direkter Weg (Uni, sonst kaum)
- indirekt:
- Buchhandel
- Institutionen (Bibliotheken)
Verlauf der Informationsübermittlung zwischen Produzent und Konsument
- Dokumenttyp
- 90 % der wissenschaftlichen Information auf Papier
- digitalisierte Dokumente (Digitalisierung: Text, Bild/Video, Ton werden nicht mehr analog, sondern digital
angeboten). Digitalisierte Information muß nicht mehr konvertiert werden (wenn das alte Format noch lesbar ist)
und kann ohne Verlust reproduziert werden.
- Multimedia: zusammengesetzte Dokumente
- Hypertext, -media
- Telekommunikation
- Vernetzung
- Ubiquität (Information überallhin transportierbar, wenn Netz vorhanden)
- Simultanität (Information sofort verfügbar)
- ohne Qualitätsverlust
Auswirkungen auf Information und Dokumentation:
- elektronisch publizieren
- Nachteile: 1. schwierig, ein Original zu finden. Wie schütze ich dieses? Autor bleibt auf der Strecke
(Copyright-Problem). 2. Lokalisierbarkeit (wie identifiziere ich die Quelle?)
- publishing on demand ("virtuelle" Dokumente) Auch hier Problem der Zurückverfolgung.
- Dokumente stehen als Volltext zur Verfügung. (Suchmöglichkeit!)
1996-10-22 Referat über Internet
PCM - Online-Magazin
1996-10-29 Folgen der digitalen Revolution
- Neue Vertriebswege entstehen (Informationsproduzent kann sich direkt an die Konsumenten wenden und umgekehrt;
Datenbanken: IVS (Informationsvermittlungsstelle: führt Recherchen in internationalen Datenbanken durch)):
"Entinstitutionalisierung": Vermittler werden unwichtiger, Benutzer wird Rechercheur.
- Information Broker: suchen für andere gegen Entgelt nach Informationen (Value added services)
- Vertikale Konzentration, vertikale Integration (horizontale auch, wenn sich Anbieter fusionieren)
- Arbeitsorganisation in Informationseinrichtungen ändert sich. (Information aus externen Datenbanken:
Vermittler kennt die Information nicht (was drinnen ist, in welcher Form); Kontrolle über Input und Output geht
verloren; kein Feedback von den Benützern)
- Arbeitsweise ändert sich: Expertensysteme ("AI") kommen zunehmend zum Einsatz (z.B. formale Erfassung eines
Zeitungsartikels: aus Quelle, Jahrgang, Autor, Titel usw. wird Karteikarte generiert) Voraussetzung:
Automatisierbarkeit der Tätigkeit. Inhaltliche Erschließung heute eingeschränkt möglich. "Agenten"
für Suche im Netz. "Gläserner Surfer"!
Übung: OPAC der Uni-Bibliothek: BIBOS mit konventionellem Katalog (Literatur in Kartei bis 1988)
oder mit anderem OPAC vergleichen und gegenüberstellen. Gesichtspunkte: Zugänglichkeit, Verfügbarkeit,
Einstieg (gibt es Unterstützung, Führung, Hilfe), Output. Tabellarisch, pro/kontra oder als Aufsatz. Bis zum
10. 12. 1996.
1996-11-05 Weitere Konsequenzen der digitalen Revolution
- Informationsauswahl und -zusammenfassung ist kommerziell verwertbar und auch urheberrechtlich geschützt.
- Trend von der Literaturdokumentation zur Faktendokumentation/Datendokumentation
- Informationsdesign: Aufbereitung von elektronischen Dokumenten -> Multimedia, um größere Akzeptanz zu
erreichen.
- Information wird zunehmend in die Bürokommunikation integriert.
- Kommerzialisierung
Emanzipation des Benutzers von Information und Dokumentation-Stellen kann auf zwei Arten erfolgen: online oder
offline.
1996-11-19
Informationsflut, Publikationsflut
Wie bewertet mensch die Qualität von Information, von Informationsdiensten?
Erster Ansatz: Veröffentlichungen zählen.
Genauere Methode: Anzahl der Zitierungen des Werks ermitteln. Wenn ein Werk wirklich von der wissenschaftlichen Welt
aufgenommen wurde, wird es auch zitiert.
Science Citation Index (SCI), Social Science Citation Index, Arts & Humanities SCI. Größte Bedeutung
bei den Naturwissenschaften, weil diese am meisten auf die angelsächsische Welt zugeschnitten sind.
Mögliche Verfälschungen:
- mechanisches Zitieren durch die Rezipienten (bekannte Autoren werden häufiger zitiert)
- unterlassenes Zitieren
- inkompetentes Zitieren (Verweis auf Sekundärarbeit anstelle der Originalversion)
- falsches Zitieren (durch Verwechslung)
- "Gefälligkeitszitierungen" ("Zitierkartell")
- Reputierte Wissenschaft hat aufgrund ihrer Reputation eine größere Chance, zitiert zu werden.
Methoden gegen die Verfälschungen:
- z.B. Herausnehmen von Eigenzitaten
Wichtiges Kriterium bei der Bewertung von Artikeln in Zeitschriften: Veröffentlichungsdatum. Versuche, die
"Halbwertszeit" der Information (der Zitierungen) zu bestimmen. Für naturwissenschaftliche Literatur angeblich ca.
5 Jahre. Weitere quantitative Methoden: Anzahl der Kopien und Entlehnungen.
"Citation Classics": Alte Veröffentlichungen, die immer wieder zitiert werden.
In Geistes- und Sozialwissenschaften spielen Classics eine größere Rolle und die Halbwertszeit ist
länger.
Formale Erfassung: Beschreibung eines Dokuments, um es wiederfinden zu können. ("B-Posten")
RAK: Regeln für die alphabetische Katalogisierung:
- Sachtitel + Verfasser
- Ausgabebezeichnung
- Erscheinungsvermerk (Ort, Verlag, Jahr, Druckort)
- Kollationsvermerke: Umfang, opt. Angabe von Illustrationen, Statistiken, Beilagen, sonst. Begleitmaterial
- Gesamttitel (bei Büchern in Reihen)
- Fußnoten
- ISBN (International Standard Book Number): X-YYYY-ZZZZ-N X: Land, geographischer Bereich (3: Deutscher Sprachraum);
Y: Verlagsnummer; Z: Titelnummer des Verlages; N: Prüfziffer. ISSN: International Standard Serial Number: für
Zeitschriften
Für audiovisuelle Medien andere Kriterien.
Inhaltliche Erschließung: Nötig, weil der Titel manchmal wenig aussagekräftig ist.
Großer Aufwand, sowohl zeitlich als auch intellektuell ("A-Posten"). Kommt in Zeiten der Volltextdatenbanken
immer mehr unter Beschuß, ist aber nötig, um die Terminologie zu standardisieren. Außerdem gibt es
sehr viele implizite Informationen, die im Volltext nicht erfaßt werden (z.B. in Zeitungsartikeln keine
Ortsangabe). Zeitinformationen schwer zu standardisieren.
Quick and Dirty-Prinzip: alles hineinbringen.
1996-11-26 Inhaltliche Erschließung
Dokumente im Volltext / Inhaltliche Erschließung: intellektuelle Arbeit / automatische
Inhaltserschließung: maschinell
Zwei Phasen der inhaltlichen Erschließung:
- Inhaltsanalyse: Dokument verstehen, Schlagwörter heraussuchen. Sprachliche und fachliche Kompetenz für
das Verständnis des Dokuments nötig.
- Hilfsmittel für das Erkennen des Inhalts (Es ist undurchführbar, den gesamten Text zu lesen): Titel;
Inhaltsverzeichnis; Inhaltsangabe am Rücken (aufpassen!); Abstract (in Zeitschriften); besonders hervorgehobene
Textstellen; Zielsetzung (in Zeitschriften); Zusammenfassung; Resümee; Literaturverzeichnis; Zitationsanalysen;
Register; Beigaben wie Tabellen, Abbildungen, Statistiken.
- Hauptthemen, Nebenthemen
- Aspekte (Zielsetzung, Theorien, Methoden, Resultate, mögliche Anwendungen, implizite Informationen)
- Bewertung des Inhalts (neutral: nicht Qualität, sondern Brauchbarkeit): Entscheidung, ob das Dokument für
die eigene Informationssamlung interessant ist, und mit welcher Intensität es erschlossen werden soll.
- Kriterien: Neuigkeitswert, Aktualität, Informatorische Lebensdauer (wie lange bleibt das Werk aktuell?),
Qualität, Relevanz für die Benutzergruppe, Zugänglichkeit, Repräsentativität, core-publication
("Zentrale Publikation")
- Inhaltsdarstellung
Sekundärdokument entsteht. Dieses dient zur Verdichtung und Harmonisierung (Vereinheitlichung und
Standardisierung in Erscheinungsbild, Vokabular). Zwecke: Ordnung und Suche.
Suchprofil muß dem Dokumentenprofil entsprechen, dann kommt es zu einem Treffer. ("Matching")
Ergebnis der Suche: Treffermenge = recall; precision = Relevanz der Dokumente (Maßzahlen: Trefferquote,
Relevanzquote).
Verfahren der Inhaltsdarstellung:
| Indexieren |
Referieren |
- Klassieren: Darstellung des Inhalts in Form von Indextermini, Zuordnung zu inhaltsgleichen Dokumenten. Gutes System
für Freihandbibliotheken. Nachteil: Mensch muß sich für einen Ort für das Dokument entscheiden,
bei Dokumenten mit mehreren Hauptthemen problematisch und willkürlich. Einordnung nur nach Hauptaspekten.
Funktioniert auch ohne Computereinsatz.
- beschreibendes Indexieren (Beschlagwortung): mehrere Indextermini, die für die Suche sinnvoll sind, werden
einem Dokument zugeordnet.
- coordinate, gleichordnendes indexing: unstrukturiertes Zuordnen, Termini gleichwertig. Vorteile: relativ einfach,
geringer Schulungsaufwand, große inhaltliche Nähe zum Dokument, kontrolliertes Vokabular. Nachteile:
fehlende Gewichtung der Begriffe, Fehlverknüpfungen möglich (ca. 90 % der wissenschaftlichen Datenbanken
arbeiten mit diesem System) Nur mit EDV-Unterstützung sinnvoll.
- syntaktisches Indexieren: Um die Nachteile des coordinate indexing zu lösen, werden immer mehr Systeme der
Gewichtung eingesetzt. Für das Problem der Verknüpfung gibt es die Möglichkeiten, Kategorien
einzuführen (z.B. Name=Bauer<=>Beruf=Bauer), oder Termini zu verknüpfen, um Sätze zu bilden (Linking). Dadurch ist das System wieder arbeitsintensiver und aufwendiger. Andere Möglichkeit:
Relationsangaben.
|
Beschreiben des Inhalts in natürlicher Sprache, in vollständigen Sätzen.
Das Ergebnis ist ein Referat oder Abstract.
- indikatives Referat: weist auf Inhalt hin
- informatives Referat: enthält die Information selber. Wenn gut gemacht, eignet es sich zum nachfolgenden
automatischen Indexieren zur Recherche nach Sachbegriffen über das kontrollierte Vokabular hinaus.
- Fremdreferat: im Zuge der inhaltlichen Erschließung durch Bibliothekare und Informationsspezialisten
- Autorenreferat
|
Für das Klassieren muß eine gute und flexible Struktur vorhanden sein.
1996-12-03
Scientific Information-Dienst
(Fortsetzung der Tabelle von der vorigen Woche)
RSWK: Regeln für die Schlagwortkatalogisierung, im
deutschsprachigen Raum sehr verbreitet. Wörter werden in festgelegter Reihenfolge zu Sätzen verknüpft
(z.B. a:präsident:krankheit:lunge). Diese System wird für Linking im Rahmen der syntaktischen Indexierung
verwendet. BIBOS macht das noch nicht.
Präkoordination: Verknüpfung der Suchbegriffe vor der Recherche. Setzt einen Lernaufwand des Anwenders
voraus.
Postkoordination: Verknüpfung der Suchbegriffe durch das System im Zuge der Recherche.
Relationsangaben: Beziehung zwischen Deskriptoren explizit angeben. Beispiele:
Vranitzky über Haider, Export von Österreich nach Iran.
Automatisches Indexieren im Gegensatz zum intellektuellen Indexieren: maschinelle Erfassung von Begriffen aus den
Texten nach Entfernung von Stop/Banalwörtern. Sehr einfach in Bezug auf den maschinellen Aufwand.
1996-12-10 Dokumentationssprache
Dokumentationssprachen sind sehr stark reglementiert, die Grammatik steht eher im Hintergrund. Sie
wird laufend an die wissenschaftliche Wirklichkeit und Terminologie angepaßt.
Elemente der Dokumentationssprache:
- Stichwort: Wort, das für die inhaltliche Erschließung verwendet und direkt dem Dokument entnommen wird.
Damit arbeiten auch automatisierte Erschließungssysteme.
Nachteile: Synonyme sind nicht bereinigt, grammatikalisch gebildete Formen gehen im Originalzustand ins Dokument
ein. Vor/Nachteil: Nähe zur Terminologie des/der Autors/In. Vorteil: gewährleistet breiten Zugang.
Vorgangsweise bei der automatisierten Erschließung:
- Normalisierung: Vereinheitlichung in grammatikalische Grundformen; Dekomposition: Komposita zerlegen. (UNITERM:
Bestrebung, Komposita in die kleinsten Teile zu zerlegen; möglicherweise Übersetzung)
- Schlagwort: Standardisiertes Wort, nicht unbedingt dem Text entnommen, Synonyme werden bereinigt. Normalisierung
nicht nötig. In Schlagwortverzeichnissen gesammelt, üblicherweise alphabetisch. SWD: Schlagwortnormdatei:
Versuch, für den deutschsprachigen Raum eine Standardisierung des Fachwortschatzes zu erreichen. Problem der
alphabetischen Einordnung: Inhaltszusammenhänge nicht erfaßt.
- Deskriptor: Entstammt einem Thesaurus (=Wortschatzverzeichnis). Natürlichsprachlich, kontrolliert, Umfang
festgelegt, systematisch dargestellt durch explizite Beziehungsangaben. Der Thesaurus enthält neben den
Deskriptoren auch Nondeskriptoren, die zwar verzeichnet sind, aber nicht für die Schlagworterfassung verwendet
werden dürfen, sondern auf den Deskriptor hinweisen. Thesauri sind normalerweise für eine
Wissenschaftsrichtung entwickelt.
- Es sind auch Relationsangaben enthalten, wie "Zeitungswissenschaft >> verwende >> Publizistik".
Relationen zwischen Deskriptoren und Nondeskriptoren:
- hierarchisch (Klassifikation)
- Abstraktionsbeziehung (generische Relation): Baum, Eiche.
- Bestandsrelation, partitive Relation: Kärnten ist ein Teil von Österreich.
- Begriffe: OB: Oberbegriff = BT: broader term; UB: Unterbegriff = NT: narrower term SG: Sachgruppe
- assoziativ: Es gibt einen Zusammenhang, SA: siehe auch, VB: verwandter Begriff. RT: related term.
- Von Nondeskriptor zum Deskriptor: Gleichsetzung, Äquivalenzrelation. BE: benütze, siehe, BS: benutze
Synonym; USE.
- Vom Deskriptor zum Nondeskriptor: BF: benutzt für; VF: verwendet für; UF: used for.
- Notation
Beispiel: Baum Laubbaum Nadelbaum Tanne
Baum
--> UB Laubbaum
--> UB Nadelbaum
Laubbaum
--> OB Baum
--> SA Nadelbaum
Nadelbaum
--> OB Baum
--> SA Laubbaum
--> UF Tanne
Tanne: Nondeskriptor
--> USE Nadelbaum
1996-12-17 Auswertung der Übungsarbeiten
- Bemerkenswert war, daß das Internet erstmals in diesem Jahrgang für die Informationssuche breit
eingesetzt wird
- Es gab Schwierigkeiten mit dem Umgang mit Computern (Fehlen von "computer literacy")
- Menügesteuerte Systeme (Laienmodus): systemgeführter Modus
- Kommandogesteuerte Systeme (Expertenmodus): benutzergeführter Modus
- Gute Systeme erlauben beide Modi und den Umstieg zwischen ihnen
- Bildschirm/Oberfläche: gute Systeme sind übersichtlich, es sind nur Texte enthalten, die wirklich
notwendig sind, klare Trennung der Felder
- Suchtermini: Wie komme ich zu den Suchbegriffen? Wird ein kontrolliertes Vokabular benötigt?
- Trunkieren, Wildcard-Suche; Maskieren
- Vokabular: Schlagwortverzeichnis (Medienbruch!) Vokabular sollte in die Suche übernommen werden
können
- Optimieren der Suchresultate:
- Zu großer Recall (=Treffermenge): Einschränkung der Suche durch:
- zusätzliche Suchbegriffe mit booleschen Operatoren (AND, OR, NOT). Diese sind oft automatisch gesetzt,
üblicherweise AND. In den meisten Systemen ist es vernünftig, Klammern zu setzen, um verschiedene Begriffe
(z.B. AND und OR) zu verknüpfen.
- Zeiteinschränkung, Ortseinschränkung, Quelle, AutorIn usw.
- Basic Index: für Sachgebietsrecherche, um in Kategorien leichter zu suchen
- Kontextoperatoren: ADJ(ACENT)[X], NEAR[X], "im selben Satz" usw. Besonders bei Volltextdokumenten sinnvoll, um die
Zusammengehörigkeit der Wörter sicherzustellen.
- Ranking: Dokumente nach ihrer Wichtigkeit ordnen
- Ranking erfolgt normalerweise automatisch, Dokumente werden vom Suchsystem nach Kriterien wie Anzahl der Treffer im
Dokument, Position der Treffer (Titel, erster Absatz), usw. geordnet. Ein Verzerrungsfaktor sind die Synonyme.
- Relevance Feedback: Möglichkeit, dem System zurückzumelden, ob die Suche erfolgreich war; gefundene
Dokumente können vorgereiht werden.
- Fehlertoleranz wäre wichtig, ist aber kaum implementiert ("Fuzzy-Logic": TRY TO USE anstelle von USE und USE
NOT; gut wenn viele Begriffe mit AND verknüpft nichts zurückgeben.)
- Output ist wichtig: gleich verwendbar, entlehnbar, Ausdruck oder Download möglich usw.
1997-01-14
Klassifikation: arbeitet mit Notation (künstlichsprachig), strukturiert Informationen systematisch in einer
Hierarchie. (hierarchisch-analytische Klassifikation <=> [Facettenklassifikation, assoziative
Klassifikation])
Existierende Klassifikationssysteme: Dewey Decimal Classification (DDC): (im angelsächsischem Sprachraum sehr
verbreitet) => Universal Decimal Classification (UDC): Anfang des 20. Jh. entwickelt, besser für Information
und Dokumentation geeignet
LCC: Library of Congress Classification: englischsprachige Literatur wird durch LCC erschlossen (nicht dezimal).
DDC: Unterteilt das Wissen der Welt in Klassen 0 ... 9, dann Untergruppen
0: Allgemeines
1: Philosophie
...
6: Angewandte Wissenschaft (Medizin, Technik):
- 60
- 61
- ...
- 65 Betriebsführung
- 651
- ...
- 659 Werbung, PR
- 659.1
- 659.2 Informationswesen, Auskünfte, Beratung
- ...
- ...
- 69
9: Geographie, Ethnologie, Geschichte
Vorteile: Sprachunabhängigkeit auf Notationsebene, Ordnung des Systems wird wiedergegeben, übersichtlich,
Struktur erweiterbar. Anzahl der Ziffern gibt an, wie "tief" mensch gerade im Baum ist. "Siehe auch"-Relation ist
automatisch durch Begriffe auf der selben Ebene gegeben.
Nachteile gegenüber Thesauri: Jeder Begriff kann nur einen Oberbegriff haben, manchmal zwanghafte Zuordnung
(z.B: Fernsehen: Technik? Kommunikationswissenschaft? Politik?). Es ist schwer, neue Informationen und
Betrachtungsweisen (Ökologie, Feminismus, Informatik ...) einzuordnen.
Echtes Beispiel:
| ...
Informationstheorie 007
Informationstheorie (Mathematik) 519.72
Informationsträger (Datenverarbeitung) ...
|
Datenbanken haben in der Klassifikation an Bedeutung gewonnen.
Klassifikation ist in der Recherche effizient, weil z.B. eine Suche erweitert werden kann, indem mensch die letzte
Ziffer wegstreicht (652 ungenügend => 65), andererseits ich auch eine Einschränkung möglich (z.B.:
Fernsehen nur im Bereich 6). Auch zur Ermittlung der Terminologie von neuen Sachgebieten nützlich. Schwer
ausdrückbare Sachverhalte können besser im Zusammenhang erklärt werden.
Großer Nachteil, daß keine automatisierte Kategorisierung möglich ist.
1997-01-28 Prüfung
Fragen:
- Information und Dokumentation als Kommunikationsprozeß Antwort /
Dokumentationssprache Antwort
- Recherche in Datenbanken / Modelle, Strategien, Perspektiven Antwort
Eine der Fragen sollte ausgewählt werden. Zusätzlich sollte eine Bewertung der LVA in Bezug auf Inhalte
und "Performance" vorgenommen werden.
2000-01-25 Prüfung
Fragen:
- Internet wissenschaftliche Informationsvermittlung?
- Bibliotheken (?) 2050 - Arbeitsorganisationen und Dienstleistungen
Eine der Fragen sollte ausgewählt werden.
© Balázs
Bárány. Quelle: Vorlesung von Dr. Herwig Jobst, nicht autorisiert.
zuletzt geändert (JMT): 2000-01-25