Datenbankaufbau : Skript
Laufkäfer, Käferdatenbank South Kensington
Kapitel 2: Datenbank-Planung und -Design
von Margarete Payer & Alois Payer
(mailto: payer@hbi-stuttgart.de
Zitierweise / cite as:
Payer, Margarete <1942 - >: Datenbankaufbau : Skript /
Margarete Payer & Alois Payer. -- Kapitel 2: Datenbank-Planung und
-Design. -- Fassung vom 1997-05-17. -- URL: http://www.payer.de/dbaufbau/dbauf02.html.
-- [Stichwort].
Letzte Überarbeitung: 1997-05-17
Anlaß: Lehrveranstaltungen an der HBI Stuttgart
©opyright: Dieser Text steht der Allgemeinheit zur Verfügung.
Eine Verwertung in Publikationen, die über übliche Zitate hinausgeht,
bedarf der ausdrücklichen Genehmigung der Verfasserin.
Dieser Text ist Teil der Abteilung Datenbankaufbau
von Tüpfli's Global
Village Library
2.0. Übersicht
- 2.1. Weiterführende Ressourcen
- 2.2. Die Lebensstadien einer Datenbank
- 2.3. Datenbank Design
- 2.4. Design der Anwendungssoftware und der
Benutzeroberfläche
- 2.4.1. Minimalanforderungen an die
Benutzeroberfläche einer bibliographischen Datenbank
2.1. Weiterführende Ressourcen
Printed Media:
Connolly, Thomas M.: Database systems : a practical
approach to design, implementation and management / Thomas M. Conolly ;
Carolyn E. Begg : Anne D. Strachan. -- Wokingham [u.a.] : Addison-Wesley,
1996. -- ISBN 0-201-42277-8. -- S. 122-145
WWW:
Özsu, M. Tamer: Database Management Systems :
Lecture Notes. -- Design. -- Sept. 1995. -- URL:
http://web.cs.ualberta.ca/~database/courses/c391/Design/.
-- Zugriff am 15. Mai 97
2.2. Die Lebensstadien einer Datenbank
Stark schematisiert kann man folgende Lebensstadien einer Datenbank
unterscheiden:
- Planung der Datenbank: alle Tätigkeiten der
Verantwortlichen, die eine Realisierung der folgenden Schritte ermöglichen
und erleichtern (Auftrag, große Zielsetzung, Bereitstellung von
Ressourcen ...)
- Definition von Benutzergruppen, vorgesehenen Anwendungen,
Gegenstand und Umfang der Datenbank
- Sammlung und Analyse der Anforderungen an die Datenbank
(Pflichtenheft)
- Datenbank-Design
- Auswahl eines Datenbank Management Systems (DBMS)
- Design der Anwendungssoftware und der Benutzeroberfläche
- Erstellung eines Prototyps, d.h. einer funktionsfähigen
Datenbank mit allen wichtigen Features der endgültigen Datenbank
- Test am Prototyp und Korrektur bisheriger Schritte
- Implementierung der vollen Datenbank
- Datenerfassung bzw. Datenkonversion
- Test und Korrekturen
- Datenbank-Unterhalt, Verbesserung, Sammlung von Erfahrungen für
größere Neuentwicklungen
2.3. Datenbank Design
Man unterscheidet beim Datenbank-Design folgende Ebenen:
- Konzeptionelles Design (conceptual design): Design der
Datenstrukturen, des Gebrauchs der Daten usw. ohne Rücksicht auf
ein bestimmtes Datenbank Management System (DBMS)
- Logisches Design (logical design): Umwandlung des
konzeptionellen Designs auf die Strukturen des vorgesehenen Datenbank
Management Systems (DBMS)
- Physisches Design (physical design): Design der
Implementierung
2.4. Design der Anwendungssoftware und der
Benutzeroberfläche
Das Design der Anwendungssoftware und der Benutzeroberfläche hat die
gleichen Ebenen wie das Datenbank-Design.
D. Shneiderman stellt folgende Forderungen an eine Benutzeroberfläche:
- Klare, eindeutige Überschrift
- Verständliche Anleitungen (kein Fachchinesisch)
- logische und einheitliche Gruppierung und Aufeinanderfolge der
einzelnen Felder
- optisch ansprechendes Layout
- dem Benutzer vertraute Bezeichnungen für die Felder usw.
- einheitliche, konsistente Terminologie; verständliche und
einheitliche Abkürzungen
- einheitliche Verwendung von Farben (gleiche Farben sollen immer das
Gleiche markieren)
- deutlich sichtbare und begrenzte Felder zum Dateneintrag
- leicht bedienbarer Cursor
- einfache Fehlerkorrektur
- Fehlermeldung bei unzulässigen Einträgen
- klare Unterscheidung zwischen optionellen und obligatorischen
Feldern für den Dateneintrag
- Kurzerklärung des angewählten Feldes in Status-Leiste
oder dgl.
- Meldung, wenn Dateneintrag vollständig, aber kein
automatisches Absenden (Benutzer muß Möglichkeit haben,
nochmals Korrekturen anzubringen)
[Shneiderman, D.: Design the user
interface : strategies for effective human-interaction. -- 2. ed. -- 1992;
zitiert nach Conolly, 1995. -- S. 143f.]
2.4.1. Minimalanforderungen an die Benutzeroberfläche
einer bibliographischen Datenbank
Es wäre wohl eine Utopie, von einem OPAC bei uns alle die tollen Möglichkeiten
zu fordern, die es anderswo gibt. Hier wird ein Mindeststandard mit ein paar zusätzlichen
Hinweisen vorgeschlagen, an dem man sich für das Regelwerk orientieren
kann. Sieht man z.B. Stichwortsuche in einer Körperschaftsnamensliste
(-index) vor, erspart man sich sämtliche Übergehungsverweisungen und
die Regeln dazu.
Einschränkend soll daraufhingewiesen werden, daß die folgenden
Anforderungen für einen OPAC in großen Bibliotheken vorgesehen sind.
Insbesondere Lösungen zum Problem Einschränkung der Trefferquote sind
bei OPAC's mit über einer Million Titel dringend erforderlich. Wartet man nämlich
erstmal bis die Datenbank mit so vielen Titeln bestückt ist, sind sinnvolle
Lösungen nur noch mit Einschränkung möglich. Eine gute Begrenzung
der Trefferquote kann man z.B. mit der Angabe der Sprache erreichen; nachträglich
bei einer Million Titel die Sprache nachzuführen, dürfte aber im
allgemeinen nicht machbar sein.
Ein OPAC sollte mindestens folgende Zugangspunkte anbieten:
- als Primäraspekte, d.h. als Zugangspunkte, die
direkt abgefragt werden können:
- Sachtitel und ihre Zusätze: Einheitssachtitel,
Nebensachtitel, Titel eines Teiles eines mehrbändigen
Werkes (Inhaltsangabe) usw., Gesamttitel
- normierte Stichwörter
- Personennamen und ihre Verweisungen
- Körperschaftsnamen und ihre Verweisungen und Verknüpfungen
("früher und später s.")
- Schlagwörter und ihre Verweisungen sowie Verknüpfungen
mit ihrer Systematik
- Notationen
- Nummern: ISBN, ISSN, Reportnummer, Werkverzeichnisnummer,
Musikverlagsnummer u. dgl.
- Erscheinungszeit (vor 1500 und bei Spezialbeständen)
- seltene Sprachen
- Signaturen
- Ort (bei alten Drucken, normiert)
- Verlag (bei alten Drucken, normiert)
- als Sekundäraspekte, d.h. als Einschränkung
einer Abfrage über einen primären Zugangspunkt:
- Erscheinungszeit: Erscheinungsjahr/e, Jahrhunderte,
Perioden
- Bearbeitungsdatum (Neuzugänge)
- Sprachen
- Erscheinungsland
- Art des Materials (physische Form): Mikrofiche, Mikrofilm,
Video, Tonträger usw.
- Erscheinungsform und formale Gattung: Monographie,
Zeitschrift, Unselbständiges Werk usw.
- Gattung: Lehrbuch, Musiknoten, Reports, Kinderbücher
usw.
- sonstige formale Festlegung: Festschrift, Verfassung,
Kongreß, Werke usw.
- weitere Zugangspunkte in Spezialsammlungen: Für
Spezialsammlungen sind weitere Aspekte (als Primär- und Sekundäraspekte)
sinnvoll: z.B.
- Ort und Verlag bei alten Drucken
- Maßstab bei Kartensammlungen
2.4.1.2. Verschiedene Suchmodi
- Stichwortsuche d.h. Suche mit einzelnen Worten, üblicherweise
ohne die Stopworte ("und" u.ä.).
[ Hilfreich wäre für die Einschränkung
der Treffer die Anwendung des Abstands- oder Nachbarschaftsoperators ("adjacency"),
wodurch man z.B. erreichen kann, daß die angegebenen
Stichworte direkt aufeinander folgen müssen. Z.B. können die
Stichworte "Weltgeschichte Biographien" zu dem Titel "Epochen
der Weltgeschichte in Biographien" führen, nicht aber
zu "Biographien aus allen Epochen der Weltgeschichte". Mit
diesem Operator kann man aber auch angeben, daß die angegebenen
Stichworte nur aus einer grammatikalischen Einheit stammen dürfen.]
Man sollte unterscheiden:
- Stichwortsuche in Sachtiteln (Einheitssachtitel,
Paralleltitel usw.) und ihren Zusätzen
- Stichwortsuche in Personennamensliste (inklusive
Normdateien: PMA usw.) z.B.
- Familienname allein: "Melanchthon"
- Teil eines Mehrfachnamens: "Torney"
- Vorname (oder Vornamen) allein: "Lulu"
- Teil des Familiennamens und ein Vorname: "Lulu
Torney"
- Ordnungshilfe (oder Teil davon): "Assisias"
- Stichwortsuche in Körperschaftsnamensliste (inklusive
GKD) z.B.
- "Rosenkreuz" (="Der Alte Mystische
Orden vom Rosenkreuz")
- "Bern Landesbibliothek" (="Schweizerische
Landesbibliothek <Bern>")
- Stichwortsuche in Schlagwortliste (inklusive
Schlagwortnormdatei, Thesauri u.ä.) z.B.
- nach einem oder mehreren Worten aus iner RSWK-
Schlagwortkette: "Reinecke Latène-Zeit"
(="Reinecke, Paul / Latène-Zeit")
- Exakte Suche ("phrase") d.h. Suche mit der
vorliegenden Wortfolge, deckt das vom Kartenkatalog her gewöhnte
Suchen ab, bietet aber weit mehr. Je vollständiger und korrekter
die Angabe ist, desto besser ist der Erfolg. Es muß gewährleistet
sein, daß es ausreicht, den Anfang einer Wortfolge oder die
korrekte Wortfolge ab einer bestimmten Stelle einzugeben. Für
kurze Titel, Namen oder Schlagworte, die aus sehr allgemeinen Worten
bestehen, ist es unumgänglich, der Maschine mitteilen zu können,
daß nur diese Wortfolge zu suchen ist.
Man sollte unterscheiden:
- Browsing oder Blättern in den Indices: durch "Blättern"
in alphabetisch angeordneten Indices kann man sich einen Überblick über
den Bestand, über verwandte Namen bzw. Körperschaften und
Schlagworte verschaffen. Man kann damit das vom fortgeschrittenen
Benutzer gewohnte Blättern im Kartenkatalog ersetzen. Personen und
Körperschaftsnamen und Schlagworte müssen mit ihren
Verweisungen oder Hinweisen auf über- und untergeordnete Elemente
(z.B. Schlagworte) u.ä. indiziert sein.
Browsing muß möglich sein:
- im Sachtitelindex
- im Personennamenindex
- im Körperschaftsnamenindex
- im Schlagwortindex
- Trankierung d.h. man gibt nur einen Teil eines Wortes
ein.
Man muß unterscheiden zwischen:
- Endtrankierung (ist absolut unerläßlich) z.B. "catalo#"
für "catalog, catalogue"
- Mitteltrankierung: ist sehr hilfreich, wenn man nicht genau
weiß, wie ein Wort geschrieben wird z.B. "Ma#er"
für "Mayer, Maier, Majer" oder "M##er"
für Mayer, Maier, Majer, Meier, Meyer...
- Linkstrankierung: z.B. "#oto" für "Foto,
Photo"; "#Braun" für "VonBraun,
VonDerBraun"...
- Orthographische Varianten (sprachbezogen): Suche nach
verschiedenen Schreibweisen ein- und desselben Namens oder Wortes. z.B.
Payer, Paier, Peyer ...; organisation, organization
- Boolesche Verknüpfungen: UND, ODER und UND NICHT:
Solche Verknüpfungs-Operatoren innerhalb und zwischen den
Zugangspunkten ermöglichen z.B. die Verknüpfung von Person und
Titel, Körperschaft und Titel u.ä.
- Bindestrichregelung: Das System sollte bei Wörtern
mit Bindestrich auch automatisch unter den einzelnen Wortteilen suchen
(wichtig insbesondere für die Bindestrichanwendung im Englischen)
z.B. "year-book" auch unter "year" und "book"
- Sucheinschränkungen. Es sollte möglich sein die
Suche mit den oben genannten Aspekten zu begrenzen:
- Erscheinungszeit
- Bearbeitungsdatum z.B. Literatur zu "Ancient India",
nach 1988 in der Bibliothek bearbeitet, da die früher
bearbeiteten Titel schon durchgesehen wurden.
- Sprachen
- Art des Materials z.B. "Mozart Zauberflöte"
als Laserdisk
- Erscheinungsform z.B. "Schweiz" als Karte
- Gattungen
- sonstige formale Festlegungen z.B. "Verein der Onliner"
und Kongreß = man könnte sämtliche Kongresse,
die mit diesem Verein verbunden sind, nachgewiesen erhalten.
Diese Aspekte sollten auch verknüpft angewendet werden können:
z.B. "Studien zum Orient" + Zeitschrift + Mikrofiche.
2.4.1.4. Weitere Erwartungen
- Interne Verknüpfungen: Mindestens Folgendes sollte
intern verknüpft sein, damit der Benutzer solche Verknüpfungen
nicht selbst herstellen muß:
- Verweisungen -- Namensformen -- Einheitssachtitel -- Titel
z.B. Suche unter "Obadja" (Personennamen) und man erhält
(vorausgesetzt, es gäbe nicht mehrere): "Abdias
<Propheta>: Prophetia"
- Schriftenreihe -- Einzeltitel
- Einzeltitel -- Schriftenreihe u.ä.
- Anzeige auf dem Bildschirm: Neben den verschiedenen
Anzeigen in Listenform sollte auch die Anzeige in der ISBD-Form ermöglicht
werden. Damit man mehrere Titel gleichzeitig auf dem Bildschirm ansehen
kann, sollte es neben der ausführlichen ISBD-Form eine ISBD
in Kurzfassung geben. Diese Kurzfassung ist zu standardisieren. Als
Minimalnorm ist wohl die Möglichkeit eines vom jeweiligen Benutzer
definierten Anzeigeformates nicht durchsetzbar.
Dem Benutzer sind verschiedene Abfragemodi je nach Expertise und Vorlieben
des Benutzers anzubieten (d.h. sowohl Menue- als auch kommandogebundene
Abfragen).
Zu Kapitel 3: Datenbank-Design: Entity-Relationship (ER) Modelling