< HOME OF SGML >

SGML/XML

Derrek Erhold, Ursula Raithelhuber

Kopie auf Dr. Web


index

0 Inhalte

  SGML/XML
 0Inhalte
 01Wunsch Inhalt
 1Einführung
 1.1Was ist SGML ?
 1.2Was ist XML ?
 2Entstehung von SGML
 3Die Rolle von SGML heute
 4Praxis: Verlage und SGML
 4.1Überblick
 4.2Fazit
 4.3SGML-Strategie von Verlagen
 5Was mit SGML noch möglich ist:
 6Ausblick
 7SGML: Techniken und Werkzeuge
 7.1Dokumenttypdefinition (DTD)
 7.1.1Beispiel: DTD-Ausschnitt für Paragraph
 7.1.2Beispiel: Ausschnitt aus Dokument für Paragraph
 7.2SGML Parser
 7.3SGML Editor
 7.4SGML Browser
 7.5SGML Datenbank
 8Verweise
 9Dank

01 Wunsch Inhalt

Kurze Einführung - was ist das

Praxis - was kann man damit machen

Beispiel - wie das technisch gemacht wird mit etwas Code. Ausblick warum es wichtig ist.

ev Link auf englische Quellen oder Lexika.

1 Einführung

1.1 Was ist SGML ?

Die Standard Generalized Markup Language - SGML - ist der Standard zur Beschreibung von Dokumenten festgelegt von der International Standardization Organization (ISO), der unter der Nummer ISO 8879 im Jahr 1986 veröffentlicht wurde. Das Ziel und die Idee dieses Standards ist es, die Struktur des Inhalts eines Dokuments von seiner layoutorientierten Erscheinungsform zu trennen. Damit wird der Schwerpunkt bei der Formatierung von Dokumenten weg vom typografischen Layout hin zur logischen und strukturellen Auszeichnung eines Dokuments verlegt. Wichtig daran zu bemerken ist, daß dies eine Sprache zur Beschreibung beliebiger Dokumente mit unterschiedlichsten Strukturen ist. Genauer gesagt ist SGML nicht eine Sprache zur Auszeichnung von Dokumenten sondern eine Meta-Sprache zur Beschreibung von Auszeichnungs- oder MarkUp-Sprachen für diese Dokumente. Der Gewinn dieser im Gegensatz zum Layouten unterschiedlichen Vorgehensweise ergibt zwei hauptsächliche Vorteile:

  1. vollständige Hard- und Softwareunabhängigkeit
  2. Publikation der Daten auf unterschiedlichen Medien.

Aufgrund ihres Meta-Charakters ist SGML also nicht nur einfach eine Sprache sondern eine Strategie.

1.2 Was ist XML ?

Dazu ein Ausschnitt aus einem Artikel von Brian E. Travis, Managing Editor, aus der < TAG >, Februar 98

Das erste Donnergrollen kam von den XML Entwicklern über ihre Pläne SGML zu vereinfachen. Diese Leute sagten, sie brauchten eine einfache Form von SGML die über das Web geliefert werden könnte. "SGML ist zu komplex für solch eine Aufgabe", sagten sie, "und diePerformance würde ein Problem sein außer wir könnten einige der unangenehmen Eigenschaften von SGML abstreifen". Ihre Vision war die Leute dazu zu bringen, SGML weiter zu benutzen für komplexe Dokumente, dann diese auszuliefern im Ganzen als XML über das Web. Die erklärte Absicht war nicht, SGML zu ersetzen, aber es zu erweitern.

Mehr unter: [http://th-o.de/sgml/whysgml.htm] . Nicht zuletzt soll damit der mehrere hundert Seiten umfassende SGML-Standard auf 20 (in Worten: zwanzig) A4 Seiten komprimiert werden. Die Extensible Markup Language (XML) ist ein Anwendungsprofil bzw. eine eingeschränkte Form von SGML, aber genau wie der Standard eine Meta-Sprache. Das Ziel von XML ist es, die Akzeptanz und Nutzbarkeit der SGML Idee zu verbessern und seine Anwendbarkeit in der Form auf das Web zu übertragen, in der es jetzt mit HTML möglich ist. XML wurde entwickelt für eine einfache Verwendung und Interoperabilität sowohl mit SGML als auch mit HTML.

2 Entstehung von SGML

SGML hat den Vorläufer GML (Generalized Markup Language), welcher von Charles Goldfarb, IBM, entwickelt wurde. Der Standard wurde - wie oben bereits erwähnt - im Jahr 1986 von der International Standards Organization (ISO) als ISO 8879-1986 veröffentlicht. Er findet weite Verbreitung in den USA als Standard-Datenformat für das CALS (Computer-Aided Acquisition and Logistics Support)-Projekt des Department of Defense und entwickelt sich zum Standard für Datenhaltung im Verlagswesen und in der Technischen Dokumentation.

3 Die Rolle von SGML heute

SGML trägt stark zum Übergang der Gesellschaft in eine Informationsgesellschaft bei, denn SGML

4 Praxis: Verlage und SGML

4.1 Überblick

Bereits einige Verlage (weltweit und in Deutschland) haben heute eine Palette elektronischer Publikationen in verschiedenen Bereichen. Das bringt häufig ähnliche, sich zum Teil überschneidende Inhalte. SGML bedeutet für die Produktion elektronischer Texte:

Das schnelle Fortschreiten von Forschung und Entwicklung bringt immer größere Datenumfänge mit sich. Das bedeutet für die Produktion elektronischer Texte die Verwaltung und Verarbeitung großer Datenmengen. Um diese noch einigermaßen überschaubar, übersichtlich und einfach nutzen zu können, gibt es sogenannte Links. Dies sind Verknüpfungen auf andere Texte oder konkrete Stellen im gleichen oder anderen Dokument. So gibt es gerade bei elektronischen Fachdatenbanken häufig

Um nun die Aktualität der Produkte zu wahren, muß die Produktion ein reibungsloses Updatemanagement mit weitestgehend automatisierter Produktion gewährleisten, dies besonders unter dem Gesichtspunkt der unterschiedlichen Arten der Datenpräsentation und der Bedienung unterschiedlicher Distributionsmedien: CD-ROM Fachdatenbank, Internet, Intranet, Diskette, Papier (Braille, Sprachausgabe, ...). Das bedeutet für die Produktion:

Bezogen auf die immer schneller voranschreitende technologische Entwicklung in der Softwareindustrie bedeutet das für die Produktion die Haltung der Daten unabhängig von den Anwendungen (Software) und von proprietären Formaten (siehe Probleme mit Microsoft Produkten).

4.2 Fazit

Verlage brauchen:

4.3 SGML-Strategie von Verlagen

5 Was mit SGML noch möglich ist:

6 Ausblick

Durch einen SGML Datenpool sind elektronisch publizierende Verlage für die Zukunft gerüstet, denn sie haben qualitativ hochwertige und aktuelle Dateninhalte sowie in technischer und inhaltlicher Hinsicht flexibel einsetzbare Daten.

7 SGML: Techniken und Werkzeuge

7.1 Dokumenttypdefinition (DTD)

Die DTD (Document Type Definition) ist die Voraussetzung für das Arbeiten mit SGML. In der DTD sind alle Elemente einer Dokumentstruktur und deren Eigenschaften (Attribute) sowie die Beziehungen zwischen den Elementen festgelegt. Die Elemente werden im Dokument durch die Tag’s verkörpert, die durch die Zeichen "<" und ">" begrenzt sind, wobei meist ein öffnendes und ein schließendes Tag zusammengehören. Beim schließenden Tag wird nach dem "<" ein "/" gesetzt.

In der DTD werden das Auftreten und die Eigenschaften eines Elements festgelegt:

7.1.1 Beispiel: DTD-Ausschnitt für Paragraph

Elementdeklaration für Paragraph

<!ELEMENT paragraph - O
(ptitel, (satz+ | num+ | absatz+)? )
>

Dabei ist paragraph der Name des Elementes. Die Phrase "- O" ist die sogenannte Tagminimierung, die in diesem Fall aussagt, daß bei paragraph das schließende Tag weggelassen werden kann ("O"). In paragraph wiederum können ("?") auf das Element ptitel (muß vorkommen) die Elemente (entweder) satz , num oder ("|") absatz ein- oder mehrmals ("+") auftreten.

Attributdeklaration für Element par

<!ATTLIST paragraph
pid  ID      #REQUIRED
>

Das Element paragraph hat in diesem Fall ein Attribut mit Namen pid welches vom Typ ID ist. Die Phrase #REQUIRED sagt aus, daß dieses Attribut belegt werden muß.

7.1.2 Beispiel: Ausschnitt aus Dokument für Paragraph

<paragraph id="p1"><ptitel>Das ist der Titel zum Paragraph mit der ID p1</ptitel>
<satz>Das ist ein Satz innerhalb des Paragraph mit der ID p1.</satz>
<satz>Das ist ein zweiter Satz innerhalb des Paragraph mit der ID p1.</satz>
<paragraph id="p2"><ptitel>Titel Paragraph p2</ptitel>
<satz>Im Paragraph mit der ID p1 wurde das Ende-Tag weggelassen, 
     da dies laut DTD erlaubt ist.</satz>
<satz>In diesem Paragraph steht das Ende-Tag da, auch das entspricht der DTD</satz>
</paragraph>

7.2 SGML Parser

Ein SGML Parser ist ein Prüfprogramm, das die Struktur eines Dokumentes gegen eine Dokumenttypdefinition (DTD) abprüft und so sicherstellt, daß das Dokument den Regeln der DTD entspricht und fehlerfrei von Programmen verarbeitet werden kann. Trifft das Programm auf einen Fehler, wird eine Meldung ausgegeben.

7.3 SGML Editor

Ein SGML Editor ist ein Editor, der dem Benutzer hilft, SGML-konforme Dokumente zu erstellen indem Elemente nur an den von der DTD vorgegebenen Stellen eingefügt werden und die gesamte Struktur eines Dokumentes überprüft werden kann, auch auf Verweisfehler.

7.4 SGML Browser

SGML Browser ist Software, die SGML Dokumente formatiert darstellt, indem jedem Element oder Elementkombinationen (z. B. Textabsätze in Listeneinträgen) ein Layout (fett, rot, 14 pt) oder eine Funktion (Popup, blinkt, läuft von links nach rechts über den Bildschirm) zugewiesen wird.

7.5 SGML Datenbank

Eine SGML Datenbank ist eine relationale, objektorientierte oder objektrelationale Datenbank, die die SGML Struktur in ihrer internen Datenbankstruktur abbildet und für die Suche in den Daten nutzt. Bietet sie außerdem Versionenkontrolle und Workflow-Management, spricht man von einem Redaktionssystem.

8 Verweise

9 Dank

Mein besonderer Dank gilt Frau Ursula Raithelhuber vom UB MEDIA Verlag St. Wolfgang für ihre freundliche Unterstützung.

Derrek Erhold -- German Home of SGML


Generiert: D. Erhold, 01.10.98

index