This page/site uses <W3C recommendations>, e.g. xHTML/CSS/DOM, and will look much better in a browser that supports <web standards>. Check the code-<validity> and conformance with standards.
site·dogma  
  :: nn ::    
     


Von Markup und Standards

Links zu anderen Sites öffnen in einem neuen Fenster
With the introduction of the XHTML family of modules and document types, the W3C has helped move the Internet content-development community from the days of malformed, non-standard markup into the well formed, valid world of XML.

Die Site unterstein.net ist derzeit noch vorrangig (d.h. vor Inhalten) mein Spiel- und Testfeld für „puristische“ Seiten: Gestaltung mit „Cascading Style Sheets“ (CSS), Markup-Code konform mit Intention und Definition der aktuellen Standards (XHTML). Weiterhin versuche ich Form und Inhalt gut zu trennen und traditionelle typografische Regeln zu achten – soweit das mit diesem Medium geht.

Getestet wird mit HTML-tidy, Explorer, Mozilla und Opera, in Abständen auch mit dem W3C-Validator. Das „Erscheinungs­bild“ ist – mit aktuellen Browsern – annähernd gleich. Ich verzichte so weit wie sinnvoll auf Grafik, insbesondere als Schriftersatz oder als Schaltflächen. Gleiches gilt für „Frames“, „Scripts“ &c.

Gestaltung ist fast ausschießlich das Ergebnis von CSS. Browser, die CSS vollständig ignorieren (wie Lynx), sind hier deshalb besser bedient, als solche, die es falsch interpretieren (wie NNavigator 4.x).

Standard
macht für Alle lesbar. Es gibt sie beim W3C. Code sollte gültig (syntaktisch richtig) und validierbar (wie definiert) sein. Die Plage sind Browser, die Standards selbst nach Jahren noch nicht umsetzen, obwohl ihre Entwickler an der Definition und Verabschiedung der Standards beteiligt waren.
Markup
macht für Maschinen lesbar. Es kennzeichnet Inhalt, nicht Form. Vgl. W3C/MarkUp. Die Absicht ist, daß Inhalt maschinell bearbeitet (aufbereitet, geformt, verwandelt) und erhalten wird. <h?> <abbr> <acronym> <blockquote> <code> <cite> etc sollten ebendies enthalten, und nicht für Layout mißbraucht werden. Inhalt ohne Markup ist tot – ein Datenfriedhof, der immer wieder umgegraben und gesichtet werden muß, um ihn zu erschließen. Ist Inhalt erstmal (von Hand und mit Kopf) über das Markup gekenn­zeichnet, kann er von Maschinen mit Stil­vor­schriften in die Form gebracht werden, die seinem Zweck für den Nutzer entspricht (oder den Fähig­keiten des ‚UA‘, user-agents).
Typografie
macht für Menschen lesbar. Sie bringt Inhalt am richtigen Ort in erkennbare Form und Beziehung. Wohlgesetzter Unterschied macht aufmerksam, dient dem (Wieder-) Finden eines Textes und (Wieder-) Erkennen seines Zweckes. Dienende Typographie stützt die Absichten des Schreibers und die Gewohnheiten des Lesers. Und sie nutzt die Konventionen des Mediums, des Faches und des Lesens. Zu letzterem gehören einfache Grundregeln für Zeichen (An- und Abführung, Binde-, Trenn-, Gedanken-Striche), Abstände und Größen. Markup-Sprachen definieren dafür typografische Entitäten: &shy; &ndash; &mdash; &nbsp; &thinsp; &ensp; &emsp; &bdquo; &ldquo; &rdquo; &laquo; &raquo; &bull; &dagger; &middot; Ein lange überfälliger, nachholender Fortschritt. Browser und Editoren bräuchten sie nur können und Designer nur nutzen, die Nutzer und Leser würden danken.
Form und Inhalt
sind getrennt. Und damit unabhängig und je für das Ziel zu ändern. Besonders die Form wird häufig neuen Erfordernissen (oder Moden) angepaßt. Stil gehört in das Stylesheet. Dafür sind eigene Stil-Sprachen definiert.
Stilwechsel ?: Lorem Ipsum – Blindtext für Styletest
Technologie
kommt und geht, Daten bleiben. Manchmal braucht es ein “upside down”, um die Dinge wieder richtig zu sehen. Natürlich brauchen Daten ständig “update”, werden Inhalte aktualisiert. Sind sie erschlossen, steckt viel Arbeit in ihnen, und sie werden – ständig anwachsend – schnell zum eigentlichen Reichtum. Und es gibt schnell neue Hard- und Software, mit denen sie anders und womöglich noch viel besser zu nutzen wären. Generell ein Kern-Problem der Archivare und Pioniere: das Daten-Kapital „alter“ Maschinen und Programme, deren individuelle Daten-Formate nicht dokumentiert (in welchem Format auch?) und nicht automatisch konvertierbar sind, les- und nutzbar halten. Es gilt zu erkennen: in einer Welt schnellen technologischen Wandels sind die Daten wichtig, und mit ihnen ihr Format, das den automatischen Transfer ihrer Funktion und Semantik gewährleisten muß.
xHTML, CSS
...
XML, XSL &c
... “its goal is to enable generic SGML to be served, received, and processed on the Web in the way that is now possible with HTML.”
  1. XML shall be straightforwardly usable over the Internet.
  2. XML shall support a wide variety of applications.
  3. XML shall be compatible with SGML.
  4. It shall be easy to write programs which process XML documents.
  5. The number of optional features in XML is to be kept to the absolute minimum, ideally zero.
  6. XML documents should be human-legible and reasonably clear.
  7. The XML design should be prepared quickly.
  8. The design of XML shall be formal and concise.
  9. XML documents shall be easy to create.
  10. Terseness in XML markup is of minimal importance.
XML ist ein einfacherer Ableger der „Standardisierten und Generalisierten Meta-Sprache“ (SGML), ein Standard, Dokument-Typen zu definieren. Eine generelle Meta-Sprache wird zu einer speziellen Markup-Sprache erweitert: den Elementen und Regeln einer Dokumenten-Gattung (wobei „Dokument“ ein sehr weit gefaßter Begriff ist). Der Dokument-Typ ist durch die Elemente und Regeln seines speziellen Markups definiert. Das Markup eines konkreten Dokuments kann auf die Gültigkeit bezüglich seiner Definition geprüft werden (Validierung).
XML-DOM/EcmaScript
...
TeX, LaTeX, TeXML
...
PDF (Portable Document Format)
... bewahrt die typo­graphische Qualität, die mit (La)TeX oder ver­gleich­baren Programmen erreicht werden kann – also eine wenigstens hin­reichende Les­barkeit, spätestens auf dem Papier. Gleich­zeitig gewähr­leistet es den großen Vorzug elektronischer Doku­mente: die Volltext-Suche. Aber: wenn das Markup nicht eingebettet ist (“tagged PDF”), wird für eine Weiter­ver­arbeitung unbedingt das Aus­gangs­format gebraucht.

Exkurs: Typografie

Die häufigsten typografischen (oder auch editorischen) Mängel:

  1. Schrift läuft zu eng
  2. Grundschrift ist zu klein
  3. Zeilenabstand ist zu gering
  4. Zeilen sind zu breit
  5. schlechter Blocksatz
  6. Schreibweisen stimmen nicht
  7. (Sonder-) Zeichen stimmen nicht
    1. falsche An- und Abführung, oder Vermischung zu vieler Varianten
    2. falsche Striche und Linien, oder verschiedene Striche/Funktionen nicht unterschieden
    3. Satzzeichen mit falscher, oder durch übermäßigen Gebrauch verschlissener Wirkung
    4. Ligaturen an falschen Stellen
  8. Auszeichnungen im Text unstimmig, fehlend oder zuviel
  9. Schriftwahl ist zu uniform
  10. Schriftmischung ist nicht stimmig
  11. Versalien und Kapitälchen nicht gesperrt
  12. Schriften sind künstlich gedehnt, gestaucht, verschieft oder verfettet
  13. Überschriften, (Kolumnen-) Titel passen nicht
  14. Gliederung und Verzeichnisse sind unklar
  15. Farben und Maße (Abstände, Größen, Stärken) sind unklar – nur zufällig gleich oder verschieden
  16. Pagina ist nicht harmonisch
  17. Seiteneinteilung ist ungeschickt
  18. Bildstellung ist ungeschickt

Experimente: TeXML

  • cf. TeXML – Erster Überblick

TeX als XML. Daten nur einmal kodieren und in nur einer Quell-Datei editieren. Also der Versuch, mit einem Datenformat sowohl eine (wenigstens hinreichende) Anzeige im Web zu erhalten, als auch die typographische Qualität von La/TeX für individuell gestaltete Dokumente und andere Ziel-Formate (Papier oder PDF) zu ermöglichen.



Gesetzt aus/für Verdana & Courier
2005 ff. ©|© Stefan Unterstein