Bitte wählen Sie:

HTML - Seitenbeschreibungssprache mit Hypertext-Funktion

Woher kommt HTML?

HTML steht für Hypertext Markup Language und ist schon seit den 90er Jahren des vergangenen Jahrhunderts der Standard für Dokumente, die im Internet zur Verfügung stehen sollen.

HTML gehört neben dem http-Protokoll (,das den Informationsaustausch zwischen Webserver und Webclient regelt) und der Spezifikation für das Adressformat für Dateiquellen URI (Unique Resource Identifier) zu den drei klassischen Säulen des World Wide Web.

In HTML ist die Idee des Hypertexts verwirklicht. Das Konzept des Hypertexts war, Bezüge von einem Textdokument zu anderen Dokumenten herzustellen. Umgesetzt wurde das in der Internet-Frühzeit durch spezielle Markierungen im Text. Damit ist keine Markierung wie Fett- oder Kursivschreibung gemeint, sondern eine Textauszeichnung, also voran- und nachgestellte Zeichenketten, die als Steuerzeichen definiert waren.

Damit konnte man die Stellen auszeichnen, die einen Bezug zu einem anderen Dokument herstellen. Dabei - so die ursprüngliche Konzeption - sollte die Verbindung nicht nur in eine Richtung geschehen, also nicht nur von Textstelle in Text A auf Text B. Auch in Text B würde, so die Idee, eine Liste hinterlegt werden, die Rückverweise auf Text A enthält.

Die Konzeption, auf diese Weise ein Wissensnetz aufzubauen, ging auf Erkenntnisse der Physiologie zurück und orientierte sich an der Arbeitsweise des menschlichen Gehirns, das Wissen in Form von aktivierbaren neuronalen Netzen repräsentiert. Wenn man so will, war dies der Versuch, Wissen nicht mehr linear wie in Büchern, sondern als Netzwerk zu organisieren und viele Dokumente miteinander zu verweben.

Was heute davon blieb, ist die Fähigkeit des vor diesem Denkhintergrund entstandenen Konstrukts HTML innerhalb eines Webdokuments auf andere Dokumente zu verweisen. Das ist das, was heute ein Link in einem Text im Web ausmacht. Per Klick wird ein anderes Dokument angezeigt. Auf diese Art und Weise werden Webseiten, die in HTML geformt sind miteinander verknüpft.

Das womöglich bisher größte ungelöste Problem ist, dass durch diese Art der Wissensrepräsentation zwar eine Kette von Begriffen entstehen kann, in dieser Verlinkung ist aber keine Information darüber enthalten, in welcher Beziehung Link A zu Dokument B steht. Verschiedene Ansätze versuchen dieses Manko zu beseitigen. Als Autor von HTML-Texten kann man den Auszeichnungen weitere Elemente hinzufügen, die die Beziehung beider Webdokumente beschreiben können. Für verschiedene Einsatzbereiche gibt es verschiedene Vokabulare und Möglichkeiten, diese zusätzlichen Auszeichnungen anzubringen. Eine vielversprechende Entwicklung ist unter schema.org beschrieben.

Natürlich sind auch Suchmaschinen sehr daran interessiert, die Beziehung zwischen vernetzten Webdokumenten besser einordnen zu können. Dies kann als wichtiger Schritt auf dem Weg zu einer semantischen Suche gelten. Suchmaschinen gehen deswegen dazu über, diese für den User unsichtbaren Elemente zur Analyse des Webdokuments heranzuziehen.

In diese Kategorie fallen auch OG-Tags, die man inzwischen im HEAD-Bereich vieler Webseiten findet und von Facebook und Twitter verwendet werden. OG steht für Open Graph. Das Open Graph Protocol ist hier beschrieben.

Bekannt sind inzwischen auch einige Dublin Core Tags, mit denen sich Angaben zum Dokument integrieren lassen. Die am häufigsten verwendten Tag dürften rel = "publisher" und rel = "author" sein.


Was kann HTML?

HTML heißt Auszeichnungssprache, weil viele spezielle Zeichenfolgen festgelegt worden sind, die eine Art Vorschrift bilden, wie der den Steuerzeichenketten folgende Text von den Browsern gehandhabt und dargestellt werden soll. Dabei ist das Prinzip, dass der darzustellende Textteil mit Einleitungs- und Beendigungssteuerzeichenketten eingebaut werden soll. Die steuernden Zeichenketten werden Tags genannt.

Um abzugrenzen, was Steuerzeichenkette und was darzustellender Text ist, verwendet man die eckigen Klammern: Das Zeichen „<“, wird verwendet, um darzustellen, dass die Steuerzeichenkette hier beginnt und das Zeichen „>“, signalisiert, dass sie hier wieder zu Ende ist. Der dazwischen eingeschlossene Text ist von der Auszeichnungsvorschrift betroffen. Es gibt also immer einen Anfangs- und einen End-Tag.

Wie die Steuerzeichnungsketten auszusehen haben und was sie bewirken sollen, ist von einer Organisation festgelegt worden, die sich World Wide Web Consortium (Abkürzung: W3C) nennt. Mitglied des W3C können Unternehmen, Verbände, Vereine und auch Einzelpersonen werden. Textdokumente, die mit HTML-Elementen ausgezeichnet sind, kann man immer noch relativ gut lesen, auch wenn es im Text vor lauter eckigen Klammern wimmelt.

Wie ein HTML Dokument strukturell auszusehen hat, welche Tags möglich sind und wie sie ineinander verschachtelbar sind, ist von w3c genau spezifiziert. Die innere Struktur eines HTML-Dokuments muss dem DOM-Modell entsprechen. DOM steht für Document Object Model. Es handelt sich um eine grundsätzlich hierarchisch aufgebaute Struktur. Das W3C bietet einen kostenlosen Service an, mit dem man feststellen kann, ob das erstellte HTML-Dokument gemäßt seiner Spezifikation valide (gültig) ist. HTML-Dokumente sollten gültig sein, damit diese in allen konformen Browsern wie von Autor beabsichtigt dargestellt werden. Der Validierungsservice des W3C ist hier zu finden: validator.w3.org

Das Gute daran ist, dass man eigentlich nur einen Texteditor braucht, um HTM-Dokumente herzustellen und zu verändern, auch wenn dies auf Dauer sehr mühsam wird. Natürlich sollen die Adressaten des mit HTML ausgezeichneten Textes diese Texte nicht in dieser Form präsentiert bekommen, sondern nach einer Interpretation der Darstellungsvorschriften die die HTML-Elemente für die einzelnen Textteile liefern. Dies ist genau das, was ein Webbrowser wie Firefox, Chrome oder leisten: Die Interpretation der HTML-Darstellungsvorschriften. Im Laufe der Zeit ist der Umfang der Darstellungsvorschriften mehrmals erweitert und ergänzt worden. Daher gibt es verschiedene Versionen von HTML. Aktuell wird oft XHTML verwendet. Neuer Standard ist HTML5

XHTML wurde mithilfe einer allgemeinen genormten Auszeichnungssprache, nämlich XML, neu definiert, während die Definition von HTML4 noch einer anderen genormten Auszeichnungssprache, nämlich SGML folgte. Beide sind im Prinzip Definitionssprachen für Auszeichnungssprachen wie HTML (aber nicht nur dafür, beide haben noch viele weitere Ableger). Wenn man so will, ist XHTML eine Anwendung von XML und HTML4 noch eine Anwendung von SGML. Doch die Entwicklung bleibt nicht stehen: Immer mehr Webseiten sind schon in HTML5 codiert. Aktuelle Webbrowser verstehen meist alle gängigen und im Web verwendeten HTML-Dialekte und können in der Regel die Webseiten so darstellen wie Autor das wollte.


Erweiterungen für HTML

Andere Erweiterungen von HTML hatten das Ziel, Webseiten mit mehr Funktionen ausstatten zu können. Pures HTML ist nicht in der Lage, einfache Rechenoperationen wie 1+1 auszuführen. Es ist eben „nur“ eine Auszeichnungssprache. Wenn solche Arbeiten wie eine Addition von Zahlen verrichtet werden muss, wird Rechenkapazität benötigt, was bei einfachen Additionen weder für den Webbrowser noch für den Webserver ein Problem wäre.

Doch umfangreiche Rechenoperationen können prinzipiell die Hardware an den Rand der Leistungsfähigkeit bringen. Um rechenintensivere Operationen überhaupt ausführen zu können, wird Javascript eingesetzt. Javascript-fähige Browser können entsprechende Skripte ausführen. Sie lassen sich sich in die HTML-Dokumente einbetten oder aus ihnen heraus aufrufen. Die Ausführung wird vom Webbrowser gesteuert. Dieser muss dann die Rechenoperationen mithilfe des Prozessors und des PCs, Notebooks oder auch Smartphones, auf dem er läuft, bewältigen.

Aktuelle Entwicklungen gehen dahin, rechenintensive Operationen serverseitig ausführen zu lassen. Es gibt einen vielversprechenden Ansatz für serverseitiges Javascript in Form von node.js.

Mit dem Wunsch, die Darstellung von Elementen in den Browsern zu verbessern, hat sich das Prinzip entwickelt, Darstellungsvorschriften für Farbe, Schriftart und Positionierungen mit Cascading Style Sheets zu handhaben. Diese legen fest, wie zum Beispiel eine Überschrift dargestellt wird, daas heißt, mit welcher Zeichengröße, Schriftart, mit welchem Abstand zum Absatztext usw. sie präsentiert werden soll.

Die entsprechenden CSS-Stile für ein HTML-Element müssen nicht in das HTML-Dokument geschrieben werden, sondern können inkludiert werden.

Den HTML - Tags kommt die Aufgabe zu, mitzuteilen, welcher Text z.B. eine Überschrift ist. Die Stylesheets sagen aus, wie die Überschriften aussehen sollen, z.B. 14 Punkt groß, fett und unterstrichen. Da Stylesheets aufeinander aufbauen können, nennt man sie Cascading Style Sheets, kurz CSS.


Wie erstellt man HTML-Dokumente?

Um Webseiten oder einen kompletten Internetauftritt zu erstellen, sind Kenntnisse in HTML, CSS, Javascript hilfreich. Wenn es sich um Webprojekte handelt, die ganz neue Wege gehen, ist dies unabdingbar. Für Webprojekte, in denen nicht die technische Innovation, sondern die Inhalte im Vordergrund stehen, was bei kommerziellen Websites meist der Fall ist, greift man Software zurück, die fast schon wie eine Art Textverarbeitungsprogramm für Webseiten funktioniert. Statt mühsam die Auszeichnungen in Klammern in eine Textdatei zu schreiben, bearbeitet man das Dokument im What-You-See-Is-What-You-Get -Modus: Man sieht als Ersteller des Dokuments das Ergebnis schon so wie es später im Web erscheinen wird, ohne sich um HTML - und CSS Syntax zu kümmern. Softwareprodukte, die das leisten, sind das teuere (da im Profisegment beheimatete) Adobe Dreamweaver oder das günstige Coffeecup.

Als Alternative zu diesen Softwarepaketen ist goneo easyPage entwickelt worden. Auch easyPage ist ein What-You-See-Is-What-You-Get-Bearbeitungsprogramm. Es läuft allerdings auf den Servern von goneo und wird mit einem Browser bedient. Ein weiterer Vorteil von easyPage ist, dass man hier nicht mit einer weißen Seite startet, sondern professionell designte Vorlagen zur Auswahl hat, die man entsprechend seiner Bedürfnisse und geschmacklichen Vorlieben mit wenigen Klicks verändert. Ist die Website mit easyPage fertig gestellt, genügt es, das Ergebnis zu veröffentlichen. Das System legt dann die von ihm erzeugten HTML- , CSS- und Javascriptdateien dem goneo Webserver ab. Danach steht Ihre mit easyPage generierte Website im World Wide Web allen Internetusern zur Verfügung.