StartseiteImpressum

Wie funktioniert das Internet?

Eine Dokumentation von Max Grossmann


Inhaltsverzeichnis

  1. Einleitung
    1. Motivation
  2. Grundlagen
    1. Das Telefon
    2. Ursprünge und Geschichtliches
    3. WWW und Internet: Zwei Paar Schuh
    4. Heute
      1. Voraussetzungen
      2. DSL, das „Schnell-Internet“
  3. Technik
    1. Glasfaser – ein Meilenstein
    2. Client-Server – eine Liebesbeziehung
    3. Der Browser
    4. Ports & DNS
    5. Der Request
    6. Über den Tellerand: andere Protokolle
  4. Schluss

Einleitung

Ohne Internet ist ein Leben heute nicht mehr denkbar. Das weltweite Netz ist billig und bietet einen riesigen Mehrwert aus einem unerschöpflichen Topf voller interessanter Dienste und Protokolle wie HTTP oder die E-Mail- Protokoll SMTP und POP3. Ich möchte Ihnen in dieser Dokumentation nicht vorstellen, welche Dienste und Websites es gibt – das würde den Rahmen dieser Seite sprengen. Ich werde hier erklären, wie das Internet von der technischen Seite her funktioniert.

Motivation

Noch vor wenigen Jahren galt das Internet nur als „Trend“, der bald wieder untergehen würde. Aber dem war nicht so. Das Internet blieb weiterhin Bestandteil unserer täglichen Arbeit und das wird es auch bleiben. Wer eine Website betreibt, schafft sich Platz für die eigene Präsentation - und das sehr günstig. Manche Anbieter vergeben für weniger als 5,— € eine neue Domain mit Speicherplatz. Doch ein eigener Platz im Netz ist nicht nur Zeichen für Modernität und Professionalität, sondern gibt Möglichkeiten zur digitalen Kommunikation – eine eigene E-Mail-Adresse á la info@meine-firma.de macht etwas her.
Meiner Meinung sollte jeder Mensch freien Zugang zu den Ressourcen haben - Gesunde wie auch Behinderte, egal welcher Art. Doch man sollte nicht nur im Internet surfen – die Person sollte wissen, wie das Internet funktioniert und wo die Ursprünge liegen. Dafür gibt es diese Dokumentation.


Grundlagen

Das Telefon

Das Internet funktioniert ursprünglich über das Telefon. Ohne die deutsche Erfindung hätte es wohl auch nie das Internet gegeben. Über die Telefonleitungen werden digitale Signale (0 und 1) übertragen, die am Server wieder in Zeichen umgewandelt werden. Ein Computerprogramm interpretiert die Befehle und sendet – wieder über das Telefonnetz – eine Antwort zurück. Diese Antwort kann positiv, negativ oder nichts von beidem sein. Der Client (z.B. der Browser) parst (wertet aus) die Antwort und unterteilt sie in Header und den Content. Der Content ist die im Browserfeld als Layout angezeigte, aufgerufene Seite. Im WWW (HTTP, Port 80) ist der bekannteste Fehler 404: Nicht gefunden. Wenn alles klappt, gibt der Server den Statuscode 200 zurück.

Ursprünge und Geschichtliches

Die Ursprünge des Internets liegen im kalten Krieg. In den frühen 60er Jahren wurde von der US Air Force ein Computernetz in Auftrag gegeben, dass selbst einen atomaren Angriff durch den Gegner problemlos überstehen könnte. Bis in die Mitte der 60er Jahre waren vier Rechner an das „ARPAnet“ angeschlossen. Später wurde das europäische Netz „europaNET“ entwickelt, welches die ersten deutschen Universitäten einband und TCP/IP unterstützte. Dann schließlich ging es bergaufwärts. Tim Berners-Lee, ein gebürtiger Brite, schrieb sich ein Programm, mit dem er einzelne Abschnitte verlinkte (Knoten). Ende 88 entschied er sich, daraus ein weltweites, riesiges Computernetz zu machen. 1990 erhielt das Projekt seinen Namen: World Wide Web. Er erfand HTTP, die URIs (Ortsbestimmung eines Dokuments) und HTML (Auszeichnungssprache im Web). Er stellte das Projekt auf einigen Messen vor und es entstanden erste Web-Browser.

WWW und Internet: Zwei Paar Schuh

Die beiden Begriffe Internet und WWW (oder Web) werden gerne verwechselt. Mit Internet werden alle angebotenen Dienste bezeichnet, also auch VoIP, FTP oder E-Mails. Mit "Web" oder "WWW" ist jedoch in der Regel nur der Zugriff auf Webseiten über Webbrowser, also das klassische Surfen gemeint.

Heute

An dem Grundprinzip des Internets, Informationen bereitzustellen, hat sich bis heute nichts geändert. Doch heute ist das Web moderner und schneller, was vor allem der größeren Verbreitung des Internets zu verdanken ist.

Voraussetzungen

Wer in das Internet will, braucht einen Computer mit Betriebssystem, einen Router (oder ein Modem) und einen Internetanschluss, der sich bei den Ortsanbietern bekommen lässt. Außerdem wird ein Browser benötigt, der bei den meisten Betriebssystemen bereits vorinstalliert ist. Meine Empfehlung lautet Mozilla Firefox. Außerdem wird zur besseren Sicherheit eine Firewall und ein Anti-Viren-Programm empfohlen.

DSL, das „Schnell-Internet“

Über DSL (Digital Subscriber Line) können digitale Leitungen per Glasfaser oder per Kupferleitungen über den Teilnehmeranschluss mit hohen Geschwindigkeiten übertragen werden. Bis zu 500 MBit/s sind möglich, die aber bisher leider nur in wenigen Teilen Deutschlands verfügbar sind. Bisher herrschen in manchen Gegenden noch ISDN- oder Modem-Verbindungen vor.


Technik

Ab hier geht es um die Technik des Internets, also eigentlich der Hauptteil.

Glasfaser – ein Meilenstein

In den meisten deutschen Städten wird es heute schon verwendet, in Übersee sowieso und mittlerweile ist es unersetzlich geworden. Wovon ich spreche? Ich spreche von Glasfaser, einer sehr effizienten Technik, mit welcher durch Totalbrechung des Lichtes Lichtsignale verlustfrei übertragen werden können. Erst nach etwa 30km muss das Licht verstärkt werden. Dies geschieht mit modernsten Geräten, die das Sonnenlicht in die Kabel „beamt“. Doch warum keine Kupferleitungen? Kupfer ist ein Metall, das immer knapper wird. Außerdem kann Kupfer Strom (der auch erzeugt werden muss!) nur begrenzt gut leiten und muss dauerhaft verstärkt werden. Das Material für Glasfaser ist in der Natur jedoch reichlich vorhanden: es handelt sich um SiO2 (Siliciumdioxid), ganz normalen Quarzsand!

Client-Server – eine Liebesbeziehung

Jeder an das Internet angeschlossene Computer erhält vom ISP (Internetprovider) eine einmalige IP-Adresse, die aus vier Adressbereichen besteht. Der ISP muss bei der jeweiligen Organisation ICANN größere IP-Räume kaufen, die er dann frei an seine Kunden vergeben kann.

001   .   001   .   001   .   001
             – bis -
255   .   255   .   255   .   255

Dieser Standard nennt sich TCP/IP.

Jeder Adressbereich der IP-Adressen kann maximal 255 Zahlen beinhalten. Somit können nur 4.228.250.625 Geräte an das Internet angeschlossen werden. Gegen dieses Dilemma wurden die IPv6-Spezifikation (die IPv4 noch nicht abgelöst hat) entwickelt, die mehrere Quadrillionen Computer zulässt, aber auch von IP-Adressen her weitaus komplizierter ist. Dies wurde nötig, nachdem immer mehr kleine Geräte das Internet für ihren Teil eroberten.
Somit hat der Client und der Server eine IP-Adresse. So kommunizieren sie und senden Ihre Anfragen bzw. Antworten zurück. Somit ist keine anonyme Anfrage/Antwort möglich, da sie sonst nie ankommen könnte.
Wenn der Client eine Anfrage sendet und der Server antwortet, dann nennt man das Client-Server-Beziehung.

Der Browser

Der (Web-)Browser ist die Software, mit welcher im Web gesurft wird. Es gibt viele verschiedene Browser, der bekannteste wird der Internet Explorer von Microsoft™ sein, Webentwickler nutzen meist den sehr guten Mozilla Firefox, der frei verfügbar ist und unter der Mozilla-Website heruntergeladen werden kann.
Der Browser hat die Aufgabe, die Anfragen zu senden und die Antworten zu interpretieren und auszugeben, also das HTML in Layout umzuwandeln. Das klappt jedoch nicht immer, meist liegt es am Website-Entwickler, aber – im Fall Internet Explorers – am Browser.

Ports & DNS

Damit das Internet funktioniert, werden sogenannte Ports benötigt. Die Protokolle wie HTTP schicken ihre Anfragen an bestimmten „Kanälen“ an den Server, der diese dann auswertet und eine spezifische Antwort an den Clienten (den Browser) zurückschickt.

Port Protokoll
21 FTP
25 SMTP
53 DNS
80 HTTP
110 POP3

Damit die Anfrage auch dort ankommt, wo sie „hin will“, werden Vermittlungsstellen benötigt, wie beim Telefonnetz. Im Internet nennt man diese Vermittlungsstellen DNS-Server. Für die verschiedenen TLDs (Top Level Domains) wie *.de, *.com, *.org, etc. gibt es diese speziellen Server, die Anfragen umleiten. Ohne diese Vermittlungsstellen könnte das Internet nur mit kryptischen Nummern funktionieren – Menschen können sich aber Namen besser merken. Der Weg eines Requests geht vereinfacht so:

-------------    |-------|                  |-------|
|           |=~~=| [ – ] |                  | [ – ] |
|           |    |       |       [...]      |       |
|           |    |       |                  |       |
-------------    | O.    |       [...]      | O.    |
     | |         |-------| =~~~~~~^~^~~~~~= |-------|
                                weitere
Client --------> DNS-Server ------------> Server
sendet Request  wandelt Namen     gibt spezifische Antwort

Client <-------- DNS-Server <------------ Server
Der Request

Der Request ist die Anfrage. Da Sie jetzt schon wissen dürften, was das ist, sehen wir nun hier, wie eine Anfrage in der normalen Benutzung aussieht.
Nehmen wir an, der Client sendet folgenden Request an www.example.com, weil er die Seite „test.html“ aufrufen möchte:

GET /test.html HTTP/1.1
Host: www.example.com

In der ersten Zeile wird definiert, dass die Anwendung die Datei „test.html“ im Hauptverzeichnis (root oder "/") bekommen (englisch „to get“) möchte. Der Host (die Domain) ist hier „www.example.com“. Im Request werden häufig noch andere Dinge definiert, wie Referrer (Seite, die davor aufgerufen wurde) oder Browser. Der Server erhält diese Anfrage und sendet die Datei (hoffentlich) zurück. Das könnte so aussehen:

200 OK
Date: Fri, 15 May 2009 14:58:20 GMT
Server: Apache
Connection: Keep-alive
Content-Length: 16

<b>It works!</b>

Nachdem der DNS-Server die Hostadresse aufgelöst hat, passiert etwas Interessantes. Was passiert, ist hier in dieser Liste aufgeführt, die jeweils die Zeilennummer beschreibt:

  1. Alles ist korrekt und es gab keinen Fehler.
  2. Datum der Antwort
  3. Server-Programm (meistens Apache)
  4. Browser wartet auf Content
  5. Länge des Contents in Bytes (hier 16)

Nach einer Leerzeile kommt der HTML-Code, der hier „It works!“ beinhaltet. Der HTML-Quelltext muss vom Browser geparst, also in in Layout umgewandelt werden.
Dieses Vorgehen passiert bei jedem Webseitenaufruf und bei jedem, möglicherweise unbewusstem, Aufruf von Dateien wie Styles oder externes Javascript.

Über den Tellerand: andere Protokolle

Jetzt schauen wir zum Schluss noch mal über den Tellerrand: was gibt es noch für Protokolle? Es gibt noch eine ganze Reihe von Protokollen, die in der täglichen Arbeit gebraucht werden, wie etwa die E-Mail-Protokolle SMTP (Versand) und POP (Empfang). Außerdem ist FTP existent, welches die Dateiübertragung auf einen Server möglich macht. Diese ganzen Protokolle werden täglich milliardenfach genutzt. Trotzdem bezweifelt niemand die Standards dieser Protokolle. Neue Protokolle haben im Internet keine Chance – das sieht man am sogenannten Server-Push, der sich glücklicherweise nicht durchsetzte. Dabei zwängt der Server dem Clienten Daten auf, die er aber nicht angefordert hat.
Allerdings gibt es auch „ausgestorbene“ Protokolle, wie etwa Gopher, die aber trotzdem noch in Uni-Großrechnern genutzt werden. Trotzdem ist und bleibt HTTP das wichtigste Protokoll.


Schluss

Ich habe versucht, hier mein Wissen zum Internet wiederzugeben. Ich hoffe, das ist mir auch geglückt. Wenn Sie eine Frage oder Kritik haben, lassen Sie sie mir zukommen: mrpg@emailn.de.
Vielen Dank.



© Max Großmann 2009. Jegliche Vervielfältigung ohne Zustimmung verboten.