Tout ce que vous avez toujours voulu savoir sur l'Internet, sans avoir jamais os? le demander... Dominique Desbois

L'Internet est un réseau mondial fédérant les réseaux télématiques sur la base d'un protocole commun de transmission des informations, TCP/IP (1). Bien qu'il ne s'agisse pas d'une norme, TCP/IP est un standard de facto, car il fournit un langage commun pour l'inter-opérabilité des différents types de réseaux locaux basés sur des protocoles distincts (Netware, Appletalk, DECnet, etc.).

Brève histoire de l'Internet

Vers la fin des années soixante, l'ARPA (2) en tant qu'agence spécialisée dans le pilotage des projets de recherche au ministère US de la Défense (le DoD) développa un réseau télématique (ARPAnet) pour relier les différents sous-traitants de la recherche militaire de haute technologie. C'est alors que fut développé le protocole TCP/IP comme standard de communication sur ce réseau. Puis, dans le courant des années 80, la NSF (3) créa un réseau télématique (NSFNET) pour relier ses différents centres informatiques équipés de super-ordinateurs, afin d'assurer pour la communauté scientifique intéressée par le calcul numérique intensif, l'accès à des services spécifiques. Adoptant le protocole TCP/IP, NFSNET constitua ainsi l'infrastructure de transmission à grande vitesse sur laquelle vint se greffer le développement du réseau Internet.
Depuis sa création en 1985, l'Internet est passé de 200 à plus de 30 000 réseaux et de 1 000 à plus de 2 million d'hôtes (les ordinateurs des usagers). Sur ces 2 millions d'hôtes, on relève environ 32% de sites académiques (enseignement et recherche), 26% de sites commerciaux et 11% de sites militaires et gouvernementaux. Environ 65% de ces sites sont situés aux USA, le reste étant réparti à travers le monde de façon assez inégale. En six ans, le trafic de l'infrastructure NFSNET est passé de 85 millions de paquets (4) en Janvier 1988 à plus de 6 500 milliards de paquets en 1994. Le rythme de croissance actuel du trafic sur le réseau est de l'ordre de 6% par mois.
L'usage le plus fréquent est certainement le courrier électronique (échanger des messages au moyen du réseau télématique). Viennent ensuite le transfert de fichier (transporter des données ou des programmes d'un ordinateur à l'autre sur le réseau) et la connexion à distance (se connecter sur un ordinateur du réseau appartenant à un site différent). En termes de volume, 37% du trafic est constitué par le transfert de fichiers, contre 16% pour les activités de messagerie électronique (courrier et nouvelles) et 7% seulement consacré à la recherche d'informations de type catalographique avec des programmes de requêtes tels que gopher ou www (5). Grâce à ce type de facilités, les usagers peuvent effectuer des recherches bibliographiques (y compris dans le catalogue de la Librairie du Congrès ou bien dans les fonds documentaires de certaines bibliothèques universitaires), télécharger des données ou des programmes ou participer à des groupes de discussion sur différents thèmes (téléconférences).

Structure de l'Internet

La structure de l'Internet est en général décrite sous la forme d'une hiérarchie à trois niveaux. A la base de cette hiérarchie figurent les réseaux locaux (LAN (6)), le réseau télématique construit autour d'un campus universitaire en constitue l'exemple le plus courant. En général, ces réseaux locaux sont connectés à des plaques régionales déterminées par rapport à une circonscription administrative ou une entité géographique. Ces plaques régionales sont interconnectées par une ou plusieurs infrastructures nationales. Les différentes infrastructures nationales sont interconnectées au niveau international par l'inter-réseau, ensemble de noeuds de transits internationaux.
En théorie, la gestion de l'Internet n'est pas centralisée : le réseau est conçu sur le modèle fédéral et différents types de partenaires émanant de plus de 70 pays y participent. Cependant, l'influence des décisions techniques est déterminante et en fait peu de pays ont la capacité d'expertise leur permettant de participer pleinement aux divers comités techniques qui prennent les décisions opérationnelles dans la mise au point des standards d'inter-opérabilité. Les plaques régionales sont gérées par des organismes à but non-lucratif ; il peut s'agir d'un regroupement d'universités sur une base géographique ou d'une agence étatique, selon les cas.
Aux USA, il existe quatre infrastructures publiques : NFSNET, Alternet, PSInet et SprintLink ; ce sont des réseaux basés sur des fibres optiques. NFSNET est financé par la NSF et constitue l'héritier direct du réseau ARPANET, l'ancêtre de tous les réseaux TCP/IP. Les autres infrastructures sont privées et gérées par des organismes à but lucratif. Les plaques régionales assurent la connectivité entre les utilisateurs finaux et l'infrastructure NFSNET. La plupart des universités et des grands organismes nationaux possèdent des liaisons spécialisées qui les relient directement au concentrateur régional. On compte actuellement une douzaine de plaques régionales. La plupart de ces plaques régionales reçoivent des subventions de la NSF et certaines d'entre elles sont co-financées par les différents Etats. Une grande partie de leur financement provient des droits de rattachement payés par les réseaux locaux. Une grande université peut payer de 60 000 à 100 000 $ par an le droit de connecter son réseau local à une plaque régionale.
En raison de son financement à caractère public, NFSNET avait à l'origine limité l'usage du réseau aux projets éducatifs et aux applications scientifiques. Cependant, la croissance rapide de l'Internet a suscité vers la fin des années 80 une pression de plus en plus forte pour l'ouverture aux usages commerciaux. Puisque l'Internet n'est pas considéré aux USA comme un service à valeur ajoutée, l'entrée d'un opérateur privé sur ce marché n'est réglementée ni par la FCC (7) au niveau fédéral, ni par les commissions d'utilité publique au niveau des différents Etats.
C'est ainsi que les infrastructures commerciales et NFSNET sont désormais interconnectées pour que le trafic puisse passer de l'une à l'autre. Etant donné que les informations à caractère scientifique ou commercial circulent désormais sur la même fibre optique, la politique mise en place par la NSF est devenue lettre morte. Les charges afférentes à cette interconnexion sont actuellement minimes et de vifs débats sont en cours pour instaurer un futur système de droits d'entrée basé véritablement sur les différences d'utilisation du réseau.
Actuellement, la gestion de l'infrastructure NFSNET est confiée par la NSF à Merit (8) Network Inc. qui en fait sous-traite ses responsabilités opérationnelles à un organisme non-lucratif, l'ANS (9), à l'origine fondé conjointement par IBM et MCI (10).

Coût de l'Internet

Il est quasiment impossible d'avancer un chiffre, puisque cela supposerait de comptabiliser les coûts de milliers de réseaux privés dont chaque opérateur serait opposé vraisemblablement à la communication de telles informations. Cependant, on peut toujours essayer d'évaluer les coûts supportés par l'infrastructure NFSNET puisque son financement est public. En 1993, la NSF a payé à Merit Inc. la somme de 11,5 millions de dollars pour la gestion de cette infrastructure. Environ 80% de cette somme est dévolue à la location des liaisons sur fibre optique et des routeurs (ordinateurs spécialisés dans le routage des paquets et la commutation de circuits). Le budget de fonctionnement du centre opérationnel (NOC (11)) qui permet le contrôle et la régulation du trafic, assure l'entretien du réseau et veille aux problèmes de sécurité, représente 7% du budget global. Il faut également ajouter à cette somme les quelques 7 millions de dollars de subventions distribuées par la NSF aux plaques régionales. Ce qui porte le budget global de subvention du fonctionnement de l'Internet à environ 20 millions de dollars, soit pour les 20 millions d'usagers du réseau, une subvention de l'ordre de 1 dollar par usager et par an. Bien sûr, il ne s'agit pas du coût total de l'Internet car cela n'inclut pas l'ensemble des fonds publics consacrés à son fonctionnement, comme par exemple les financements fournis par les Etats, ceux des universités financées par les Etats tout comme les fonds provenant d'autres gouvernements. Personne ne sait comment on peut les comptabiliser, cependant certains projets de recherche tentent d'estimer les dépenses globales engagées par les USA dans le fonctionnement de l'Internet. On suppose, plus que l'on estime, que la subvention de 20 millions de dollars versée par la NSF représenterait moins de 10% de la dépense globale supportée par les USA.
L'infrastructure NFSNET sera très probablement abandonnée dans un proche avenir. En raison de la prolifération d'infrastructures et d'interconnexions de plaques régionales à vocation commerciale, l'existence d'une infrastructure sur la base d'un financement fédéral est remise en question. Dans de récents communiqués, la NSF a annoncé qu'elle financerait uniquement des points d'accès aux réseaux permettant d'interconnecter les différentes infrastructures privées et plaques régionales et le service de routage performant qui devrait accompagner ce dispositif. Les six super-ordinateurs de la NSF dédiés au calcul intensif seront reliés par une infrastructure à très haut débit (VBNS (12)) dont l'accès devrait être restreint aux chercheurs et services spécialisés. Son but sera de définir des spécifications de développement en matière de transmission vidéo et de visualisation haute définition à distance.
Le nouveau réseau interne aux USA devrait être moins hiérarchique et plus interconnecté. La séparation entre l'infrastructure et les plaques régionales devrait s'estomper au fur et à mesure que celles-ci se connecteront aux futurs points d'accès et que le trafic s'écoulera plutôt à travers la chaîne des plaques régionales que par l'intermédiaire de l'infrastructure.
La plupart des utilisateurs de l'Internet accède au réseau par l'intermédiaire du réseau de leur employeur connecté à une plaque régionale. Cependant, depuis quelques années, un certain nombre de fournisseurs indépendants ont émergé. Ils proposent à des petites et moyennes entreprises ou à des particuliers des accès à l'Internet en utilisant soit des liaisons louées soit le réseau commuté. Depuis 1993, certains réseaux privés tels que Delphi ou World ont offert un service d'accès complet à l'Internet pour leurs clients tandis que d'autres tels que Compuserve offrent la possibilité d'échanges de messagerie électronique avec l'Internet depuis plusieurs années déjà.
Il existe désormais un grand nombre d'infrastructures et de plaques régionales dans d'autres pays. Par exemple, la plupart des pays européens ont des réseaux nationaux rattachés à l'infrastructure européenne Ebone (13). Cette infrastructure de communication pourrait être améliorée car elle souffre de problèmes d'efficacité : il est, par exemple, courant que le trafic entre deux pays européens soit acheminé par l'infrastructure NFSNET aux USA en raison de problèmes de saturation des liaisons intra-européennes.

Technologie de l'Internet

La plupart des infrastructures et des plaques régionales utilisent des liaisons téléphoniques louées. Cependant, la distinction fondamentale s'opère dans la technique de transmission utilisée sur ces lignes téléphoniques : les compagnies de téléphones utilisent la commutation de circuit alors que l'Internet utilise la commutation de paquets. Cette distinction peut paraître absconse mais elle influe de façon déterminante sur le coût et les politiques d'utilisation du réseau.
Les réseaux téléphoniques utilisent la commutation de circuit : un circuit de bout en bout doit être réalisé pour que la communication soit établie. Un quota déterminé des ressources du réseau est réservé pour établir la communication et aucun autre appel ne peut utiliser ces ressources avant que cette communication soit terminée. Ce qui signifie qu'un long silence entre deux adolescents timides utilise les mêmes ressources qu'une négociation serrée entre deux avocats expérimentés. La commutation de circuits offre des garanties de performances telles que le délai maximum de réponse, ce qui est essentiel pour des applications temps-réel comme la téléphonie. Il est également plus facile d'offrir une facturation détaillée à l'usager.
L'Internet utilise une technique de commutation de paquets. Le terme de paquet indique que le flot de données émis par votre ordinateur est découpé en fractions de 200 octets (en moyenne) pour circuler sur le réseau. Chaque paquet est doté d'une en-tête qui contient l'information nécessaire à l'acheminement du paquet de son origine vers sa destination. Ainsi, au sein du flot de données circulant sur le réseau chaque paquet est indépendant.
L'avantage principal de la commutation de paquets est de permettre un multiplexage statistique des différentes lignes de communication : c'est à dire que les paquets émanant de différentes sources peuvent circuler sur la même ligne, autorisant ainsi une utilisation efficiente d'une capacité fixe de transmission. Avec les techniques actuelles, les paquets sont admis sur le réseau sur la base du premier arrivé, premier servi. Si une surcharge du réseau intervient, les paquets seront alors mis en attente ou détruits.
Le protocole de transmission sur l'Internet est dit non-connecté. Cela signifie qu'il n'est pas nécessaire d'établir une communication de bout en bout sur le réseau ; chaque paquet est acheminé indépendamment vers sa destination. Dès qu'un paquet est prêt, l'ordinateur-hôte l'envoie à un autre ordinateur appelé routeur. Le routeur examine l'adresse de destination dans l'en-tête et envoie le paquet à un autre routeur, choisi d'après une heuristique de routage. Un paquet peut être acheminé d'un ordinateur à l'autre par l'intermédiaire d'une trentaine de routeurs. La topologie du réseau étant reconfigurée dynamiquement, différents paquets d'une même session peuvent être acheminés par des voies distinctes.
Tout au long du parcours, les paquets peuvent être scindés en paquets plus petits ou regroupés en paquets plus volumineux. Quand ces paquets atteignent leur destination finale, ils sont réassemblés par l'ordinateur-hôte. Ces règles d'assemblage et de désassemblage des paquets font partie intégrante du protocole TCP/IP.
Certains réseaux à commutation de paquets travaillent en mode dit connecté (en particulier, certains réseaux au protocole X25 comme Tymnet). Dans un tel réseau, la communication est établie avant que la transmission ne débute, comme dans les réseaux à commutation de circuits. Un chemin est alors défini et l'information nécessaire à l'acheminement des paquets est stockée dans la mémoire des routeurs. On peut dire que les réseaux travaillant en mode non-connecté économisent la mémoire des routeurs et les temps de connexion tandis que les réseaux travaillant en mode connecté économisent les calculs nécessaires au processus d'acheminement (qui sont refaits pour chaque paquet en mode non-connecté).
La technologie utilisée par l'Internet est constituée d'une infrastructure de lignes de communications reliées entre elles par des commutateurs ou des routeurs. Sur l'infrastructure ou les plaques régionales, la plupart sont des liaisons téléphoniques spécialisées mais commencent à être remplacées par des fibres optiques. Les routeurs sont des ordinateurs spécialisés ; ceux utilisés par NFSNET sont des stations de travail IBM RS6000 modifiées tandis que la plupart des routeurs utilisés par les autres opérateurs sont des processeurs spécialisés d'origine Cisco, Wellfleet, 3Com ou DEC, constructeurs qui détiennent la plus grande part du marché.
Le terme de rapidité est impropre puisqu'électrons ou photons ne peuvent circuler plus vite que la vitesse de la lumière quel que soit le support ; la vitesse d'acheminement d'une unité élémentaire d'information (bit) est sensiblement la même pour tous les réseaux. Il faut plutôt parler de débit : l'objectif étant d'envoyer simultanément le plus de bits possible par quantum de temps. Les usagers de modems téléphoniques sont maintenant familiers de cette course au débit : récemment les vitesses sont passées de 300 à 2 400, puis 4 800, 9600 voire maintenant à 19 200 bps (14). Les liaisons louées sont passées de 56 Kbps (15) à 1,5 Mbps (16) pour les liaisons T1 au cours des années 80, puis ont atteint des débits de 45 Mbps avec les liaisons T3 au début des années 90. Des liaisons à 155 Mbps sont désormais disponibles, bien qu'elles ne soient pas très répandues. Le Congrès des Etats-Unis souhaite implanter une infrastructure de communication à 1 Gbps (17) dès 1995 (la fameuse autoroute des données chère au vice-président Al Gore !). Pour fixer les idées, les actuelles liaisons T3 à 45 Mbps permettent de transférer environ 1400 pages de texte à la seconde. Une encyclopédie de 20 volumes peut être acheminée d'un océan à l'autre en 30 secondes grâce au réseau NFSNET. Cependant, il faut garder à l'esprit qu'il s'agit de la vitesse sur autoroute, les routes d'accès aux plaques régionales étant réalisées à partir de liaisons T1 beaucoup plus lentes.
Les contraintes économiques peuvent expliquer une grande part des préférences exprimées par l'Internet et d'autres réseaux publics de transmission de données en faveur de la commutation de paquets relativement à la commutation de circuits. Les réseaux à commutation de circuits utilisent un grand nombre de lignes afin d'économiser sur la commutation et le routage. Une fois la communication établie, la liaison est allouée quel que soit le taux de transfert de données et aucun calcul n'est nécessaire pour le routage de ces informations. L'utilisation d'une telle technique est pertinente lorsque le coût des lignes est relativement bon marché face à celui des commutateurs.
Chaque décennie voit le coût des équipements de télécommunications décroître de façon exponentielle. Cependant, depuis les années 70, le coût des commutateurs est relativement meilleur marché que celui des liaisons. C'est ainsi que la commutation de paquets est devenue un mode économique de transmission de données : au prix d'un supplément de calcul nécessité par le routage, on partage désormais les liaisons entre plusieurs connexions simultanées. Cette préférence pour une solution mettant en oeuvre beaucoup de routeurs bon marché avec peu de liaisons relativement onéreuses, se manifeste en particulier pour les infrastructures de réseau. Dans le cas de NFSNET, par exemple, chaque paquet entrant sur l'infrastructure passe par deux routeurs à l'entrée et deux autres à la sortie. Ainsi un paquet entrant à Cleveland et sortant à New York traverse quatre routeurs NFSNET mais seulement une liaison T3.

Facturation sur l'Internet

Jusqu'à une époque récente, la quasi-totalité des utilisateurs était facturée de façon identique quelle que soit leur utilisation de l'Internet. Une connexion de bande passante fixe était facturée par un forfait annuel, permettant un usage illimité jusqu'au débit maximum de la ligne (bande passante). Dans ce mode de facturation à la connexion, la plupart de ces connexions sont payées par des organismes gouvernementaux, fédéraux ou des universités, mais les utilisateurs finaux ne payent rien directement.
Même si ce schéma de facturation domine encore le marché, on enregistre d'ores et déjà un certain nombre de variantes. La plus significative est celle du débit d'informations garanti. Dans ce schéma, l'organisme s'acquitte de deux droits. Le premier est basé sur la bande passante de la liaison qui défini le débit maximum possible. Le second est basé sur le débit maximum garanti à l'usager. Les opérateurs de réseaux mettent en place des capacités suffisantes pour faire transiter simultanément l'ensemble du flot garanti émanant de leurs clients et installent des régulateurs de débit sur chaque connexion. Quand certains clients opèrent en dessous de leurs engagements, les excédents de capacités deviennent disponibles pour les autres utilisateurs sur la base d'une stratégie de service premier entrant, premier servi .
Ce dernier type de facturation est plus répandu sur les réseaux privés que sur l'Internet car le débit TCP/IP ne peut être garanti qu'à l'intérieur d'un même réseau, ce qui constitue une sérieuse limitation en attendant que les 20 000 réseaux de l'Internet offrent tous le même type de garantie. Les réseaux qui proposent la facturation à débit garanti, possèdent en général la capacité d'atteindre la totalité de la bande passante garantie. Un équivalent serait la situation où une banque possèderait un fonds de réserve correspondant à 100% de ses engagements. En l'état de la technologie, un tel dispositif est pourtant nécessaire puisque qu'il n'a pas de moyens, utilisables en commun, pour affecter un système de priorité aux paquets.
Dans la plupart des cas, les paquets entrant sur l'Internet ont un coût marginal nul. Cependant à la périphérie du réseau, on enregistre certaines exceptions. Par exemple, certains réseaux privés comme Compuserve fournissent des services de courrier électronique via l'Internet. Plusieurs d'entre-eux ont mis en place une tarification au message avec un coût unitaire très faible. Les réseaux publics au Chili et en Nouvelle-Zélande impose à leurs clients une tarification au paquet pour tout le trafic international.

Evolution de l'Internet

Actuellement beaucoup de réseaux informationnels se recouvrent (e.g., téléphone, télégraphe, câble, TV) et on assiste à l'émergence de nouveaux services (messageries vocales ou vidéo, téléphones portables). Chacun de ces réseaux informationnels est conçu en fonction d'un type particulier de services, la valeur ajoutée fournie par chacun des services étant suffisante pour supporter les coûts induits par la redondance des media physiques.
Cependant, en raison des coûts élevés d'implantation d'une infrastructure de communications, il y a une incitation très forte pour proposer des réseaux à intégration de services : toute ces informations pouvant être véhiculées sous forme digitale, il n'y a plus lieu de prévoir un réseau spécifique à chaque forme de communication. La convergence vers un réseau à intégration de services constitue désormais l'argument essentiel utilisé pour promouvoir de futures autoroutes de données. Cette mutation vers les réseaux à intégration de services aura des conséquences majeures sur la structure du marché et les modalités de la compétition.
Afin de favoriser l'émergence de ces réseaux à intégration de services, la communauté internationale a mandaté l'Union Internationale des Télécommunications (UIT) pour concevoir un nouveau type de réseau combinant la commutation de paquets et celle de circuits. C'est ainsi que le CCITT (18) a adopté récemment une recommandation concernant la commutation de cellules, appelée ATM (19), pour de futurs réseaux à haut débit. La commutation de cellules est similaire à la la commutation de paquets en ce qu'elle subdivise le flot des données en paquets pour les envoyer sur des lignes de communication partagées par plusieurs processus communicants. La différence majeure se situe au niveau de la taille des cellules qui est fixe, alors que la taille des paquets est variable. Cela permet d'obtenir des garanties sur les délais de transmission puisque qu'une cellule ne peut rester immobilisée derrière un paquet d'un volume trop important.
Un réseau ATM ressemble à un réseau à commutation de circuits par le fait qu'il fonctionne en mode connecté. Chaque connexion possède une phase d'établissement, durant laquelle est créé un circuit virtuel. Le fait que ce circuit soit virtuel et non physique a deux avantages majeurs. Le premier, c'est qu'il n'est pas nécessaire d'immobiliser les ressources du réseau pour une connexion donnée ; ainsi les économies réalisées par le multiplexage statistique sont préservées. En second lieu, une fois que le circuit virtuel est établi, le temps de commutation est optimisé ce qui permet un débit supérieur. A l'origine, la technologie ATM autorisait des débits de 155 Mbps tandis que les infrastructures classiques opéraient au débit maximum de 45 Mbps. L'évolution vers le Gigabit semble plus certaine pour les réseaux ATM que pour les réseaux traditionnels à commutation de paquets.
Aux Etats-Unis, la résolution fédérale sur le calcul intensif de 1991 (High Performance Computing Act) envisage une infrastructure à 1 Gigabit à l'horizon 95. Six réseaux expérimentaux permettent actuellement de tester différentes approches. Pour avoir une échelle d'appréciation du débit de ce type de réseaux, il suffit de rappeler que la plupart des universités sont connectées aujourd'hui avec des liaisons Internet à 56 Kbps. Avec un tel débit, il faut 5 heures pour transmettre 1 Gigabit.
Le développement des réseaux à intégration de service est actuellement en pleine expansion. Plusieurs opérateurs du câble ont déjà commencé à offrir des connexions Internet à leurs clients (20) ; ATT, MCI et toutes les compagnies issues du démantèlement du Bell System sont impliquées dans des joints ventures avec des opérateurs de câble TV et d'autres réseaux spécialisés pour la fourniture de nouveaux services tels que la vidéo à la carte. Les réseaux à technologie ATM, bien qu'ils aient été développés à l'origine pour la téléphonie, ont d'abord été utilisés comme des réseaux numériques locaux à certaines entreprises, voire régionaux pour certains opérateurs de l'infrastructure.

Notes

  1. Transmission Control Protocol / Internet Protocol
  2. Advanced Research Projects Administration
  3. National Science Foundation
  4. Le paquet est l'unité de transport d'information sur ce type de réseau. La taille moyenne des paquets est d'environ 200 caractères.
  5. Word Wide Web
  6. Local Area Network
  7. Federal Communication Commission
  8. Michigan Educational Research Information Triad
  9. Advanced Network & Services Inc.
  10. Consortium fondé par plusieurs industriels américains pour développer les recherches pré-compétitives en informatique.
  11. Network Operations Center
  12. Very high speed Backbone Network Service
  13. European Backbone
  14. bits par seconde
  15. Kilo-bit (103) par seconde
  16. Méga-bit (106) par seconde
  17. Giga-bit (109) par seconde
  18. Comité Consultatif International pour le Télégraphe et le Téléphone
  19. Asynchronous Transfer Mode
  20. Les réseaux du cable étant unidirectionnels la plupart du temps, ces solutions utilisent des connecteurs asymétriques qui fournissent l'information à 10 Mbps sur le cable TV mais qui envoient les réponses sur une ligne téléphonique à 14,4 Kbps. Ce schéma à la faveur de la plupart des utilisateurs qui déchargent des données plutôt qu'il ne les téléchargent.