P4 est un langage de programmation permettant d'exprimer la logique de traitement des paquets au sein d'un élément de communication de réseau informatique tel qu'un commutateur, une carte réseau, un routeur ou une appliance afin d'y exécuter des actions.
Le langage de programmation P4 a été proposé par certaines universités aux entreprises en 2014 et est décrit à l'origine dans un document du SIGCOMM CCR intitulé "Programming Protocol-Independent Packet Processors". La dénomination commune se raccourcit à l'acronyme "P4".
Le premier atelier sur le langage P4 a eu lieu le [1] à l'Université de Stanford, il était présidé par Nick McKeown de cette même université et Jennifer Rexford, de l'Université de Princeton.
Le consortium P4.org a publié la spécification finale de la nouvelle version du langage dénommée P416, en [2], remplaçant la première version du langage, appelée P414.
Principe
Considéré comme une évolution du Software Defined Networking(SDN)[3], P4 permet de programmer la façon dont le flux est traité par l’acheminement de paquets sur du matériel de transmission de paquets réseaux[3] tels que des routeurs, des commutateurs ou des pare-feux[4], qu'ils soient matériels ou logiciels[3]. Comme son nom « Programmation de processeurs indépendants des protocoles » l’indique, le langage ne tient pas compte du format d’un paquet. En effet, les développeurs déclarent le traitement d’un paquet dans un programme écrit en langage P4, et le compilateur le met par la suite au format souhaité selon le matériel cible[5]. La programmation en langage P4 est notamment utilisée pour mettre en œuvre les fonctions de transfert de niveau 3 et les fonctions INT[5]. La technologie In-Band Network Telemetry permet à de commutateurs de mesurer de fournir des informations détaillées sur la charge du réseau et de les utiliser pour fournir des mécanismes de contrôle de la congestion et donc mieux gérer la stabilité du réseau à très haut débit.
Il existe deux versions de ce langage : P414 et P416[6]. P416 apporte des changements importants et n'est pas rétrocompatible avec P414. Ainsi, de nombreuses fonctionnalités ont été supprimées du langage de base P414 et sont déjà ou sont destinées à être implémentées dans des bibliothèques externes[7].
Fonctionnement
P4 vise la programmation complète du traitement des données sur un équipement réseau. Ce langage est capable de réellement programmer le comportement d’un équipement réseau. Un algorithme de traitement d’un paquet IPv4 pourra être simplement construit. Le format même des paquets est simplement défini dans le programme. L’exemple ci-dessous montre comment analyser (parser) une trameEthernet.
Une fois l'analyse des paquets entrants effectuée, les en-têtes sont extraites et envoyées dans des tables de type "Match+Actions".
Ces tables contiennent les informations des paquets correspondants ainsi que les protocoles pris en compte pour leur acheminement.
Il ne reste plus qu'à spécifier les actions à exécuter pour les paquets correspondants.
Une fois le programme créé, il suffit de le compiler pour qu’il puisse fonctionner sur le matériel désiré[8].
Syntaxe
Un programme de type P4 contient les attributs des composants clés suivants :
Une définition d'en-tête qui décrit la séquence et la structure d'une série de champs. Elle comprend la spécification des largeurs de champs et des contraintes sur les valeurs des champs[9] ;
Une définition d'analyseur spécifie comment identifier les en-têtes et les séquences d'en-têtes valides dans les paquets[9];
Tables
Les tables match+action sont le mécanisme permettant d'effectuer le traitement des paquets. Le programme P4 définit les champs sur lesquels une table peut correspondre et les actions qu'elle peut exécuter[9] ;
Actions
P4 supporte la construction d'actions complexes à partir de primitives plus simples, indépendantes du protocole. Ces actions complexes sont disponibles dans les tables match+action[9] ;
Programmes de contrôle
Le programme de contrôle détermine l'ordre des tables match+action qui sont appliquées à un paquet. Un programme impératif simple décrit le flux de contrôle entre les tables match+action[9].
Afin d'être implémenté sur le matériel cible, qui peut être de type matériel ou logiciel[3], le programme écrit en P4 doit être compilé, c'est-à-dire transformé par le compilateur, en un code objet. Il existe deux compilateurs, un premier utilisé à l'origine pour P414, écrit en Python[6], et un autre, depuis la version P416, nommé P4C. Ce dernier, fournit par le groupe de développeurs P4 "P4 Language Consortium", est compatible avec les deux versions du langage et est implémenté en C++11, sous licence open-sourceApache 2[10]. Le compilateur dispose de deux analyseurs, pour chacun des deux langages. L'analyseur de programme P414 convertit le programme en P416[6].
P4C effectue un traitement en trois parties :
Front-end : Indépendamment du matériel cible, il est chargé d'effectuer divers contrôles du programme tels que la syntaxe, la sémantique, afin que le code soit conforme aux spécifications du langage[11], puis il simplifie et optimise le code au besoin ;
Mid-end : Il effectue les transformations du code afin qu'il corresponde en partie à la cible, mais n'ajoute pas d'affectations de ressources spécifiques ;
Le langage P4 a été conçu pour répondre à trois objectifs[16] :
Il offre une possibilité de mise à niveau ou de modification sur site : Une fois déployé sur le matériel, le programme peut être modifié dans le cas où le traitement des paquets doit évoluer[16].
De plus le langage: P4 n'est lié à aucun protocole réseau et aucun traitement de packet spécifique, il n'a donc pas de notion prédéterminée du format d'un paquet. Cela permet de définir de nouveaux protocoles si nécessaire et élimine les contraintes sur la façon dont les paquets individuels peuvent être corrélés[4].
La cible ne bénéficie d'aucune obligation sur le plan matériel: Lors de l'écriture du programme P4, les développeurs définissent les fonctionnalités du traitement des paquets sans se préoccuper des spécificités du matériel cible sur lequel le programme doit être implémenté[16].
Expérimentations
P4 est un langage qui est peu utilisé mais qui fait tout de même l'objet d'expérimentations ayant divers objectifs.
Détection d'attaques
L'implémentation de P4 sur un commutateur de type logiciel montre que le langage peut être utilisé pour de la détection d'attaques, comme les attaques SYN[4]. P4 permet une flexibilité de la mémoire allouée à un dispositif, à la différence d'un matériel réseau standard qui peut avoir une mémoire d'une taille fixe. Sur un matériel implémenté avec P4, il est possible de modifier la taille de la mémoire au besoin, et donc d'enregistrer le trafic réseau. Ainsi, P4 peut aider à la sécurisation de réseau via une connaissance complète du trafic de données au sein du réseau[4]. Cependant, selon les circonstances de l'attaque, l'expérimentation montre que la détection d'attaque est plus difficile.
Surveillance du réseau
P4 permet de surveiller et visualiser les informations sur l'état du réseau à moindre coût. En effet, à la différence de SDN qui apporte des coûts élevés pour la surveillance du réseau, P4 récupère des informations sur l'état du réseau (identification du commutateur, perte de paquets et occupation de la file d'attente, etc.) sans ajouter de paquets de détection supplémentaires[17]. Une fois ces informations récoltées, le trafic est contrôlé en temps réel en fonction de l'état du réseau[18], ce qui permet notamment d'éliminer le phénomène de congestion[19].
Pare-feu logiciel
Le langage peut être utilisé afin de mettre en place un pare-feu logiciel à moindre coût. Cependant dans une expérimentation, il est démontré que l'efficacité du pare-feu dépend du nombre de paquets qui transitent. Ainsi, s'il peut être plus rapide que certains pare-feux virtualisés quand il y a moins de 1000 paquets, dès que ce seuil est dépassé son efficacité baisse[20].
Avantages
Dans le cadre des expérimentations d’implémentation qui ont eu lieu, il a été démontré que le langage P4 dispose de plusieurs avantages.
Ainsi, il améliore la sécurité du réseau[4] grâce à la mise en place des en-têtes et des règles de traitement des flux qui permettent d’éviter la congestion.
De plus, le langage apporte une certaine flexibilité au niveau des matériels réseaux. En effet, il permet de programmer le traitement des paquets en utilisant uniquement des requêtes et des consultations de tables, indépendamment du matériel sur lequel il est implémenté, contrairement aux matériels réseaux traditionnels qui disposent d’un langage propriétaire.
Le langage offre également la possibilité d’analyser des trames et, à l’aide du compilateur, gèrent les détails de bas niveau tels que l’allocation de ressources, car il permet de décomposer les ressources de stockage, et l’ordonnancement.
Avec la version P416 du langage, les créateurs du langage ont mis à disposition des librairies, ce qui est un avantage pour le développement de certaines fonctions spécifiques au matériel.
Inconvénients
En 2020, le langage P4 est supporté par très peu de matériel ce qui limite son utilisation. Ceci peut être expliqué par le fait que le langage P4 est en développement actif, les fournisseurs de matériels attendent que le langage se stabilise et se démocratise avant de proposer du matériel adapté. P4 laisse aussi beaucoup de détails non spécifiés[21].
P4 augmente également les risques d'encourir des bugs d'exécution après le déploiement des programmes P4[22], ou bien des erreurs d'implémentation de protocoles par exemple[23]. L'absence de runtime, logiciel responsable de l'exécution des programmes informatiques, rendent difficile le dépannage de ces bugs[22].
De plus, selon l'architecture du réseau, il est parfois difficile de traduire les spécificités en P4[24]. Le langage P4 ne définit pas l'interface entre le plan de données et le plan de contrôle, il s'agit d'une spécificité liée au matériel cible[7].
P4 ne permet d’exécuter des actions qu'à l'intérieur des trames réseaux ou lorsqu'une correspondance table+action a été trouvée les tables de correspondance de P4 ne peuvent pas effectuer de correspondance sur des champs de longueur variable[25]. Ainsi, la comparaison entre plusieurs variables peut être compliquée, notamment lorsque l'on souhaite trouver la plus petite valeur, car P4 ne peut comparer que des valeurs entre elles dans les objets de contrôle et peut les modifier uniquement s'il y a une correspondance dans une table. De plus les tables de correspondance de P4 ne peuvent pas effectuer de correspondance sur des champs de longueur variable[25].
(en) Junjie Geng, Jinyao Yan, Yangbiao Ren et Yuan Zhang, « Design and Implementation of Network Monitoring and Scheduling Architecture Based on P4 », ACM (Association for Computing Machinery) - Proceedings of the 2nd International Conference on computer science and application engineering, , p. 1-6 (ISBN9781450365123, DOI10.1145/3207677.3278059).
(en) Belma Turkovic, Fernando Kuipers, Niels van Adrichem et Koen Langendoen, « Fast network congestion detection and avoidance using P4 », ACM (Association for Computing Machinery) - Proceedings of the 2018 Workshop on networking for emerging applications and technologies, , p. 1-8 (ISBN9781450359078, DOI10.1145/3229574.3229581).
(en) Joseph Hill, Mitchel Aloserij et Paola Grosso, « Tracking Network Flows with P4 », 2018 IEEE/ACM Innovating the Network for Data-Intensive Science (INDIS), , p. 36-43 (ISBN9781728101941, DOI10.1109/INDIS.2018.00006).
(en) Jehandad Khan et Peter Athanas, « Query language for large-scale P4 network debugging », ACM (Association for Computing Machinery) - Proceedings of the 2018 Symposium on architectures for networking and communications systems, , p. 162-164 (ISBN9781450359023, DOI10.1145/3230718.3232108)
(en) Christian Wernecke, Helge Parzyjegla, Gero Muhl, Peter Danielis et Dirk Timmermann, « Realizing Content-Based Publish/Subscribe with P4 », 2018 IEEE Conference on Network Function Virtualization and Software Defined Networks (NFV-SDN), , p. 1-7 (DOI10.1109/NFV-SDN.2018.8725641).
(en) Regis F.T Martins, Fabio L Verdi, Rodolfo Villaca et Luis Fernando U Garcia, « Using Probabilistic Data Structures for Monitoring of Multi-tenant P4-based Networks », 2018 IEEE Symposium on Computers and Communications (ISCC), , p. 204-207 (ISBN9781538669501, DOI10.1109/ISCC.2018.8538352).
(en) Anirudh Sivaraman, Kim Changhoon, Ramkumar Krishnamoorthy, Advait Dixit et Mihai Budiu, « DC.p4: programming the forwarding plane of a data-center switch », Proceedings of the 1st ACM SIGCOMM Symposium on software defined networking research, , p. 1-8 (ISBN9781450334518, DOI10.1145/2774993.2775007).
(en) Elie F Kfoury, Jorge Crichigno, Elias Bou-Harb, David Khoury et Gautam Srivastava, « Enabling TCP Pacing using Programmable Data Plane Switches », IEEE Conference Publications - 42nd International Conference on Telecommunications and Signal Processing (TSP), , p. 273-277 (ISBN9781728118642, DOI10.1109/TSP.2019.8768888)
(en) Zijun Hang, Mei Wen, Yang Shi et Chunyuan Zhang, « Programming Protocol-Independent Packet Processors High-Level Programming (P4HLP): Towards Unified High-Level Programming for a Commodity Programmable Switch », Directory of Open Access Journals (DOAJ), vol. 8(9), , p. 958 (ISSN2079-9292, DOI10.3390/electronics8090958)
(en) Mihai Budiu et Chris Dodd, « The P416 Programming Language », ACM Digital Library (Association for Computing Machinery) - ACM SIGOPS Operating Systems Review, vol. 51, no 1, , p. 5-14 (ISSN1943-586X, DOI10.1145/3139645.3139648)
(en) Radek Isa, Pavel Benacek et Viktor Pus, « Verification of Generated RTL from P4 Source Code », IEEE 26th International Conference on Network Protocols (ICNP), , p. 444-445 (ISBN9781538660430, DOI10.1109/ICNP.2018.00065)
(en) Rui Miguel, Salvatore Signorello et Fernando M. V Ramos, « Named Data Networking with Programmable Switches », IEEE 26th International Conference on Network Protocols (ICNP), , p. 400-405 (ISBN9781538660430, DOI10.1109/ICNP.2018.00055).
(en) Lucas Freire, Miguel Neves, Alberto Schaeffer-Filho et Marinho Barcellos, « POSTER: Finding Vulnerabilities in P4 Programs with Assertion-based Verification », IEEE Concurrency, , p. 2495-2497 (ISBN9781450349468, DOI10.1145/3133956.3138837).
(en) Cheng Zhang, Jun Bi, Yu Zhou, Jianping Wu, Bingyang Liu, Zhaogeng Li, Abdul Basit Dogar et Yangyang Wang, « P4DB: On-the-fly debugging of the programmable data plane », IEEE 25th International Conference on Network Protocols (ICNP),, , p. 1-10 (ISBN9781509065011, DOI10.1109/ICNP.2017.8117548).
(en) Jeferson Santiago Da Silva, François-Raymond Boyer, Laurent-Olivier Chiquette et J. M. Pierre Langlois, « Extern Objects in P4: an ROHC Header Compression Scheme Case Study », 4th IEEE Conference on Network Softwarization and Workshops (NetSoft), (ISBN978-1-5386-4633-5, DOI10.1109/NETSOFT.2018.8460108)
(en) Radu Stoenescu, Dragos Dumitrescu, Matei Popovici, Lorina Negreanu et Costin Raiciu, « Debugging P4 programs with vera », Proceedings of the 2018 Conference of the ACM Special Interest Group on data communication, , p. 518-532 (ISBN9781450355674, DOI10.1145/3230543.3230548)
(en) Peilong Li et Yan Luo, « P4GPU: Accelerate packet processing of a P4 program with a CPU-GPU heterogeneous architecture », ACM/IEEE Symposium on Architectures for Networking and Communications Systems (ANCS), , p. 125-126 (ISBN9781450341837, DOI10.1145/2881025.2889480)
(en) Pavel Benáček, Viktor Puš, Hana Kubátová et Tomáš Čejka, « P4-To-VHDL: Automatic generation of high-speed input and output network blocks », Microprocessors and Microsystems, vol. 56, , p. 22-33 (ISBN978-1-7281-0194-1, DOI10.1016/j.micpro.2017.10.012)
(en) Pat Bosshart, Dan Daly, Glen Gibb, Martin Izzard, Nick Mckeown, Jennifer Rexford, Cole Schlesinger, Dan Talayco, Amin Vahdat, George Varghese et David Walker, « P4: programming protocol-independent packet processors », ACM SIGCOMM Computer Communication Review, vol. 44, no 3, , p. 87-95 (ISSN1943-5819, DOI10.1145/2656877.2656890).
(en) Ali Kheradmand et Grigore Rosu, « P4K: A Formal Semantics of P4 and Applications », Cornell University, (arXiv1804.01468)
(en) F Paolucci, F Civerchia, A Sgambelluri, A Giorgetti, F Cugini et P Castoldi, « P4 Edge node enabling stateful traffic engineering and cyber security », IEEE/OSA Journal of Optical Communications and Networking, vol. 11, no 1, , A84-A95 (ISSN1943-0639)
(en) Bin Niu, Jiawei Kong, Shaofei Tang, Yingcong Li et Zuqing Zhu, « Visualize Your IP-over-Optical Network in Realtime: a P4-based Flexible Multilayer In-band Network Telemetry (ML-INT) System », IEEE Access, vol. 7, (ISSN2169-3536, DOI10.1109/ACCESS.2019.2924332)
(en) Miguel Neves, Lucas Freire, Alberto Schaeffer-Filho et Marinho Barcellos, « Verification of P4 programs in feasible time using assertions », ACM Digital Library (Association for Computing Machinery) - Proceedings of the 14th International Conference on emerging networking experiments and technologies, , p. 73-85 (ISBN9781450360807, DOI10.1145/3281411.3281421)
(en) Datta Rakesh, Choi Sean, Chowdhary Anurag et Park Younghee, « P4Guard: Designing P4 Based Firewall », MILCOM 2018 - 2018 IEEE Military Communications Conference (MILCOM), October 2018, pp.1-6, , p. 1-6 (ISBN9781538671856, DOI10.1109/MILCOM.2018.8599726).
(en) Jed Liu, William Hallahan, Cole Schlesinger, Milad Sharif, Jeongkeun Lee, Robert Soulé, Han Wang et Călin Caşcaval, « p4v: practical verification for programmable data planes », Proceedings of the 2018 Conference of the ACM Special Interest Group on data communication, , p. 490-503 (ISBN9781538671856, DOI10.1145/3230543.3230582)