MPEG est le sigle d’un groupe de travail (le Moving Picture Experts Group) composé de spécialistes en informatique, électronique, télécommunication, etc. Ces experts sont chargés du développement de normes et de formats informatiques au plan international. Ces normes concernent essentiellement le codage de la vidéo et de l’audio, notamment la compression, la décompression et le traitement de fichiers. Ce groupe de travail a déjà répondu à de nombreuses problématiques dans le cadre d’applications de stockage et de lecture de fichiers numériques.
Formats et histoire du MPEG
Les premières réunions du Moving Picture Experts Group ont eu lieu en 1988, il s’agissait de travailler sur la norme MPEG 1 dédiée à la vidéo stockée sur les CD (qualité VHS, 1h de vidéo sur 600 Mo). En 1994, la norme MPEG 2 s’est adaptée au DVD et à la télévision numérique. Elle comprend le codage de l’audio et de la vidéo ainsi que son transport, et fait des progrès en terme de résolution.
La norme MPEG 4 est née en août 1998. Pour la petite histoire, la terminologie MPEG 3 n’a pas été retenue car le MP3 était déjà née dans la norme MPEG 1 (c’est la troisième couche : MPEG Audio Layer III) et on a souhaité éviter toute confusion.
Les normes MPEG 7 (recherche et filtrage) et MPEG 21 (tout contenu multimédia et architectures) ont suivi ainsi que les normes MPEG A, B, C, D et V en cours de développement et de standardisation.
Description de la norme MPEG 4
La norme MPEG 4 concerne le stockage, l’intégration et la diffusion, soit le codage, d’objets audiovisuels. Le MPEG 4 est orienté objet (notion informatique), ce qui permet de travailler avec des objets vidéos. Cette notion se révèle très pratique car il est rendu possible de séparer un arrière-plan et un élément animé. Le format MPEG 4 comprends la vidéo, l’audio, les images en deux dimensions mais aussi la 3D. Il est par ailleurs adapté à la diffusion sur les réseaux bas débit et haut débit, pour les transferts par téléchargement et le streaming (diffusion en mode continu, envoi et chargement progressif).
Wikipedia décrit 22 parties différentes dans la norme MPEG 4. Ces parties sont composées de plusieurs niveaux et de collections d’algorithmes. Par exemple, la deuxième couche est utilisée pour la compression vidéo, des codecs tels que DivX ou Xvid utilisent cette partie de la norme. DivX est originellement basé sur MPEG-4, on dira un mot sur les codecs un peu plus loin dans cet article.
Une des applications du format MPEG 4 est la constitution de scènes complexes. Par exemple, avec l’utilisation de studios virtuels à la télévision permettant de faire se rencontrer des personnes virtuellement sur un plateau. On peut également parler de la technique de motion capture (capture de mouvement), utilisée pour faire correspondre des gestes particuliers à un avatar. C’est une technique très utilisée dans l’univers de la 3D.
CODECS et Conteneurs vidéo
Un codec est un logiciel qui permet de coder-décoder un signal numérique, il met notamment en œuvre les procédés formalisés par le MPEG. Les codecs sont caractérisés par leur architecture (la plateforme logicielle ou le ‘player’), par la définition des résolutions et d’un espace colorimétrique.
Voici une liste non exhaustive de codecs : Cinepak, Sorenson, INDEO, Eidos, MPEG 1, MPEG 2, DivX 3.11 à 6.7 et Xvid, RV9 (Real Video), FLV (Flash Video). Il y a des codecs propriétaires et des codecs libres.
Un conteneur vidéo est un fichier permettant de stocker des flux audio et vidéo, et de les combiner. Au moment de la restitution, il permet de synchroniser ces flux. Il peut par ailleurs contenir un menu, un chapitrage et des sous-titres. Il ne s’agit en fait que d’une enveloppe, les logiciels qui permettent de décompresser ou décoder ces flux sont les codecs. Un fichier conteneur peut accepter plusieurs types de codecs.
Il existe plusieurs conteneurs vidéo. Le plus utilisé est celui qui a été développé par Microsoft : AVI (Audio Video Interleaved). Il s’utilise notamment avec MPEG, divx, xvid pour la vidéo, et mp3 pour l’audio. AVI n’accepte pas le chapitrage et limite le nombre de pistes sons. Il ne prend pas tous les flux et chaque flux étant défini par un codec, il peut y avoir plusieurs combinaisons de codecs audio et vidéo. Divx-mp3 et xvid-mp3 sont les combinaisons les plus utilisées.
Quicktime est un conteneur vidéo multi-pistes et multi-canaux qui accepte les sous-titres et le chapitrage. C’est un produit de la célèbre marque à la pomme. On pourra également citer les conteneurs OGM (Ogg Media Streams), Matroska, WMW (Windows Media Video) et d’autres devenus un peu obsolètes…