La vidéo numérique

http://gillot55.free.fr

14-05-2015

La vidéo numérique

Les bases de la vidéo numérique

Pour obtenir un fichier vidéo, il faut réunir et synchroniser un fichier vidéo (images) et un fichier audio (son).

Les fichiers audio et vidéo sont toujours encodés cad compressés. Si la vidéo n’était pas compressée, il faudrait (720 pixels x 576 pixels x 3 couleurs) = 1 244 160 octets = 1,18 Mo par image, soit 28,5 Mo par seconde de film (à un taux de 25 images par seconde), sans compter la piste son. Un DVD ne pourrait contenir que 3 min de film, et il faudrait que le lecteur arrive à fournir un débit de 28,5 Mo/s, ce qui est élevé. Un minimum de compression est donc indispensable. L'outil servant à l'encodage est un codec (= codeur/décodeur). Selon le type de codec utilisé on obtient un format vidéo ou audio spécifique (détails des formats ci-dessous).

Le fichier final qui réunit les fichiers audio et vidéo est appelé fichier conteneur. Il a sa propre extension, par ex MKV ou AVI. On dit que les flux vidéo et audio sont encapsulés dans le fichier conteneur, ou encore que le fichier conteneur est multiplexé (= contient plusieurs flux). Chaque fichier conteneur a sa spécificité (détails des formats de conteneurs ci-dessous).

Il ne faut pas confondre codec avec fichier conteneur. Un conteneur permet de stocker des flux vidéo et audio, c’est donc une boîte (le contenant). Un codec permet d'encoder et de décoder les flux (le contenu de la boîte). Ceci implique qu'un logiciel capable de reconnaître et d'ouvrir un conteneur ne pourra pas toujours décoder les flux, s'il ne dispose pas des codecs adéquats.

Historique de quelques formats vidéo

En 1988, l’ISO crée le groupe de travail MPEG (Moving Picture Experts Group) qui rassemble de nombreux spécialistes provenant de l’industrie de l’électronique des composants, de l’informatique et des télécommunications. Ce groupe d’experts est chargé du développement de normes internationales pour la vidéo numérique. La première norme, appelée MPEG-1, sort en 1988. Le MPEG est toujours actif de nos jours, en 2005 il compte environ 350 membres.

Les spécifications de formats produits par MPEG sont ouvertes, mais non libres : leur utilisation est soumise au paiement de redevances (royalties). L’argent est collecté par MPEG-LA, compagnie crée en 1997 et basée dans le Colorado (USA). Le groupe d’experts MPEG est indépendant de MPEG-LA.

DV (Digital Video) 1992

Norme de la vidéo numérique faiblement compressée mise au point par un groupe différent de MPEG. C’est un large consortium regroupant plus d’une cinquantaine de sociétés, qui a constitué une alliance industrielle historique dans le monde de l’électronique ! Cette association a été constituée pour définir les spécifications des premiers magnétoscopes numériques grand public.

Le format DV applique une compression de base, en compressant chaque image au format JPEG (compression intra-image). Comme chaque image est compressée individuellement et indépendamment des autres images, cela permet un montage vidéo à l’image près. Le DV est donc un format idéal pour le montage vidéo. Mais sa résolution est limitée à 720 × 576 pixels, il faut donc réserver ce format pour des vidéos destinées à être compressées en MPEG-2, pas en HD. Pour le montage de vidéos HD (résolution 1920x1080) utiliser le format AVCHD, basé sur la norme H.264 MPEG-4 AVC (voir ci-dessous).

MPEG-2 1994

Norme de deuxième génération élaborée par le MPEG, largement utilisée pour les films sur DVD.

La qualité d’image est similaire à celle du format DV et la résolution est identique (max 720x576 pixels). La différence avec le DV vient de la taille du fichier qui est moindre, car le format MPEG-2 utilise en plus une compression inter-image, cad que chaque image est comparée à la précédente et les redondances sont éliminées. Cela permet de diviser la taille du fichier et donc le débit à fournir par le lecteur, jusqu'à 3 fois sans perte.

MPEG-4 Part 1 à 6 1999

Norme de quatrième génération élaborée par le MPEG. La norme est divisée en plusieurs "Parts" qui traitent de points très divers. De nos jours la norme MPEG-4 est encore enrichie : en 2014 la Part 31 a été publiée.

WMV (Windows Media Video) 1999

Codec propriétaire de Microsoft, utilisé par le lecteur Windows Media. Les autres compagnies du domaine se sont rendues compte que Microsoft a pillé les brevets des standards existants comme le MPEG-2 et MPEG-4 AVC/H.264. Face à la pression exercée par les détenteurs de brevets, Microsoft a dû demander à MPEG-LA d'ouvrir un programme de licences. Actuellement, le codec WMV évolue en codec VC-1, qui est donc en concurrence avec la norme MPEG-4 AVC/H.264.

DivX 1999

Codec propriétaire de DivXNetworks (DivX Inc.) appliquant la norme MPEG-4 Part 2. DivXNetworks paie ainsi une redevance à MPEG-LA. Le DivX permet de compresser fortement sans perte notable de qualité. Par exemple si un film DVD (MPEG-2) de 4,7 Go est compressé en DivX, alors il peut tenir sur un CD de 700 Mo. Ce codec a été au centre de controverses à cause de son utilisation pour copier et distribuer des films extraits de DVD aux droits réservés.

En 2009, la version 7 de DivX prend en charge la création du conteneur MKV, la norme vidéo H.264 (sortie en 2003) et le format audio AAC.

Xvid (Xvid = DivX à l’envers !) 2001

Codec libre et gratuit créé par un groupe de volontaires après que les sources de DivX aient cessé d'être disponibles (puisque DivX est une marque déposée et payante). Xvid ne respecte pas le paiement d'une redevance et implémente la technologie développée par le consortium MPEG gratuitement. Xvid (gratuit) et DivX (payant) sont donc concurrents.

H.264 = MPEG-4 AVC (Advanced Video Coding) = MPEG-4 Part 10 2003

Norme élaborée par le MPEG pour la haute définition HD : 1920 x 1080 ou 1280 x 720 pixels. Exemple de codecs d’application : x264, OpenH264, Nero Digital AVC, Quicktime 7, et les médias de haute-definition video tel que le Blu-ray Disc.

x264 2005

Codec libre et gratuit (opensource) appliquant la norme H.264. Ce codec ne respecte pas le paiement d'une redevance à MPEG-LA, comme Xvid.

En 2013, la société Cisco Systems (Mozilla) a proposé un codec ouvert appelé OpenH264. Leur refus du codec x264 s'explique par son absence de redevance au MPEG-LA. Au contraire, Cisco se porte garant de cette redevance pour tout usage qui pourra être fait de son codec OpenH264.

AVCHD (Advanced Video Codec High Definition) 2006

Codec appliquant la norme H.264, développé par Sony et Panasonic pour équiper leurs caméscopes numériques. C’est aussi le format utilisé pour le montage vidéo en HD. Pour le son la compression est en AC 5.1 Dolby Digital, ou Linear PCM, comme les disques Blu-ray. Ce format utilise des images entrelacées (interlaced) cad qu’on affiche 50 images par seconde en remplaçant chaque fois la moitié des lignes. Cela revient à traiter deux demi-images successivement : une qui ne contient que les lignes paires, la suivante que les lignes impaires. Cet entrelacement donne une meilleure fluidité aux images avec des mouvements rapides sur les téléviseurs. Par contre il faut que le logiciel de montage vidéo sache traiter cet entrelacement. Depuis 2009, presque tous les logiciels sur PC savent désentrelacer à la lecture.

H.265 = HEVC (High Efficiency Video Coding) 2013

Norme élaborée par le MPEG devant succéder au H.264 MPEG-4 AVC. Elle offre un gain en compression de l'ordre de 50 % en 720p et de 60 % en 1080p par rapport à l’AVC, dans une configuration similaire et pour une qualité équivalente. De plus HEVC supporte des cadences d'images plus élevées, pouvant atteindre 100, 120 ou 150 images par seconde. Ces progrès nécessitent l'utilisation d'algorithmes plus complexes.

Remarque : la TV Samsung UE40F7000 sortie en 2013 ne lit pas encore le H.265.

Historique de quelques formats audio

Le PCM (Pulse Code Modulation = Modulation d'impulsion codée) est la première phase de la numérisation d'un signal électrique analogique représentant le son, donc sans compression de données. C’est la représentation numérique du signal électrique. Un fichier capable de restituer le signal PCM d’origine est qualifié de Sans perte (lossless) . Si la compression détruit des données du signal PCM d’origine alors le fichier est qualifié Avec pertes (lossy).

A l’heure actuelle, toutes les bandes son sont en stéréo au minimum, ou multicanaux pour certains. Cela implique que le fichier audio contient au moins 2 bandes son mono. En conséquence tous les fichiers audio sont à la base des fichiers conteneur.

AC-3 (Audio Coding 3) = 5.1 = Dolby Digital Avec pertes (lossy) 1987

Conteneur et codec. Le conteneur permet de multiplexer jusqu’à 6 canaux sonores indépendants (avant gauche, central, avant droit, arrière gauche, arrière droit, et caisson de grave = subwoofer). Le codec permet de compresser les flux audio avec un facteur 10 à 12 (comme le mp3). Les taux d’échantillonnage sont de 32 ou 44,1 ou 48 kHz avec un taux de transfert allant de 32 à 640 kbit/s.

« Batman : Le Défi » (Batman Returns) a été le premier film qui a utilisé la technologie Dolby Digital durant l'été 1992 dans les salles de cinéma.

WAV = WAVE (WAVEform audio file format) Avec ou sans pertes selon codec 1991

Conteneur propriétaire de Microsoft et IBM capable de recevoir des formats aussi variés que le MP3, le WMA, et le PCM. C'est ce dernier qui est le plus courant, c'est pour cela que l'extension WAV est souvent considérée (à tort) comme correspondant toujours à des fichiers « sans pertes » (lossless). Ce conteneur est limité en taille à 2 Go (ou 4 Go actuellement), ce qui le rend inapte au travail moderne sur des fichiers haute-définition.

Nombre de canaux du WAV : 1 à 6

Fréquence d'échantillonnage : 11, 22, 44, 48 ou 96 KHz

AU (Audio) Sans perte (lossless) 1992

Conteneur audio très simple développé par Sun Microsystems. Les données au format PCM ne sont pas compressées, donc il n’y a pas de perte. C’est le conteneur encore utilisé en 2015 par le logiciel Audacity pour conserver les données sources.

MP3 = MPEG-1/2 Audio Layer 3 (= couche 3) Avec pertes (lossy) 1993

Norme développée par l’ISO et qui est l’application sonore des standard MPEG-1 et MPEG-2. A ce titre le MP3 devrait être soumis à des redevances, mais dans la pratique, aucune royalty n'est prélevée sur les fichiers au format MP3.

Exemple de codec qui applique la norme MP3 : LAME, compresseur MP3 Open Source.

Le codec MP3 utilise un système de compression partiellement destructif. Il ne retransmet pas intégralement le spectre des fréquences audio. En revanche il tente d'annuler d'abord les sons les moins perçus de façon à ce que les dégradations se fassent remarquer le moins possible. Ce n'est pas une compression à proprement parler, mais plutôt une suppression d'informations (format destructif).

AAC (Advanced Audio Coding) Avec pertes (lossy) 1997

Norme et codec développés par des compagnies du disque, puis reconnu comme standard international par le MPEG la même année. Comme le MP3 il applique une compression avec perte de données, mais le rapport qualité sur débit binaire est sensé être meilleur que celui du MP3. En terme de qualité d'audition, la comparaison avec le MP3 est souvent sujette à controverse, car une telle comparaison est subjective et dépend du matériel à comparer (genre musical).

	MP3	AAC
Fréquences d’échantillonnage	16 à 48 kHz	8 à 96 kHz
Nombre de canaux	1 (mono) ou 2 (stéréo)	1 à 48
Débit max (bitrate)	320 kbit/s max	320 kbit/s max
Mesure technique de protection	aucune	gère les droits numériques (DRM)

FLAC (Free Lossless Audio Codec) Sans perte (lossless) 2000

Codec libre de compression audio sans perte. FLAC se distingue d’algorithmes sans perte (tels que ZIP et gzip) en ce qu’il a été créé spécifiquement pour compresser des données audio. La méthode ZIP réduit la taille d’un fichier audio de qualité CD de 20 à 40 %, alors que FLAC obtient des taux de 30 à 70 %. Si des codecs à perte comme le MP3 et le Vorbis peuvent atteindre des ratios de 80-90 %, voire plus, ils le font en éliminant des données du flux originel. FLAC n’enlève aucune information du flux audio.

FLAC utilise la prédiction linéaire pour convertir les échantillons en une série de blocs non-corrélés d’environ 100 ms (connus sous le nom de résidus), qui sont stockés de manière efficiente en utilisant le codage de Golomb-Rice. Il utilise aussi le codage par plages pour les blocs d’échantillons identiques, tels les passages blancs. Ceci lui permet d’être décompressé à la volée durant la lecture, y compris par un système autonome équipé de peu de mémoire.

Étant un codec sans perte, le FLAC est très utilisé comme format d’archivage : si le support original est perdu, endommagé ou usé, une copie en FLAC des pistes audio garantit qu’une copie exacte des données originales peut être récupérée à tout moment.

FLAC utilise un CRC pour identifier les morceaux corrompus dans le cas de l’utilisation en streaming, mais aussi le hachage MD5 complet des données PCM brutes stockés dans leur en-tête de métadonnées STREAMINFO.

Nombre de canaux du FLAC : 1 à 8

Fréquence d'échantillonnage : 1 Hz à 1 048 KHz, avec des incréments de 1 Hz

AAC-LC (Advanced Audio Coding - Low Complexity) = MPEG-4 Part 3 Avec pertes (lossy) 2003

Norme développée par le MPEG comme troisième partie du MPEG-4. Le codec AAC-LC assure à ce jour le meilleur rapport qualité/débit des codecs audio à perte.

HE-AACv2 (High Efficiency - Advanced Audio Coding version 2) Avec pertes (lossy) 2006

HE-AACv2 = AAC avec Reconstruction de Bande Spectrale et Stéréo Paramétrique. La stéréo paramétrique est une fonctionnalité audio définie dans MPEG-4 Part 3 destinée à renforcer l'efficacité de codage dans les médias stéréo à faible bande passante (diffusion en streaming sur internet). Les données stéréo sont encodées comme un flux monophonique à l'aide de quelques informations paramétriques additionnelles embarquées dans le flux principal, pour recréer le son stéréo originel. Cela permet une bonne qualité stéréo avec des débits très bas, allant en moyenne de 16 à 40 kbit/s ! Dans le convertisseur SUPERv2015, le choix des débits en HE-AAC est limité entre 16 et 56 kbit/s ! Le HE-AAC est donc à réserver pour les diffusions en streaming.

Historique de quelques formats conteneur

Selon le type de conteneur, la façon dont sont organisées les données (vidéo et/ou audio) à l'intérieur du fichier est différente. De plus, certains conteneurs permettent de stocker des sous-titres, des éléments de chapitrage, ainsi que d'autres informations sur le média (appelées métadonnées, ou tags).

MOV (Movie) 1989

Conteneur propriétaire de Apple, utilisé par le lecteur QuickTime. A partir de 2001, ce conteneur permet le streaming cad la lecture de la vidéo au fur et à mesure de son téléchargement sur internet.

AVI (Audio Video Interleave = Imbrication Audio Vidéo) 1992

Conteneur propriétaire de Microsoft qui ne permet pas le streaming (le fichier doit être complet pour pouvoir être lu). Il réunit une piste vidéo et jusqu’à 99 pistes audio, ce qui permet de bénéficier, par exemple, de plusieurs langues pour un même film.

Codecs vidéo supportés : DivX, Xvid, DV, Mpeg2/4…

Codecs audio : AC3, mp3, PCM…

Taille maxi d’un fichier AVI : 2 Go.

TS (Transport Stream) 1994

Conteneur propriétaire élaboré par MPEG, largement utilisé pour la télévision numérique terrestre, par câble ou par satellite. Il utilise pas ou peu de code temporel, mais comprend des fonctionnalités de correction d'erreur pour le transport sur média non-sûr (câble ou par satellite). C'est l’équivalent du format PS (Program Stream) qui vise les médias dit sûrs, comme le DVD. Actuellement, Free (groupe Iliad) utilise le codec H.264 dans ses diffusions de vidéos au format TS.

MP4 = MPEG-4 Part 14 2001

Conteneur propriétaire élaboré par MPEG qui permet le streaming. Ses variantes sont le m4a (MPEG-4 Audio) et le m4p (MPEG-4 Protégé contre la copie par DRM).

FLV (Flash Vidéo) 2002

Conteneur propriétaire de Adobe Systems (Macromedia à la base) qui permet le streaming. Le codec vidéo est soit une variante du H.264, soit le codec VP6 de la société On2 (appartenant à Google), soit encore une suite de captures d’écran. L'audio est soit non compressé (PCM), soit compressé en MP3.

MKV (Matroska Video, du russe matriochka = poupée russe) 2003, essor à partir de 2007

Conteneur gratuit et ouvert, développé par une association loi 1901 française, et qui permet le streaming. Ce conteneur est open source et aucune redevance n’est due. Le conteneur MKV est capable d'encapsuler des contenus en haute définition 720p ou 1080p, ainsi qu'en ultra haute définition (UHD) 4K. Cela en fait un format privilégié pour la copie des HD-DVD ou des disques BluRay.

wikipedia

http://www.gypsevideo.fr/index.php?option=com_content&view=article&id=123

http://www.commentcamarche.net/contents/73-m4a-format-aac-et-caracteristiques

http://www.commentcamarche.net/contents/74-dolby-digital-ac3

http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html

http://www.figer.com/Publications/avchd.htm#.VVYKaC7lsgQ