14-05-2015
La vidéo
numérique
Les bases de la vidéo
numérique
Pour obtenir un fichier vidéo, il faut réunir et
synchroniser un fichier vidéo
(images) et un fichier audio
(son).
Les fichiers audio et vidéo sont toujours encodés cad compressés.
Si la vidéo n’était pas compressée, il faudrait (720 pixels x 576 pixels x 3
couleurs) = 1 244 160 octets = 1,18 Mo par image, soit 28,5 Mo par seconde de
film (à un taux de 25 images par seconde), sans compter la piste son. Un DVD ne
pourrait contenir que 3 min de film, et il faudrait que le lecteur arrive à
fournir un débit de 28,5 Mo/s, ce qui est élevé. Un minimum de compression est
donc indispensable. L'outil servant à l'encodage est un codec (= codeur/décodeur).
Selon le type de codec utilisé on obtient un format
vidéo ou audio spécifique (détails des formats ci-dessous).
Le fichier final qui réunit les fichiers audio et
vidéo est appelé fichier conteneur.
Il a sa propre extension, par ex MKV ou AVI. On dit que les flux vidéo et audio
sont encapsulés dans le fichier
conteneur, ou encore que le fichier conteneur est multiplexé (= contient plusieurs flux). Chaque fichier conteneur a
sa spécificité (détails des formats de conteneurs ci-dessous).
Il ne faut pas confondre codec
avec fichier conteneur. Un conteneur permet de stocker des flux vidéo et
audio, c’est donc une boîte (le contenant). Un codec
permet d'encoder et de décoder les flux (le contenu de la boîte). Ceci implique
qu'un logiciel capable de reconnaître et d'ouvrir un conteneur ne pourra pas
toujours décoder les flux, s'il ne dispose pas des codecs
adéquats.
Historique de quelques
formats vidéo
En 1988, l’ISO crée le groupe de travail MPEG (Moving Picture Experts Group) qui rassemble de nombreux spécialistes
provenant de l’industrie de l’électronique des composants, de l’informatique et
des télécommunications. Ce groupe d’experts est chargé du développement de
normes internationales pour la vidéo numérique. La première norme, appelée
MPEG-1, sort en 1988. Le MPEG est toujours actif de nos jours, en 2005 il
compte environ 350 membres.
Les spécifications de formats produits par MPEG
sont ouvertes, mais non libres : leur utilisation est soumise au paiement de
redevances (royalties). L’argent est collecté par MPEG-LA, compagnie crée en
1997 et basée dans le Colorado (USA). Le groupe d’experts MPEG est indépendant
de MPEG-LA.
DV (Digital Video) 1992
Norme de la vidéo numérique faiblement compressée
mise au point par un groupe différent de MPEG. C’est un large consortium
regroupant plus d’une cinquantaine de sociétés, qui a constitué une alliance
industrielle historique dans le monde de l’électronique ! Cette
association a été constituée pour définir les spécifications des premiers
magnétoscopes numériques grand public.
Le format DV applique une compression de base, en
compressant chaque image au format JPEG (compression intra-image). Comme chaque image
est compressée individuellement et indépendamment des autres images, cela
permet un montage vidéo à l’image près. Le DV est donc un format idéal pour le
montage vidéo. Mais sa résolution est limitée à 720 × 576 pixels, il faut donc réserver ce format pour des vidéos
destinées à être compressées en MPEG-2, pas en HD. Pour le montage de vidéos HD
(résolution 1920x1080) utiliser le format AVCHD, basé sur la norme H.264 MPEG-4
AVC (voir ci-dessous).
MPEG-2 1994
Norme de deuxième génération élaborée par le MPEG,
largement utilisée pour les films sur DVD.
La qualité d’image est similaire à celle du format
DV et la résolution est identique (max 720x576 pixels). La différence avec le
DV vient de la taille du fichier qui est moindre, car le format MPEG-2 utilise
en plus une compression inter-image, cad que chaque image est comparée à la précédente et les
redondances sont éliminées. Cela permet de diviser la taille du fichier et donc
le débit à fournir par le lecteur, jusqu'à 3 fois sans perte.
MPEG-4 Part 1 à 6 1999
Norme de quatrième génération élaborée par le
MPEG. La norme est divisée en plusieurs "Parts" qui traitent de
points très divers. De nos jours la norme MPEG-4 est encore enrichie : en
2014 la Part 31 a été publiée.
WMV (Windows Media Video) 1999
Codec propriétaire de
Microsoft, utilisé par le lecteur Windows Media. Les autres compagnies du
domaine se sont rendues compte que Microsoft a pillé les brevets des standards
existants comme le MPEG-2 et MPEG-4 AVC/H.264. Face à la pression exercée par
les détenteurs de brevets, Microsoft a dû demander à MPEG-LA d'ouvrir un
programme de licences. Actuellement, le codec WMV
évolue en codec VC-1, qui est donc en concurrence
avec la norme MPEG-4 AVC/H.264.
DivX 1999
Codec propriétaire de DivXNetworks (DivX Inc.) appliquant la norme MPEG-4 Part 2. DivXNetworks paie ainsi une redevance à MPEG-LA. Le DivX permet de compresser fortement sans perte notable de
qualité. Par exemple si un film DVD (MPEG-2) de 4,7 Go est compressé en DivX, alors il peut tenir sur un CD de 700 Mo. Ce codec a été au centre de controverses à cause de son
utilisation pour copier et distribuer des films extraits de DVD aux droits
réservés.
En 2009, la version 7 de DivX
prend en charge la création du conteneur MKV, la norme vidéo H.264 (sortie en
2003) et le format audio AAC.
Xvid (Xvid = DivX
à l’envers !) 2001
Codec libre et gratuit créé par
un groupe de volontaires après que les sources de DivX
aient cessé d'être disponibles (puisque DivX est une
marque déposée et payante). Xvid ne respecte pas le
paiement d'une redevance et implémente la technologie développée par le
consortium MPEG gratuitement. Xvid (gratuit) et DivX (payant) sont donc concurrents.
H.264 = MPEG-4 AVC (Advanced Video Coding) = MPEG-4 Part 10 2003
Norme élaborée par le MPEG pour la haute
définition HD : 1920 x 1080 ou 1280 x 720 pixels. Exemple de codecs d’application : x264, OpenH264, Nero Digital AVC, Quicktime 7, et
les médias de haute-definition video
tel que le Blu-ray
Disc.
x264 2005
Codec libre et gratuit (opensource) appliquant la norme H.264. Ce codec ne respecte pas le paiement d'une redevance à
MPEG-LA, comme Xvid.
En 2013,
la société Cisco Systems (Mozilla)
a proposé un codec ouvert appelé OpenH264. Leur refus du codec x264
s'explique par son absence de redevance au MPEG-LA. Au contraire, Cisco se
porte garant de cette redevance pour tout usage qui pourra être fait de son codec OpenH264.
AVCHD (Advanced Video Codec High
Definition) 2006
Codec appliquant la norme
H.264, développé par Sony et Panasonic pour équiper leurs caméscopes
numériques. C’est aussi le format utilisé pour le montage vidéo en HD. Pour le son la compression est en AC 5.1 Dolby
Digital, ou Linear PCM, comme les disques Blu-ray. Ce format utilise des images entrelacées (interlaced) cad qu’on affiche 50 images par seconde en remplaçant
chaque fois la moitié des lignes. Cela revient à traiter deux demi-images successivement : une qui ne contient que
les lignes paires, la suivante que les lignes impaires. Cet entrelacement donne
une meilleure fluidité aux images avec des mouvements rapides sur les
téléviseurs. Par contre il faut que le logiciel de montage vidéo sache traiter
cet entrelacement. Depuis 2009, presque tous les logiciels sur PC savent
désentrelacer à la lecture.
H.265 = HEVC (High Efficiency Video
Coding) 2013
Norme élaborée par le MPEG devant succéder au H.264
MPEG-4 AVC. Elle offre un gain en compression de l'ordre de 50 % en 720p et de
60 % en 1080p par rapport à l’AVC, dans une
configuration similaire et pour une qualité équivalente. De plus HEVC supporte
des cadences d'images plus élevées, pouvant atteindre 100, 120 ou 150 images
par seconde. Ces progrès nécessitent l'utilisation d'algorithmes plus
complexes.
Remarque :
la TV Samsung UE40F7000 sortie en 2013 ne lit pas encore le H.265.
Historique de quelques
formats audio
Le PCM (Pulse Code Modulation = Modulation
d'impulsion codée) est la première phase de la numérisation d'un signal
électrique analogique représentant le son, donc sans compression de données.
C’est la représentation numérique du signal électrique. Un fichier capable de
restituer le signal PCM d’origine est qualifié de Sans
perte (lossless) . Si la compression détruit des
données du signal PCM d’origine alors le fichier est qualifié Avec pertes (lossy).
A l’heure actuelle, toutes les bandes son sont en stéréo au minimum, ou multicanaux pour
certains. Cela implique que le fichier audio contient au moins 2 bandes son
mono. En conséquence tous les fichiers audio sont à la base des fichiers conteneur.
AC-3 (Audio Coding
3) = 5.1 = Dolby Digital Avec pertes (lossy) 1987
Conteneur et codec. Le
conteneur permet de multiplexer jusqu’à 6 canaux sonores indépendants (avant
gauche, central, avant droit, arrière gauche, arrière droit, et caisson de
grave = subwoofer). Le codec
permet de compresser les flux audio avec un facteur 10 à 12 (comme le mp3). Les
taux d’échantillonnage sont de 32 ou 44,1 ou 48 kHz avec un taux de transfert
allant de 32 à 640 kbit/s.
« Batman : Le Défi » (Batman Returns) a été le premier film qui a utilisé la technologie
Dolby Digital durant l'été 1992 dans les salles de cinéma.
WAV = WAVE (WAVEform
audio file format) Avec ou sans pertes selon codec 1991
Conteneur propriétaire de Microsoft et IBM capable
de recevoir des formats aussi variés que le MP3, le WMA, et le PCM. C'est ce
dernier qui est le plus courant, c'est pour cela que l'extension WAV est
souvent considérée (à tort) comme correspondant toujours à des fichiers « sans
pertes » (lossless). Ce conteneur est limité en
taille à 2 Go (ou 4 Go actuellement), ce qui le rend inapte au travail moderne
sur des fichiers haute-définition.
Nombre de canaux du WAV : 1 à 6
Fréquence d'échantillonnage : 11, 22, 44, 48 ou 96 KHz
AU (Audio) Sans perte (lossless) 1992
Conteneur audio très simple développé par Sun Microsystems. Les données au format PCM ne sont pas
compressées, donc il n’y a pas de perte. C’est le conteneur encore utilisé en
2015 par le logiciel Audacity pour conserver les
données sources.
MP3 = MPEG-1/2 Audio Layer 3 (=
couche 3) Avec pertes (lossy) 1993
Norme développée par l’ISO et qui est
l’application sonore des standard MPEG-1 et MPEG-2. A ce titre le MP3 devrait
être soumis à des redevances, mais dans la pratique, aucune royalty
n'est prélevée sur les fichiers au format MP3.
Exemple de codec qui
applique la norme MP3 : LAME,
compresseur MP3 Open Source.
Le codec MP3 utilise un
système de compression partiellement destructif. Il ne retransmet pas
intégralement le spectre des fréquences audio. En revanche il tente d'annuler
d'abord les sons les moins perçus de façon à ce que les dégradations se fassent
remarquer le moins possible. Ce n'est pas une compression à proprement parler,
mais plutôt une suppression d'informations (format destructif).
AAC (Advanced Audio Coding) Avec pertes (lossy) 1997
Norme et codec
développés par des compagnies du disque, puis reconnu comme standard
international par le MPEG la même année. Comme le MP3 il applique une
compression avec perte de données, mais le rapport qualité sur débit binaire
est sensé être meilleur que celui du MP3. En terme de qualité d'audition, la
comparaison avec le MP3 est souvent sujette à controverse, car une telle
comparaison est subjective et dépend du matériel à comparer (genre musical).
|
MP3 |
AAC |
Fréquences
d’échantillonnage |
16 à 48 kHz |
8 à 96 kHz |
Nombre
de canaux |
1 (mono) ou 2 (stéréo) |
1 à 48 |
Débit
max (bitrate) |
320 kbit/s
max |
320 kbit/s
max |
Mesure
technique de protection |
aucune |
gère les droits
numériques (DRM) |
FLAC (Free Lossless Audio Codec) Sans perte (lossless) 2000
Codec libre de compression
audio sans perte. FLAC se distingue d’algorithmes sans perte (tels que ZIP et gzip) en ce qu’il a été créé spécifiquement pour compresser
des données audio. La méthode ZIP réduit la taille d’un fichier audio de
qualité CD de 20 à 40 %, alors que FLAC obtient des taux de 30 à 70 %. Si des codecs à perte comme le MP3 et le Vorbis
peuvent atteindre des ratios de 80-90 %, voire plus, ils le font en éliminant
des données du flux originel. FLAC n’enlève aucune information du flux audio.
FLAC utilise la prédiction linéaire pour convertir
les échantillons en une série de blocs non-corrélés
d’environ 100 ms (connus sous le nom de résidus), qui sont stockés de manière
efficiente en utilisant le codage de Golomb-Rice. Il
utilise aussi le codage par plages pour les blocs d’échantillons identiques,
tels les passages blancs. Ceci lui permet d’être décompressé à la volée durant
la lecture, y compris par un système autonome équipé de peu de mémoire.
Étant un codec sans
perte, le FLAC est très utilisé comme format d’archivage : si le support
original est perdu, endommagé ou usé, une copie en FLAC des pistes audio
garantit qu’une copie exacte des données originales peut être récupérée à tout
moment.
FLAC utilise un CRC pour identifier les morceaux
corrompus dans le cas de l’utilisation en streaming,
mais aussi le hachage MD5 complet des données PCM brutes stockés dans leur
en-tête de métadonnées STREAMINFO.
Nombre de canaux du FLAC : 1 à 8
Fréquence d'échantillonnage : 1 Hz à 1 048 KHz, avec des
incréments de 1 Hz
AAC-LC (Advanced Audio Coding - Low
Complexity) = MPEG-4 Part 3 Avec pertes (lossy) 2003
Norme développée par le MPEG comme troisième
partie du MPEG-4. Le codec AAC-LC assure à ce jour le
meilleur rapport qualité/débit des codecs audio à
perte.
HE-AACv2 (High Efficiency - Advanced Audio
Coding version 2) Avec pertes
(lossy) 2006
HE-AACv2 = AAC avec Reconstruction de Bande
Spectrale et Stéréo Paramétrique. La stéréo paramétrique est une fonctionnalité
audio définie dans MPEG-4 Part 3 destinée à renforcer l'efficacité de codage
dans les médias stéréo à faible bande passante (diffusion en streaming sur internet). Les
données stéréo sont encodées comme un flux monophonique à l'aide de quelques
informations paramétriques additionnelles embarquées dans le flux principal,
pour recréer le son stéréo originel. Cela permet une bonne qualité stéréo avec
des débits très bas, allant en moyenne de 16 à 40 kbit/s !
Dans le convertisseur SUPERv2015, le choix des débits en HE-AAC est limité
entre 16 et 56 kbit/s ! Le HE-AAC est donc à
réserver pour les diffusions en streaming.
Historique de quelques
formats conteneur
Selon le type de conteneur, la façon dont sont
organisées les données (vidéo et/ou audio) à l'intérieur du fichier est différente.
De plus, certains conteneurs permettent de stocker des sous-titres, des éléments
de chapitrage, ainsi que d'autres informations sur le
média (appelées métadonnées,
ou tags).
MOV (Movie) 1989
Conteneur propriétaire de Apple, utilisé par le
lecteur QuickTime. A partir de 2001, ce conteneur
permet le streaming cad la
lecture de la vidéo au fur et à mesure de son téléchargement sur internet.
AVI (Audio Video
Interleave = Imbrication Audio Vidéo) 1992
Conteneur propriétaire de Microsoft qui ne permet
pas le streaming (le fichier doit être complet pour
pouvoir être lu). Il réunit une piste vidéo et jusqu’à 99 pistes audio, ce qui
permet de bénéficier, par exemple, de plusieurs langues pour un même film.
Codecs vidéo supportés : DivX, Xvid, DV, Mpeg2/4…
Codecs audio : AC3, mp3, PCM…
Taille maxi d’un fichier AVI : 2 Go.
TS (Transport Stream) 1994
Conteneur propriétaire élaboré par MPEG, largement
utilisé pour la télévision numérique terrestre, par câble ou par satellite. Il utilise
pas ou peu de code temporel, mais comprend des fonctionnalités de correction
d'erreur pour le transport sur média non-sûr (câble
ou par satellite). C'est l’équivalent du format PS (Program
Stream) qui vise les médias dit
sûrs, comme le DVD. Actuellement, Free (groupe Iliad)
utilise le codec H.264 dans ses diffusions de vidéos
au format TS.
MP4 = MPEG-4 Part 14 2001
Conteneur propriétaire élaboré par MPEG qui permet
le streaming. Ses variantes sont le m4a (MPEG-4
Audio) et le m4p (MPEG-4 Protégé contre la copie par DRM).
FLV (Flash Vidéo) 2002
Conteneur propriétaire de Adobe Systems (Macromedia à la base)
qui permet le streaming. Le codec
vidéo est soit une variante du H.264, soit le codec
VP6 de la société On2 (appartenant à Google), soit
encore une suite de captures d’écran. L'audio est soit non compressé (PCM),
soit compressé en MP3.
MKV
(Matroska
Video, du russe matriochka = poupée russe) 2003,
essor à partir de 2007
Conteneur gratuit et ouvert, développé par une
association loi 1901 française, et qui permet le streaming.
Ce conteneur est open source et aucune redevance n’est due. Le conteneur MKV
est capable d'encapsuler des contenus en haute définition 720p ou 1080p, ainsi
qu'en ultra haute définition (UHD) 4K. Cela en fait un format privilégié pour
la copie des HD-DVD ou des disques BluRay.
wikipedia
http://www.gypsevideo.fr/index.php?option=com_content&view=article&id=123
http://www.commentcamarche.net/contents/73-m4a-format-aac-et-caracteristiques
http://www.commentcamarche.net/contents/74-dolby-digital-ac3
http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html
http://www.figer.com/Publications/avchd.htm#.VVYKaC7lsgQ