L'encodage avec <application>MEncoder</application>

L'encodage avec <application>MEncoder</application> Faire un MPEG-4 ("DivX") de bonne qualité à partir d'un DVD Il est fréquemment demandé:"Comment puis-je recopier un DVD avec la meilleure qualité possible pour une taille donnée ?". Ou encore:"Comment puis-je recopier un DVD sur mon disque dur avec la meilleure qualité possible ? je m'en fiche de la taille du ficher, je veux la meilleure qualité?" Cette dernière question est peut-être un peu mal posée. Après tout, si vous ne vous souciez pas de la taille du fichier, pourquoi ne pas simplement copier le flux MPEG-2 du DVD entier ? Bien sûr, votre AVI finira par faire 5Gb, mais si vous voulez la meilleure qualité et ne vous souciez pas de la taille, ceci est probablement votre meilleure option. En fait, la raison pour laquelle vous voulez convertir un DVD en MPEG-4 est que vous tenez réellement compte de la taille du fichier. Il est difficile de proposer une recette sur la façon de créer des MPEG-4 de très haute qualité à partir de DVD. Il y a plusieurs facteurs à prendre en compte, et vous devriez comprendre ces détails ou vous serez déçus par les résultats. Ci-dessous nous allons examiner quelques-uns de ces problèmes, et voir un exemple. Nous supposerons que vous utilisez libavcodec pour encoder la vidéo, bien que la théorie s'applique également à d'autres codecs. Si vous ne vous sentez pas de taille, vous devriez utiliser une des interfaces graphiques listées sur la page de notre projet dans Section MEncoder. Ainsi, vous devriez être capable de faire de encodages de DVD de haute qualité sans trop réfléchir, ces outils sont faits pour prendre les bonnes décisions à votre place. Préparer l'encodage : identifier le matériel source et le nombre d'images par secondes Avant même de penser à encoder un film, il est nécessaire de passer par quelques étapes préliminaires. La première et plus importante étape avant l'encodage sera la détermination du type de contenu utilisé. Si votre matériel source provient d'un DVD ou de la télévision hertzienne/câble/satellite, il sera stocké sous l'un de ces 2 formats : NTSC pour l'Amérique du nord et le Japon, et PAL pour l'Europe, etc. Il est important de réaliser que ceci est uniuement le formatage pour être passé sur une télévision et cela ne correspond souvent pas au format original du film. L'expérience montre que le NTSC est bien plus dur à encoder car il y a plus d'éléments à identifier dans la source. Afin de produire un encodage acceptable, vous devez connaître le format original. Négliger cette étape créera divers défauts dans votre encodage, dont de hideux effets de peigne et des images dupliquées ou même perdues. De plus, ces artefacts sont mauvais pour l'efficacité d'encodage : vous obtiendriez une moins bonne qualité pour le même débit. Identification du nombre d'images par seconde de la source Voici une liste de types de matériel source courants, où vous devriez les trouver et leurs propriétés : Film standard: produit pour une diffusion cinématographique en 24 images par secondes. Vidéo PAL: Enregistrée par une caméra à 50 trames par secondes. Une trame consiste en l'ensemble des lignes paires (ou impaires) d'une image. La télévision a été créée de façon à afficher alternativement l'une ou l'autre de ces trames créant ainsi une forme de compression analogique bon marché. L'oeil humain est censé compenser cette alternance de trames mais dès lors que vous comprenez l'entrelacement, vous apprendrez à le voir aur la télévision et vous ne la regarderez plus de la même façon. Deux trames ne font pas une image complète, car elles sont capturées avec un décalage d'1/50e de seconde et donc, à moins qu'il n'y ait pas de mouvement, elles ne s'alignent pas parfaitement. Vidéo NTSC : Enregistré par une caméra à 60000/1001 trames par secondes, ou 60 trames par secondes dans l'ère noir/blanc. A part cela, similaire au PAL. Dessins animés: Habituellement dessiné en 24 images par secondes, peut exister en mélange de variés nombre d'images par secondes. Infographie: peut être de n'importe quel nombre d'images par secondes mais certains sont plus communs que d'autres; 24 et 30 sont typiques du NTSC et 25 du PAL. Vieux films: nombre d'images par secondes généralement plus bas. Identification du matériel source Les films composés d'images entières sont dits progressifs, alors que ceux composés de trames indépendantes sont appelés soit entrelacés soit vidéo - bien que ce dernier terme soit plutôt ambigu. Pour compliquer le tout, certains films sont un mélange des 2. La distinction la plus importante qui doit être faite entre ces formats est que certains utilisent des images entières alors que d'autres, des trames. Avant d'être visionnable sur un téléviseur, tout film (DVD inclus) doit être converti dans un format basé sur des trames. Les diverses méthodes par lesquelles ceci peut être fait peuvent être rassemblées sous le terme anglais "telecine", parmi lesquels l'infâme NTSC "3:2 pulldown" en est une variété. A moins que la vidéo source ne soit déjà basée sur des trames (au bon nombre par seconde), vous devez transformer le film dans un format autre que celui d'origine. Plusieurs variétés communes de pulldown : Pulldown PAL 2:2 : Le plus joli de tous. Chaque image est affichée pour la durée de deux trames par extraction des lignes paires et impaires, puis en les affichant par alternance. Si l'original est à 24 images par secondes, ce procédé accélère le film de 4%. pulldown PAL 2:2:2:2:2:2:2:2:2:2:2:3: Toutes les 12 images sont affichées pour la durée de 3 trames au lieu de deux. Cela permet d'éviter le problème de l'accélération de 4% mais rend le processus bien plus difficile à inverser. Cette technique est généralement utilisée dans les productions musicales où l'accélération de 4% endommagerait sérieusement la qualité musicale. Téléciné NTSC 3:2: Les images sont alternativement affichées pendant une durée de 3 ou 2 trames. Cela donne un nombre de trames par seconde de 2,5 fois le nombre d'images par seconde de l'original. Le résultat est aussi très légèrement ralenti de 60 trames par secondes à 60000/1001 trames par seconde pour maintenir la vitesse d'affichage NTSC. Pulldown NTSC 2:2: Utilisé pour montré du 30 images par secondes sur du NTSC. Joli, comme le pulldown PAL 2:2. Il y aussi des méthodes de conversion entre vidéos NTSC et PAL mais cela sort du cadre de ce guide. Au cas où vous rencontriez un film au format NTSC ou PAL et vouliez l'encodez, le mieux serait de trouver une copie du film dans le format original. La conversion entre ces deux formats est hautement destructrice et ne peut être inversee proprement, votre encodage en souffrirait grandement s'il était fait à partir d'une source déja convertie (en NTSC ou PAL). Quand des vidéos sont stockées sur un DVD, les paires de trames consécutives sont rassemblées en une image même si elles ne sont pas censées être affichées au même moment. Le standard MPEG-2 utilisé dans les DVDs et la télévision numérique fournit un moyen à la fois d'encoder les images progressives originales et de stocker le numéro des trames auxquelles une image doit petre montrée dans l'en-tête de cette image. Si cette méthode est utilisée, on dit que le film est "soft-téléciné" puisque le procédé impose uniquement au lecteur DVD d'appliquer le pulldown sur le film plutôt que d'altérer le film lui-même. Ce cas est de loin préférable puisqu'il peut être facilement inversé (en fait, ignoré) par l'encodeur et puisqu'il préserve la qualité au maximum. Malgré cela, beaucoup de studios de production de DVD et d'émission n'utilisent pas les techniques d'encodage correctes, au lieu de cela, elles produisent des films en "hard telecine" dans lesquels des trames sont dupliquées dans l'encodage MPEG-2. Les étapes pour gérer correctement ce genre de cas seront évoquées plus tard dans ce guide. Pour l'instant, nous allons vous donner quelques indications pour définir à quel type source vous avez à faire : Régions NTSC: Si MPlayer affiche que le nombre d'image a changé en 24000/1001 quand vous regardez votre film et qu'il ne change plus après cela, c'est presque certainement un contenu progressif qui a été "soft téléciné". Si MPlayer affiche un nombre d'images par seconde alternant entre 24000/1001 et 30000/1001 et que vous voyez un effet de peigne par moment, alors il y a plusieurs possibilités. Les segments en 24000/1001 images par seconde sont très certainement un contenu progressif, "soft teleciné" mais les parties en 30000/1001 images par secondes peuvent être soit un contenu en 24000/1001 images par seconde "hard-telecinées", soit une vidéo NTSC en 60000/1001 trames par seconde. Utilisez les mêmes conseils que ceux pour les deux cas qui suivent pour savoir lequel. Si MPlayer montre un nombre d'images par seconde constant et que chacune des images des scènes de mouvement souffre d'un effet de peigne, alors votre film est une vidéo NTSC à 60000/1001 trames par seconde. Si MPlayer montre un nombre d'images par seconde constant et que deux images sur cinq souffrent d'un effet de peigne, votre film est "hard téléciné" en 24000/1001 images par seconde. Régions PAL: Si vous ne voyez jamais d'effet de peigne, le film est en pulldown 2:2. Si vous voyez un effet de peigne apparaissant et disparaissant toutes les demi-secondes, alors le film a subi un pulldown 2:2:2:2:2:2:2:2:2:2:2:3. Si vous voyez toujours un effet de peigne dans les scènes de mouvement, alors le film est en PAL à 50 trames par secondes. Astuce: MPlayer peut ralentir la lecture d'un film en utilisant l'option ou le jouer image par image. Essayer afin de regarder le film très lentement ou presser la touche "." répététivement pour avancer image par image et ainsi identifier la "signature" du pulldown si celle-ci n'est pas visible à vitesse normale. Quantificateur constant contre multipasse Il est possible d'encoder votre film à de très différentes qualités. Avec un encodeurs vidéo modernes et quelques compression pré-codec (antibruit et redimensionnement) il est possible d'obtenir une trés bonne qualité pour un film grand écran de 90-110 minutes sur 700Mb. De plus, à part les plus longs, tous les films peuvent être encodés à une qualité presque parfaite sur 1400Mb. Il y a trois approches possibles pour encoder une vidéo: débit constant (CBR), quantification constante, et multipasse (ABR (pour average bitrate ou débit moyen). La complexité des images d'un film et donc le nombre de bits requis pour les compresser peut varier grandement d'une scène à l'autre. Les encodeurs vidéos modernes peuvent s'ajuster à ces besoins en faisant varier le débit. Cependant, dans des modes simples comme le CBR, le compresseur ne connaît pas le besoin en débit pour les scènes à venir et ne peut donc pas excéder le débit moyen requis pour de longues portions du film. Des modes plus avancés, comme l'encodage multipasse peuvent prendre en compte les statistiques des passes précédentes, ce qui règle le problème ci-dessus. Note: La plupart des codecs qui supportent la compression ABR supportent seulement deux passages alors que d'autres comme le x264, le Xvid et le libavcodec supportent le multipasse ce qui améliore légèrement la qualité à chaque passe même si ces améliorations ne sont plus visibles ou mesurables après environ la quatrième passe. Ainsi, dans cette section, deux passes et multipasse seront utilisés indifféremment. Dans chacun de ces modes, le codec vidéo (tel que libavcodec) sépare les images vidéo en macroblocs de 16x16 pixels et applique ensuite un quantificateur sur chaque macrobloc. Plus le quantificateur est bas, meilleure est la qualité et plus le débit est grand. La méthode utilisée par l'encodeur pour déterminer quel quantificateur utiliser pour un macrobloc donné varie et est très configurable. (ceci est une simplification à l'extrême du processus, mais il est utile de comprendre le principe de base). Lorsque vous spécifiez un débit constant, le codec vidéo encode la vidéo en excluant les détails autant qu'il le faut et aussi peu que possible de façon à rester en dessous du débit spécifié. Si la taille du fichier vous est vraiment égale, vous pourriez aussi bien fixer un débit constant infini (en pratique, dela signifie une valeur assez haute pour ne pas poser de limites, tel que 10000Kbit). Sans réelle restriction de débit, le codec utilisera le plus bas quantificateur possible pour chaque macrobloc (tel que spécifié par pour libavcodec, qui vaut 2 par défaut). Dès que vous spécifiez un débit suffisament bas pour que le codec soit forcé d'utiliser un quantificateur plus grand, vous ruinez très certainement la qualité votre vidéo. Pour éviter ça, vous devriez probablement réduire la résolution de votre vidéo en suivant la méthode décrite plus tard dans ce guide.En général, vous devriez éviter le CBR si vous vous souciez de la qualité. Avec un quantificateur constant, le codec utilise le même quantificateur (spécifié par l'option pour libavcodec) sur chaque macrobloc. Si vous voulez un encodage de la meilleure qualité possible, cette fois encore en ignorant le débit, vous pouvez utiliser . Cela donnera le même débit et le même PSNR (Peak Signal-to-Noise Ratio, rapport signal sur bruit de crête) que le CBR avec =infini et la valeur par défaut de : 2. Le problème avec la quantification constante est que cela utilise le quantificateur spécifié que le macrobloc en ait besoin ou non. En fait, il doit être possible d'utiliser un quantificateur plus haut sur un macrobloc sans sacrifier la qualité visuelle. Pourquoi gaspiller les bits avec un quantificateur inutilement bas ? Votre microprocesseur a assez de ressources car il a le temps, mais votre disque lui a une taille limitée. Avec l'encodage deux passes, la première passe va encoder le film comme en CBR, mais va garder un journal des propriétés de chaque image. Ces données sont ensuite utilisées pendant la seconde passe de façon à choisir intelligemment quels quantificateurs utiliser. Lors des scènes d'action rapide ou celles ayant beaucoup de détails, des quantificateurs plus élevés seront probablement utilisés. Pendant les scènes avec peu de mouvements ou avec peu de détails, ce seront des quantificateurs plus bas. Normalement, la quantité de mouvement est bien plus importante que la quantité de détail. Si vous utilisez , alors vous gaspillez des bits. Si vous utilisez , vous n'avez pas la meilleure qualité d'encodage. Supposez que vous encodez un DVD avec , et que le résultat est 1800Kbit/s. Si vous faites un encodage en deux passes avec , la vidéo produite aura une meilleure qualité pour le même débit. Maintenant que vous êtes convaincu que l'encodage deux passes est la bonne méthode, la vraie question est maintenant de savoir quel débit utiliser. Il n'y a pas de réponse toute faite. Idéalement, vous devriez choisir un débit offrant un compromis entre qualité et taille de fichier. Cette valeur varie selon la vidéo source. Si la taille ne compte pas, un bon point de départ pour un encodage de très haute qualité est environ 2000kbit/s plus ou moins 200kbit/s. Pour les vidéos comportant beaucoup d'actions ou de détails ou si vous avez de très bon yeux, vous pouvez choisir 2400 ou 2600. Pour certains DVDs, vous pourriez ne pas voir de différence à 1400kbps. C'est une bonne idée que d'essayer sur des scènes avec différents débits pour se rendre compte. Si vous avez fixé une taille limite, alors il faudra d'une certaine façon calculer le débit. Mais avant cela, il faudra définir l'espace que vous réservez aux piste(s) audio et vous devrez les encoder en premier. Vous pourrez alors calculer le débit souhaité avec l'équation suivante : Débit = (taille_fichier_final_en_Mo - taille_fichier_son_en_Mo) * 1024 * 1024 / durée_en_secondes * 8 / 1000 Par exemple, pour ramener deux heures de films sur un CD de 702Mo avec une piste son de 60Mo, le débit vidéo sera alors de : (702 - 60) * 1024 * 1024 / (120*60) * 8 / 1000 = 740kbit/s Contraintes pour une compression efficace De par la nature intrinsèque de la compression MPEG, de nombreux paramètres entrent en jeu afin d'obtenir une qualité maximale. Le MPEG découpe la vidéo en carré de 16x16 appelé macroblocs. Chacun d'entre eux est composé de 4 petits (8x8) blocs contenant des informations sur la luminosité (intensité) ainsi que de 2 blocs (donc à résolution moitié) contenant des informations chromatiques (pour les teintes rouge-cyan et bleu-jaune). Même si la longueur et la largeur du film ne sont pas des multiples de 16, l'encodeur utilisera des macroblocs de 16x16 pour couvrir l'image entière, l'espace restant sera alors perdu. Si votre intérêt est de conserver une très bonne qualité, utiliser des résolutions non multiples de 16 n'est pas une bonne idée. La plupart des DVDs ont aussi des bandes noires sur les bords. Négliger ces parties peut altérer la qualité de plusieurs manières. La compression MPEG est aussi dépendante du domaine de transformation des fréquences, en particulier du "Discrete Cosine Transform (DCT)" (une espèce de transformée de Fourier). Ce type d'encodage est efficace pour les formes et les transitions douces, mais fonctionne moins bien avec les contours acérés. Afin d'encoder correctement, il demandera plus de bits, sinon des artefacts de compression apparaîtront, aussi connus sous le nom de "ringing". La transformation en fréquence (DCT) prend place séparément dans chaque macrobloc (en fait, dans chaque bloc), donc le problème n'apparaîtra que si un bord franc se situe dans ce bloc. Si vos bordures noires commencent exactement sur un multiple de 16, ce ne sera pas un problème. En pratique, les bordures ne sont jamais bien alignées, et il sera certainement nécessaire de les couper pour éviter ces défauts. En plus des transformations au niveau des fréquences, la compression MPEG utilise des vecteurs de mouvements représentant les changements d'une image à la suivante. Ces vecteurs de mouvements voient leur utilité grandement réduite quand la prochaine image à un contenu totalement différent. Quand il y a un mouvement qui sort de la région encodée, cela ne pose pas de problème aux vecteurs. En revanche, cela peut poser des problèmes avec les bandes noires: Pour chaque macrobloc, la compression MPEG stocke un vecteur identifiant quelle partie de l'image précédente devrait être copiée dans les macroblocs de l'image suivante. Seules les différences devront alors être encodées. Si le macrobloc s'étend et prend en compte une des bordures noire de l'image, alors le vecteur de mouvement écrasera la bordure noire. Cela veut dire que de nombreux bits sont gaspillés pour re-noircir la bande noire ou alors (plus probable) que le vecteur de mouvement ne sera pas du tout utilisé et que tout le macrobloc devra alors être ré-encodé. Dans tous les cas, l'efficacité de l'encodage en est grandement améliorée. Une fois encore, ce problème n'existe que si les lignes des bordures noires ne sont pas un multiple de 16. Enfin, supposons que l'on ait un macrobloc à l'intérieur d'une image et qu'un objet se déplace dans ce bloc proche d'un bord de l'image. Malheureusement, le MPEG ne sait pas faire "copier juste la partie qui dans l'image et laisser tomber la partie noire". Donc la partie noire sera alors aussi copiée, ce qui fait encore gaspiller beaucoup de bits pour compresser un morceau d'image qui n'est pas sensé être là. Si l'objet en mouvement parcourt depuis le bord noir jusque dans la zone encodée, le MPEG dispose d'optimisation spéciales pour copier en répétition des pixels depuis le bord de l'image lorsque celui vient de l'extérieur de la partie encodée. Ces optimisations deviennent inutiles quand le film à des bandes noires. Contrairement aux problèmes 1 et 2, même les bordures noires multiples de 16 n'aident pas dans ce cas. Malgré le fait que les bordures soient entièrement noires et quelles ne changent jamais, il y a toujours un minimum de macroblocs impliqués. Pour toutes ces raisons, il est préférable de couper entièrement ces bandes noires. Dans la même optique, s'il y a une partie contenant du bruit ou de la distorsion d'image près d'une bordure, la coupure l'enlèvera et permettra d'avoir une amélioration significative de la qualité de l'encodage. Les puristes parmi les vidéophiles souhaiteront préserver l'encodage le plus proche possible de l'original, à moins qu'ils n'encodent avec un quantificateur constant, la qualité gagnée après la suppression des bandes noires améliorera grandement la qualité finale de l'encodage au regard des quelques informations perdues. Découpage et Redimensionnement Vous vous souvenez de la section précédente que les dimensions (à la fois largeur et hauteur) de l'image finale doivent être des multiples de 16. Cela peut être réalisé par recadrage (découpe), redimensionnement ou une combinaison des deux. Lors du recadrage, il y a quelques règles qui doivent être respectées pour éviter d'endommager votre film. Le format YUV normal, 4:2:0, stocke la chrominance (la couleur) de manière sous-échantillonnée, c'est à dire que la chrominance est échantillonée moitié moins souvent que la luminance (intensité). Sur le schéma suivant, L indique l'échantillonage en luminance et C en chrominance. L L L L L L L L C C C C L L L L L L L L L L L L L L L L C C C C L L L L L L L L Comme vous pouvez le voir, les lignes et colonnes de l'image viennent naturellement par deux. Ainsi, les dimensions de votre recadrage ainsi que ses distances au bords d'origine doivent être paires. Si elles ne l'étaient pas, les chrominances et luminances ne seraient plus alignées. En théorie, il est possible d'avoir des dimensions impaires, mais cela requière un nouvel échantillonage de la chrominance, ce qui engendre potentiellement des pertes d'information et n'est pas supporté par le filtre de recadrage. Ensuite, la vidéo entrelacée est échantillonée de la façon suivante: Top field Bottom field L L L L L L L L C C C C L L L L L L L L L L L L L L L L C C C C L L L L L L L L L L L L L L L L C C C C L L L L L L L L L L L L L L L L C C C C L L L L L L L L Comme vous pouvez le voir, le plus petit motif à se répéter est sur 4 lignes. Donc, pour la vidéo entrelacée, la hauteur de votre recadrage et sa distance verticale aux bords doivent être des multiples de 4. La résolution native pour un DVD NTSC est 720x480 et 720x576 pour un PAL, mais il y a un indicateur d'aspect qui spécifie que le mode est plein-écran (full-screen 4:3) ou bien écran large (wide-screen 16:9). Un grand nombre de DVDs (pas tous) en wide-screen ne respecte pas strictement le format 16:9, mais est plutôt en 1,85:1 ou 2,35:1 (cinémascope). Ceci signifie qu'il y aura des bandes noires à enlever sur la vidéo. MPlayer fournit un filtre de détection qui détermine le rectangle de recadrage (). Lancer l'application MPlayer avec l'option et il affichera les options de recadrage pour enlever les bandes. Vous devez laisser tourner le film suffisamment longtemps pour que toute la zone de l'image soit vue de façon à obtenir des valeurs précises. Ensuite, testez les valeurs obtenues avec MPlayer en utilisant la ligne de commande fournie par , et éventuellement ajustez le rectangle de recadrage. Ce filtre offre la possibilité de le positionner de façon interactive pendant le film. N'oubliez pas de suivre les recommandations précédentes sur la divisibilité des dimensions de l'image afin de ne pas désaligner les plans de chrominance. Dans certain cas, le redimensionnement n'est pas souhaitable. Il est délicat dans le sens vertical avec des vidéos entrelacées, si vous désirez conserver l'entrelacement, vous devrez vous abstenir de redimensionner. Sans redimensionner, pour utiliser des dimensions multiples de 16, il vous faudra recadrer plus petit que l'image. Ne pas recadrer plus grand que l'image parce que car les bandes noires sont nuisibles à la compression. Le MPEG-4 utilisant des macroblocs de 16x16, assurez-vous que les dimensions de la vidéo que vous encodez sont des multiples de 16, sinon vous dégraderez la qualité, surtout à de faibles débits. Pour ce faire, vous pouvez arrondir les dimensions du rectangle de recadrage au multiple de 16 inférieur. Comme expliqué plus haut, durant le recadrage, vous devrez augmenter le décalage en Y de la moitié de la différence entre l'ancienne et la nouvelle hauteur pour que l'image résultante se situe au milieu de l'ancienne. Et à cause de la façon dont les vidéos DVD sont échantillonées, assurez-vous que ce décalage en Y est un nombre pair. (En fait, c'est une règle: n'utilisez jamais une valeur impaire lors d'un recadrage ou d'un redimensionnement de vidéo). Si vous ne vous faites pas à l'idée de vous débarrasser de quelques pixels, vous préférerez sans doute redimensionner la vidéo. Nous allons voir cela dans notre exemple ci-dessous. En fait, vous pouvez laisser le filtre faire tout cela pour vous: il a un paramètre optionnel d'arrondi qui vaut 16 par défaut. Faites aussi attention aux pixels à "demi-noir" sur les bords. Assurez-vous qu'ils sont en dehors de votre recadrage, autrement, vous gâcherez des bits qui seraient mieux utilisés ailleurs. Après tout ceci, vous obtiendrez une vidéo qui n'est pas tout à fait au format 1,85:1 ou 2,35:1, mais quelque chose d'assez proche. Vous pourriez alors calculer le nouveau format à la main mais MEncoder propose une option appelée pour libavcodec qui fera cela pour vous. N'agrandissez surtout pas cette vidéo pour obtenir les dimensions standards à moins que vous n'aimiez gâcher votre espace disque. Ce changement d'échelle se fait à la lecture, le lecteur utilisera les données stockées dans le fichier AVI pour effectuer le bon rendu. Malheureusement, tous les lecteurs vidéos n'appliquent pas ce redimensionnement automatique, c'est peut-être pour cela que vous voudrez quand même procéder à ce redimensionnement. Choix de la résolution et du débit Si vous n'encodez pas dans un mode à quantificateur constant, vous devez sélectionner un débit. Le concept de débit (bitrate) est assez simple. C'est un nombre (moyen) de bits par seconde qui sera utilisé pour stocker votre film. Normalement, le débit est mesuré en kilobits (1000 bits) par seconde. La taille de votre film sur le disque dur correspond au débit multiplié par sa durée plus une petite quantité pour l'"en-tête" (surcoût, voir par exemple la section sur les conteneurs AVI). D'autres paramètres comme le redimensionnement, le recadrage, etc. ne modifieront pas la taille du fichier sauf si vous y changez aussi le débit. Le débit n'est pas proportionnel à la résolution. Ce qui veut dire qu'un fichier en 320x240 à 200kbit/sec n'aura pas la même qualité que le même film en 640x480 à 800kbit/sec ! A cela, deux raisons: Visuelle : Les artefacts de compression MPEG se remarquent plus facilement à une plus grande échelle. Les artefacts apparaissent à l'échelle des blocs (8x8). L'oeil humain ne voit pas les erreurs dans 4800 petits blocs aussi facilement que qu'il les voit dans 1200 grands blocs (en supposant une visualisation en plein écran dans les deux cas). Théorique : quand vous réduisez la taille d'une image mais que vous continuez à utiliser les mêmes tailles de bloc (8x8) pour la transformation dans l'espace des fréquences, vous déplacez plus de données vers les hautes fréquences. Grossièrement dit: chaque pixel contient plus de détails qu'avant. Donc, même si votre image de taille réduite ne contient plus qu'un quart de l'information dans le domaine spatial, elle peut toujours contenir une grande part de l'information dans l'espace des fréquences (en supposant que les hautes fréquences étaient sous-utilisées dans votre originale en 640x480). Les anciens guides recommandaient de choisir un débit et une résolution basés sur "1 bit par pixel", mais ce n'est que peu justifié avec les raisons évoquées ci-dessus. Une meilleure estimation reste que le débit augmente proportionnellement à la racine carrée de la résolution, donc une image 320x240 à 400kbit/sec sera comparable à une en 640x480 à 800 kbit/sec. Cela n'a pas été strictement vérifié par la théorie ou une quelconque méthode. De plus, pour un film donné, le résultat variera en fonction du bruit, des détails, du degré de mouvement, etc.. Il est futile de donner des recommandations générales du style: un nombre de bits par longueur de diagonale (similaire au bit par pixel, en utilisant la racine carrée). Jusqu'à maintenant, nous avons discuté de la difficulté de choisir le débit et la résolution. Calcul de la résolution Les étapes qui suivent vous guideront dans le calcul de la résolution de votre encodage sans trop distordre la vidéo, en prenant en compte les différents types d'information sur la source vidéo. En premier lieu, il faut calculer le format de l'encodage: ARc = (Wc x (ARa / PRdvd )) / Hc Où : Wc et Hc sont la largeur et la hauteur de la vidéo recadrée, ARa est le format affiché, généralement 4/3 ou 16/9, PRdvd est le ratio des pixels du DVD qui normalement est égal à 1,25 (=720/576) pour le PAL et 1,5(=720/480) pour le NTSC, Ensuite, vous pouvez calculer la résolution X et Y en tenant compte du facteur de Qualité de Compression (CQ): ResY = INT(SQRT( 1000*Bitrate/25/ARc/CQ )/16) * 16 et ResX = INT( ResY * ARc / 16) * 16 D'accord, mais c'est quoi ce CQ ? le CQ représente le nombre de bit par pixel et par image encodée. Grosso modo, plus le CQ est grand, moins il y aura de chances de voir apparaître des artefacts de compression. En tout cas, si vous avez une limite de taille pour votre film (1 ou 2 CDs par exemple), il y a donc une limite au nombre de bits total que vous pouvez lui allouer et il est donc nécessaire de trouver le bon compromis entre compressibilité et la qualité. Le CQ dépend du débit, de l'efficacité du codec vidéo et de la résolution du film. Une manière d'augmenter le CQ, c'est de réduire la résolution du film puisque le débit est calculé en fonction de la taille finale désirée et la longueur du film qui sont constant. Avec les codecs ASP MPEG-4 comme le Xvid ou le libavcodec, un CQ en dessous de 0,18 donne généralement une image type mosaïque car il n'y pas assez de bits pour coder les informations de chaque macrobloc (le MPEG-4, comme les autres codecs, groupe les pixels compressés par blocs pour compresser l'image, s'il n'y a pas assez de bits, les bords de ce macrobloc deviennent alors visibles). Donc il est raisonnable de prendre un CQ entre 0,20 et 0,22 pour une copie tenant sur 1 CD, et entre 0,26 et 0,28 pour une copie sur 2 CDs avec des options d'encodage standard. Des options d'encodage plus avancées telles que celles listées ici pour le libavcodec et le Xvid devraient permettre d'obtenir la même qualité avec un CQ se situant entre 0,18 et 0,20 pour une copie sur 1 CD et 0,24 à 0,26 pour une copie sur 2 CDs. Avec les codecs ASP MPEG-4 comme le x264, vous pouvez utiliser un CQ se situant entre 0,14 et 0,16 avec des options standards d'encodage, et même descendre entre 0,10 et 0,12 avec des options avancées x264. Veuillez noter que le CQ n'est qu'un indicateur, il dépend directement du contenu encodé, un CQ de 0,18 pourrait sembler parfait pour un film de Bergman, mais trop petit pour un film comme Matrix contenant beaucoup de scènes d'actions. A l'opposé, il est inutile d'aller au delà de 0,30 pour le CQ, vous ne feriez que gâcher de l'espace disque sans gain notable en qualité. Notez aussi, comme cela a été dit plus haut que les vidéos en plus petites résolutions auront besoin d'un plus grand CQ (comparé à la résolution d'un DVD par exemple) pour un rendu correct. Les filtres Apprendre à utiliser les filtres vidéos de MEncoder est essentiel pour créer des fichiers bien encodés. Toutes les transformations vidéos sont exécutées au travers de filtres, comme le recadrage (découpe), le redimensionnement, l'ajustement de couleur, la suppression du bruit, l'ajustement de la netteté, le dés-entrelacement, le téléciné, le téléciné inverse, ou l'effacement des macroblocs trop visible, pour n'en nommer que quelques un. Avec le grand nombre de formats d'entrée supporté, la variété des filtres disponibles dans MEncoder est l'un de ses principaux avantages sur d'autres programmes similaires. Les filtres sont chargés dans la chaîne grâce à l'option -vf : -vf filtre1=options,filtre2=options,... La plupart des filtres acceptent plusieurs options numériques séparées par des double-points (:), mais la syntaxe varie d'un filtre à l'autre, aussi lisez la page manuel pour avoir les détails sur les filtres que vous souhaitez utiliser. Les filtres agissent sur la vidéo dans l'ordre de leur chargement. Par exemple, la chaîne suivante : -vf crop=688:464:12:4,scale=640:464 recadrera d'abord une zone de 688x464 depuis le bord haut gauche mais avec un décalage de (12;4), puis redimensionnera la vidéo pour obtenir du 640x464. Certains filtres ont besoin d'être chargés au début (ou proche du début) de la chaîne pour profiter d'informations du décodeur vidéo qui seraient perdues ou invalidées par d'autres filtres. Les principaux exemples sont (postprocessing, seulement dans le cas d'un estompage des macroblocs ou des enlèvements des artefacts de compression), le (un autre post processus pour enlever les artefacts MPEG), le (téléciné inverse), et (conversion du soft téléciné en hard telecine). En général, il vaut mieux utiliser le moins de filtres possibles afin de conserver l'encodage le plus proche possible du DVD source. Le recadrage est souvent nécessaire (comme expliqué plus haut), mais évitez de redimensionner l'image. Bien qu'il soit parfois préférable de réduire la taille de l'image plutôt que d'utiliser un quantificateur plus élevé, nous voulons éviter tout ceci:souvenez-vous que nous avons décidé au départ d'échanger des bits pour de la qualité. Aussi, n'ajustez pas le gamma, le contraste, la luminosité, etc. Ces réglages peuvent être bons chez vous mais pas sur un autre écran. Ils doivent être appliqués lors de la lecture uniquement. Une chose que vous pouvez vouloir faire est de passer la vidéo à travers un filtre trés léger antibruit, comme par exemple . Il s'agit encore une fois d'optimiser l'utilisation de l'espace disque: pourquoi le gaspiller à encoder du bruit alors qu'il sera là de toutes façons à la lecture? Augmenter les paramètres de améliorera encore la compressibilité, mais si vous les augmentez trop, vous risquez de dégrader l'image. Les valeurs suggérées ci-dessus () sont plutôt conservatrices, n'hésitez pas à les augmenter et à regarder le résultat par vous-même. Entrelacmeent et Téléciné Presque tous les films sont tournés en 24 images par seconde. Puisque le NTSC est en 30000/1001 images par seconde, certains traitements doivent être appliqués pour l'adapter au débit NTSC. Ce procédé est appelé 3:2 pulldown, plus communément appelé téléciné (car le pulldown est souvent appliqué durant la phase de conversion en téléciné), et de façon simpliste, il fonctionne en ralentissant le film à 24000/1001 images par seconde, et en répétant une image sur 4. Aucun traitement spécifique n'est cependant appliqué à la vidéo des DVDs PAL, qui fonctionnent à 25 images par seconde (techniquement, PAL peut être téléciné, ce qui est appelé 2:2 pulldown, mais ceci n'est pas un problème en pratique). Le film en 24 images par seconde est simplement lu en 25 images par seconde. Le résultat est que la vidéo tourne légèrement plus vite, mais à moins d'être un extra-terrestre, vous ne verrez probablement pas la différence. Le son de la plupart des DVDs PAL a été corrigé de façon à sonner correctement quand il est lu à 25 images par seconde, même si la piste audio (et donc le film entier) a une durée 4% plus courte que les DVDs NTSC. Puisque la vidéo d'un DVD PAL n'a pas été modifiée, vous n'avez pas à vous soucier de la cadence de défilement des images. La source est en 25 images par seconde, et votre copie sera en 25 images par seconde. Cependant, si vous recopier un film d'un DVD NTSC, vous pourrez avoir besoin d'appliquer du téléciné inverse. Pour les films tournés en 24 images par seconde, la vidéo du DVD NTSC est soit en 30000/1001 téléciné, soit en 24000/1001 progressif et prévu pour être téléciné à la volée par le lecteur DVD. D'un autre coté, les séries TV sont généralement seulement entrelacées, pas télécinées. Ce n'est pas une règle absolue: certaines séries TV sont entrelacées (comme 'Buffy contre les vampires') alors que d'autres sont un mélange de progressif et d'entrelacé (comme 'Dark Angel', ou '24 heures chrono'). Il est fortement recommandé de lire la section Comment gérer le téléciné et le dés-entrelacement avec les DVDs NTSC pour apprendre à gérer les différentes possibilités. De toutes façons, si vous copiez principalement des films, vous rencontrerez de la vidéo 24 images par seconde progressive ou télécinée, et dans ce cas vous pouvez utiliser le filtre . Encodage de vidéos entrelacées Si la vidéo que vous désirez encoder est entrelacée (NTSC ou PAL), vous devez décider si vous voulez la dés-entrelacer ou non. Si le dés-entrelaçage rend votre film visionable sur des appareil à balayage progressif tels que les écrans d'ordinateur ou les projecteurs, cela a un coup: le taux de 50 ou 60 000/1001 trames par secondes passera à 25 ou 30 000/1001 et en gros, la moitié de l'information de votre film sera perdue pendant les scènes avec beaucoup de mouvement. Ainsi, si votre encodage a pour but l'archivage de haute qualité, il est recommandé de ne pas dés-entrelacer. Le film pourra toujours être dés-entrelacé lors de sa lecture sur un appareil à balayage progressif. La puissance des ordinateurs actuels oblige les lecteurs à utiliser pour ce faire des filtres de désentrelaçage qui offrent un rendu final imparfait. Mais les lecteurs du futur seront capables de mimer l'affichage entrelacé des téléviseurs. Des précautions particulières doivent être prises lors d'un travail sur vidéo entrelacée: La hauteur de recadrage et son décalage vertical doivent être des multiples de 4. Tout redimensionnement vertical doit être effectué en mode entrelacé. Les filtres de post-traitement et d'antibruit peuvent ne pas marcher comme souhaité si vous ne prenez pas soin de ne travailler que sur une trame à la fois et ils peuvent détériorerla video s'ils sont utilisés incorrectement. En tenant compte de ces recommandations, voici notre premier exemple : mencoder capture.avi -mc 0 -oac lavc -ovc lavc -lavcopts \ vcodec=mpeg2video:vbitrate=6000:ilme:ildct:acodec=mp2:abitrate=224 Notez l'usage des options et . Remarques sur la synchronisation Audio/Vidéo Le système de synchronisation audio/vidéo de MEncoder a été créé dans le but de pouvoir lire et restaurer même des fichiers dont la synchronisation est faussée ou été mal faite, ou des fichiers corrompus. Cependant, dans certains cas, ils peuvent créer des duplications ou des sauts d'image non désirés et peut-être une légère désynchronisation lorsqu'ils sont utilisés sur des fichiers sources propres (bien sûr, les questions de synchronisation A/V ne se posent que si vous encodez ou copiez la bande son en même temps que vous encodez la video, ce qui est fortement encouragé). Ainsi, vous devez peut-être passer à la synchronisation A/V basique grâce à l'option . Vous pouvez la mettre dans votre fichier de configuration ~/.mplayer/mencoder tant que vous ne travaillez que sur des fichiers sources propres (DVD, capture Télé, encodage MPEG-4 de haute qualité, etc) et des fichiers ASF/RM/MOV non-détériorés. Si vous désirez vous protéger encore plus contre les sauts et les duplication étranges d'images, vous pouvez utiliser à la fois et . Cela empêche toute synchronisation A/V et copie les images une à une. Vous ne pouvez donc pas l'utiliser avec des filtres qui ajoutent ou enlèvent des image de façon imprévisible ou si votre fichier source a un nombre d'images par seconde variable! L'option n'est donc généralement pas recommandée. Il a été signalé que l'encodage audio nommé "3 passes" que MEncoder supporte provoquait des désynchronisations A/V. Cela arrive en tout cas quand il est utilisé en même temps que certains filtres, donc, il est maintenant recommandé de ne pas utiliser le mode audio "3 passes". Cette possibilité n'est conservé que pour des raisons de compatibilité et pour les utilisateurs experts qui savent quand l'utiliser. Il a été signalé des désynchronisations A/V lors d'encodage à partir de l'entrée standard avec MEncoder. Ne faites pas ça ! Utilisez toujours un fichier ou un CD/DVD/etc comme source. Choisir le codec video Le choix du meilleur codec video dépend de plusieurs facteurs comme la taille, la qualité, la lecture en transit (streamability), la facilité d'utilisation, la popularité qui, pour certains d'entre eux dépendent de préférences personnelles et de contraintes techniques. L'efficacité de la compression: Il est assez évident que les codec des toutes dernières générations sont faits pour augmenter la qualité et la compression. Donc, les auteurs de ce guide et de nombreuses autres personnes pensent que vous ne pouvez pas vous tromper Attention tout de même: décoder une video MPEG-4 AVC de la resolution d'un DVD nécessite une machine puissante (i.e. un Pentium 4 à plus de 1.5GHz ou un Pentium M à plus de 1GHz). si vous choisissez un codec MPEG-4 AVC comme le x264 au lieu de codecs MPEG-4 ASP tels que le libavcodec MPEG-4 ou le Xvid. (Les développeurs de codec peuvent être intéressés par la lecture de l'avis de Michael Niedermayer's sur "why MPEG4-ASP sucks".) De la même manière, vous devriez obtenir une meilleure qualité en utilisant un codec MPEG-4 ASP plutôt que MPEG-2. Néanmoins, les nouveaux codecs qui sont en développement peuvent souffrir de bugs qui n'ont pas encore été repérés et qui peuvent saboter un encodage. Ce malheureusement parfois le prix à payer pour l'utilisation de technologies de pointe. De plus, commencer à utiliser un nouveau codec impose que vous passiez du temps pour vous habituer à ses options de façon à ce que vous sachiez quoi ajuster pour parvenir à la qualité désirée. Compatibilité du matériel: Cela prend habituellement beaucoup de temps pour que les lecteurs vidéos de salon se mettent à supporter les derniers codecs vidéos. Ainsi, la plupart ne supportent que le MPEG-1 (comme les VCD, XVCD et KVCD), le MPEG-2 (comme les DVD, SVCD and KVCD) et le MPEG-4 ASP (comme les DivX, LMP4 libavcodec et Xvid) (attention: toutes les fonctionnalités MPEG-4 ASP ne sont généralement pas supportées). Référez-vous aux spécifications techniques de votre lecteur (si elles existent), ou surfez sur le net pour plus d'infos. La meilleure qualité par temps d'encodage: Les codecs qui sont sortis depuis un certain temps (comme l'encodeur MPEG-4 de libavcodec et Xvid) sont habituellement largement optimisés avec toutes sortes d'algorithmes astucieux et des routines optimiées en assembleur SIMD. C'est pourquoi ils tendent à fournir la meilleure qualité par temps d'encodage. Par contre, ils peuvent avoir des options très avancées qui, si elles sont enclenchées, rendent l'encodage très lent pour des gains limités. Si vous recherchez la vitesse, vous devriez conserver à peu près les réglages par défaut du codec vidéo (bien que vous deviez quand même essayer les autres options qui sont mentionnées dans d'autres sections de ce guide). Vous pouvez aussi vouloir choisir un codec multi-threadé, bien que ce ne soit utile que pour les utilisateurs de machines avec plusieurs processeurs. Le codec MPEG-4 de libavcodec le permet mais les gains en temps sont limités et cela procure une légère baisse de qualité d'image L'encodage multi-threadé du codec Xvid, activé par l'option , peut être utilisé pour améliorer la vitesse d'encodage — de typiquement 40-60% — avec très peu voire aucune détérioration de l'image. Le codec x264 permet aussi l'encodage multi-threadé ce qui l'accélère pour le moment de 15-30% (selon les réglages) avec une baisse de PSNR d'environ 0.05dB. Les préférences personnelles: Là les choses deviennent presqu'irrationnel: pour la même raison pour laquelle certains s'accrochaient encore à DivX 3 alors que d'autres codecs plus modernes faisaient des merveilles depuis des années, certaines personnes préfèrent Xvid ou le codec MPEG-4 de libavcodec par rapport à x264. Vous devriez vous faire votre propre opinion. Ne croyez pas ceux qui ne jurent que par un seul codec. Prenez quelques échantillons de sources brutes et comparez les différentes options et codecs pour en trouver un qui vous convienne le mieux. Le meilleur codec est celui que vous maîtrisez et celui qui vous semble le plus joli à vous yeux Le même encodage peut apparaître différement sur le moniteur de quelqu'un d'autre ou lorsqu'il est lu par un autre décodeur, donc armez vos encodages pour le futur en les lisant sur différentes machines. ! Référez-vous à la section Sélection des codecs et du format du conteneur pour avoir une liste des codecs supportés. Le son Le son est un problème bien plus simple à résoudre : si la qualité vous intéresse, laissez le flux audio tel quel. Même les flux AC3 5.1 utilisent au plus 448Kbit/s, et tous ces bits sont utiles. Vous pourriez être tenté de convertir le son en Ogg Vorbis de haute qualité, mais le fait que vous n'ayez pas d'entrée AC3 (dolby digital) sur votre chaîne HIFI aujourd'hui ne signifie pas que vous n'en n'aurez pas demain. Pensez au futur en conservant le flux AC3. Vous pouvez le garder en le copiant directement dans le flux vidéo pendant l'encodage. Vous pouvez aussi l'extraire avec l'intention de l'inclure dans des conteneurs tels que NUT ou Matroska. mplayer fichier_source.vob -aid 129 -dumpaudio -dumpfile son.ac3 mettra dans le fichier son.ac3 la piste audio 129 du fichier fichier_source.vob (NB : les fichiers VOB des DVD utilisent normalement un système de numérotation différent pour les pistes audio, ainsi la piste numéro 129 est la deuxième piste du fichier). Mais parfois vous n'aurez d'autres choix que de re-compresser le son afin de laisser plus de place à la vidéo. La plupart des gens optent alors pour le codec MP3 ou le Vorbis. Bien que ce dernier soit très efficace, le MP3 est bien mieux accepté par les lecteurs de salon même si cette tendance évolue. N'utilisez pas l'option si vous avez l'intention d'ajouter du son à votre encodage vidéo, même plus tard. En effet, même s'il est probable que tout fonctionne correctement, l'utilisation de l'option peut cacher certains problèmes dans la ligne de commande de votre encodage. En d'autres mots, avoir une bande son pendant l'encodage vous certifie que vous pourrez avoir une synchronisation propre (en supposant que vous ne receviez pas de messages comme Trop de paquets audio dans la mémoire tampon ) Vous aurez besoin que MEncoder traite le son. Vous pouvez par exemple copier la bande son originale pendant l'encodage avec l'option ou la convertir en "léger" 4kHz mono WAV PCM avec l'option . Autrement, dans certains cas, cela générera un fichier vidéo qui ne se synchronisera pas avec l'audio. Cela arrive quand le nombre de trames vidéos dans le fichier source ne correspond pas exactement à la longueur totale des trames audio ou lorsqu'il y a une discontinuité ou des frames audio en trop ou manquantes. La bonne façon de gérer ce type de problèmes est d'insérer un silence ou bien de couper l'audio à ces emplacements. Cependant, MPlayer ne sait pas le faire, donc si vous dé-multiplexez l'AC3 et l'encodez avec une autre application (ou le sortez en PCM avec MPlayer), les discontinuités subsistent et la seule façon de les corriger est de supprimer ou de rajouter des trames. Tant que MEncoder voit la piste son pendant qu'il encode la vidéo, il peut faire ces suppressions/rajouts (ce qui fonctionne habituellement car cela se produit lorsque l'image est totalement noire ou lors de changement de scènes) mais si MEncoder ne voit pas la piste son, il encodera toutes les trames telles quelles et elles ne correspondront pas au fichier audio final, quand, par exemple, vous multiplexerez la piste vidéo et la piste son dans un fichier Matroska. Dans un premier temps, il faudra convertir le son du DVD en fichier WAV que le codec audio peut utiliser en entrée. Par exemple : mplayer fichier_source.vob -ao pcm:file=fichier_destination_son.wav -vc dummy -aid 1 -vo null aura pour effet de prendre la seconde piste audio du fichier fichier_source.vob pour la placer dans le fichier fichier_destination_son.wav. Vous voudrez ensuite peut-être normaliser le son avant l'encodage, car les pistes audio des DVDs sont généralement enregistrées à un faible volume. Vous pouvez par exemple utiliser l'outil normalize qui est normalement disponible sur la plupart des distributions. Si vous utilisez Windows, un outil comme BeSweet fera le même travail. Vous le compresserez ensuite en Vorbis ou MP3. Par exemple : oggenc -q1 fichier_destination_son.wav encodera fichier_destination_son.wav avec une qualité de 1, ce qui est équivaut à environ 80Kb/s, soit le minimum si vous voulez de la qualité. Notez que MEncoder ne sait actuellement pas multiplexer les pistes audio Vorbis dans le fichier final car il ne supporte que les conteneurs AVI ou MPEG en sortie, chacun pouvant mener à des problèmes de synchronisation A/V avec certains lecteurs quand le fichier AVI contient des flux audio VBR comme Vorbis. Ne vous inquiétez pas, ce document vous montrera comment y arriver avec un programme tiers. Le multiplexage Maintenant que vous avez encodé votre vidéo, vous désirez très certainement la multiplexer avec une ou plusieurs pistes audio vers un conteneur comme l'AVI, le MPEG, le Matroska ou le NUT. MEncoder ne supporte nativement que des conteneurs AVI ou MPEG. Par exemple : mencoder -oac copy -ovc copy -o sortie_film.avi -audiofile entrée_audio.mp2 entrée_video.avi Cela aura pour effet de fusionner le fichier vidéo entrée_video.avi et le fichier audio entrée_audio.mp2 vers un seul fichier AVI sortie_film.avi. Cette commande marche avec le MPEG-1 layer I, II, ou III (plus connu sous le nom de MP3), WAV et aussi quelques autres formats audio. Une des caractéristiques expérimentales de MEncoder est le support de libavformat, une bibliothèque issue du projet FFmpeg qui supporte le multiplexage et dé-multiplexage vers une grande variété de conteneurs. Par exemple : mencoder -oac copy -ovc copy -o sortie_film.asf -audiofile entrée_audio.mp2 entrée_video.avi -of lavf -lavfopts format=asf Cela fera strictement la même chose que pour l'exemple précédent, sauf que le conteneur de sortie sera l'ASF. Souvenez-vous que ce support est encore très expérimental (mais il s'améliore de jour en jour), et ne marchera que si vous compilez MPlayer avec l'option activée libavformat (ce qui veut dire que les packets binaires ne marcheront peut-être pas). Améliorer la fiabilité du multiplexage et de la synchronisation Audio/Video Vous avez peut-être fait l'expérience de sérieux problèmes de synchronisation A/V en essayant de multiplexer votre video avec la bande son, où, quelque soit le décalage audio, vous n'arrivez pas à obtenir une synchronisation correcte. Ceci peut arriver quand vous utilisez des filtres video qui dupliquent ou enlèvent des images, comme le filtre téléciné inverse. Il est vivement conseillé d'utiliser le filtre vidéo à la fin de votre chaîne de filtres pour éviter ce type de problème. Sans l'option , si MEncoder veut dupliquer une image, il s'en remet au multiplexeur pour mettre une marque dans le conteneur de façon à ce que la dernière image soit affichée 2 fois pour maintenir la synchronisation sans avoir à écrire une nouvelle image. Avec l'option , MEncoder va simplement passer une deuxième fois la dernière image dans la chaîne de filtres. Ce qui veut dire que l'encodeur recevra exactement la même image 2 fois, puis les compressera. Il en résultera un fichier légèrement plus grand, mais cela ne posera plus de problèmes quand vous démultiplexerez ou remultiplexerez vers un autre conteneur. Il se peut aussi que vous n'ayiez pas d'autres choix que d'utiliser l'option avec certains conteneurs peu liés à MEncoder comme ceux supportés par libavformat, qui peuvent ne pas supporter la duplication d'image au niveau du conteneur. Limitations du conteneur AVI Bien que ce soit le format de conteneur le plus largement supporté après le MPEG-1, l'AVI a des inconvénients majeurs. Le plus évident d'entre eux est peut-être l'entête. Pour chaque morceau (chunk) du fichier AVI, 24 octets sont gâchés en entête et index. Ce qui se traduit par environ 5Mo par heure, soit entre 1 et 2,5% du volume du fichier pour un film de 700Mo. Cela peut ne pas sembler important, mais cela peut représenter la différence entre pouvoir utiliser un débit de 700 kbits/sec au lieu de 714 kbits/sec pour une même video. Et pour la qualité, chaque bit compte. En plus de cette grosse inefficacité, l'AVI a aussi d'autres limitations majeures: Seuls les contenus à nombre d'images par seconde constant peuvent être stockés. Ceci est particulièrement limitant si vous voulez stocker des fichiers aux contenus hétérogènes (par exemple un mélange de vidéo NTSC et de films sur pellicule). En fait, il existe des astuces qui permettent de stocker des contenus à nombre d'images par seconde variable dans un AVI, mais cela multiplie par au moins 5 la taille (déjà énorme) des entêtes et ce n'est donc pas réellement applicable. L'audio dans un fichier AVI doit soit avoir un débit constant (CBR), soit une taille de trame constante (i.e. toutes les trames décodent le même nombre d'échantillons). Malheureusement, le codec le plus efficace, Vorbis, ne satisfait aucun de ces critères. Donc, si vous envisagez de stocker un fichier en AVI, vous devrez utiliser un codec moins performant comme le MP3 ou l'AC3. Ceci dit, MEncoder ne supporte actuellement pas l'encodage à d'images par seconde variable ou le Vorbis; Donc vous n'allez peut-être pas considérer les 2 points précédents commes des limitations si vous n'utilisez que MEncoder pour encoder. Pourtant, il est possible d'utiliser MEncoder uniquement pour l'encodage vidéo, puis d'utiliser des outils externes pour l'encodage de l'audio et multiplexer le tout vers un conteneur différent. Le multiplexage dans le conteneur Matroska Matroska est un conteneur libre, ouvert, qui vise à offrir de nombreuses fonctionnalités avancées que des conteneurs plus anciens comme l'AVI ne peut gérer. Par exemple, le Matroska supporte le débit vidéo variable (VBR), un framerate variable (VFR), chapitres, attachement de fichiers, code de détection d'erreur (EDC) et des codecs A/V modernes comme le "Advanced Audio Coding" (AAC), le "Vorbis" ou le "MPEG-4 AVC" (H.264), presque tous n'étant pas supportés par l'AVI. Les outils nécessaires à la création de fichier Matroska sont appelés collectivement mkvtoolnix, et sont disponibles pour la plupart des systèmes Unix mais aussi pour Windows. Puisque Matroska est un standard ouvert, vous trouverez peut-être d'autres outils qui vous conviendront mieux, mais comme mkvtoolnix est le plus connu, et qu'il est supporté par Matroska lui même, nous allons parler de son utilisation. La façon la plus simple de démarrer avec Matroska, c'est probablement d'utiliser MMG, l'interface graphique livrée avec mkvtoolnix, et de suivre le guide de l'interface graphique de mkvmerge (mmg). Vous pouvez aussi multiplexer des fichiers vidéo et audio en utilisant la ligne de commande : mkvmerge -o sortie.mkv entree_video.avi entree_audio1.mp3 entree_audio2.ac3 Ceci aura pour effet de multiplexer le fichier vidéo entree_video.avi avec les deux fichiers audio entre_audio1.mp3 et entree_audio2.ac3 dans un fichier Matroska sortie.mkv. Matroska, comme mentionné ci-dessus, est capable de faire bien plus que ça, comme plusieurs pistes audio (avec un réglage précis de la synchronisation audio/video), chapitres, sous titres, coupures, etc... Merci de bien vouloir vous reporter à la documentation de cette application pour plus d'informations. Comment gérer le téléciné et l'entrelacement des DVDs NTSC Introduction Qu'est ce que le téléciné ? Si vous ne comprenez pas grand-chose à ce qui est écrit dans le document présent, je vous suggère de visiter cette page (en anglais): http://en.wikipedia.org/wiki/Telecine Ce lien pointe vers une documentation relativement claire et compréhensible sur ce qu'est le téléciné. Une note à propos des nombres Beaucoup de documents renvoient à un nombre de trames par secondes pour la vidéo NTSC de 59.94 ce qui correspond à 29.97 images complètes par secondes (pour le télécine et l'entrelacé) et à 23.976 (pour le progressif). Pour simplifier, certains documents arrondissent même à 60, 30 et 24. En toute rigueur, tous ces nombres sont des approximations. Les vidéos NTSC en noir et blanc avaient exactement 60 trames par secondes, mais 60000/1001 a été choisi par la suite pour s'accomoder de la couleur en conservant la compatibilité avec les téléviseurs noir et blanc de l'époque. La vidéo numérique NTSC (par exemple sur un DVD) est aussi en 60000/1001 trames par seconde. A partir de là, la vidéo entrelacée et télécinée est faite pour être en 30000/1001 images par seconde; les vidéos progressives en 24000/1001 images par secondes. De plus anciennes versions de la documentation MEncoder et plusieurs e-mails archivés de liste de diffusion font référence à 59.94, 29.97, et 23.976. Toute la documentation de MEncoder a été mise à jour pour utiliser les fractions, et vous devriez aussi les utiliser. est incorrect. doit être utilisé à la place. Comment le téléciné est-il utilisé? Toutes les vidéos qui sont censées être affichées sur des téléviseurs NTSC doivent être en 60000/1001 trames par secondes. Les téléfilms sont souvent filmés directement en 60000/1001 trames par secondes, alors que la majorité des films pour le cinéma est en 24000/1001 images par seconde. Quand les DVD contenant des films faits pour le cinéma sont masterisés, la vidéo est alors convertie pour la télévision par un processus appelé le téléciné. Sur un DVD, la vidéo n'est jamais vraiment stockée à 60000/1001 trames par seconde. Si la vidéo est d'origine en 60000/1001, chaque paire de trames est alors combinée pour former une image, ce qui donne 30000/1001 images par seconde. Les lecteurs de DVD de salon lisent alors les fanions incorporé au flux vidéo pour déterminer si la première ligne à afficher doit être paire ou impaire. Normalement, les contenus à 24000/1001 images par seconde restent comme cela lorsqu'ils sont encodés pour un DVD, et le lecteur DVD doit alors faire la conversion du téléciné à la volée. Parfois, la vidéo est télécinée avant d'être stockée sur le DVD, même si c'était originalement du 24000/1001 images par seconde, cela devient du 60000/1001 trames par seconde. Quand elles sont stockées sur le DVD, les trames sont combinées par paires pour former 30000/1001 images par seconde. Quand on regarde les images formées individuellement à partir de la vidéo en 60000/1001 trames par seconde, téléciné ou autre, l'entrelacement est clairement visible et ce, qu'il y ait un mouvement ou non car l'une des trames (disons les lignes impaires) représente un moment dans le temps 1/(60000/1001) seconde plus tard que les autres. Regarder une vidéo entrelacée sur un ordinateur semble laid parce que l'écran a une résolution plus élevée et parce que la vidéo est affichée image après image au lieu de trame après trame. Notes : Cette section ne s'appliquent qu'aux DVDs NTSC, pas au PAL. Les lignes de commande MEncoder données en exemple au long de ce document ne sont pas à utiliser tel quels. Elles représentent juste le minimum requis pour encoder la vidéo qui s'y rapportent. La meilleure méthode pour faire un bon encodage de DVD ou procéder à des réglages avancés de libavcodec pour atteindre une qualité optimum sont des questions en dehors des propos de ce guide. Il y a quelques notes en bas de page spécifiques à ce guide, elles sont liées comme ceci : [1] Comment savoir quel type de vidéo vous avez ? Progressive Les vidéos progressives ont été filmées initialement à 24000/1001 images par seconde et stockées sur le DVD sans altération. Quand vous lisez un DVD en progressif dans MPlayer, la ligne suivante sera affichée dès le début de la lecture : demux_mpg: 24000/1001 images par seconde progressive NTSC content detected, switching framerate. Dorénavent, demux_mpg ne devrait jamais dire qu'il trouve "une vidéo NTSC à 30000/1001 images par secondes." Quand vous regardez une vidéo progressive, vous ne devriez jamais voir d'entrelacement. Mais soyez attentif, il arrive parfois qu'un peu de téléciné se glisse sans prévenir. Il m'est arrivé de tomber sur des émissions de télévisions en DVD avec une seconde de téléciné à chaque changement de scène ou à d'autres emplacements au hasard. Une autre fois, la première moitié du DVD était en progressif et la seconde en téléciné. Si vous voulez en être vraiment sûr, vous pouvez scanner le film entier : mplayer dvd://1 -nosound -vo null -benchmark L'utilisation de l'option fait lire MPlayer aussi vite qu'il le peut - en fonction du matériel, cela peut prendre un certain temps. Chaque fois que demux_mpg signale un changement, la ligne immédiatement au dessus vous donnera le temps auquel ce changement est arrivé. Parfois, la vidéo progressive sur les DVDs est signalée en tant que "soft-telecine" parce qu'elle est censée être télécinée par le lecteur DVD. Téléciné Les vidéos télécinées ont été filmées en 24000/1001 et sont télécinées avant d'être gravées sur DVD. MPlayer ne signale jamais une variation d'images par secondes quand il lit une vidéo télécinée. Au visionnage d'une vidéo télécinée, vous verrez des artefacts d'entrelacement qui semblent "clignoter": ils apparaissent et disparaissent répététivement. Vous pouvez le voir plus précisément en suivant les indications ci-dessous: mplayer dvd://1 Chercher une scène avec beaucoup de mouvements. Utiliser la touche . pour avancer image par image. Observer le schéma de répétition des images entrelacées et progressives. Si vous obtenez PPPII, PPPII, PPPII,... alors la vidéo est télécinée. Si vous observez d'autres schémas de répétition, alors la vidéo a peut-être été télécinée avec une méthode non-standard; MEncoder ne sait pas convertir un téléciné non-standard en progressif sans dégradation. Si aucun schéma n'est visible, c'est alors sûrement une vidéo entrelacée. Parfois, la vidéo progressive sur les DVDs est signalée en tant que "soft-telecine" parce qu'elle est censée être télécinée par le lecteur DVD. Parfois, la vidéo télécinée sur les DVDs est signalée "hard-telecine". Le hard-teleciné étant à 60000/1001 images par seconde, le lecteur DVD lit la vidéo sans manipulation. Une autre façon de savoir si la source est télécinée ou non, est de la lire avec l'option et depuis une ligne de commande et de voir comment l'option combine les trames. Si la source est télécinée, vous devriez voir sur la console un schéma de répétition 3:2 avec des alternances de 0+.1.+2 et 0++1. L'avantage de cette technique est que vous n'avez pas besoin de visionner la source pour l'identifier, ce qui peut être utile pour automatiser la procédure d'encodage, ou pour effectuer cette procédure à distance à travers une connexion lente. Entrelacée Les vidéos entrelacées ont été filmées en 60000/1001 trames par seconde, puis stockées sur le DVD en tant que 30000/1001 images par seconde. L'effet est le résultat de la combinaison de paires de trames dans une image. Chaque trame est censée être décalée de 1/(60000/1001) de seconde les unes des autres. Quand elles sont affichées simultanément, la différence devient visible. Comme pour la vidéo télécinée, MPlayer ne signale jamais une variation d'images par secondes quand il lit une vidéo entrelacée. Si vous regardez attentivement une vidéo entrelacée image par image avec la touche ., vous verrez l'entrelacement de chaque trame. Mélange de progressive et télécinée Toutes les vidéos qui mélangent progressif et téléciné ont été filmées en 24000/1001 images par seconde, puis certaines parties ont été converties en téléciné. Quand MPlayer lit ce type de fichier, il doit jongler (souvent répététivement) entre "le 30000/1001 images par seconde NTSC" et "le 24000/1001 images par secondes NTSC progressif". Regardez les messages de MPlayer pour voir ces messages. Vous devriez aller voir la section "30000/1001 images par seconde NTSC" afin d'être sûr que c'est vraiment du téléciné, et pas seulement de l'entrelacé. Mélange de vidéo progressive et entrelacée Dans les vidéos qui mélangent le progressif et le téléciné, les flux vidéos progressifs et entrelacés sont combinés l'un à l'autre. Cette catégorie ressemble au "mélange de progressive et télécinée" jusqu'à ce que vous examiniez la partie en 30000/1001 images par seconde et que vous vous aperceviez qu'il n'y a pas de trace de téléciné. Comment encoder chaque catégorie ? Comme évoqué au départ, les exemples de lignes de commande MEncoder ne doivent pas être utilisés tels quels; ils fournissent uniquement les paramètres minimum pour encoder chaque catégorie. Progressive La vidéo progressive ne nécessite pas de filtrage particulier pour l'encodage. Le seul paramètre qui ne doit pas être omis est: . Sinon, MEncoder essayera d'encoder en 30000/1001 images par seconde et dupliquera certaines images. mencoder dvd://1 -oac copy -ovc lavc -ofps 24000/1001 Il n'est pas rare de se trouver avec une vidéo qui semble progressive mais qui contient en fait quelques courts passages en téléciné. A moins d'être vraiment sûr l'état de la vidéo, il est préférable de traiter la vidéo comme un mélange de progressive et télécinée. La perte en performance est faible [3]. Téléciné A partir d'une video télécinée, il est possible de retrouver le format original en 24000/1001 avec un processus appelé téléciné-inverse. Plusieurs filtres de MPlayer permettent ce processus; le meilleur d'entre eux, , est décrit à la section Mélange de progressif et téléciné. Entrelacée Dans la plupart des cas pratiques, il n'est pas possible de récupérer complètement une vidéo progressive depuis une entrelacée. Pour ce faire, la seule manière sans perdre la moitié de la résolution verticale est de doubler le nombre d'images par seconde et d'essayer de "deviner" ce que devraient être les lignes manquantes pour chacune des trames (ce qui a des inconvénients, voir méthode 3). Encodez la vidéo sous forme entrelacée. Normalement, l'entrelacement ruine la capacité de compression de l'encodeur, mais libavcodec possède deux paramètres spécialement définis pour gérer le stockage de la vidéo entrelacée de manière plus satisfaisante: et . Aussi, l'utilisation de est-elle fortement recommandée [2] car cela encodera les macroblocs non-entrelacés à des endroits où il n'y a pas de mouvements. Notez que n'est pas nécessaire ici. mencoder dvd://1 -oac copy -ovc lavc -lavcopts ildct:ilme:mbd=2 Utilisez un filtre de désentrelacement avant l'encodage. Plusieurs de ces filtres sont disponibles, chacun avec ses avantages et inconvénients. Consultez pour voir lesquels sont disponibles (selectionnez les lignes contenant "deint" avec grep), et fouillez dans les listes de diffusion MPlayer, vous trouverez nombres de discussions sur les différents filtres. Encore une fois, le nombre d'images par seconde ne change pas, donc l'option n'est pas nécessaire. Une dernière chose: le désentrelacement doit être fait après recadrage [1] et avant redimensionnement. mencoder dvd://1 -oac copy -vf pp=lb -ovc lavc Malheureusement, cette option est un boguée dans MEncoder ; cela devrait bien marcher avec MEncoder G2, mais on n'en est pas encore là. Vous risquez de subir des plantages. Peu importe, l'option est de créer une image complète à partir de chaque trame, ce qui donne le débit de 60000/1001 images par seconde. L'avantage de cette approche est qu'aucune donnée n'est jamais perdue. Cependant, vu que chaque image vient avec seulement une trame, les lignes manquantes doivent être interpolées d'une façon ou d'une autre. Il n'y a pas de très bonne méthode générant les données manquantes, et donc le résultat sera un peu similaire à celui obtenu en utilisant des filtres de désentrelacement. Générer les lignes manquantes crée aussi d'autres problèmes, simplement parce que la quantité de données double. Ainsi, de plus haut débit (en kbit/s) d'encodage sont nécessaires pour conserver la qualité, et plus de puissance CPU est utilisée pour l'encodage et le décodage. a plusieurs options pour gérer la création des lignes manquantes de chaque image. Si vous utilisez cette méthode, alors regardez le manuel, et prenez l'option qui semble la meilleure pour votre matériel. Notez que lors de l'utilisation de vous devez définir les deux options et à deux fois le nombre d'image par seconde de votre source originale. mencoder dvd://1 -oac copy -vf tfields=2 -ovc lavc -fps 60000/1001 -ofps 60000/1001 Si vous avez prévu de beaucoup réduire la taille, vous pouvez n'extraire et n'encoder qu'une des deux trames. Bien sûr, vous perdrez la moitié de la résolution verticale, mais si vous avez prévu la réduire au moins de moitié par rapport à l'original, cette perte n'aura que peu d'importance. Le résultat sera un fichier progressif à 30000/1001 images par seconde. La procédure est d'utiliser l'option , puis de recadrer [1] et de redimensionner de manière appropriée. Souvenez-vous que vous devrez ajuster la dimension pour compenser la réduction de moitié de la résolution verticale. mencoder dvd://1 -oac copy -vf field=0 -ovc lavc Mélange de progressive et télécinée Afin de convertir une vidéo composée de passages progressifs et de télécinés en vidéo entièrement progressive, les parties en téléciné doivent être télécinées-inverse. Il y a trois moyens d'accomplir cela, comme décrit ci-dessous. Notez que vous devez toujours téléciner-inverse avant tout redimensionnement et aussi (sauf si vous savez vraiment ce que vous faites) avant tout découpage [1]. L'option est nécessaire ici parce que la sortie vidéo sera en 24000/1001 images par seconde. L'option est faite pour téléciner-inverse la source vidéo télécinée tandis que les données progressives sont laissées intactes. Afin de fonctionner correctement, doit être suivi par le filtre ou MEncoder plantera. est, cependant, la méthode la plus propre et la plus précise disponible pour encoder le téléciné et le "Mélange de progressive et télécinée". mencoder dvd://1 -oac copy -vf pullup,softskip -ovc lavc -ofps 24000/1001 Une méthode plus ancienne consiste à, au lieu de téléciner-inverse les passages télécinés, téléciner les parties non-télécinées et ensuite téléciner-inverse la vidéo entière. Cela semble confus? softpulldown est un filtre qui parcours une vidéo et rend téléciné le fichier entier. Si nous faisons suivre softpulldown par soit ou soit , le résultat final sera entièrement progressif. L'option est nécessaire. mencoder dvd://1 -oac copy -vf softpulldown,ivtc=1 -ovc lavc -ofps 24000/1001 Je n'ai pas moi-même utilisé , mais voilà ce que D Richard Felker III en dit:

Il est correct, mais à mon avis, il essaie de désentrelacer plutôt que de téléciner-inverse trop souvent (tout comme les lecteurs DVD de salon & les TVs progressive) ce qui donne des clignotements affreux et d'autre artefacts. Si vous prévoyer l'utiliser, vous aurez au minimum besoin de passer du temps à affiner les options et à regarder le résultat en sortie pour vous assurer que cela n'esquinte pas tout.

Mélange de progressive et d'entrelacée Il y a deux façons de gérer cette catégorie, chacune étant un compromis. Vous devez faire votre choix en vous basant sur la durée/localisation de chaque type. Traitez-le comme une vidéo progressive. Les parties entrelacées sembleront entrelacées, et certaines des trames entrelacées devront être jetées, ayant pour résultat un peu de sautillement irrégulier. Vous pouvez utiliser un filtre de post-traitement si vous le voulez, mais cela peut sensiblement dégrader les parties progressives. Cette option ne devrait surtout pas être utilisée si vous prévoyez afficher la vidéo finale sur un appareil entrelacé (avec une carte TV, par exemple). Si vous avez des images entrelacées dans une vidéo en 24000/1001 images par seconde, elles seront télécinées en même temps que les images progressives. La moitié des "images" entrelacées sera affichée pour une durée de trois trames (3/(60000/1001) secondes), ce qui a pour résultat un effet pichenette de "retour en arrière" ce qui est du plus mauvais effet. Si vous tentez quand même ceci, vous devez utiliser un filtre désentrelaçant comme ou . Cela peut aussi être une mauvaise idée pour l'affichage progressif. Cela laissera tomber des paires de trames entrelacées consécutives, résultant en une discontinuité qui peut être plus visible qu'avec la seconde méthode, ce qui affichera certaines images progressives en double. Une vidéo entrelacée à 30000/1001 images par seconde est déjà un peu hachée parce qu'elle devrait en réalité être projetée à 60000/1001 trames par seconde, pour que les images dupliquées ne se voient pas trop. De toutes façons, il vaut mieux analyser votre contenu et voir comment vous voulez l'afficher. Si votre vidéo est à 90% progressive et que vous ne pensez pas la regarder sur une TV, vous devriez favoriser une approche progressive. Si elle est seulement à moitié progressive, vous voudrez probablement l'encoder comme si elle était entièrement entrelacée. Traitez-le comme entrelacée. Certaines images des parties progressives auront besoin d'être dupliquées, ce qui entraînera un sautillement irrégulier. Encore une fois, les filtres désentrelaçant peuvent légèrement dégrader les parties progressives. Notes de bas de pages A propos de recadrage: Les données vidéo d'un DVD sont stockées dans un format appelé YUV 4:2:0. Dans la vidéo YUV, la luminance ("luminosité") et la chrominance ("couleur") sont stockés séparément. Parce que l'oeil humain est d'une certaine façon moins sensible à la couleur qu'à la luminosité, dans une image YUV 4:2:0 il n'y a qu'un pixel de chrominance pour 4 pixels de luminance. Dans une image progressive, chaque carré de quatre pixels de luminance (deux de chaque coté) a un pixel de chrominance commun. Vous devez recadrer le YUV 4:2:0 progressif à des résolutions paires, et utiliser un décalage pair. Par exemple, est correct mais ne l'est pas. Quand vous avez à faire à un YUV 4:2:0 entrelacé, la situation devient un peu plus compliquée. Au lieu d'avoir chaque série de quatre pixels de luminance se partager un pixel de chrominance dans une image, chaque série de quatre pixels de luminance dans chaque champs se partage un pixel de chrominance. Quand les trames sont entrelacées pour former une image, chaque ligne de scan fait un pixel de haut. Maintenant, au lieu d'avoir la série de quatre pixels de luminance dans un carré, il y a deux pixels côte à côte sur une ligne et les deux autres pixels de la série sont côte à côte deux lignes de scan plus bas. Les deux pixels de luminance dans la ligne de scan intermédiaire appartiennent à une autre trame, et donc partage un pixel de chrominance différent avec deux pixels de luminance deux lignes de scan plus loin. Toute cette confusion rend nécessaire d'avoir des dimensions de recadrage et de décalage verticales multiples de quatre. Dans le sens horizontal, il suffit que les dimensions restent paires. Pour la vidéo télécinée, il est recommandé que le recadrage se fasse après le téléciné-inverse. Une fois que la vidéo est progressive, il vous suffit de recadrer par nombres pairs. Si vous voulez accélérer légèrement la vitesse d'encodage, en jouant sur les dimensions de recadrage, vous devez recadrer verticalement par multiples de quatre ou bien le filtre de téléciné-inverse n'aura pas les données adéquates. Pour la vidéo entrelacée (pas télécinée), vous devez toujours recadrer verticalement par multiples de quatre à moins que vous n'utilisiez l'option avant. A propos des paramètres d'encodage et de la qualité: Le fait que l'option soit recommandée ici ne veut pas dire qu'elle ne devrait pas être utilisée autre part. Avec , est l'une des deux options de libavcodec qui augmente le plus la qualité, et vous devriez toujours les utiliser à moins que la baisse de vitesse d'encodage ne soit prohibitive (ex: encodage en temps réel). Il y a bien d'autres options de libavcodec qui augmentent la qualité d'encodage (et réduisent sa rapidité) mais ceci est au delà du propos de ce document. A propos de la performance de pullup: Utiliser l'option (avec ) sur une vidéo progressive est sans danger, et c'est généralement une bonne idée à moins qu'il soit certain que la source est entièrement progressive. La perte de performance est faible dans la plupart des cas. Sur un encodage minimal, ralentit MEncoder de 50%. L'ajout du traitement du son et d'options avancées de masquent cette différence, en limitant la perte de performance due à l'utilisation de à 2%. Encodage avec la famille de codec <systemitem class="library">libavcodec</systemitem> libavcodec fournit un encodage simple pour plusieurs formats vidéos et audio intéressants. Vous pouvez encoder vers les codecs suivant (la liste suivante est plus ou moins à jour): Codecs vidéo de <systemitem class="library">libavcodec</systemitem> Nom du codec vidéoDescription mjpeg Motion JPEG ljpeg JPEG sans perte h261 H.261 h263 H.263 h263p H.263+ mpeg4 ISO standard MPEG-4 (DivX, compatible Xvid) msmpeg4 pre-standard MPEG-4 variant par MS, v3 (AKA DivX3) msmpeg4v2 pre-standard MPEG-4 by MS, v2 (utilisé dans les vieux fichiers ASF) wmv1 Windows Media Vidéo, version 1 (AKA WMV7) wmv2 Windows Media Vidéo, version 2 (AKA WMV8) rv10 RealVidéo 1.0 rv20 RealVidéo 2.0 mpeg1vidéo MPEG-1 vidéo mpeg2vidéo MPEG-2 vidéo huffyuv compression sans perte asv1 ASUS Vidéo v1 asv2 ASUS Vidéo v2 ffv1 codec vidéo sans perte de FFmpeg svq1 Sorenson vidéo 1 flv Sorenson H.263 utilisé dans Vidéo Flash dvvideo Vidéo Numérique Sony snow codec basé sur l'ondelette expérimentale de FFmpeg La première colonne contient les noms de codec qui doivent être donnés après la configuration de vcodec, par exemple comme ceci: Un exemple avec la compression MJPEG: mencoder dvd://2 -o title2.avi -ovc lavc -lavcopts vcodec=mjpeg -oac copy Codecs audio de <systemitem class="library">libavcodec</systemitem>= Nom de codec audioDescription mp2 MPEG Layer 2 ac3 AC3, AKA Dolby Digital adpcm_ima_wav IMA adaptatif PCM (4 bits par échantillon, compression 4:1) sonic codec avec/sans perte expérimental La première colonne contient les noms de codec qui doivent être donnés après l'option acodec, par exemple comme ceci: Un exemple avec compression AC3: mencoder dvd://2 -o title2.avi -oac lavc -lavcopts acodec=ac3 -ovc copy Contrairement aux codecs vidéo de libavcodec, ses codecs audio ne font pas un usage avisé des bits qu'ils consomment car ils leur manquent certains modèles psycho-acoustiques minimaux (quand ils en ont) ce que la plupart des autres implémentations de codecs possèdent. Cependant, notez que tous ces codecs audio sont très rapides et sont disponibles à partir du moment où MEncoder a été compilé avec libavcodec (ce qui est le cas la plupart du temps), et ne dépend pas de bibliothèques externes. Options d'encodage de libavcodec Idéalement, vous voudriez probablement juste dire à mencoder de passer en mode "haute qualité" et passer à autre chose. Ce serait sûrement sympa, mais c'est malheureusement difficile à implémenter car les différentes options d'encodage donnent des résultats de qualité différents en fonction du matériel source. Ceci vient du fait que la compression dépend des propriétés visuelles de la vidéo en question. Par exemple, un film d'animation et un film d'action ont des propriétés très différentes et nécessitent des options différentes pour obtenir un encodage optimal. La bonne nouvelle, c'est que certaines options ne devraient jamais être omises, comme , , et . Voir ci-dessous pour une description détaillée des options d'encodage les plus communes. Options à régler: vmax_b_frames: 1 ou 2 est bon selon le film. Notez que si vous avez besoin d'avoir votre encodage décodable par DivX5, vous aurez besoin d'activer le support "closed GOP", en utilisant l'option de libavcodec, mais vous aurez besoin de désactiver la détection de scène, ce qui n'est pas une bonne idée étant donné que cela affectera un peu l'efficacité d'encodage. vb_strategy=1: aide pour les scènes avec beaucoup de mouvement. Sur certaines vidéos, l'option vmax_b_frames peut affecter la qualité, mais utiliser vmax_b_frames=2 avec vb_strategy=1 aide. dia: portée de la passe de recherche de mouvement. Plus la valeur de cette option est élevée, meilleure sera la qualité et plus l'encodage sera lent. Les valeurs négatives représentent une échelle complètement différente. De bonnes valeurs sont -1 pour un encodage rapide, ou 2-4 pour un plus lent. predia: portée de recherche de mouvement en pré-passe. Pas aussi important que dia. De bonnes valeurs vont de 1 (par défaut) à 4. Cela requière preme=2 pour être réellement utile. cmp, subcmp, precmp: Fonction de comparaison pour l'estimation de mouvement. Testez avec les valeurs 0 (défaut), 2 (hadamard), 3 (dct), et 6 (taux de distorsion). 0 est le plus rapide, et suffisant pour precmp. Pour cmp et subcmp, 2 est bon pour les animations, et 3 est bon pour les films d'action. 6 peut être (ou non) un peu meilleur, mais est lent. last_pred: Nombre de prédicteurs de mouvement à prendre depuis l'image précédente. 1-3 (ou dans ces eaux) améliore la qualité pratiquement sans perte en vitesse. De plus hautes valeurs ralentiront l'encodage sans réel gain. cbp, mv0: Contrôle la sélection de macroblocs. Un petit coût en vitesse pour un petit gain en qualité. qprd: quantification adaptative basée sur la complexité des macroblocs. Peut aider ou gêner selon la vidéo et les autres options. Cela peut causer des artefacts à moins que vous ne paramétriez vqmax à des valeurs raisonnablement petites (6 c'est bien, voire peut-être 4); vqmin=1 devrait aussi aider. qns: très lente, spécialement quand combinée avec qprd. Avec cette option, l'encodeur minimise le bruit dû aux artefacts de compression au lieu de faire correspondre strictement la vidéo encodée à la source. Ne l'utilisez pas à moins d'avoir déjà peaufiné tout le reste et que les résultats ne soient pas encore assez bons. vqcomp: mise au point du contrôle de débit. La nature du film définiera quelles sont les bonnes valeurs à appliquer Vous pouvez sans problème laisser cette option de côté si vous voulez. Réduire vqcomp met plus de bits sur les scènes de basse complexité, l'augmenter les met sur les scènes de haute complexité (défaut: 0.5, portée: 0-1. recommandé: 0.5-0.7). vlelim, vcelim: Définit le coefficient du seuil d'élimination pour la luminance et les plans de chrominance. Ils sont encodés séparément dans tous les algorithmes de style MPEG. L'idée derrière tout ceci est d'utiliser de bonnes heuristiques pour déterminer quand le changement dans un bloc est inférieur au seuil que vous avez spécifié, et dans ce cas, de simplement encoder le bloc comme étant "sans changement". Cela économise des bits et accélére peut-être l'encodage. vlelim=-4 et vcelim=9 semblent être de bonnes valeurs pour les films de "scènes réelles", mais semblent ne pas aider avec les films d'animation; quand vous voudrez encoder une animation, vous devriez probablement les laisser tel quel. qpel: Estimation de mouvement de quart de pixel. MPEG-4 utilise une précision d'un demi pixel pour sa recherche de mouvement par défaut, donc cette option augmente la quantité d'information qui est stockée dans le fichier encodé. Le gain ou la perte en terme de compression dépend du film, mais ce n'est habituellement pas très efficace pour les animations. qpel induit toujours un surcoût significatif en temps de décodage (+25% en pratique). psnr: n'affecte pas l'encodage mais écrit un fichier journal donnant le type/taille/qualité de chaque image, et imprime un résumé du PSNR (rapport signal sur bruit) à la fin. Options qu'il n'est pas recommandé de changer: vme: La valeur par défaut est la meilleure. lumi_mask, dark_mask: Quantification adaptative pyscho-visuelle. Vous ne voulez pas jouer avec ces options si vous tenez à la qualité. Des valeurs raisonnables peuvent être efficaces dans votre cas, mais soyez prévenu, ceci reste très subjectif. scplx_mask: Essaie d'empêcher l'apparition d'artefacts dûs aux blocs, mais le post-traitement est plus efficace. Exemples de paramètres d'encodage Les paramètrages suivants sont des exemples de différentes combinaisons d'options d'encodage qui affectent le compromis vitesse / qualité pour un débit donné. Tous les paramètrages d'encodage ont été testés sur un échantillon vidéo de résolution 720x448 à 30000/1001 images par seconde, le débit cible était de 900kbit/s, et la machine était un AMD-64 3400+ à 2400 MHz en mode 64 bits. Chaque exemple d'encodage est donné avec la vitesse d'encodage mesurée (en images par seconde) et la perte en PSNR (en dB) par rapport au réglage de "très haute qualité". Sachez que selon votre video source, votre machine et les derniers développements, vous pourrez obtenir des résultats très différents. DescriptionOptions d'encodagevitesse (en images/s)perte relative de PSNR (en dB) Très haute qualité 6im/s 0dB Haute qualité 15im/s -0.5dB Rapide 42im/s -0.74dB Temps réel 54im/s -1.21dB Matrices inter/intra personnalisées Grâce à cette fonctionnalité de libavcodec vous pouvez rentrer des matrices personnalisées inter (image I ou images clé) et intra (image P ou image prédite). De nombreux codecs le supportent - on rapporte que mpeg1video et mpeg2video fonctionnent avec. Cette fonctionnalité est utilisée habituellement pour régler les matrices utilisées par les spécifications KVCD. La Matrice de Quantification KVCD "Notch" : Intra: 8 9 12 22 26 27 29 34 9 10 14 26 27 29 34 37 12 14 18 27 29 34 37 38 22 26 27 31 36 37 38 40 26 27 29 36 39 38 40 48 27 29 34 37 38 40 48 58 29 34 37 38 40 48 58 69 34 37 38 40 48 58 69 79 Inter: 16 18 20 22 24 26 28 30 18 20 22 24 26 28 30 32 20 22 24 26 28 30 32 34 22 24 26 30 32 32 34 36 24 26 28 32 34 34 36 38 26 28 30 32 34 36 38 40 28 30 32 34 36 38 42 42 30 32 34 36 38 40 42 44 Utilisation: $ mencoder entree.avi -o sortie.avi -oac copy -ovc lavc -lavcopts inter_matrix=...:intra_matrix=... $ mencoder input.avi -ovc lavc -lavcopts vcodec=mpeg2video:intra_matrix=8,9,12,22,26,27,29,34,9,10,14,26,27,29,34,37, 12,14,18,27,29,34,37,38,22,26,27,31,36,37,38,40,26,27,29,36,39,38,40,48,27, 29,34,37,38,40,48,58,29,34,37,38,40,48,58,69,34,37,38,40,48,58,69,79 :inter_matrix=16,18,20,22,24,26,28,30,18,20,22,24,26,28,30,32,20,22,24,26, 28,30,32,34,22,24,26,30,32,32,34,36,24,26,28,32,34,34,36,38,26,28,30,32,34, 36,38,40,28,30,32,34,36,38,42,42,30,32,34,36,38,40,42,44 -oac copy -o svcd.mpg Exemple Voilà, vous venez tout juste d'acheter votre exemplaire de 'Harry Potter et la Chambre des Secrets' (édition panoramique, bien sûr), et vous voulez copier ce DVD afin de pouvoir l'ajouter à votre PC Home Cinéma. C'est un DVD de région 1, donc en NTSC. L'exemple ci-dessous peut quand même être adapté au PAL, si ce n'est que vous devrez retirer l'option (parce que le le nombre d'images par seconde en sortie est le même que celui en entrée), et bien sûr les dimensions de recadrage seront différentes. Après avoir lancé , nous suivons le processus détaillé dans la section Comment gérer le téléciné et l'entrelacement dans les DVDs NTSC et découvrons que c'est une vidéo progressive à 24000/1001 images par seconde, ce qui signifie que nous n'avons pas besoin d'utiliser de filtre téléciné-inverse, comme ou . Ensuite, nous voulons déterminer le rectangle de recadrage approprié, donc nous utilisons le filtre : mplayer dvd://1 -vf cropdetect Assurez-vous que vous visualisez une image complètement remplie (comme une scène lumineuse), et vous verrez dans la console de sortie de MPlayer: crop area: X: 0..719 Y: 57..419 (-vf crop=720:362:0:58) Revisionnons ensuite le film avec le filtre pour tester le résultat: mplayer dvd://1 -vf crop=720:362:0:58 Et nous nous apercevons que tout a l'air parfait. Ensuite, nous nous assurons que la hauteur et la largeur sont des multiples de 16. La largeur est bonne, cependant la hauteur ne l'est pas. Vu que nous avons quelques notions minimales de maths, nous savons que le plus proche multiple de 16 inférieur à 362 est 352. Nous pourrions juste utiliser , mais il serait mieux d'enlever un peu du haut et un peu du bas afin de garder la partie centrale. Nous avons rétréci la hauteur de 10 pixels, mais nous ne voulons pas augmenter le décalage de 5 pixels vu que c'est un nombre impair et que cela affectera défavorablement la qualité. A la place, nous augmentons le décalage vertical de 4 pixels: mplayer dvd://1 -vf crop=720:352:0:62 Une autre raison pour retirer les pixels du haut et du bas est que nous nous assurons que nous avons éliminé tous les pixels à moitié noir s'ils existent. Si votre vidéo est télécinée, assurez-vous que le filtre (ou n'importe quel autre filtre téléciné-inverse que vous avez décidé d'utiliser) apparaissent dans la chaîne de filtres avant que vous ne recadriez. Si il est entrelacé, désentrelacez-le avant le recadrage. (Si vous choisissez de préserver la vidéo entrelacée, alors assurez-vous que votre décalage vertical de recadrage est un multiple de 4.) Si la perte de ces 10 pixels vous peine réellement, vous pouvez préférez réduire les dimensions au plus proche multiple de 16. La chaîne de filtres ressemblerait à ceci: -vf crop=720:362:0:58,scale=720:352 Réduire la taille de la vidéo comme cela signifie qu'une petite quantité de détails est perdu bien que cela ne soit probablement pas perceptible. Augmenter la taille entraînera une qualité inférieure (à moins que vous n'augmentiez le débit). Le recadrage enlève quand à lui complétement les pixels à l'extérieur du nouveau cadrage. C'est un compromis dont vous devrez tenir compte selon les circonstances. Par exemple, si une vidéo DVD a été faite pour la télévision, vous pourriez vouloir éviter le redimensionnement vertical, étant donné que l'échantillon de lignes correspond à la manière avec laquelle le contenu a été enregistré. En inspectant le film, nous voyons qu'il contient une bonne quantité d'action et beaucoup de détails, donc nous choisissons un débit de 2400Kb/s. Nous sommes maintenant prêts à faire l'encodage deux passes. Première passe: mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \ -lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=1 \ -o Harry_Potter_2.avi La seconde passe est la même, si ce n'est que nous spécifions : mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \ -lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=2 \ -o Harry_Potter_2.avi Les options augmenteront considérablement la qualité au prix d'une plus longue durée d'encodage. Il y a peu de raison de ne pas utiliser ces options quand le but premier est la qualité. Les options sélectionne une fonction de comparaison qui donne une meilleure qualité que celle par défaut. Vous pouvez essayer de faire varier ces paramètres (reportez-vous à la page man pour les valeurs possibles) étant donné que différentes fonctions peuvent avoir un impact important sur la qualité selon le matériel source. Par exemple, si vous trouvez que libavcodec produit trop d'artefacts de blocs, vous pouvez essayer de choisir la fonction de comparaison expérimentale NSSE via . Pour ce film, le AVI résultant durera 138 minutes et pèsera à peu près 3GB. Et puisque vous disiez que la taille du fichier ne comptait pas, cette taille est parfaitement acceptable. Cependant, si vous l'aviez voulu plus petite, vous pourriez essayer un débit inférieur. L'augmentation du débit améliore la qualité, mais de moins en moins, ainsi, tandis que nous pourrions clairement voir une amélioration de 1800Kb/s à 2000Kb/s, cela peut ne pas être notable au-dessus de 2000Kb/s. Libre à vous d'expérimenter jusqu'à totale satisfaction. Parce que nous avons passé la source vidéo au travers d'un filtre antibruit, vous pourriez vouloir en rajouter un peu pendant la lecture. Ceci, avec le filtre de post-traitement , améliore de façon radicale la perception de qualité et aide à éliminer les artefacts de bloc de la vidéo. Avec l'option de MPlayer, vous pouvez faire varier le montant de post-traitement effectué par le filtre spp en fonction de la disponibilté de votre processeur. Aussi, arrivé à ce point, vous pourriez vouloir appliquer une correction gamma et/ou couleur pour convenir au mieux à votre écran. Par exemple: mplayer Harry_Potter_2.avi -vf spp,noise=9ah:5ah,eq2=1.2 -autoq 3 Encodage avec le codec <systemitem class="library">Xvid</systemitem> Xvid est une bibliothèque libre pour encoder les flux vidéo MPEG-4 ASP. Avant de commencer à encoder, vous avez besoin de paramétrer MEncoder pour qu'il la supporte.. Ce guide a pour principal objectif de fournir le même genre d'information que le guide d'encodage avec x264. Par conséquent, commencez par lire la première partie de ce guide. Quelles options devrais-je utiliser pour avoir les meilleurs résultats? Commencez par passer en revue la section Xvid de la page man de MPlayer. Cette section est prévue pour être un supplément de la page man. Les paramètrages par défaut de Xvid donnent déjà un bon compromis entre vitesse et qualité, vous pouvez donc sans risque vous en contenter si la section suivante vous laisse perplexe. Options d'encodage de <systemitem class="library">Xvid</systemitem> vhq Ce paramètre affecte l'algorithme de choix de macrobloc, plus la valeur du paramètre est élevée, meilleure sera la décision. Le paramètrage par défaut peut être utilisé de façon sûre pour tous les encodages, alors que des valeurs plus élevées améliorent toujours le PSNR mais rendent l'encodage significativement plus lent. Veuillez noter qu'un meilleur PSNR ne veut pas forcément dire que l'image sera meilleure, mais vous informe qu'elle est plus proche de l'originale. Désactiver l'option accélére de façon notable l'encodage; si la vitesse est un point critique pour vous, cela peut valoir le coup. bvhq Cela a le même effet que vhq, mais agit sur les images B. L'impact sur la vitesse est négligeable et la qualité est légèrement améliorée (environ +0.1dB PSNR). max_bframes Permettre un plus grand nombre d'images B consécutives améliore habituellement la compressibilité bien que cela puisse également entraîner plus d'artefacts de blocs. Le paramétrage par défaut est un bon compromis entre compressibilité et qualité, mais vous pouvez l'augmenter jusqu'à 3 si vous êtes obnubilé par le débit. Vous pouvez aussi le réduire à 1 ou 0 si vous aspirez à la perfection, même si dans ce cas vous deviez vous assurer que le débit cible est suffisament élevé pour que l'encodeur n'ait pas à augmenter les quantificateurs pour l'atteindre. bf_threshold Ceci contrôle la sensibilité de l'encodeur pour les images B, où une plus haute valeur amène à ce que plus d'images B soient utilisées (et vice versa). Ce paramètre est fait pour être utilisé avec ; si vous êtes obnubilé par le débit, vous devez augmenter à la fois et , tandis que vous pouvez augmenter et baisser de façon à ce que l'encodeur puisse utiliser plus d'images B uniquement aux endroits qui en ont vraiment besoin. Un faible nombre de et une valeur élevée de n'est probablement pas un choix avisé vu qu'il obligera l'encodeur à mettre des images B en des endroits qui n'en tireront pas de bénéfice et donc réduiront la qualité visuelle. Cependant, si vous avez besoin d'être compatible avec des lecteurs qui supportent seulement de vieilles versions DivX (qui ne supportent pas plusieurs images B consécutives), ce serait votre seul possibilité pour augmenter la compressibilité en utilisant les images B. trellis Optimise la procédure de quantification pour obtenir un compromis optimal entre le PSNR et le débit, ce qui permet une économie significative de bits. Ces bits seront en retour utilisés autre part dans la vidéo, augmentant la qualité visuelle globale. Vous devriez toujours l'utiliser étant donné son énorme impact sur la qualité. Même si vous recherchez de la vitesse, ne le désactivez pas avant d'avoir réduit et toutes les autres options plus gourmandes en ressource à leur minimum. hq_ac Active une meilleure méthode d'estimation des coefficients AC, ce qui réduit légèrement la taille de fichier d'environ 0.15 à 0.19% (ce qui correspond à moins de 0.01dB PSNR d'augmentation), tandis qu'elle a un impact négligeable sur la vitesse. Il est donc recommandé de toujours la laisser activée. cartoon Faite pour un meilleur encodage des dessins animés, n'a pas d'impact sur la vitesse étant donné qu'elle règle juste les heuristiques de décision pour ce type de contenu. me_quality Ce paramètre contrôle la précision de l'estimation de mouvement. Plus est élevé, plus l'estimation du mouvement d'origine est précise et donc mieux l'encodage final rendra le mouvement d'origine. Le paramètrage par défaut est le meilleur dans tous les cas; ainsi il est recommandé de ne pas le désactiver à moins que vous ne recherchiez vraiment la rapidité, vu que tout les bits économisés par une bonne estimation du mouvement seraient dépensés autre part, augmentant la qualité générale. Donc, n'allez pas plus bas que 5, et encore, seulement en dernier recours. chroma_me Améliore l'estimation de mouvement en prenant aussi en compte l'information de la chrominance (couleur), alors que seule utilise uniquement la luminance (niveaux de gris). Cela ralentit l'encodage de 5-10% mais améliore sensiblement la qualité visuelle en réduisant les effets de bloc et cela réduit aussi la taille des fichiers d'environ 1.3%. Si vous cherchez de la vitesse, vous devriez désactiver cette option avant de penser à la réduction de . chroma_opt A pour objectif d'améliorer la qualité de la chrominance de l'image à proximité des bords totalement blancs ou noirs, plutôt que d'améliorer la compression. Ceci peut aider à réduire l'effet "d'escalier rouge". lumi_mask Tente de donner moins de débit à une partie de l'image que l'oeil humain ne peut pas très bien voir, ce qui devrait permettre à l'encodeur de dépenser les bits économisés sur des parties plus importantes de l'image. La qualité de l'encodage liée à cette option dépend grandement des préférences personnelles et du type de moniteur ainsi que de son réglage (typiquement, cela ne semblera pas si bien si le réglage est lumineux ou si c'est un moniteur TFT). qpel Augmente le nombre de vecteurs de mouvement candidats en augmentant la précision de l'estimation de mouvement de halfpel (demi-pixel) à quarterpel (quart de pixel). L'idée est de trouver de meilleurs vecteurs de mouvement pour réduire le débit (donc augmenter la qualité à débit constant). Cependant, les vecteurs de mouvement avec une précision quarterpel requièrent quelques bits en plus à coder et les vecteurs candidats ne donnent pas toujours de résultats (vraiment) meilleurs. Assez souvent, le codec dépense des bits pour une plus grande précision, mais en retour il n'y a que peu ou pas d'amélioration de la qualité. Malheureusement, il n'y a aucun moyen de prédire les possibles avantages de , donc en fait, vous devez l'encoder avec et sans pour en être sûr. peut quasiment doubler la durée d'encodage, et nécessiter jusqu'à 25% de puissance processeur en plus pour le décodage. Il n'est pas supporté par tous les lecteurs. gmc Essaye d'économiser des bits sur des scènes panoramiques en employant un unique vecteur de mouvement pour l'image entière. Cela augmente presque toujours le PSNR, mais ralentit l'encodage significativement (ainsi que le décodage). Par conséquent, vous devriez seulement l'employer si vous avez réglé au maximum. Le GMC de Xvid est plus sophistiqué que celui de DivX, mais il est seulement supporté par quelques lecteurs. Profils d'encodage Xvid supporte des profils d'encodage via l'option , ce qui est utilisé pour imposer des restrictions sur les propriétés du flux vidéo Xvid pour qu'il puisse être relu sur tout ce qui supporte le profil choisi. Les restrictions sont en rapport avec les résolutions, les débits et certaines fonctionnalités MPEG-4. La table suivante montre ce que chaque profil supporte. Simple Simple avancé DivX Nom de profil 0 1 2 3 0 1 2 3 4 5 De poche NTSC Portable PAL Portable NTSC Home Cinéma PAL Home Cinéma TV Haute Définition Largeur [pixels] 176 176 352 352 176 176 352 352 352 720 176 352 352 720 720 1280 Hauteur [pixels] 144 144 288 288 144 144 288 288 576 576 144 240 288 480 576 720 Images par seconde 15 15 15 15 30 30 15 30 30 30 15 30 25 30 25 30 Débit moyen max [kbit/s] 64 64 128 384 128 128 384 768 3000 8000 537.6 4854 4854 4854 4854 9708.4 Débit moyen maximal au delà de 3 secs [kbit/s] 800 8000 8000 8000 8000 16000 Images B maxi 0 0 0 0 0 1 1 1 1 2 Quantification MPEG X X X X X X Quantification adaptative X X X X X X X X X X X X Encodage entrelacé X X X X X X X X X Quaterpixel X X X X X X Compensation globale du mouvement X X X X X X Exemples de paramètres d'encodage Les paramètres suivant sont des exemples de différentes combinaisons d'option d'encodage qui affectent le compromis entre la vitesse et la qualité pour le même débit cible. Tous les paramètrages d'encodage ont été testés sur un échantillon vidéo en 720x448 à 30000/1001 images par seconde, le débit cible était de 900kbit/s, et la machine était un AMD-64 3400+ à 2400 MHz en mode 64 bits. Chaque exemple d'encodage est donné avec la vitesse d'encodage mesurée (en images par seconde) et la perte en PSNR (en dB) par rapport au réglage de "très haute qualité". Sachez que selon votre video source, votre machine et les derniers développements, vous pourrez obtenir des résultats très différents. DescriptionOptions d'encodagevitesse (en images par secondes)Perte PSNR relative (en dB) Très haute qualité 16 0dB Haute qualité 18 -0.1dB Rapide 28 -0.69dB Temps réel 38 -1.48dB Encodage avec le codec <systemitem class="library">x264</systemitem> x264 est une librairie libre pour encoder des flux vidéo H.264/AVC. Avant de commencer à encoder, vous avez besoin de paramétrer MEncoder pour qu'il le supporte. Les options d'encodage de x264 Veuillez commencer par passer en revue la section x264 de la page man de MPlayer. Cette section est prévue pour être un complément à la page man. Ici, vous trouverez des conseils sur les options qui sont le plus susceptible d'intéresser la plupart des gens. La page man est plus laconique mais aussi plus exhaustive et offre parfois de bien meilleurs détails techniques. Introduction Ce guide considère deux principales catégories d'options d'encodage: Les options qui traitent principalement du compromis entre la durée d'encodage et la qualité Les options susceptibles de satisfaire diverses préférences personnelles et exigences spéciales Finalement, seul vous pouvez décider quelles sont les meilleures options en fonction de vos objectifs. La décision pour la première catégorie d'options est la plus simple: vous devez seulement décider si les différences de qualité justifient les différences de vitesse. Pour la deuxième catégorie d'options, les préférences peuvent être bien plus subjectives, et plus de facteurs peuvent être impliqués. Notez que certaines des options de type "préférences personnelles et exigences spéciales" peuvent aussi avoir un impact important sur la vitesse ou la qualité, mais ce n'est pas là leur utilité première. Quelques unes des options de "préférences personnelles" peuvent même avoir des effets jugés bénéfiques par certaines personnes mais néfastes par d'autres. Avant de continuer, il vous est important que vous sachiez que ce guide utilise une seule une mesure de qualité: le PSNR global. Pour une brève explication du PSNR, voir l'article Wikipedia sur le PSNR. Le PSNR global est le dernier nombre PSNR donné quand vous incluez l'option dans . Pour toutes les assertions faites sur le PSNR, il sera supposé un débit constant. Pratiquement tous les commentaires de ce guide supposent que vous effectuez un encodage en deux passes. Lors de la comparaison d'options, il y a deux raisons principales pour l'utilisation d'un encodage en deux passes. Premièrement, l'utilisation de deux passes permet souvent de gagner environ 1dB en PSNR, ce qui est une très grande différence. Deuxièmement, tester les options en faisant des comparaisons directes de qualité avec un encodage en une passe introduit un facteur de confusion important: le débit varie souvent de façon significative avec chaque encodage. Il n'est pas toujours facile de dire si les changements de qualité sont principalement dûs aux changements d'options, ou si ils reflètent essentiellement des différences aléatoires dans le débit atteint. Options qui affectent principalement la vitesse et la qualité subq: Des options qui vous permettent de jouer sur le compromis vitesse-qualité, et (voir ci-dessous) sont habituellement de loin les plus importantes. Si vous êtes intéressés par le bidouillage soit de la vitesse soit de la qualité, ces options sont les premières que vous devriez prendre en considération. Sur la vitesse, les options et interagissent entre elles assez fortement. L'expérience montre que, avec une image de référence, (le réglage par défaut) est environ 35% plus lent que . Avec 6 images de référence, la pénalité passe au dessus des 60%. L'effet de sur le PSNR semble assez constant indépendamment du nombre d'images de référence. Typiquement, résulte en un PSNR global supérieur de 0.2-0.5 dB par rapport à . C'est habituellement assez pour être visible. est le mode le plus lent et le plus élevé en qualité. Par rapport à , il gagne habituellement de 0.1-0.4 dB en PSNR avec des coûts en vitesse variant de 25% à 100%. A la différence des autres niveaux de , le comportement de ne dépend pas beaucoup de et . Au lieu de cela, l'efficacité de dépend principalement du nombre d'images B utilisées. Lors d'une utilisation normale, cela signifie que a un grand impact sur la vitesse et la qualité dans le cas de scènes d'action complexes, mais il peut ne pas avoir beaucoup d'effets sur les scènes avec peu de mouvements. Notez qu'il est recommandé de toujours régler à des valeurs autres que zéro (voir ci-dessous). frameref: est réglé à 1 par défaut, mais il ne faut pas penser que cela implique qu'il est raisonnable de le laisser à 1. Augmenter simplement à 2 permet un gain de PSNR d'environ 0.15dB, avec une pénalité de 5-10% sur la vitesse; cela semble être un bon compromis. gagne environ 0.25dB de PSNR par rapport à , ce qui devrait être une différence visible. est environ 15% plus lent que . Malheureusement, les gains diminuent rapidement. peut entraîner un gain de seulement 0.05-0.1 dB par rapport à avec une pénalité de 15% sur la vitesse. Au delà de , les gains en qualité sont habituellement très faible (bien que vous deviez garder à l'esprit à travers toute cette discussion que cela peut varier fortement selon la source vidéo utilisée). Dans un cas raisonnablement typique, améliorera le PSNR global d'un minuscule 0.02dB par rapport à , avec un surcoût sur la vitesse de 15%-20%. Avec des valeurs aussi élevées de , la seule vraie bonne chose qui puisse être dite est que de l'augmenter même au delà ne nuira presque certainement jamais au PSNR, mais les bénéfices sur la qualité sont à peine mesurables, et encore moins perceptibles. Note: Augmenter à des valeurs inutilement élevées peut affecter et habituellement affecte l'efficacité d'encodage si vous désactivez le CABAC. Avec le CABAC activé (comportement par défaut), la possibilité de régler "trop haut" semble trop éloignée pour s'en inquiéter, et dans le futur, il est possible que des optimisations l'élimine complètement. Si la vitesse vous intéresse, un compromis raisonnable est d'utiliser des valeurs de et basses pour la première passe, et de les augmenter ensuite sur pour la seconde passe. Typiquement, cela a un effet négatif négligeable sur la qualité finale: vous perdrez probablement bien moins de 0.1dB en PSNR, ce qui devrait être une différence beaucoup trop faible pour être visible. Cependant, des valeurs différentes de peuvent parfois affecter le choix du type de frame. Ce sont très probablement des cas périphériques rares, mais si vous voulez en être complètement certain, regardez si votre vidéo a soit des motifs plein écran, clignotants et répétitifs, soit de très grandes occlusions provisoires qui pourraient nécessiter une image I1. Ajustez le de la première passe pour qu'il soit assez grand pour contenir la durée du cycle de clignotement (ou d'occlusion). Par exemple, si la scène fait clignoter deux images sur une durée de trois images, réglez le de la première passe à 3 ou plus. Ce problème est probablement extrêmement rare sur des vidéos de type action, mais cela arrive quelquefois dans des captures de jeu vidéo. me: Cette option sert pour le choix de la méthode de recherche d'estimation de mouvement. Cette option modifie de manière directe le compromis entre qualité et vitesse. n'est plus rapide que de quelques pourcents par rapport à la recherche par défaut et entraîne une diminution du PSNR global inférieure à 0.1dB. Le paramètre par défaut () est un compromis raisonnable entre vitesse et qualité. améliore de moins de 0.1dB le PSNR global avec une pénalité sur la vitesse variant en fonction de . Pour de hautes valeurs de (par exemple 12 ou plus), est environ 40% plus lent que le par défaut. Avec , la pénalité sur la vitesse chute à 25%-30%. utilise une recherche exhaustive qui est trop lente pour une utilisation pratique. partitions=all: Cette option autorise l'utilisation des sous-partitions 8x4, 4x8 et 4x4 (en plus de celles présentes par défaut) dans les macroblocs prédits. L'autoriser résulte en une perte de vitesse raisonnablement consistente de 10%-15%. Cette option est plutôt inutile pour les videos sources contenant uniquements de faibles mouvements, particulièrement pour les sources avec beaucoup de petits objets en mouvement. Un gain d'environ 0.1dB peut être espéré. bframes: Si vous avez l'habitude d'encoder avec d'autre codecs, vous avez peut-être réalisé que les images B ne sont pas toujours utiles. Avec le H.264, ceci a changé: il y a de nouvelles techniques et types de blocs qui sont possibles avec les images B. Habituellement, même un algorithme de choix d'image B naïf peut avoir un bénéfice significatif sur le PSNR. Il est intéressant de noter que l'utilisation d'images B accélère habituellement légèrement la seconde passe, et peut aussi accélérer l'encodage en une seule passe si le choix adaptatif d'image B est désactivé. Avec le choix adaptatif d'image B désactivé (l'option de ), le réglage optimal n'est habituellement pas supérieur à , sinon les scènes riches en mouvement vont en souffrir. Avec le choix adaptatif d'image B activé (le comportement par défaut), cela ne pose plus de problème d'utiliser des valeurs plus élevées; l'encodeur réduira l'utilisation d'images B dans les scènes où cela endommagerait la compression. L'encodeur choisi rarement d'utiliser plus de 3 ou 4 images B; régler cette option à une valeur plus élevée aura peu d'effet. b_adapt: Note: activé par défaut. Avec cette option activée, l'encodeur utilise une procédure de décision raisonnablement rapide pour réduire le nombre d'images B utilisées dans les scènes pour lesquelles leur utilisation n'apporterait pas grand-chose. Vous pouvez utiliser pour affiner la tendance de l'encodeur à insérer des images B. La pénalité de vitesse du chois adaptatif d'images B est actuellement plutôt modeste, mais il en est de même pour le potentiel gain en qualité. En général, cela ne fait pas de mal. Notez que cela affecte uniquement la vitesse et le choix du type d'image lors de la première passe. Les options et n'ont pas d'effet lors des passages suivants. b_pyramid: Vous pouvez aussi activer cette option si vous utilisez 2 images B ou plus; comme l'indique la page man, vous obtiendrez une faible amélioration de la qualité sans surcoût en vitesse. Notez que ces vidéos ne peuvent pas être lues avec les décodeurs basés sur libavcodec antérieurs au 5 mars 2005 (environ). weight_b: En théorie, il n'y a beaucoup de gain à espérer de cette option. Cependant, dans les scènes de fondu, la prédiction pondérée permet d'économiser beaucoup en débit (kbit/s). Dans le MPEG-4 ASP, un fondu-au-noir est habituellement le mieux compressé en tant qu'une coûteuse série d'images I; utiliser la prédiction pondérée pour les images B permet d'en convertir au moins une partie images B bien plus légères. Le coût en durée d'encodage est minimal, étant donné qu'aucun choix supplémentaire n'a besoin d'être fait. Aussi, contrairement à ce que les gens semblent deviner, les besoins en puissance informatique du décodeur ne sont pas beaucoup affectés par la prédiction pondérée, tout le reste étant équivalent. Malheureusement, l'algorithme adaptatif de choix d'images B actuel a une forte tendance à éviter les images B pendant les fondus. Jusqu'à ce que cela change, cela peut être une bonne idée d'ajouter à votre si vous pensez que les fondus auront un impact important dans votre vidéo. Options relatives à diverses préférences Encodage en deux passes: On a suggéré ci-dessus de toujours utiliser un encodage en deux passages, mais il reste tout de même quelques raisons pour ne pas l'utiliser. Par exemple, si vous faites une capture de la télévision et l'encodez en temps réel, vous êtes obligé d'utiliser un encodage 1 passe. De plus, le 1 passe est évidemment plus rapide que le 2 passes; si vous utilisez exactement les mêmes options lors des 2 passes, l'encodage 2 passes est presque deux fois plus lent. Cependant, il y a de très bonnes raisons pour utiliser l'encodage 2 passes. D'une part, le contrôle de débit du mono-passe n'est pas medium et fait donc souvent des choix peu raisonnables parce qu'il n'a pas de vue d'ensemble de la vidéo. Par exemple, supposez que vous ayez une vidéo de deux minutes consistant en deux moitiés distinctes. La première moitié est une scène riche en mouvements qui dure 60 secondes qui, isolée, requière environ 2500kbit/s pour être correct. Suit immédiatement une scène de 60 secondes beaucoup moins exigeante qui peut être très bien à 300kbit/s. Supposez que vous demandiez 1400kbps en supposant que cela soit suffisant pour s'accomoder des deux scènes. Le contrôle de débit du mono-passe commettra des "fautes" dans un tel cas. Premièrement, il visera 1400kbit/s pour les deux segments. Le premier segment sera quantifié à l'excès et aura donc des artefacts de blocs de façon irrationnelle et inacceptable. Le second segment sera trop peu quantifié, il aura l'air parfait, mais le coût en débit de cette perfection sera complètement irrationnel. Ce qui est encore plus difficile à éviter est le problème de transition entre les 2 scènes. Les premières secondes de la seconde partie seront grandement surquantifiées, parce que le contrôle de débit s'attend encore aux exigences qu'il a rencontrées dans la première partie. Cette "période d'erreur" pendant laquelle les faibles mouvements sont sur-quantifiés aura l'air parkinsonien, et utilisera en réalité moins que les 300kbit/s qu'il aurait pris pour le rendre correct. Il y a des façons d'atténuer les pièges de l'encodage en simple passe, mais ils peuvent avoir tendance à augmenter les erreurs de prédiction de débit. Le contrôle du débit en multi-passes peut apporter d'énormes avantages par rapport au mono-passe. En utilisant les statistiques récupérées lors de la première passe d'encodage, l'encodeur peut estimer, avec une précision raisonnable, le "coût" (en bits) de l'encodage de n'importe quelle image, à n'importe quel quantificateur. Cela permet d'avoir une allocation des bits beaucoup plus rationnelle et mieux planifiée entre les scènes coûteuses (beaucoup de mouvements) et celles bon marché (peu de mouvements). Voir ci-dessous pour quelques suggestions sur la manière d'ajuster cette allocation à votre guise. De plus, l'encodage en deux passes ne prend pas nécessairement deux fois plus de temps que le simple passe. Vous pouvez jouer avec les options lors de la première passe pour avoir une vitesse plus élevée et une qualité plus faible. Si vous choisissez bien vos options, vous pouvez obtenir une première passe très rapide. La qualité résultante de la seconde passe sera légèrement plus basse parce que la prédiction de la taille sera moins précise, mais la différence de qualité sera normalement trop faible pour être visible. Essayez, par exemple, d'ajouter à la première passe . Ensuite, sur la seconde passe, utilisez des options plus lentes pour avoir une meilleure qualité: Encodage en trois passes ? x264 offre la possibilité de faire un nombre arbitraire de passes consécutives. Si vous spécifiez lors de la première passe, puis utilisez pour la passe suivante, cette dernière passe lira les statistiques calculées lors du passage précédent, et écrira ses propres statistiques. Une autre passe suivante aura une très bonne base pour faire des prédictions très précises de tailles des images pour un quantificateur donné. En pratique, les gains sur la qualité d'ensemble sont généralement proches de zéro et il est très possible que la troisième passe donne un PSNR global plus faible que le précédent. Typiquement, le 3 passes aide si vous obtenez une mauvaise prédiction de débit ou un mauvais rendu lors des transitions de scènes quand vous utilisez seulement deux passes. Ceci peut se produire sur les clips extrêmement courts. Il y a aussi quelques cas spéciaux dans lesquels trois (ou plus) passes sont utiles pour les utilisateurs avancés, mais par souci de brièveté, ce guide ne traitera pas ces cas spéciaux. qcomp: gère l'allocation des bits entre les images "coûteuses" des scènes riches en mouvement et celles "bon marché" des scènes de faible mouvement. La valeur minimale, s'emplie à réaliser un vrai débit constant. Typiquement, cela rendrait des scènes riches en mouvements vraiment laides, alors que les scènes plus statiques seraient absolument parfaites, mais cela utiliserait aussi beaucoup plus de bits que nécessaire pour les rendre excellentes. La valeur maximale, rend les paramètres de quantifications (QP) presque constants. Un QP constant donne un bon rendu, mais la plupart des gens pensent qu'il est plus raisonnable d'enlever quelques bits des scènes coûteuses (où la perte de qualité n'est pas aussi visible) et de les ré-allouer aux scènes qui sont plus faciles à encoder à une excellente qualité. vaut 0.6 par défaut, ce qui peut être légèrement trop faible au goût de nombre de personnes (0.7-0.8 sont aussi communément utilisées). keyint: permet de jouer sur le compromis entre la précision de la navigation dans les fichiers et leur efficacité de compression. Par défaut, est égal à 250. Sur des videos à 25 images par secondes, cela garantit que la navigation peut se faire avec une précision de 10 secondes. Si vous pensez qu'il est important et utile de pouvoir faire une recherche avec une granularité de 5 secondes, règlez à ; cela dégradera légèrement le rapport qualité/débit. Si vous vous souciez seulement de la qualité et non de la capacité à faire une recherche, vous pouvez le mettre à des valeurs beaucoup plus élevées (bien entendu, plus vous augmenterez, moins il aura de gain visuels). Le flux vidéo aura toujours des points de recherche tant qu'il y aura des changements de de scène. deblock: Ce sujet risque d'être une source de controverses. H.264 définit une procédure simple de déblocage sur les blocs I ayant des forces et des seuils pré-réglés en fonction du QP du bloc en question. Par défaut, les blocs à QP élevés sont fortement filtrés et les blocs à faible QP ne le sont pas du tout. Les forces pré-réglées définies par les standards sont bien choisies et il y a de grandes chances pour qu'elles soient optimales du point de vue du PSNR quel que soit la vidéo que vous encodez. Les paramètres de vous permettent de spécifier des décalages par rapport aux seuils de déblocage pré-définis. Beaucoup de gens semblent penser que baisser grandement la force du filtre de déblocage (par exemple -3) est une bonne idée. Ce n'est cependant presque jamais le cas et dans la plupart des cas, ceux qui le font ne comprennent pas très bien comment le déblocage fonctionne par défaut. La première et plus importante chose à savoir à propos du filtre de déblocage de H264 est que les seuils par défaut sont presque toujours optimaux du point de vue du PSNR. Dans les rares cas où ils ne le sont pas, le décalage idéal est de plus ou moins 1. Décaler les paramètres de déblocage d'une plus grande valeur est presqu'une garantie de dégradation du PSNR. Augmenter la force du filtre diluera les détails; la baisser augmentera l'effet de bloc. C'est une mauvaise idée que de baisser les seuils de déblocage si votre source est principalement de faible complexité spatiale (c-à-d avec peu de détails ou de bruit). Le filtre de H264 réussit très bien à camoufler les artefacts qui se apparaissent. De toutes façons, si la complexité spatiale de la source est élevée, les artefacts sont moins discernables parce qu'ils tendent à ressembler à du détail ou du bruit. La vision humaine remarque facilement qu'un détail a été enlevé mais ne remarque pas si facilement quand un bruit est mal représenté. Quand il s'agit de qualité subjective, le bruit et les détails sont d'une certaine façon interchangeables. En baissant la force du filtre de déblocage, vous allez très probablement augmenter les erreurs en ajoutant des artefacts mais l'oeil ne les remarquera pas parce qu'il les confondra avec des détails. Cependant, ceci ne justifie toujours pas une diminution de la force du filtre de déblocage. Vous pouvez généralement obtenir une meilleure qualité de bruit lors du post-traitement. Si votre encodage en H.264 est trop flou ou sale, essayez de jouer avec quand vous visionner votre film encodé. devrait camoufler la plupart des artefacts légers. Cela aura l'air certainement mieux que ce que vous obtiendriez en jouant uniquement avec le filtre de déblocage. Exemples de paramètre d'encodage Les paramètres ci-dessous sont des exemples de différentes combinaisons d'option de compression qui affectent le compromis entre vitesse et qualité pour un même débit cible. Tous les paramètres d'encodage sont testés sur un échantillon vidéo à 720x448 à30000/1001 images par seconde, le débit cible est à 900kbit/s, et la machine est un AMD-64 3400+ à 2400 MHz en mode 64 bits. Chaque paramètre d'encodage exploite la vitesse de compression mesurée (en images par seconde) et la perte de PSNR (en dB) en la comparant au paramètre de "très haute qualité". Veuillez comprendre que selon votre source, le type de votre machine et les derniers développements logiciels, vous pourrez obtenir des résultats très différents. DescriptionOptions d'encodagevitesse (en images/s)Perte PSNR relative (en dB) Très haute qualité 6 0dB Haute qualité 13 -0.89dB Rapide 17 -1.48dB Encoder avec la famille de codecs <systemitem class="library">Video For Windows</systemitem> Video for Windows offre la possibilité d'encoder en utiliser les codecs vidéo binaires. Il est possible d'encoder avec les codecs suivants (si vous en connaissez d'autres, dites-le nous!) Notez que le support est très expériemental que que certains codecs peuvent ne pas fonctionner correctement. Certains codecs ne fonctionnent qu'avec certains espaces de couleur ; essayez les options et si un codec se plante ou donne un résulat étrange. Les codecs Video for Windows supportés Nom de fichier du codec Video Description (FourCC) md5sum Commentaire aslcodec_vfw.dll Alparysoft lossless codec vfw (ASLC) 608af234a6ea4d90cdc7246af5f3f29a avimszh.dll AVImszh (MSZH) 253118fe1eedea04a95ed6e5f4c28878 nécessite avizlib.dll AVIzlib (ZLIB) 2f1cc76bbcf6d77d40d0e23392fa8eda divx.dll DivX4Windows-VFW acf35b2fc004a89c829531555d73f1e6 huffyuv.dll HuffYUV (lossless) (HFYU) b74695b50230be4a6ef2c4293a58ac3b iccvid.dll Cinepak Video (cvid) cb3b7ee47ba7dbb3d23d34e274895133 icmw_32.dll Motion Wavelets (MWV1) c9618a8fc73ce219ba918e3e09e227f2 jp2avi.dll ImagePower MJPEG2000 (IPJ2) d860a11766da0d0ea064672c6833768b m3jp2k32.dll Morgan MJPEG2000 (MJ2C) f3c174edcbaef7cb947d6357cdfde7ff m3jpeg32.dll Morgan Motion JPEG Codec (MJPG) 1cd13fff5960aa2aae43790242c323b1 mpg4c32.dll Microsoft MPEG-4 v1/v2 b5791ea23f33010d37ab8314681f1256 tsccvid.dll TechSmith Camtasia Screen Codec (TSCC) 8230d8560c41d444f249802a2700d1d5 erreur shareware sous windows vp31vfw.dll On2 Open Source VP3 Codec (VP31) 845f3590ea489e2e45e876ab107ee7d2 vp4vfw.dll On2 VP4 Personal Codec (VP40) fc5480a482ccc594c2898dcc4188b58f vp6vfw.dll On2 VP6 Personal Codec (VP60) 04d635a364243013898fd09484f913fb crash sous Linux vp7vfw.dll On2 VP7 Personal Codec (VP70) cb4cc3d4ea7c94a35f1d81c3d750bc8d mauvais FourCC ? ViVD2.dll SoftMedia ViVD V2 codec VfW (GXVE) a7b4bf5cac630bb9262c3f80d8a773a1 msulvc06.DLL MSU Lossless codec (MSUD) 294bf9288f2f127bb86f00bfcc9ccdda Décodable par Window Media Player, mais pas MPlayer (pour le moment). camcodec.dll CamStudio lossless video codec (CSCD) 0efe97ce08bb0e40162ab15ef3b45615 sf.net/projects/camstudio La première colonne contient le nom du codec qui soit être donné après le paramètre codec, comme ceci: . Le code FourCC utilisé par chaque codec est donné entre parenthèse. Exemple de compression VP3: mencoder dvd://2 -o title2.avi -ovc vfw -xvfwopts codec=vp31vfw.dll -oac copy Utiliser <application>MEncoder</application> pour créer des fichiers compatibles VCD/SVCD/DVD. Contraintes de Format MEncoder est capable de créer des fichiers MPEG aux formats VCD, SCVD et DVD en utilisant la bibliothèque libavcodec. Ces fichiers peuvent ensuite être utilisés avec vcdimager ou dvdauthor pour créer des disques lisibles par une platine de salon standard. Les formats DVD, SVCD, et VCD sont très contraignants. Seule un faible nombre de résolutions et de formats d'image sont acceptés. Si votre film ne respecte pas ces conditions, vous devrez redimensionner, recadrer ou ajouter des bords noirs à l'image pour le rendre compatible. Contraintes de format Format Résolution Codec vidéo débit vidéo en kbit/s Taux d'échantillonnage Codec audio débit audio en kbit/s images par seconde format d'image NTSC DVD 720x480, 704x480, 352x480, 352x240 MPEG-2 9800 48000 Hz AC3,PCM 1536 (max) 30000/1001, 24000/1001 4:3, 16:9 (seulement pour 720x480) NTSC DVD 352x240 Ces résolutions sont rarement utilisées pour les DVDs parce qu'elles sont d'assez basse qualité. MPEG-1 1856 48000 Hz AC3,PCM 1536 (max) 30000/1001, 24000/1001 4:3, 16:9 NTSC SVCD 480x480 MPEG-2 2600 44100 Hz MP2 384 (max) 30000/1001 4:3 NTSC VCD 352x240 MPEG-1 1150 44100 Hz MP2 224 24000/1001, 30000/1001 4:3 PAL DVD 720x576, 704x576, 352x576, 352x288 MPEG-2 9800 48000 Hz MP2,AC3,PCM 1536 (max) 25 4:3, 16:9 (seulement pour 720x576) PAL DVD 352x288 MPEG-1 1856 48000 Hz MP2,AC3,PCM 1536 (max) 25 4:3, 16:9 PAL SVCD 480x576 MPEG-2 2600 44100 Hz MP2 384 (max) 25 4:3 PAL VCD 352x288 MPEG-1 1152 44100 Hz MP2 224 25 4:3 Si votre film est au format 2,35:1 (la plupart des films d'action récents), vous devrez ajouter des bords noirs ou recadrer le film en 16:9 pour faire un DVD ou un VCD. Si vous ajoutez des bords noirs, essayez qu'ils soient d'une épaisseur multiple de 16 de façon à minimiser l'impact sur la performance d'encodage. Le DVD a heureusement un débit suffisamment élevé pour que vous n'ayez pas trop à vous inquiéter pour l'efficacité de l'encodage, par contre, le SVCD et le VCD sont très limités en débit et demandent des efforts pour obtenir une qualité acceptable. Contraintes de Taille GOP Les DVD, VCD, et SVCD vous contraignent aussi à des tailles relativement basses de GOP (Group of Pictures ou "Groupe d'Images"). Pour des vidéo à 30 images par secondes, la plus large taille de GOP permise est 18. Pour 25 ou 24 images par secondes, le maximum est 15. La taille du GOP est réglée en utilisant l'option . Contraintes de débit Le format VCD requière que le débit de votre vidéo soit constant (CBR) à 1152 kbit/s. A cette forte contrainte, il faut ajouter la très petite taille de la mémoire tampon VBV: 327 kbits. Le SVCD autorise des débits vidéo variables jusqu'à 2500 kbit/s et une taille de mémoire tampon VBV légèrement moins restrictive de 917 kbits. Les débits vidéo DVD peuvent aller jusqu'à 9800 kbit/s (bien que les débits typiques soient d'à peu près la moitié) et la taille de la mémoire tampon VBV est de 1835 kbits. Options de sortie MEncoder a des options de contrôle du format de sortie. En utilisant ces options nous pouvons lui dire de créer le type de fichier correct. Les options pour le VCD et le SVCD sont appelées xvcd et xsvcd, parce que ce sont des formats étendus. Elles ne sont pas strictement conformes, principalement parce que la sortie ne contient pas de décalages de scan. Si vous avez besoin de générer une image SVCD, vous devriez passer le fichier de sortie à vcdimager. VCD: -of mpeg -mpegopts format=xvcd SVCD: -of mpeg -mpegopts format=xsvcd DVD(avec estampille temporelle sur chaque image si possible): -of mpeg -mpegopts format=dvd:tsaf DVD avec pullup NTSC: -of mpeg -mpegopts format=dvd:tsaf:telecine -ofps 24000/1001 Ceci permet au contenu progressif à 24000/1001 images par secondes d'être encodé à 30000/1001 images par secondes tout en restant avec le format DVD. Format d'image L'argument de est utilisé pour encoder le format d'image du fichier. Durant la lecture le format d'image est utilisé pour redonner à la vidéo la taille correcte. 16:9 ou "Écran Large" -lavcopts aspect=16/9 4:3 ou "Plein Écran" -lavcopts aspect=4/3 2,35:1 ou NTSC "Cinémascope" -vf scale=720:368,expand=720:480 -lavcopts aspect=16/9 Pour calculer la taille de dimensionnement correcte, utilisez la largeur étendue NTSC de 854/2,35 = 368 2,35:1 ou PAL "Cinémascope" -vf scale="720:432,expand=720:576 -lavcopts aspect=16/9 Pour calculer la taille de dimensionnement correcte, utilisez la largeur étendue PAL de 1024/2,35 = 432 Maintaining A/V sync Afin de maintenir la synchronization audio/video lors de l'encodage, MEncoder doit dupliquer ou effacer des images. Cela marche plutôt bien lor du multiplexage dans un fichier AVI mais il est pratiquement garanti d'échouer à maintenir la synchronisation A/V avec d'autres conteneurs tel que le MPEG. C'est pourquoi il est nécessaire d'ajouter le filtre vidéo à la fin de la chaîne de filtre pour éviter ce type de problème. Vous pouvez trouver plus de détails techniques sur dans la section Améliorer la fiabilité du multiplexage et de la synchronisation Audio/Video ou dans le manuel. Conversion du Taux d'échantillonnage Si le taux d'échantillonnage de l'audio du fichier original n'est pas le même que celui demandé par le format cible, la conversion du taux d'échantillonnage est nécessaire. Ceci est réalisé en utilisant ensemble l'option et le filtre audio . DVD: -srate 48000 -af lavcresample=48000 VCD et SVCD: -srate 44100 -af lavcresample=44100 Utiliser libavcodec pour l'encodage VCD/SVCD/DVD Introduction libavcodec peut être utilisé pour créer des vidéos compatibles avec les standards VCD/SVCD/DVD en utilisant les options appropriées. lavcopts Ceci est une liste de champs de que vous pourriez avoir besoin de changer si vous voulez faire un film compatible VCD, SVCD, ou DVD: acodec: pour le VCD, le SVCD, ou le DVD PAL; est plus communément utilisé pour le DVD. L'audio PCM peut aussi être utilisé pour le DVD, mais c'est principalement une grande perte d'espace. Notez que l'audio MP3 n'est compatible avec aucun de ces formats, cependant les lecteurs n'ont souvent aucun problème pour les jouer. abitrate: (débit audio) 224 pour le VCD; jusqu'à 384 pour le SVCD; jusqu'à 1536 pour le DVD, mais utilise communément une gamme de valeurs de 192 kbit/s pour le stéréo à 384 kbit/s pour le son canaux 5.1. vcodec: pour le VCD; pour le SVCD; est habituellement utilisé pour le DVD mais on peut aussi utiliser pour des résolutions CIF. keyint: Utilisé pour régler la taille du GOP. 18 pour les vidéo à 30 images par secondes, ou 15 pour les vidéos à 25/24 images par secondes. Les producteurs commerciaux semblent préférer des intervalles entre images clés de 12. Il est possible d'augmenter cette valeur et de rester compatible avec la plupart des lecteurs. Un de 25 ne devrait jamais causer de problèmes. vrc_buf_size: 327 pour le VCD, 917 pour le SVCD, et 1835 pour le DVD. vrc_minrate: 1152, pour le VCD. Peut être laissé de côté pour le SVCD et le DVD. vrc_maxrate: 1152 pour le VCD; 2500 pour le SVCD; 9800 pour le DVD. Pour le SVCD et le DVD, vous pourriez vouloir utiliser des valeurs plus basses selon vos préférences et contraintes personnelles. vbitrate: (débit vidéo) 1152 pour le VCD; jusqu'à 2500 pour le SVCD; jusqu'à 9800 pour le DVD. Pour les deux derniers formats, les valeurs de vbitrate devrait être réglées selon vos goûts. Par exemple, si vous voulez vraiment faire tenir 20 heures ou plus sur un DVD, vous pouvez utiliser vbitrate=400. La qualité de la vidéo résultante sera probablement assez mauvaise. Si vous essayez d'avoir la qualité maximum possible sur un DVD, utilisez vbitrate=9800, mais sachez que cela pourrait vous forcer à ne stocker que moins d'une heure de vidéo sur un DVD simple couche. Exemples Ceci est un paramétrage typique minimal de pour encoder une vidéo: VCD: -lavcopts vcodec=mpeg1video:vrc_buf_size=327:vrc_minrate=1152:\ vrc_maxrate=1152:vbitrate=1152:keyint=15:acodec=mp2 SVCD: -lavcopts vcodec=mpeg2video:vrc_buf_size=917:vrc_maxrate=2500:vbitrate=1800:\ keyint=15:acodec=mp2 DVD: -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:\ keyint=15:acodec=ac3 Options Avancées Pour une qualité d'encodage plus élevée, vous pouvez aussi souhaiter ajouter des options d'amélioration de qualité à lavcopts, comme , et autres. Notez que, bien que et soient souvent utile avec le MPEG-4, elles ne sont pas utilisables avec MPEG-1 ou MPEG-2. Aussi, si vous essayez de créer un encodage DVD de très haute qualité, il peut être utile d'ajouter à lavcopts. Le faire peut aider à réduire l'apparition de blocs dans les zones de faible variations de couleurs. Pour résumer, la ligne suivante est un exemple de paramétrage de lavcopts pour un DVD de haute qualité: -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=8000:\ keyint=15:trell:mbd=2:precmp=2:subcmp=2:cmp=2:dia=-10:predia=-10:cbp:mv0:\ vqmin=1:lmin=1:dc=10 Encodage Audio Le VCD et SVCD supportent l'audio MPEG-1 layer II, en utilisant un des encodeurs MP2 toolame, twolame, ou libavcodec. Le MP2 libavcodec est loin d'être aussi bon que les deux autres bibliothèques, cependant il devrait toujours être disponible en utilisation. Le VCD ne supporte que l'audio avec un débit constant (CBR) alors que le SVCD supporte aussi le débit variable (VBR). Soyez prudents lors de l'utilisation du VBR car certains mauvais lecteurs pourraient ne pas trop bien le supporter. Pour l'audio DVD, le codec AC3 de libavcodec est utilisé. toolame Pour un VCD et un SVCD: -oac toolame -toolameopts br=224 twolame Pour un VCD et un SVCD: -oac twolame -twolameopts br=224 libavcodec Pour un DVD avec un son 2 canaux: -oac lavc -lavcopts acodec=ac3:abitrate=192 Pour un DVD avec un son 5,1 canaux: -channels 6 -oac lavc -lavcopts acodec=ac3:abitrate=384 Pour un VCD et un SVCD: -oac lavc -lavcopts acodec=mp2:abitrate=224 Combiner le tout Cette section présente certaines commandes complètes pour créer des vidéos compatibles VCD/SVCD/DVD. DVD PAL mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:576,\ harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\ vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=15:acodec=ac3:\ abitrate=192:aspect=16/9 -ofps 25 \ -o film.mpg film.avi DVD NTSC mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:480,\ harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\ vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=18:acodec=ac3:\ abitrate=192:aspect=16/9 -ofps 30000/1001 \ -o film.mpg film.avi AVI PAL Contenant Audio AC3 vers DVD Si la source a déjà l'audio en AC3, utilisez au lieu de la réencoder. mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:tsaf -vf scale=720:576,\ harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:\ vbitrate=5000:keyint=15:aspect=16/9 -ofps 25 \ -o film.mpg film.avi AVI NTSC Contenant Audio AC3 vers DVD Si la source a déjà l'audio en AC3, et est en NTSC @ 24000/1001 fps: mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:tsaf:telecine \ -vf scale=720:480,harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:\ vrc_maxrate=9800:vbitrate=5000:keyint=15:aspect=16/9 -ofps 24000/1001 \ -o film.mpg film.avi SVCD PAL mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \ scale=480:576,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ vcodec=mpeg2video:mbd=2:keyint=15:vrc_buf_size=917:vrc_minrate=600:\ vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 25 \ -o film.mpg film.avi SVCD NTSC mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \ scale=480:480,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ vcodec=mpeg2video:mbd=2:keyint=18:vrc_buf_size=917:vrc_minrate=600:\ vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 30000/1001 \ -o film.mpg film.avi VCD PAL mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \ scale=352:288,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ vcodec=mpeg1video:keyint=15:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\ vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 25 \ -o film.mpg film.avi VCD NTSC mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \ scale=352:240,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ vcodec=mpeg1video:keyint=18:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\ vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 30000/1001 \ -o film.mpg film.avi