mpv/liba52/resample_mmx.c

// this code come from a52dec/libao/audio_out_oss.c

// FIXME FIXME FIXME

// a52_resample_init should find the requested converter (from type flags ->
// given number of channels) and set up some function pointers...

// a52_resample() should do the conversion.

// MMX optimizations from Michael Niedermayer (michaelni@gmx.at) (under GPL)

/* optimization TODO / NOTES 
    movntq is slightly faster (0.5% with the current test.c benchmark) 
	(but thats just test.c so that needs to be testd in reallity)
	and it would mean (C / MMX2 / MMX / 3DNOW) versions 
*/

#include <inttypes.h>
#include "a52.h"
#include "../config.h"

#ifdef HAVE_MMX
static uint64_t __attribute__((aligned(8))) magicF2W= 0x43c0000043c00000LL;
static uint64_t __attribute__((aligned(8))) wm1010= 0xFFFF0000FFFF0000LL;
static uint64_t __attribute__((aligned(8))) wm0101= 0x0000FFFF0000FFFFLL;
static uint64_t __attribute__((aligned(8))) wm1100= 0xFFFFFFFF00000000LL;
#endif

static inline int16_t convert (int32_t i)
{
    if (i > 0x43c07fff)
	return 32767;
    else if (i < 0x43bf8000)
	return -32768;
    else
	return i - 0x43c00000;
}

static int chans=2;
static int flags=0;

void a52_resample_init(int _flags,int _chans){
    chans=_chans;
    flags=_flags;
}

int a52_resample(float * _f, int16_t * s16)
{
    int i;
    int32_t * f = (int32_t *) _f;

    switch (flags) {
    case A52_MONO:
#ifdef HAVE_MMX
	asm volatile(
		"movl $-512, %%esi		\n\t"
		"movq magicF2W, %%mm7		\n\t"
		"movq wm1100, %%mm3		\n\t"
		"movq wm0101, %%mm4		\n\t"
		"movq wm1010, %%mm5		\n\t"
		"pxor %%mm6, %%mm6		\n\t"
		"1:				\n\t"
		"movq (%1, %%esi, 2), %%mm0	\n\t"
		"movq 8(%1, %%esi, 2), %%mm1	\n\t"
		"leal (%%esi, %%esi, 4), %%edi	\n\t"
		"psubd %%mm7, %%mm0		\n\t"
		"psubd %%mm7, %%mm1		\n\t"
		"packssdw %%mm1, %%mm0		\n\t"
		"movq %%mm0, %%mm1		\n\t"
		"pand %%mm4, %%mm0		\n\t"
		"pand %%mm5, %%mm1		\n\t"
		"movq %%mm6, (%0, %%edi)	\n\t" // 0 0 0 0
		"movd %%mm0, 8(%0, %%edi)	\n\t" // A 0
		"pand %%mm3, %%mm0		\n\t"
		"movd %%mm6, 12(%0, %%edi)	\n\t" // 0 0
		"movd %%mm1, 16(%0, %%edi)	\n\t" // 0 B
		"pand %%mm3, %%mm1		\n\t"
		"movd %%mm6, 20(%0, %%edi)	\n\t" // 0 0
		"movq %%mm0, 24(%0, %%edi)	\n\t" // 0 0 C 0
		"movq %%mm1, 32(%0, %%edi)	\n\t" // 0 0 0 B
		"addl $8, %%esi			\n\t"
		" jnz 1b			\n\t"
		"emms				\n\t"
		:: "r" (s16+1280), "r" (f+256)
		:"%esi", "%edi", "memory"
	);
#else
	for (i = 0; i < 256; i++) {
	    s16[5*i] = s16[5*i+1] = s16[5*i+2] = s16[5*i+3] = 0;
	    s16[5*i+4] = convert (f[i]);
	}
#endif
	break;
    case A52_CHANNEL:
    case A52_STEREO:
    case A52_DOLBY:
/* benchmark scores are 0.3% better with SSE but we would need to set bias=0 and premultiply it
#ifdef HAVE_SSE
	asm volatile(
		"movl $-1024, %%esi		\n\t"
		"1:				\n\t"
		"cvtps2pi (%1, %%esi), %%mm0	\n\t"
		"cvtps2pi 1024(%1, %%esi), %%mm2\n\t"
		"movq %%mm0, %%mm1		\n\t"
		"punpcklwd %%mm2, %%mm0		\n\t"
		"punpckhwd %%mm2, %%mm1		\n\t"
		"movq %%mm0, (%0, %%esi)	\n\t"
		"movq %%mm1, 8(%0, %%esi)	\n\t"
		"addl $16, %%esi		\n\t"
		" jnz 1b			\n\t"
		"emms				\n\t"
		:: "r" (s16+512), "r" (f+256)
		:"%esi", "memory"
	);*/
#ifdef HAVE_MMX
	asm volatile(
		"movl $-1024, %%esi		\n\t"
		"movq magicF2W, %%mm7		\n\t"
		"1:				\n\t"
		"movq (%1, %%esi), %%mm0	\n\t"
		"movq 8(%1, %%esi), %%mm1	\n\t"
		"movq 1024(%1, %%esi), %%mm2	\n\t"
		"movq 1032(%1, %%esi), %%mm3	\n\t"
		"psubd %%mm7, %%mm0		\n\t"
		"psubd %%mm7, %%mm1		\n\t"
		"psubd %%mm7, %%mm2		\n\t"
		"psubd %%mm7, %%mm3		\n\t"
		"packssdw %%mm1, %%mm0		\n\t"
		"packssdw %%mm3, %%mm2		\n\t"
		"movq %%mm0, %%mm1		\n\t"
		"punpcklwd %%mm2, %%mm0		\n\t"
		"punpckhwd %%mm2, %%mm1		\n\t"
		"movq %%mm0, (%0, %%esi)	\n\t"
		"movq %%mm1, 8(%0, %%esi)	\n\t"
		"addl $16, %%esi		\n\t"
		" jnz 1b			\n\t"
		"emms				\n\t"
		:: "r" (s16+512), "r" (f+256)
		:"%esi", "memory"
	);
#else
	for (i = 0; i < 256; i++) {
	    s16[2*i] = convert (f[i]);
	    s16[2*i+1] = convert (f[i+256]);
	}
#endif
	break;
    case A52_3F:
	for (i = 0; i < 256; i++) {
	    s16[5*i] = convert (f[i]);
	    s16[5*i+1] = convert (f[i+512]);
	    s16[5*i+2] = s16[5*i+3] = 0;
	    s16[5*i+4] = convert (f[i+256]);
	}
	break;
    case A52_2F2R:
#ifdef HAVE_MMX
	asm volatile(
		"movl $-1024, %%esi		\n\t"
		"movq magicF2W, %%mm7		\n\t"
		"1:				\n\t"
		"movq (%1, %%esi), %%mm0	\n\t"
		"movq 8(%1, %%esi), %%mm1	\n\t"
		"movq 1024(%1, %%esi), %%mm2	\n\t"
		"movq 1032(%1, %%esi), %%mm3	\n\t"
		"psubd %%mm7, %%mm0		\n\t"
		"psubd %%mm7, %%mm1		\n\t"
		"psubd %%mm7, %%mm2		\n\t"
		"psubd %%mm7, %%mm3		\n\t"
		"packssdw %%mm1, %%mm0		\n\t"
		"packssdw %%mm3, %%mm2		\n\t"
		"movq 2048(%1, %%esi), %%mm3	\n\t"
		"movq 2056(%1, %%esi), %%mm4	\n\t"
		"movq 3072(%1, %%esi), %%mm5	\n\t"
		"movq 3080(%1, %%esi), %%mm6	\n\t"
		"psubd %%mm7, %%mm3		\n\t"
		"psubd %%mm7, %%mm4		\n\t"
		"psubd %%mm7, %%mm5		\n\t"
		"psubd %%mm7, %%mm6		\n\t"
		"packssdw %%mm4, %%mm3		\n\t"
		"packssdw %%mm6, %%mm5		\n\t"
		"movq %%mm0, %%mm1		\n\t"
		"movq %%mm3, %%mm4		\n\t"
		"punpcklwd %%mm2, %%mm0		\n\t"
		"punpckhwd %%mm2, %%mm1		\n\t"
		"punpcklwd %%mm5, %%mm3		\n\t"
		"punpckhwd %%mm5, %%mm4		\n\t"
		"movq %%mm0, %%mm2		\n\t"
		"movq %%mm1, %%mm5		\n\t"
		"punpckldq %%mm3, %%mm0		\n\t"
		"punpckhdq %%mm3, %%mm2		\n\t"
		"punpckldq %%mm4, %%mm1		\n\t"
		"punpckhdq %%mm4, %%mm5		\n\t"
		"movq %%mm0, (%0, %%esi,2)	\n\t"
		"movq %%mm2, 8(%0, %%esi,2)	\n\t"
		"movq %%mm1, 16(%0, %%esi,2)	\n\t"
		"movq %%mm5, 24(%0, %%esi,2)	\n\t"
		"addl $16, %%esi		\n\t"
		" jnz 1b			\n\t"
		"emms				\n\t"
		:: "r" (s16+1024), "r" (f+256)
		:"%esi", "memory"
	);
#else
	for (i = 0; i < 256; i++) {
	    s16[4*i] = convert (f[i]);
	    s16[4*i+1] = convert (f[i+256]);
	    s16[4*i+2] = convert (f[i+512]);
	    s16[4*i+3] = convert (f[i+768]);
	}
#endif	
	break;
    case A52_3F2R:
	for (i = 0; i < 256; i++) {
	    s16[5*i] = convert (f[i]);
	    s16[5*i+1] = convert (f[i+512]);
	    s16[5*i+2] = convert (f[i+768]);
	    s16[5*i+3] = convert (f[i+1024]);
	    s16[5*i+4] = convert (f[i+256]);
	}
	break;
    case A52_MONO | A52_LFE:
#ifdef HAVE_MMX
	asm volatile(
		"movl $-1024, %%esi		\n\t"
		"movq magicF2W, %%mm7		\n\t"
		"pxor %%mm6, %%mm6		\n\t"
		"1:				\n\t"
		"movq 1024(%1, %%esi), %%mm0	\n\t"
		"movq 1032(%1, %%esi), %%mm1	\n\t"
		"movq (%1, %%esi), %%mm2	\n\t"
		"movq 8(%1, %%esi), %%mm3	\n\t"
		"psubd %%mm7, %%mm0		\n\t"
		"psubd %%mm7, %%mm1		\n\t"
		"psubd %%mm7, %%mm2		\n\t"
		"psubd %%mm7, %%mm3		\n\t"
		"packssdw %%mm1, %%mm0		\n\t"
		"packssdw %%mm3, %%mm2		\n\t"
		"movq %%mm0, %%mm1		\n\t"
		"punpcklwd %%mm2, %%mm0		\n\t"
		"punpckhwd %%mm2, %%mm1		\n\t"
		"leal (%%esi, %%esi, 2), %%edi	\n\t"
		"movq %%mm6, (%0, %%edi)	\n\t"
		"movd %%mm0, 8(%0, %%edi)	\n\t"
		"punpckhdq %%mm0, %%mm0		\n\t"
		"movq %%mm6, 12(%0, %%edi)	\n\t"
		"movd %%mm0, 20(%0, %%edi)	\n\t"
		"movq %%mm6, 24(%0, %%edi)	\n\t"
		"movd %%mm1, 32(%0, %%edi)	\n\t"
		"punpckhdq %%mm1, %%mm1		\n\t"
		"movq %%mm6, 36(%0, %%edi)	\n\t"
		"movd %%mm1, 44(%0, %%edi)	\n\t"
		"addl $16, %%esi		\n\t"
		" jnz 1b			\n\t"
		"emms				\n\t"
		:: "r" (s16+1536), "r" (f+256)
		:"%esi", "%edi", "memory"
	);
#else
	for (i = 0; i < 256; i++) {
	    s16[6*i] = s16[6*i+1] = s16[6*i+2] = s16[6*i+3] = 0;
	    s16[6*i+4] = convert (f[i+256]);
	    s16[6*i+5] = convert (f[i]);
	}
#endif
	break;
    case A52_CHANNEL | A52_LFE:
    case A52_STEREO | A52_LFE:
    case A52_DOLBY | A52_LFE:
	for (i = 0; i < 256; i++) {
	    s16[6*i] = convert (f[i+256]);
	    s16[6*i+1] = convert (f[i+512]);
	    s16[6*i+2] = s16[6*i+3] = s16[6*i+4] = 0;
	    s16[6*i+5] = convert (f[i]);
	}
	break;
    case A52_3F | A52_LFE:
	for (i = 0; i < 256; i++) {
	    s16[6*i] = convert (f[i+256]);
	    s16[6*i+1] = convert (f[i+768]);
	    s16[6*i+2] = s16[6*i+3] = 0;
	    s16[6*i+4] = convert (f[i+512]);
	    s16[6*i+5] = convert (f[i]);
	}
	break;
    case A52_2F2R | A52_LFE:
	for (i = 0; i < 256; i++) {
	    s16[6*i] = convert (f[i+256]);
	    s16[6*i+1] = convert (f[i+512]);
	    s16[6*i+2] = convert (f[i+768]);
	    s16[6*i+3] = convert (f[i+1024]);
	    s16[6*i+4] = 0;
	    s16[6*i+5] = convert (f[i]);
	}
	break;
    case A52_3F2R | A52_LFE:
	for (i = 0; i < 256; i++) {
	    s16[6*i] = convert (f[i+256]);
	    s16[6*i+1] = convert (f[i+768]);
	    s16[6*i+2] = convert (f[i+1024]);
	    s16[6*i+3] = convert (f[i+1280]);
	    s16[6*i+4] = convert (f[i+512]);
	    s16[6*i+5] = convert (f[i]);
	}
	break;
    }
    return chans*256;
}
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`// this code come from a52dec/libao/audio_out_oss.c`

			`// FIXME FIXME FIXME`

			`// a52_resample_init should find the requested converter (from type flags ->`
			`// given number of channels) and set up some function pointers...`

			`// a52_resample() should do the conversion.`

MMX opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3570 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 21:19:57 +00:00			`// MMX optimizations from Michael Niedermayer (michaelni@gmx.at) (under GPL)`

			`/* optimization TODO / NOTES`
			`movntq is slightly faster (0.5% with the current test.c benchmark)`
			`(but thats just test.c so that needs to be testd in reallity)`
			`and it would mean (C / MMX2 / MMX / 3DNOW) versions`
			`*/`

resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`#include <inttypes.h>`
			`#include "a52.h"`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3568 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 19:33:19 +00:00			`#include "../config.h"`

			`#ifdef HAVE_MMX`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3575 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-18 00:56:08 +00:00			`static uint64_t __attribute__((aligned(8))) magicF2W= 0x43c0000043c00000LL;`
			`static uint64_t __attribute__((aligned(8))) wm1010= 0xFFFF0000FFFF0000LL;`
			`static uint64_t __attribute__((aligned(8))) wm0101= 0x0000FFFF0000FFFFLL;`
			`static uint64_t __attribute__((aligned(8))) wm1100= 0xFFFFFFFF00000000LL;`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3568 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 19:33:19 +00:00			`#endif`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00
			`static inline int16_t convert (int32_t i)`
			`{`
			`if (i > 0x43c07fff)`
			`return 32767;`
			`else if (i < 0x43bf8000)`
			`return -32768;`
			`else`
			`return i - 0x43c00000;`
			`}`

			`static int chans=2;`
			`static int flags=0;`

			`void a52_resample_init(int _flags,int _chans){`
			`chans=_chans;`
			`flags=_flags;`
			`}`

			`int a52_resample(float * _f, int16_t * s16)`
			`{`
			`int i;`
			`int32_t * f = (int32_t *) _f;`

			`switch (flags) {`
			`case A52_MONO:`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3575 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-18 00:56:08 +00:00			`#ifdef HAVE_MMX`
			`asm volatile(`
			`"movl $-512, %%esi \n\t"`
			`"movq magicF2W, %%mm7 \n\t"`
			`"movq wm1100, %%mm3 \n\t"`
			`"movq wm0101, %%mm4 \n\t"`
			`"movq wm1010, %%mm5 \n\t"`
			`"pxor %%mm6, %%mm6 \n\t"`
			`"1: \n\t"`
			`"movq (%1, %%esi, 2), %%mm0 \n\t"`
			`"movq 8(%1, %%esi, 2), %%mm1 \n\t"`
			`"leal (%%esi, %%esi, 4), %%edi \n\t"`
			`"psubd %%mm7, %%mm0 \n\t"`
			`"psubd %%mm7, %%mm1 \n\t"`
			`"packssdw %%mm1, %%mm0 \n\t"`
			`"movq %%mm0, %%mm1 \n\t"`
			`"pand %%mm4, %%mm0 \n\t"`
			`"pand %%mm5, %%mm1 \n\t"`
			`"movq %%mm6, (%0, %%edi) \n\t" // 0 0 0 0`
			`"movd %%mm0, 8(%0, %%edi) \n\t" // A 0`
			`"pand %%mm3, %%mm0 \n\t"`
			`"movd %%mm6, 12(%0, %%edi) \n\t" // 0 0`
			`"movd %%mm1, 16(%0, %%edi) \n\t" // 0 B`
			`"pand %%mm3, %%mm1 \n\t"`
			`"movd %%mm6, 20(%0, %%edi) \n\t" // 0 0`
			`"movq %%mm0, 24(%0, %%edi) \n\t" // 0 0 C 0`
			`"movq %%mm1, 32(%0, %%edi) \n\t" // 0 0 0 B`
			`"addl $8, %%esi \n\t"`
			`" jnz 1b \n\t"`
			`"emms \n\t"`
			`:: "r" (s16+1280), "r" (f+256)`
			`:"%esi", "%edi", "memory"`
			`);`
			`#else`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`for (i = 0; i < 256; i++) {`
			`s16[5i] = s16[5i+1] = s16[5i+2] = s16[5i+3] = 0;`
			`s16[5*i+4] = convert (f[i]);`
			`}`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3575 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-18 00:56:08 +00:00			`#endif`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`break;`
			`case A52_CHANNEL:`
			`case A52_STEREO:`
			`case A52_DOLBY:`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3568 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 19:33:19 +00:00			`/* benchmark scores are 0.3% better with SSE but we would need to set bias=0 and premultiply it`
			`#ifdef HAVE_SSE`
			`asm volatile(`
			`"movl $-1024, %%esi \n\t"`
			`"1: \n\t"`
			`"cvtps2pi (%1, %%esi), %%mm0 \n\t"`
			`"cvtps2pi 1024(%1, %%esi), %%mm2\n\t"`
			`"movq %%mm0, %%mm1 \n\t"`
			`"punpcklwd %%mm2, %%mm0 \n\t"`
			`"punpckhwd %%mm2, %%mm1 \n\t"`
			`"movq %%mm0, (%0, %%esi) \n\t"`
			`"movq %%mm1, 8(%0, %%esi) \n\t"`
			`"addl $16, %%esi \n\t"`
			`" jnz 1b \n\t"`
			`"emms \n\t"`
			`:: "r" (s16+512), "r" (f+256)`
			`:"%esi", "memory"`
			`);*/`
			`#ifdef HAVE_MMX`
			`asm volatile(`
			`"movl $-1024, %%esi \n\t"`
			`"movq magicF2W, %%mm7 \n\t"`
			`"1: \n\t"`
			`"movq (%1, %%esi), %%mm0 \n\t"`
			`"movq 8(%1, %%esi), %%mm1 \n\t"`
			`"movq 1024(%1, %%esi), %%mm2 \n\t"`
			`"movq 1032(%1, %%esi), %%mm3 \n\t"`
			`"psubd %%mm7, %%mm0 \n\t"`
			`"psubd %%mm7, %%mm1 \n\t"`
			`"psubd %%mm7, %%mm2 \n\t"`
			`"psubd %%mm7, %%mm3 \n\t"`
			`"packssdw %%mm1, %%mm0 \n\t"`
			`"packssdw %%mm3, %%mm2 \n\t"`
			`"movq %%mm0, %%mm1 \n\t"`
			`"punpcklwd %%mm2, %%mm0 \n\t"`
			`"punpckhwd %%mm2, %%mm1 \n\t"`
			`"movq %%mm0, (%0, %%esi) \n\t"`
			`"movq %%mm1, 8(%0, %%esi) \n\t"`
			`"addl $16, %%esi \n\t"`
			`" jnz 1b \n\t"`
			`"emms \n\t"`
			`:: "r" (s16+512), "r" (f+256)`
			`:"%esi", "memory"`
			`);`
			`#else`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`for (i = 0; i < 256; i++) {`
			`s16[2*i] = convert (f[i]);`
			`s16[2*i+1] = convert (f[i+256]);`
			`}`
mmx opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3568 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 19:33:19 +00:00			`#endif`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`break;`
			`case A52_3F:`
			`for (i = 0; i < 256; i++) {`
			`s16[5*i] = convert (f[i]);`
			`s16[5*i+1] = convert (f[i+512]);`
			`s16[5i+2] = s16[5i+3] = 0;`
			`s16[5*i+4] = convert (f[i+256]);`
			`}`
			`break;`
			`case A52_2F2R:`
MMX opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3570 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 21:19:57 +00:00			`#ifdef HAVE_MMX`
			`asm volatile(`
			`"movl $-1024, %%esi \n\t"`
			`"movq magicF2W, %%mm7 \n\t"`
			`"1: \n\t"`
			`"movq (%1, %%esi), %%mm0 \n\t"`
			`"movq 8(%1, %%esi), %%mm1 \n\t"`
			`"movq 1024(%1, %%esi), %%mm2 \n\t"`
			`"movq 1032(%1, %%esi), %%mm3 \n\t"`
			`"psubd %%mm7, %%mm0 \n\t"`
			`"psubd %%mm7, %%mm1 \n\t"`
			`"psubd %%mm7, %%mm2 \n\t"`
			`"psubd %%mm7, %%mm3 \n\t"`
			`"packssdw %%mm1, %%mm0 \n\t"`
			`"packssdw %%mm3, %%mm2 \n\t"`
			`"movq 2048(%1, %%esi), %%mm3 \n\t"`
			`"movq 2056(%1, %%esi), %%mm4 \n\t"`
			`"movq 3072(%1, %%esi), %%mm5 \n\t"`
			`"movq 3080(%1, %%esi), %%mm6 \n\t"`
			`"psubd %%mm7, %%mm3 \n\t"`
			`"psubd %%mm7, %%mm4 \n\t"`
			`"psubd %%mm7, %%mm5 \n\t"`
			`"psubd %%mm7, %%mm6 \n\t"`
			`"packssdw %%mm4, %%mm3 \n\t"`
			`"packssdw %%mm6, %%mm5 \n\t"`
			`"movq %%mm0, %%mm1 \n\t"`
			`"movq %%mm3, %%mm4 \n\t"`
			`"punpcklwd %%mm2, %%mm0 \n\t"`
			`"punpckhwd %%mm2, %%mm1 \n\t"`
			`"punpcklwd %%mm5, %%mm3 \n\t"`
			`"punpckhwd %%mm5, %%mm4 \n\t"`
			`"movq %%mm0, %%mm2 \n\t"`
			`"movq %%mm1, %%mm5 \n\t"`
			`"punpckldq %%mm3, %%mm0 \n\t"`
			`"punpckhdq %%mm3, %%mm2 \n\t"`
			`"punpckldq %%mm4, %%mm1 \n\t"`
			`"punpckhdq %%mm4, %%mm5 \n\t"`
			`"movq %%mm0, (%0, %%esi,2) \n\t"`
			`"movq %%mm2, 8(%0, %%esi,2) \n\t"`
			`"movq %%mm1, 16(%0, %%esi,2) \n\t"`
			`"movq %%mm5, 24(%0, %%esi,2) \n\t"`
			`"addl $16, %%esi \n\t"`
			`" jnz 1b \n\t"`
			`"emms \n\t"`
			`:: "r" (s16+1024), "r" (f+256)`
			`:"%esi", "memory"`
			`);`
			`#else`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`for (i = 0; i < 256; i++) {`
			`s16[4*i] = convert (f[i]);`
			`s16[4*i+1] = convert (f[i+256]);`
			`s16[4*i+2] = convert (f[i+512]);`
			`s16[4*i+3] = convert (f[i+768]);`
			`}`
MMX opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3570 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 21:19:57 +00:00			`#endif`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`break;`
			`case A52_3F2R:`
			`for (i = 0; i < 256; i++) {`
			`s16[5*i] = convert (f[i]);`
			`s16[5*i+1] = convert (f[i+512]);`
			`s16[5*i+2] = convert (f[i+768]);`
			`s16[5*i+3] = convert (f[i+1024]);`
			`s16[5*i+4] = convert (f[i+256]);`
			`}`
			`break;`
			`case A52_MONO \| A52_LFE:`
MMX opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3570 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 21:19:57 +00:00			`#ifdef HAVE_MMX`
			`asm volatile(`
			`"movl $-1024, %%esi \n\t"`
			`"movq magicF2W, %%mm7 \n\t"`
			`"pxor %%mm6, %%mm6 \n\t"`
			`"1: \n\t"`
			`"movq 1024(%1, %%esi), %%mm0 \n\t"`
			`"movq 1032(%1, %%esi), %%mm1 \n\t"`
			`"movq (%1, %%esi), %%mm2 \n\t"`
			`"movq 8(%1, %%esi), %%mm3 \n\t"`
			`"psubd %%mm7, %%mm0 \n\t"`
			`"psubd %%mm7, %%mm1 \n\t"`
			`"psubd %%mm7, %%mm2 \n\t"`
			`"psubd %%mm7, %%mm3 \n\t"`
			`"packssdw %%mm1, %%mm0 \n\t"`
			`"packssdw %%mm3, %%mm2 \n\t"`
			`"movq %%mm0, %%mm1 \n\t"`
			`"punpcklwd %%mm2, %%mm0 \n\t"`
			`"punpckhwd %%mm2, %%mm1 \n\t"`
			`"leal (%%esi, %%esi, 2), %%edi \n\t"`
			`"movq %%mm6, (%0, %%edi) \n\t"`
			`"movd %%mm0, 8(%0, %%edi) \n\t"`
			`"punpckhdq %%mm0, %%mm0 \n\t"`
			`"movq %%mm6, 12(%0, %%edi) \n\t"`
			`"movd %%mm0, 20(%0, %%edi) \n\t"`
			`"movq %%mm6, 24(%0, %%edi) \n\t"`
			`"movd %%mm1, 32(%0, %%edi) \n\t"`
			`"punpckhdq %%mm1, %%mm1 \n\t"`
			`"movq %%mm6, 36(%0, %%edi) \n\t"`
			`"movd %%mm1, 44(%0, %%edi) \n\t"`
			`"addl $16, %%esi \n\t"`
			`" jnz 1b \n\t"`
			`"emms \n\t"`
			`:: "r" (s16+1536), "r" (f+256)`
			`:"%esi", "%edi", "memory"`
			`);`
			`#else`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`for (i = 0; i < 256; i++) {`
			`s16[6i] = s16[6i+1] = s16[6i+2] = s16[6i+3] = 0;`
			`s16[6*i+4] = convert (f[i+256]);`
			`s16[6*i+5] = convert (f[i]);`
			`}`
MMX opt git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3570 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-17 21:19:57 +00:00			`#endif`
resample.c added - float->int conversion and channel ordering git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@3413 b3059339-0415-0410-9bf9-f77b7e298cf2 2001-12-09 19:23:15 +00:00			`break;`
			`case A52_CHANNEL \| A52_LFE:`
			`case A52_STEREO \| A52_LFE:`
			`case A52_DOLBY \| A52_LFE:`
			`for (i = 0; i < 256; i++) {`
			`s16[6*i] = convert (f[i+256]);`
			`s16[6*i+1] = convert (f[i+512]);`
			`s16[6i+2] = s16[6i+3] = s16[6*i+4] = 0;`
			`s16[6*i+5] = convert (f[i]);`
			`}`
			`break;`
			`case A52_3F \| A52_LFE:`
			`for (i = 0; i < 256; i++) {`
			`s16[6*i] = convert (f[i+256]);`
			`s16[6*i+1] = convert (f[i+768]);`
			`s16[6i+2] = s16[6i+3] = 0;`
			`s16[6*i+4] = convert (f[i+512]);`
			`s16[6*i+5] = convert (f[i]);`
			`}`
			`break;`
			`case A52_2F2R \| A52_LFE:`
			`for (i = 0; i < 256; i++) {`
			`s16[6*i] = convert (f[i+256]);`
			`s16[6*i+1] = convert (f[i+512]);`
			`s16[6*i+2] = convert (f[i+768]);`
			`s16[6*i+3] = convert (f[i+1024]);`
			`s16[6*i+4] = 0;`
			`s16[6*i+5] = convert (f[i]);`
			`}`
			`break;`
			`case A52_3F2R \| A52_LFE:`
			`for (i = 0; i < 256; i++) {`
			`s16[6*i] = convert (f[i+256]);`
			`s16[6*i+1] = convert (f[i+768]);`
			`s16[6*i+2] = convert (f[i+1024]);`
			`s16[6*i+3] = convert (f[i+1280]);`
			`s16[6*i+4] = convert (f[i+512]);`
			`s16[6*i+5] = convert (f[i]);`
			`}`
			`break;`
			`}`
			`return chans*256;`
			`}`