Subversion Repositories Kolibri OS

Rev

Blame | Last modification | View Log | RSS feed

  1. /*
  2.  * All Video Processing kernels
  3.  * Copyright © <2010>, Intel Corporation.
  4.  *
  5.  * This program is licensed under the terms and conditions of the
  6.  * Eclipse Public License (EPL), version 1.0.  The full text of the EPL is at
  7.  * http://www.opensource.org/licenses/eclipse-1.0.php.
  8.  *
  9.  * Authors:
  10.  *    Halley Zhao <halley.zhao@intel.com>
  11.  */
  12.  
  13. // Module name: YUV_to_RGBX_Coef.asm
  14. //----------------------------------------------------------------
  15. #define ubDEST_RGBX          ubTOP_Y       // I'd like use them for color conversion
  16.  
  17. // is dst surface |R|G|B|X| layout? otherwise, it is |B|G|R|X| layout
  18. and.nz.f0.1 (1) dNULLREG     r1.2:ud         0xFF000000:ud      
  19. #ifdef FIX_POINT_CONVERSION
  20.    // ###### set up transformation coefficient
  21.        // R = clip((   298 * C +   0 * D +    409 * E + 128) >> 8)
  22.        // R = clip((0x012A * C +   0 * D + 0x0199 * E + 128) >> 8)
  23.    (-f0.1) mov (1) REG2(r, nTEMP0, 0):ud       0x0000012A:ud      
  24.    (-f0.1) mov (1) REG2(r, nTEMP0, 1):ud       0x00000199:ud      
  25.    ( f0.1) mov (1) REG2(r, nTEMP0, 4):ud       0x0000012A:ud      
  26.    ( f0.1) mov (1) REG2(r, nTEMP0, 5):ud       0x00000199:ud      
  27.  
  28.        // G = clip((    298 * C -    100 * D -    208 * E + 128) >> 8)
  29.        // G = clip(( 0x012A * C -   0x64 * D -   0xD0 * E + 128) >> 8)
  30.        // G = clip(( 0x012A * C + 0xFF9C * D + 0xFF30 * E + 128) >> 8)
  31.    mov (1) REG2(r, nTEMP0, 2):ud       0xFF9C012A:ud      
  32.    mov (1) REG2(r, nTEMP0, 3):ud       0x0000FF30:ud      
  33.  
  34.        // B = clip((  298 * C +    516 * D +   0 * E + 128) >> 8)
  35.        // B = clip((0x012A* C + 0x0204 * D +   0 * E + 128) >> 8)
  36.    (-f0.1) mov (1) REG2(r, nTEMP0, 4):ud       0x0204012A:ud
  37.    (-f0.1) mov (1) REG2(r, nTEMP0, 5):ud       0x00000000:ud
  38.    ( f0.1) mov (1) REG2(r, nTEMP0, 0):ud       0x0204012A:ud
  39.    ( f0.1) mov (1) REG2(r, nTEMP0, 1):ud       0x00000000:ud
  40.  
  41.    // asr.sat (24) REG2(r,nTEMP0,0)<1>    REG2(r,nTEMP0,0)<0;24,1>    1:w
  42.    asr.sat (8) REG2(r,nTEMP0, 0)<1>:w    REG2(r,nTEMP0, 0)<0;8,1>:w    1:w
  43.    asr.sat (4)  REG2(r,nTEMP0,8)<1>:w    REG2(r,nTEMP0,8)<0;4,1>:w    1:w
  44.    
  45.        // C = Y' - 16          D = U - 128         E = V - 128
  46.     mov (1) REG2(r, nTEMP0, 6):ud       0x008080F0:ud
  47.  
  48.     #define wYUV_to_RGB_CH2_Coef_Fix        REG2(r, nTEMP0, 0)
  49.     #define wYUV_to_RGB_CH1_Coef_Fix        REG2(r, nTEMP0, 4)
  50.     #define wYUV_to_RGB_CH0_Coef_Fix        REG2(r, nTEMP0, 8)
  51.     #define bYUV_OFF                        REG2(r,nTEMP0,24)
  52.  
  53.     // debug use
  54.     #define bYUV_to_RGB_CH2_Coef_Fix        REG2(r, nTEMP0, 0)
  55.     #define bYUV_to_RGB_CH1_Coef_Fix        REG2(r, nTEMP0, 8)
  56.     #define bYUV_to_RGB_CH0_Coef_Fix        REG2(r, nTEMP0, 16)
  57.  
  58. #else
  59.         // R = Y             + 1.13983*V
  60.         // R = clip( Y                  + 1.402*(Cr-128))  // ITU-R
  61.     (-f0.1) mov (1) REG2(r, nTEMP8, 3):f       0.000f       // A coef
  62.     (-f0.1) mov (1) REG2(r, nTEMP8, 2):f       1.402f       // V coef
  63.     (-f0.1) mov (1) REG2(r, nTEMP8, 1):f       0.0f         // U coef
  64.     (-f0.1) mov (1) REG2(r, nTEMP8, 0):f       1.0f         // Y coef
  65.  
  66.     ( f0.1) mov (1) REG2(r, nTEMP10, 3):f       0.000f       // A coef
  67.     ( f0.1) mov (1) REG2(r, nTEMP10, 2):f       1.402f       // V coef
  68.     ( f0.1) mov (1) REG2(r, nTEMP10, 1):f       0.0f         // U coef
  69.     ( f0.1) mov (1) REG2(r, nTEMP10, 0):f       1.0f         // Y coef
  70.    
  71.         // G = Y - 0.39465*U - 0.58060*V
  72.         // G = clip( Y - 0.344*(Cb-128) - 0.714*(Cr-128))
  73.     mov (1) REG2(r, nTEMP8, 7):f       0.000f       // A coef
  74.     mov (1) REG2(r, nTEMP8, 6):f      -0.714f       // V coef
  75.     mov (1) REG2(r, nTEMP8, 5):f      -0.344f       // U coef
  76.     mov (1) REG2(r, nTEMP8, 4):f       1.0f         // Y coef
  77.  
  78.         // B = Y + 2.03211*U
  79.         // B = clip( Y + 1.772*(Cb-128))
  80.     (-f0.1) mov (1) REG2(r, nTEMP10, 3):f       0.000f      // A coef
  81.     (-f0.1) mov (1) REG2(r, nTEMP10, 2):f       0.0f        // V coef
  82.     (-f0.1) mov (1) REG2(r, nTEMP10, 1):f       1.772f      // U coef
  83.     (-f0.1) mov (1) REG2(r, nTEMP10, 0):f       1.0f        // Y coef
  84.  
  85.     ( f0.1) mov (1) REG2(r, nTEMP8, 3):f       0.000f      // A coef
  86.     ( f0.1) mov (1) REG2(r, nTEMP8, 2):f       0.0f        // V coef
  87.     ( f0.1) mov (1) REG2(r, nTEMP8, 1):f       1.772f      // U coef
  88.     ( f0.1) mov (1) REG2(r, nTEMP8, 0):f       1.0f        // Y coef
  89.  
  90.     mov (1) REG2(r, nTEMP10,  4):ud         0x008080F0:ud
  91.  
  92.     #define fYUV_to_RGB_CH2_Coef_Float          REG2(r, nTEMP8, 0)
  93.     #define fYUV_to_RGB_CH1_Coef_Float          REG2(r, nTEMP8, 4)
  94.     #define fYUV_to_RGB_CH0_Coef_Float          REG2(r, nTEMP10, 0)
  95.     #define bYUV_OFF                            REG2(r,nTEMP10,16)
  96.  
  97.     .declare fROW_YUVA       Base=REG(r,nTEMP0) ElementSize=4 SrcRegion=REGION(8,8) Type=f    // r nTEMP0 - r nTEMP7
  98.  
  99. #endif
  100.