Subversion Repositories Kolibri OS

Rev

Blame | Last modification | View Log | RSS feed

  1. /*
  2.  * All Video Processing kernels
  3.  * Copyright © <2010>, Intel Corporation.
  4.  *
  5.  * This program is licensed under the terms and conditions of the
  6.  * Eclipse Public License (EPL), version 1.0.  The full text of the EPL is at
  7.  * http://www.opensource.org/licenses/eclipse-1.0.php.
  8.  *
  9.  */
  10.  
  11. // Module name: NV12_Load_8x4.asm
  12. //----------------------------------------------------------------
  13.  
  14. #define  NV12_LOAD_8x4
  15. #include "PL2_Load.inc"
  16.  
  17. // Load 16x8 planar Y ----------------------------------------------------------
  18.     add  (2) rMSGSRC.0<1>:d     wORIX<2;2,1>:w    wSRC_H_ORI_OFFSET<2;2,1>:w       // Source Y Block origin
  19. #if !defined(LOAD_UV_ONLY)
  20.     mov  (1) rMSGSRC.2<1>:ud    nDPR_BLOCK_SIZE_Y:ud                               // Y block width and height (16x8)
  21.     mov  (8) mMSGHDRY<1>:ud     rMSGSRC<8;8,1>:ud
  22.     send (8) udSRC_Y(0)<1>      mMSGHDRY    udDUMMY_NULL    nDATAPORT_READ    nDPMR_MSGDSC+nDPR_MSG_SIZE_Y+nBI_CURRENT_SRC_Y:ud
  23. #endif
  24.  
  25. // Load 8x4 planar U and V -----------------------------------------------------
  26.     asr (1)  rMSGSRC.1<1>:d     rMSGSRC.1<0;1,0>:d       1:w   // U/V block origin should be half of Y's
  27.     mov (1)  rMSGSRC.2<1>:ud    nDPR_BLOCK_SIZE_UV:ud          // U/V block width and height (16x4)
  28.     mov  (8) mMSGHDRU<1>:ud     rMSGSRC<8;8,1>:ud
  29.     send (8) udSRC_U(0)<1>      mMSGHDRU    udDUMMY_NULL    nDATAPORT_READ    nDPMR_MSGDSC+nDPR_MSG_SIZE_UV+nBI_CURRENT_SRC_UV:ud
  30.  
  31. // Convert to word-aligned format ----------------------------------------------
  32. #if defined(FIX_POINT_CONVERSION) || defined(FLOAT_POINT_CONVERSION)
  33.     // load NV12 and save it as packed AYUV to dst (64x8)
  34.  
  35.     $for (nY_NUM_OF_ROWS-1; >-1; -1) {
  36.         // #### Y
  37.         mov (8)  ubDEST_Y(0,%1*16*4)<4>             ubSRC_Y(0,%1*16)<0;8,1>
  38.         mov (8)  ubDEST_Y(0,(%1*16+8)*4)<4>         ubSRC_Y(0,%1*16+8)<0;8,1>
  39.  
  40.         // #### U/V
  41.         // error from compile: "Invalid horiz size 8", so I have to repeat UV first
  42.         // mov (4)  ubDEST_Y(0,%1*16*4+1)<8>                   ubSRC_U(0,%1/2*16)<0;4,2>
  43.         // mov (4)  ubDEST_Y(0,%1*16*4+1+32)<8>                ubSRC_U(0,%1/2*16+8)<0;4,2>
  44.        
  45.         // repeate U/V for each one
  46.         mov (8)     REG2(r,nTEMP18,0)<2>:uw                 uwSRC_U(0,%1/2*8)<0;8,1>
  47.         mov (8)     REG2(r,nTEMP18,1)<2>:uw                 uwSRC_U(0,%1/2*8)<0;8,1>
  48.        
  49.         // mov U/V to ubDEST
  50.         mov (8)    ubDEST_Y(0,%1*16*4+1)<4>             REG2(r,nTEMP18,0)<0;8,2>:ub
  51.         mov (8)    ubDEST_Y(0,%1*16*4+1+32)<4>          REG2(r,nTEMP18,16)<0;8,2>:ub
  52.  
  53.         mov (8)    ubDEST_Y(0,%1*16*4+2)<4>             REG2(r,nTEMP18,1)<0;8,2>:ub
  54.         mov (8)    ubDEST_Y(0,%1*16*4+2+32)<4>          REG2(r,nTEMP18,17)<0;8,2>:ub
  55.     }
  56. #else
  57.   #if !defined(LOAD_UV_ONLY)
  58.     $for (nY_NUM_OF_ROWS-1; >-1; -1) {
  59.         mov (16)  uwDEST_Y(0,%1*16)<1>      ubSRC_Y(0,%1*16)
  60.     }
  61.   #endif
  62.     $for (nUV_NUM_OF_ROWS/2-1; >-1; -1) {
  63.         // why "mov (16)"? should it be 8?
  64.         mov (16)  uwDEST_U(0,%1*16)<1>      ubSRC_U(0,%1*32)<32;16,2>
  65.         mov (16)  uwDEST_V(0,%1*16)<1>      ubSRC_U(0,%1*32+1)<32;16,2>
  66.     }
  67.  
  68. #endif    
  69.  
  70. // End of NV12_Load_8x4
  71.