Subversion Repositories Kolibri OS

Rev

Blame | Last modification | View Log | RSS feed

  1. /*
  2.  * All Video Processing kernels
  3.  * Copyright © <2010>, Intel Corporation.
  4.  *
  5.  * This program is licensed under the terms and conditions of the
  6.  * Eclipse Public License (EPL), version 1.0.  The full text of the EPL is at
  7.  * http://www.opensource.org/licenses/eclipse-1.0.php.
  8.  *
  9.  */
  10.  
  11. //---------- PL3_AVS_IEF_Unpack_16x8.asm ----------
  12.        
  13. #ifdef AVS_OUTPUT_16_BIT        //Output is packed in AVYU format
  14. // Move first 8x8 words of Y to dest GRF (as packed)
  15.     mov (4) uwDEST_Y(0,1)<4>       uwAVS_RESPONSE(0,0)<4;4,1>                                      
  16.     mov (4) uwDEST_Y(1,1)<4>       uwAVS_RESPONSE(0,8)<4;4,1>                                      
  17.     mov (4) uwDEST_Y(4,1)<4>       uwAVS_RESPONSE(0,4)<4;4,1>                                    
  18.     mov (4) uwDEST_Y(5,1)<4>       uwAVS_RESPONSE(0,12)<4;4,1>                                    
  19.     mov (4) uwDEST_Y(8,1)<4>       uwAVS_RESPONSE(1,0)<4;4,1>                                      
  20.     mov (4) uwDEST_Y(9,1)<4>       uwAVS_RESPONSE(1,8)<4;4,1>                                      
  21.     mov (4) uwDEST_Y(12,1)<4>      uwAVS_RESPONSE(1,4)<4;4,1>                                    
  22.     mov (4) uwDEST_Y(13,1)<4>      uwAVS_RESPONSE(1,12)<4;4,1>                                    
  23.     mov (4) uwDEST_Y(16,1)<4>      uwAVS_RESPONSE(2,0)<4;4,1>                                    
  24.     mov (4) uwDEST_Y(17,1)<4>      uwAVS_RESPONSE(2,8)<4;4,1>                                    
  25.     mov (4) uwDEST_Y(20,1)<4>      uwAVS_RESPONSE(2,4)<4;4,1>                                  
  26.     mov (4) uwDEST_Y(21,1)<4>      uwAVS_RESPONSE(2,12)<4;4,1>                                  
  27.     mov (4) uwDEST_Y(24,1)<4>      uwAVS_RESPONSE(3,0)<4;4,1>                                    
  28.     mov (4) uwDEST_Y(25,1)<4>      uwAVS_RESPONSE(3,8)<4;4,1>                                    
  29.     mov (4) uwDEST_Y(28,1)<4>      uwAVS_RESPONSE(3,4)<4;4,1>                                  
  30.     mov (4) uwDEST_Y(29,1)<4>      uwAVS_RESPONSE(3,12)<4;4,1>                                  
  31.  
  32. // Move first 8x8 words of U to dest GRF (as packed)
  33.     mov (4) uwDEST_Y(0,0)<4>       uwAVS_RESPONSE(4,0)<4;4,1>                                      
  34.     mov (4) uwDEST_Y(1,0)<4>       uwAVS_RESPONSE(4,8)<4;4,1>                                      
  35.     mov (4) uwDEST_Y(4,0)<4>       uwAVS_RESPONSE(4,4)<4;4,1>                                    
  36.     mov (4) uwDEST_Y(5,0)<4>       uwAVS_RESPONSE(4,12)<4;4,1>                                    
  37.     mov (4) uwDEST_Y(8,0)<4>       uwAVS_RESPONSE(5,0)<4;4,1>                                      
  38.     mov (4) uwDEST_Y(9,0)<4>       uwAVS_RESPONSE(5,8)<4;4,1>                                      
  39.     mov (4) uwDEST_Y(12,0)<4>      uwAVS_RESPONSE(5,4)<4;4,1>                                    
  40.     mov (4) uwDEST_Y(13,0)<4>      uwAVS_RESPONSE(5,12)<4;4,1>                                    
  41.     mov (4) uwDEST_Y(16,0)<4>      uwAVS_RESPONSE(6,0)<4;4,1>                                    
  42.     mov (4) uwDEST_Y(17,0)<4>      uwAVS_RESPONSE(6,8)<4;4,1>                                    
  43.     mov (4) uwDEST_Y(20,0)<4>      uwAVS_RESPONSE(6,4)<4;4,1>                                  
  44.     mov (4) uwDEST_Y(21,0)<4>      uwAVS_RESPONSE(6,12)<4;4,1>                                  
  45.     mov (4) uwDEST_Y(24,0)<4>      uwAVS_RESPONSE(7,0)<4;4,1>                                    
  46.     mov (4) uwDEST_Y(25,0)<4>      uwAVS_RESPONSE(7,8)<4;4,1>                                    
  47.     mov (4) uwDEST_Y(28,0)<4>      uwAVS_RESPONSE(7,4)<4;4,1>                                  
  48.     mov (4) uwDEST_Y(29,0)<4>      uwAVS_RESPONSE(7,12)<4;4,1>                                  
  49.  
  50. // Move first 8x8 words of V to dest GRF (as packed)
  51.     mov (4) uwDEST_Y(0,2)<4>       uwAVS_RESPONSE(8,0)<4;4,1>                                      
  52.     mov (4) uwDEST_Y(1,2)<4>       uwAVS_RESPONSE(8,8)<4;4,1>                                      
  53.     mov (4) uwDEST_Y(4,2)<4>       uwAVS_RESPONSE(8,4)<4;4,1>                                    
  54.     mov (4) uwDEST_Y(5,2)<4>       uwAVS_RESPONSE(8,12)<4;4,1>                                    
  55.     mov (4) uwDEST_Y(8,2)<4>       uwAVS_RESPONSE(9,0)<4;4,1>                                      
  56.     mov (4) uwDEST_Y(9,2)<4>       uwAVS_RESPONSE(9,8)<4;4,1>                                      
  57.     mov (4) uwDEST_Y(12,2)<4>      uwAVS_RESPONSE(9,4)<4;4,1>                                    
  58.     mov (4) uwDEST_Y(13,2)<4>      uwAVS_RESPONSE(9,12)<4;4,1>                                    
  59.     mov (4) uwDEST_Y(16,2)<4>      uwAVS_RESPONSE(10,0)<4;4,1>                                    
  60.     mov (4) uwDEST_Y(17,2)<4>      uwAVS_RESPONSE(10,8)<4;4,1>                                    
  61.     mov (4) uwDEST_Y(20,2)<4>      uwAVS_RESPONSE(10,4)<4;4,1>                                  
  62.     mov (4) uwDEST_Y(21,2)<4>      uwAVS_RESPONSE(10,12)<4;4,1>                                  
  63.     mov (4) uwDEST_Y(24,2)<4>      uwAVS_RESPONSE(11,0)<4;4,1>                                    
  64.     mov (4) uwDEST_Y(25,2)<4>      uwAVS_RESPONSE(11,8)<4;4,1>                                    
  65.     mov (4) uwDEST_Y(28,2)<4>      uwAVS_RESPONSE(11,4)<4;4,1>                                  
  66.     mov (4) uwDEST_Y(29,2)<4>      uwAVS_RESPONSE(11,12)<4;4,1>                                  
  67.  
  68. // Move first 8x8 words of A to dest GRF (as packed)
  69.     mov (4) uwDEST_Y(0,3)<4>       0:uw                                    
  70.     mov (4) uwDEST_Y(1,3)<4>       0:uw                                    
  71.     mov (4) uwDEST_Y(4,3)<4>       0:uw                                  
  72.     mov (4) uwDEST_Y(5,3)<4>       0:uw                                  
  73.     mov (4) uwDEST_Y(8,3)<4>       0:uw                                    
  74.     mov (4) uwDEST_Y(9,3)<4>       0:uw                                    
  75.     mov (4) uwDEST_Y(12,3)<4>      0:uw                                  
  76.     mov (4) uwDEST_Y(13,3)<4>      0:uw                                  
  77.     mov (4) uwDEST_Y(16,3)<4>      0:uw                                    
  78.     mov (4) uwDEST_Y(17,3)<4>      0:uw                                    
  79.     mov (4) uwDEST_Y(20,3)<4>      0:uw                                  
  80.     mov (4) uwDEST_Y(21,3)<4>      0:uw                                  
  81.     mov (4) uwDEST_Y(24,3)<4>      0:uw                                    
  82.     mov (4) uwDEST_Y(25,3)<4>      0:uw                                    
  83.     mov (4) uwDEST_Y(28,3)<4>      0:uw                                  
  84.     mov (4) uwDEST_Y(29,3)<4>      0:uw                                  
  85.  
  86. // Move second 8x8 words of Y to dest GRF
  87.     mov (4) uwDEST_Y(2,1)<4>       uwAVS_RESPONSE_2(0,0)<4;4,1>                                      
  88.     mov (4) uwDEST_Y(3,1)<4>       uwAVS_RESPONSE_2(0,8)<4;4,1>                                      
  89.     mov (4) uwDEST_Y(6,1)<4>       uwAVS_RESPONSE_2(0,4)<4;4,1>                                    
  90.     mov (4) uwDEST_Y(7,1)<4>       uwAVS_RESPONSE_2(0,12)<4;4,1>                                    
  91.     mov (4) uwDEST_Y(10,1)<4>      uwAVS_RESPONSE_2(1,0)<4;4,1>                                      
  92.     mov (4) uwDEST_Y(11,1)<4>      uwAVS_RESPONSE_2(1,8)<4;4,1>                                      
  93.     mov (4) uwDEST_Y(14,1)<4>      uwAVS_RESPONSE_2(1,4)<4;4,1>                                    
  94.     mov (4) uwDEST_Y(15,1)<4>      uwAVS_RESPONSE_2(1,12)<4;4,1>                                    
  95.     mov (4) uwDEST_Y(18,1)<4>      uwAVS_RESPONSE_2(2,0)<4;4,1>                                    
  96.     mov (4) uwDEST_Y(19,1)<4>      uwAVS_RESPONSE_2(2,8)<4;4,1>                                    
  97.     mov (4) uwDEST_Y(22,1)<4>      uwAVS_RESPONSE_2(2,4)<4;4,1>                                  
  98.     mov (4) uwDEST_Y(23,1)<4>      uwAVS_RESPONSE_2(2,12)<4;4,1>                                  
  99.     mov (4) uwDEST_Y(26,1)<4>      uwAVS_RESPONSE_2(3,0)<4;4,1>                                    
  100.     mov (4) uwDEST_Y(27,1)<4>      uwAVS_RESPONSE_2(3,8)<4;4,1>                                    
  101.     mov (4) uwDEST_Y(30,1)<4>      uwAVS_RESPONSE_2(3,4)<4;4,1>                                  
  102.     mov (4) uwDEST_Y(31,1)<4>      uwAVS_RESPONSE_2(3,12)<4;4,1>                                  
  103.  
  104. // Move second 8x8 words of U to dest GRF
  105.     mov (4) uwDEST_Y(2,0)<4>       uwAVS_RESPONSE_2(4,0)<4;4,1>                                      
  106.     mov (4) uwDEST_Y(3,0)<4>       uwAVS_RESPONSE_2(4,8)<4;4,1>                                      
  107.     mov (4) uwDEST_Y(6,0)<4>       uwAVS_RESPONSE_2(4,4)<4;4,1>                                    
  108.     mov (4) uwDEST_Y(7,0)<4>       uwAVS_RESPONSE_2(4,12)<4;4,1>                                    
  109.     mov (4) uwDEST_Y(10,0)<4>      uwAVS_RESPONSE_2(5,0)<4;4,1>                                      
  110.     mov (4) uwDEST_Y(11,0)<4>      uwAVS_RESPONSE_2(5,8)<4;4,1>                                      
  111.     mov (4) uwDEST_Y(14,0)<4>      uwAVS_RESPONSE_2(5,4)<4;4,1>                                    
  112.     mov (4) uwDEST_Y(15,0)<4>      uwAVS_RESPONSE_2(5,12)<4;4,1>                                    
  113.     mov (4) uwDEST_Y(18,0)<4>      uwAVS_RESPONSE_2(6,0)<4;4,1>                                    
  114.     mov (4) uwDEST_Y(19,0)<4>      uwAVS_RESPONSE_2(6,8)<4;4,1>                                    
  115.     mov (4) uwDEST_Y(22,0)<4>      uwAVS_RESPONSE_2(6,4)<4;4,1>                                  
  116.     mov (4) uwDEST_Y(23,0)<4>      uwAVS_RESPONSE_2(6,12)<4;4,1>                                  
  117.     mov (4) uwDEST_Y(26,0)<4>      uwAVS_RESPONSE_2(7,0)<4;4,1>                                    
  118.     mov (4) uwDEST_Y(27,0)<4>      uwAVS_RESPONSE_2(7,8)<4;4,1>                                    
  119.     mov (4) uwDEST_Y(30,0)<4>      uwAVS_RESPONSE_2(7,4)<4;4,1>                                  
  120.     mov (4) uwDEST_Y(31,0)<4>      uwAVS_RESPONSE_2(7,12)<4;4,1>                                  
  121.  
  122. // Move second 8x8 words of V to dest GRF
  123.     mov (4) uwDEST_Y(2,2)<4>       uwAVS_RESPONSE_2(8,0)<4;4,1>                                      
  124.     mov (4) uwDEST_Y(3,2)<4>       uwAVS_RESPONSE_2(8,8)<4;4,1>                                      
  125.     mov (4) uwDEST_Y(6,2)<4>       uwAVS_RESPONSE_2(8,4)<4;4,1>                                    
  126.     mov (4) uwDEST_Y(7,2)<4>       uwAVS_RESPONSE_2(8,12)<4;4,1>                                    
  127.     mov (4) uwDEST_Y(10,2)<4>      uwAVS_RESPONSE_2(9,0)<4;4,1>                                      
  128.     mov (4) uwDEST_Y(11,2)<4>      uwAVS_RESPONSE_2(9,8)<4;4,1>                                      
  129.     mov (4) uwDEST_Y(14,2)<4>      uwAVS_RESPONSE_2(9,4)<4;4,1>                                    
  130.     mov (4) uwDEST_Y(15,2)<4>      uwAVS_RESPONSE_2(9,12)<4;4,1>                                    
  131.     mov (4) uwDEST_Y(18,2)<4>      uwAVS_RESPONSE_2(10,0)<4;4,1>                                    
  132.     mov (4) uwDEST_Y(19,2)<4>      uwAVS_RESPONSE_2(10,8)<4;4,1>                                    
  133.     mov (4) uwDEST_Y(22,2)<4>      uwAVS_RESPONSE_2(10,4)<4;4,1>                                  
  134.     mov (4) uwDEST_Y(23,2)<4>      uwAVS_RESPONSE_2(10,12)<4;4,1>                                  
  135.     mov (4) uwDEST_Y(26,2)<4>      uwAVS_RESPONSE_2(11,0)<4;4,1>                                    
  136.     mov (4) uwDEST_Y(27,2)<4>      uwAVS_RESPONSE_2(11,8)<4;4,1>                                    
  137.     mov (4) uwDEST_Y(30,2)<4>      uwAVS_RESPONSE_2(11,4)<4;4,1>                                  
  138.     mov (4) uwDEST_Y(31,2)<4>      uwAVS_RESPONSE_2(11,12)<4;4,1>                                  
  139.  
  140. // Move second 8x8 words of A to dest GRF
  141.     mov (4) uwDEST_Y(2,3)<4>       0:uw                                    
  142.     mov (4) uwDEST_Y(3,3)<4>       0:uw                                    
  143.     mov (4) uwDEST_Y(6,3)<4>       0:uw                                  
  144.     mov (4) uwDEST_Y(7,3)<4>       0:uw                                  
  145.     mov (4) uwDEST_Y(10,3)<4>      0:uw                                    
  146.     mov (4) uwDEST_Y(11,3)<4>      0:uw                                    
  147.     mov (4) uwDEST_Y(14,3)<4>      0:uw                                  
  148.     mov (4) uwDEST_Y(15,3)<4>      0:uw                                  
  149.     mov (4) uwDEST_Y(18,3)<4>      0:uw                                    
  150.     mov (4) uwDEST_Y(19,3)<4>      0:uw                                    
  151.     mov (4) uwDEST_Y(22,3)<4>      0:uw                                  
  152.     mov (4) uwDEST_Y(23,3)<4>      0:uw                                  
  153.     mov (4) uwDEST_Y(26,3)<4>      0:uw                                    
  154.     mov (4) uwDEST_Y(27,3)<4>      0:uw                                    
  155.     mov (4) uwDEST_Y(30,3)<4>      0:uw                                  
  156.     mov (4) uwDEST_Y(31,3)<4>      0:uw                                  
  157.  
  158. /*      This section will be used if 16-bit output is needed in planar format -vK
  159.     // Move 1st 8x8 words of Y to dest GRF at lower 8 words of each RGF.
  160.     $for(0; <8/2; 1) {
  161.         mov (8) uwDEST_Y(%1*2)<1>          uwAVS_RESPONSE(%1)<8;4,1>        
  162.         mov (8) uwDEST_Y(%1*2+1)<1>        uwAVS_RESPONSE(%1,8)<8;4,1>      
  163.     }
  164.  
  165.     // Move 8x8 words of U to dest GRF  
  166.     $for(0; <8/2; 1) {
  167.         mov (8) uwDEST_U(%1*2)<1>          uwAVS_RESPONSE(%1+4)<8;4,1>  
  168.         mov (8) uwDEST_U(%1*2+1)<1>        uwAVS_RESPONSE(%1+4,8)<8;4,1>
  169.     }
  170.  
  171.     // Move 8x8 words of V to dest GRF  
  172.     $for(0; <8/2; 1) {
  173.         mov (8) uwDEST_V(%1*2)<1>          uwAVS_RESPONSE(%1+8)<8;4,1>      
  174.         mov (8) uwDEST_V(%1*2+1)<1>        uwAVS_RESPONSE(%1+8,8)<8;4,1>    
  175.     }
  176.  
  177.     // Move 2nd 8x8 words of Y to dest GRF  
  178.     $for(0; <8/2; 1) {
  179.         mov (8) uwDEST_Y(%1*2,8)<1>          uwAVS_RESPONSE_2(%1)<8;4,1>        
  180.         mov (8) uwDEST_Y(%1*2+1,8)<1>        uwAVS_RESPONSE_2(%1,8)<8;4,1>      
  181.     }
  182.  
  183.     // Move 2nd 8x8 words of U to dest GRF  
  184.     $for(0; <8/2; 1) {
  185.         mov (8) uwDEST_U(%1*2,8)<1>          uwAVS_RESPONSE_2(%1+4)<8;4,1>  
  186.         mov (8) uwDEST_U(%1*2+1,8)<1>        uwAVS_RESPONSE_2(%1+4,8)<8;4,1>
  187.     }
  188.  
  189.     // Move 2nd 8x8 words of V to dest GRF  
  190.     $for(0; <8/2; 1) {
  191.         mov (8) uwDEST_V(%1*2,8)<1>          uwAVS_RESPONSE_2(%1+8)<8;4,1>      
  192.         mov (8) uwDEST_V(%1*2+1,8)<1>        uwAVS_RESPONSE_2(%1+8,8)<8;4,1>    
  193.     }
  194. */
  195. #else /* OUTPUT_8_BIT */
  196.     // Move 1st 8x8 words of Y to dest GRF at lower 8 words of each RGF.
  197.     $for(0; <8/2; 1) {
  198.         mov (8) uwDEST_Y(%1*2)<1>          ubAVS_RESPONSE(%1,1)<16;4,2>        // Copy high byte in a word
  199.         mov (8) uwDEST_Y(%1*2+1)<1>        ubAVS_RESPONSE(%1,8+1)<16;4,2>      // Copy high byte in a word
  200.     }
  201.  
  202.     // Move 8x8 words of U to dest GRF  
  203.     $for(0; <8/2; 1) {
  204.         mov (8) uwDEST_U(%1*2)<1>          ubAVS_RESPONSE(%1+4,1)<16;4,2>      // Copy high byte in a word
  205.         mov (8) uwDEST_U(%1*2+1)<1>        ubAVS_RESPONSE(%1+4,8+1)<16;4,2>    // Copy high byte in a word
  206.     }
  207.  
  208.     // Move 8x8 words of V to dest GRF  
  209.     $for(0; <8/2; 1) {
  210.         mov (8) uwDEST_V(%1*2)<1>          ubAVS_RESPONSE(%1+8,1)<16;4,2>      // Copy high byte in a word
  211.         mov (8) uwDEST_V(%1*2+1)<1>        ubAVS_RESPONSE(%1+8,8+1)<16;4,2>    // Copy high byte in a word
  212.     }
  213.  
  214.     // Move 2nd 8x8 words of Y to dest GRF at higher 8 words of each RGF.
  215.     $for(0; <8/2; 1) {
  216.         mov (8) uwDEST_Y(%1*2,8)<1>          ubAVS_RESPONSE_2(%1,1)<16;4,2>     // Copy high byte in a word
  217.         mov (8) uwDEST_Y(%1*2+1,8)<1>        ubAVS_RESPONSE_2(%1,8+1)<16;4,2>   // Copy high byte in a word
  218.     }
  219.  
  220.     // Move 2nd 8x8 words of U to dest GRF  
  221.     $for(0; <8/2; 1) {
  222.         mov (8) uwDEST_U(%1*2,8)<1>          ubAVS_RESPONSE_2(%1+4,1)<16;4,2>   // Copy high byte in a word
  223.         mov (8) uwDEST_U(%1*2+1,8)<1>        ubAVS_RESPONSE_2(%1+4,8+1)<16;4,2> // Copy high byte in a word
  224.     }
  225.  
  226.     // Move 2nd 8x8 words of V to dest GRF  
  227.     $for(0; <8/2; 1) {
  228.         mov (8) uwDEST_V(%1*2,8)<1>          ubAVS_RESPONSE_2(%1+8,1)<16;4,2>   // Copy high byte in a word
  229.         mov (8) uwDEST_V(%1*2+1,8)<1>        ubAVS_RESPONSE_2(%1+8,8+1)<16;4,2> // Copy high byte in a word
  230.     }
  231. #endif
  232. //------------------------------------------------------------------------------
  233.     // Re-define new # of lines
  234.     #undef nUV_NUM_OF_ROWS
  235.     #undef nY_NUM_OF_ROWS
  236.      
  237.     #define nY_NUM_OF_ROWS      8
  238.     #define nUV_NUM_OF_ROWS     8
  239.                    
  240.  
  241.