Subversion Repositories Kolibri OS

Rev

Blame | Last modification | View Log | RSS feed

  1. /*
  2.  * Copyright (c) 2013
  3.  *      MIPS Technologies, Inc., California.
  4.  *
  5.  * Redistribution and use in source and binary forms, with or without
  6.  * modification, are permitted provided that the following conditions
  7.  * are met:
  8.  * 1. Redistributions of source code must retain the above copyright
  9.  *    notice, this list of conditions and the following disclaimer.
  10.  * 2. Redistributions in binary form must reproduce the above copyright
  11.  *    notice, this list of conditions and the following disclaimer in the
  12.  *    documentation and/or other materials provided with the distribution.
  13.  * 3. Neither the name of the MIPS Technologies, Inc., nor the names of its
  14.  *    contributors may be used to endorse or promote products derived from
  15.  *    this software without specific prior written permission.
  16.  *
  17.  * THIS SOFTWARE IS PROVIDED BY THE MIPS TECHNOLOGIES, INC. ``AS IS'' AND
  18.  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  19.  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
  20.  * ARE DISCLAIMED.  IN NO EVENT SHALL THE MIPS TECHNOLOGIES, INC. BE LIABLE
  21.  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
  22.  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
  23.  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
  24.  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
  25.  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
  26.  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  27.  * SUCH DAMAGE.
  28.  *
  29.  * AAC Spectral Band Replication decoding functions (fixed-point)
  30.  * Copyright (c) 2008-2009 Robert Swain ( rob opendot cl )
  31.  * Copyright (c) 2009-2010 Alex Converse <alex.converse@gmail.com>
  32.  *
  33.  * This file is part of FFmpeg.
  34.  *
  35.  * FFmpeg is free software; you can redistribute it and/or
  36.  * modify it under the terms of the GNU Lesser General Public
  37.  * License as published by the Free Software Foundation; either
  38.  * version 2.1 of the License, or (at your option) any later version.
  39.  *
  40.  * FFmpeg is distributed in the hope that it will be useful,
  41.  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  42.  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  43.  * Lesser General Public License for more details.
  44.  *
  45.  * You should have received a copy of the GNU Lesser General Public
  46.  * License along with FFmpeg; if not, write to the Free Software
  47.  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
  48.  */
  49.  
  50. /**
  51.  * @file
  52.  * AAC Spectral Band Replication decoding functions (fixed-point)
  53.  * Note: Rounding-to-nearest used unless otherwise stated
  54.  * @author Robert Swain ( rob opendot cl )
  55.  * @author Stanislav Ocovaj ( stanislav.ocovaj imgtec com )
  56.  */
  57. #define USE_FIXED 1
  58.  
  59. #include "aac.h"
  60. #include "sbr.h"
  61. #include "aacsbr.h"
  62. #include "aacsbrdata.h"
  63. #include "aacsbr_fixed_tablegen.h"
  64. #include "fft.h"
  65. #include "aacps.h"
  66. #include "sbrdsp.h"
  67. #include "libavutil/internal.h"
  68. #include "libavutil/libm.h"
  69. #include "libavutil/avassert.h"
  70.  
  71. #include <stdint.h>
  72. #include <float.h>
  73. #include <math.h>
  74.  
  75. static VLC vlc_sbr[10];
  76. static void aacsbr_func_ptr_init(AACSBRContext *c);
  77. static const int CONST_LN2       = Q31(0.6931471806/256);  // ln(2)/256
  78. static const int CONST_RECIP_LN2 = Q31(0.7213475204);      // 0.5/ln(2)
  79. static const int CONST_076923    = Q31(0.76923076923076923077f);
  80.  
  81. static const int fixed_log_table[10] =
  82. {
  83.     Q31(1.0/2), Q31(1.0/3), Q31(1.0/4), Q31(1.0/5), Q31(1.0/6),
  84.     Q31(1.0/7), Q31(1.0/8), Q31(1.0/9), Q31(1.0/10), Q31(1.0/11)
  85. };
  86.  
  87. static int fixed_log(int x)
  88. {
  89.     int i, ret, xpow, tmp;
  90.  
  91.     ret = x;
  92.     xpow = x;
  93.     for (i=0; i<10; i+=2){
  94.         xpow = (int)(((int64_t)xpow * x + 0x40000000) >> 31);
  95.         tmp = (int)(((int64_t)xpow * fixed_log_table[i] + 0x40000000) >> 31);
  96.         ret -= tmp;
  97.  
  98.         xpow = (int)(((int64_t)xpow * x + 0x40000000) >> 31);
  99.         tmp = (int)(((int64_t)xpow * fixed_log_table[i+1] + 0x40000000) >> 31);
  100.         ret += tmp;
  101.     }
  102.  
  103.     return ret;
  104. }
  105.  
  106. static const int fixed_exp_table[7] =
  107. {
  108.     Q31(1.0/2), Q31(1.0/6), Q31(1.0/24), Q31(1.0/120),
  109.     Q31(1.0/720), Q31(1.0/5040), Q31(1.0/40320)
  110. };
  111.  
  112. static int fixed_exp(int x)
  113. {
  114.     int i, ret, xpow, tmp;
  115.  
  116.     ret = 0x800000 + x;
  117.     xpow = x;
  118.     for (i=0; i<7; i++){
  119.         xpow = (int)(((int64_t)xpow * x + 0x400000) >> 23);
  120.         tmp = (int)(((int64_t)xpow * fixed_exp_table[i] + 0x40000000) >> 31);
  121.         ret += tmp;
  122.     }
  123.  
  124.     return ret;
  125. }
  126.  
  127. static void make_bands(int16_t* bands, int start, int stop, int num_bands)
  128. {
  129.     int k, previous, present;
  130.     int base, prod, nz = 0;
  131.  
  132.     base = (stop << 23) / start;
  133.     while (base < 0x40000000){
  134.         base <<= 1;
  135.         nz++;
  136.     }
  137.     base = fixed_log(base - 0x80000000);
  138.     base = (((base + 0x80) >> 8) + (8-nz)*CONST_LN2) / num_bands;
  139.     base = fixed_exp(base);
  140.  
  141.     previous = start;
  142.     prod = start << 23;
  143.  
  144.     for (k = 0; k < num_bands-1; k++) {
  145.         prod = (int)(((int64_t)prod * base + 0x400000) >> 23);
  146.         present = (prod + 0x400000) >> 23;
  147.         bands[k] = present - previous;
  148.         previous = present;
  149.     }
  150.     bands[num_bands-1] = stop - previous;
  151. }
  152.  
  153. /// Dequantization and stereo decoding (14496-3 sp04 p203)
  154. static void sbr_dequant(SpectralBandReplication *sbr, int id_aac)
  155. {
  156.     int k, e;
  157.     int ch;
  158.  
  159.     if (id_aac == TYPE_CPE && sbr->bs_coupling) {
  160.         int alpha      = sbr->data[0].bs_amp_res ?  2 :  1;
  161.         int pan_offset = sbr->data[0].bs_amp_res ? 12 : 24;
  162.         for (e = 1; e <= sbr->data[0].bs_num_env; e++) {
  163.             for (k = 0; k < sbr->n[sbr->data[0].bs_freq_res[e]]; k++) {
  164.                 SoftFloat temp1, temp2, fac;
  165.  
  166.                 temp1.exp = sbr->data[0].env_facs[e][k].mant * alpha + 14;
  167.                 if (temp1.exp & 1)
  168.                   temp1.mant = 759250125;
  169.                 else
  170.                   temp1.mant = 0x20000000;
  171.                 temp1.exp = (temp1.exp >> 1) + 1;
  172.                 if (temp1.exp > 66) { // temp1 > 1E20
  173.                     av_log(NULL, AV_LOG_ERROR, "envelope scalefactor overflow in dequant\n");
  174.                     temp1 = FLOAT_1;
  175.                 }
  176.  
  177.                 temp2.exp = (pan_offset - sbr->data[1].env_facs[e][k].mant) * alpha;
  178.                 if (temp2.exp & 1)
  179.                   temp2.mant = 759250125;
  180.                 else
  181.                   temp2.mant = 0x20000000;
  182.                 temp2.exp = (temp2.exp >> 1) + 1;
  183.                 fac   = av_div_sf(temp1, av_add_sf(FLOAT_1, temp2));
  184.                 sbr->data[0].env_facs[e][k] = fac;
  185.                 sbr->data[1].env_facs[e][k] = av_mul_sf(fac, temp2);
  186.             }
  187.         }
  188.         for (e = 1; e <= sbr->data[0].bs_num_noise; e++) {
  189.             for (k = 0; k < sbr->n_q; k++) {
  190.                 SoftFloat temp1, temp2, fac;
  191.  
  192.                 temp1.exp = NOISE_FLOOR_OFFSET - \
  193.                     sbr->data[0].noise_facs[e][k].mant + 2;
  194.                 temp1.mant = 0x20000000;
  195.                 if (temp1.exp > 66) { // temp1 > 1E20
  196.                     av_log(NULL, AV_LOG_ERROR, "envelope scalefactor overflow in dequant\n");
  197.                     temp1 = FLOAT_1;
  198.                 }
  199.                 temp2.exp = 12 - sbr->data[1].noise_facs[e][k].mant + 1;
  200.                 temp2.mant = 0x20000000;
  201.                 fac   = av_div_sf(temp1, av_add_sf(FLOAT_1, temp2));
  202.                 sbr->data[0].noise_facs[e][k] = fac;
  203.                 sbr->data[1].noise_facs[e][k] = av_mul_sf(fac, temp2);
  204.             }
  205.         }
  206.     } else { // SCE or one non-coupled CPE
  207.         for (ch = 0; ch < (id_aac == TYPE_CPE) + 1; ch++) {
  208.             int alpha = sbr->data[ch].bs_amp_res ? 2 : 1;
  209.             for (e = 1; e <= sbr->data[ch].bs_num_env; e++)
  210.                 for (k = 0; k < sbr->n[sbr->data[ch].bs_freq_res[e]]; k++){
  211.                     SoftFloat temp1;
  212.  
  213.                     temp1.exp = alpha * sbr->data[ch].env_facs[e][k].mant + 12;
  214.                     if (temp1.exp & 1)
  215.                         temp1.mant = 759250125;
  216.                     else
  217.                         temp1.mant = 0x20000000;
  218.                     temp1.exp = (temp1.exp >> 1) + 1;
  219.                     if (temp1.exp > 66) { // temp1 > 1E20
  220.                         av_log(NULL, AV_LOG_ERROR, "envelope scalefactor overflow in dequant\n");
  221.                         temp1 = FLOAT_1;
  222.                     }
  223.                     sbr->data[ch].env_facs[e][k] = temp1;
  224.                 }
  225.             for (e = 1; e <= sbr->data[ch].bs_num_noise; e++)
  226.                 for (k = 0; k < sbr->n_q; k++){
  227.                     sbr->data[ch].noise_facs[e][k].exp = NOISE_FLOOR_OFFSET - \
  228.                         sbr->data[ch].noise_facs[e][k].mant + 1;
  229.                     sbr->data[ch].noise_facs[e][k].mant = 0x20000000;
  230.                 }
  231.         }
  232.     }
  233. }
  234.  
  235. /** High Frequency Generation (14496-3 sp04 p214+) and Inverse Filtering
  236.  * (14496-3 sp04 p214)
  237.  * Warning: This routine does not seem numerically stable.
  238.  */
  239. static void sbr_hf_inverse_filter(SBRDSPContext *dsp,
  240.                                   int (*alpha0)[2], int (*alpha1)[2],
  241.                                   const int X_low[32][40][2], int k0)
  242. {
  243.     int k;
  244.     int shift, round;
  245.  
  246.     for (k = 0; k < k0; k++) {
  247.         SoftFloat phi[3][2][2];
  248.         SoftFloat a00, a01, a10, a11;
  249.         SoftFloat dk;
  250.  
  251.         dsp->autocorrelate(X_low[k], phi);
  252.  
  253.         dk = av_sub_sf(av_mul_sf(phi[2][1][0], phi[1][0][0]),
  254.              av_mul_sf(av_add_sf(av_mul_sf(phi[1][1][0], phi[1][1][0]),
  255.              av_mul_sf(phi[1][1][1], phi[1][1][1])), FLOAT_0999999));
  256.  
  257.         if (!dk.mant) {
  258.             a10 = FLOAT_0;
  259.             a11 = FLOAT_0;
  260.         } else {
  261.             SoftFloat temp_real, temp_im;
  262.             temp_real = av_sub_sf(av_sub_sf(av_mul_sf(phi[0][0][0], phi[1][1][0]),
  263.                                             av_mul_sf(phi[0][0][1], phi[1][1][1])),
  264.                                   av_mul_sf(phi[0][1][0], phi[1][0][0]));
  265.             temp_im   = av_sub_sf(av_add_sf(av_mul_sf(phi[0][0][0], phi[1][1][1]),
  266.                                             av_mul_sf(phi[0][0][1], phi[1][1][0])),
  267.                                   av_mul_sf(phi[0][1][1], phi[1][0][0]));
  268.  
  269.             a10 = av_div_sf(temp_real, dk);
  270.             a11 = av_div_sf(temp_im,   dk);
  271.         }
  272.  
  273.         if (!phi[1][0][0].mant) {
  274.             a00 = FLOAT_0;
  275.             a01 = FLOAT_0;
  276.         } else {
  277.             SoftFloat temp_real, temp_im;
  278.             temp_real = av_add_sf(phi[0][0][0],
  279.                                   av_add_sf(av_mul_sf(a10, phi[1][1][0]),
  280.                                             av_mul_sf(a11, phi[1][1][1])));
  281.             temp_im   = av_add_sf(phi[0][0][1],
  282.                                   av_sub_sf(av_mul_sf(a11, phi[1][1][0]),
  283.                                             av_mul_sf(a10, phi[1][1][1])));
  284.  
  285.             temp_real.mant = -temp_real.mant;
  286.             temp_im.mant   = -temp_im.mant;
  287.             a00 = av_div_sf(temp_real, phi[1][0][0]);
  288.             a01 = av_div_sf(temp_im,   phi[1][0][0]);
  289.         }
  290.  
  291.         shift = a00.exp;
  292.         if (shift >= 3)
  293.             alpha0[k][0] = 0x7fffffff;
  294.         else {
  295.             a00.mant <<= 1;
  296.             shift = 2-shift;
  297.             if (shift == 0)
  298.                 alpha0[k][0] = a00.mant;
  299.             else {
  300.                 round = 1 << (shift-1);
  301.                 alpha0[k][0] = (a00.mant + round) >> shift;
  302.             }
  303.         }
  304.  
  305.         shift = a01.exp;
  306.         if (shift >= 3)
  307.             alpha0[k][1] = 0x7fffffff;
  308.         else {
  309.             a01.mant <<= 1;
  310.             shift = 2-shift;
  311.             if (shift == 0)
  312.                 alpha0[k][1] = a01.mant;
  313.             else {
  314.                 round = 1 << (shift-1);
  315.                 alpha0[k][1] = (a01.mant + round) >> shift;
  316.             }
  317.         }
  318.         shift = a10.exp;
  319.         if (shift >= 3)
  320.             alpha1[k][0] = 0x7fffffff;
  321.         else {
  322.             a10.mant <<= 1;
  323.             shift = 2-shift;
  324.             if (shift == 0)
  325.                 alpha1[k][0] = a10.mant;
  326.             else {
  327.                 round = 1 << (shift-1);
  328.                 alpha1[k][0] = (a10.mant + round) >> shift;
  329.             }
  330.         }
  331.  
  332.         shift = a11.exp;
  333.         if (shift >= 3)
  334.             alpha1[k][1] = 0x7fffffff;
  335.         else {
  336.             a11.mant <<= 1;
  337.             shift = 2-shift;
  338.             if (shift == 0)
  339.                 alpha1[k][1] = a11.mant;
  340.             else {
  341.                 round = 1 << (shift-1);
  342.                 alpha1[k][1] = (a11.mant + round) >> shift;
  343.             }
  344.         }
  345.  
  346.         shift = (int)(((int64_t)(alpha1[k][0]>>1) * (alpha1[k][0]>>1) + \
  347.                        (int64_t)(alpha1[k][1]>>1) * (alpha1[k][1]>>1) + \
  348.                        0x40000000) >> 31);
  349.         if (shift >= 0x20000000){
  350.             alpha1[k][0] = 0;
  351.             alpha1[k][1] = 0;
  352.             alpha0[k][0] = 0;
  353.             alpha0[k][1] = 0;
  354.         }
  355.  
  356.         shift = (int)(((int64_t)(alpha0[k][0]>>1) * (alpha0[k][0]>>1) + \
  357.                        (int64_t)(alpha0[k][1]>>1) * (alpha0[k][1]>>1) + \
  358.                        0x40000000) >> 31);
  359.         if (shift >= 0x20000000){
  360.             alpha1[k][0] = 0;
  361.             alpha1[k][1] = 0;
  362.             alpha0[k][0] = 0;
  363.             alpha0[k][1] = 0;
  364.         }
  365.     }
  366. }
  367.  
  368. /// Chirp Factors (14496-3 sp04 p214)
  369. static void sbr_chirp(SpectralBandReplication *sbr, SBRData *ch_data)
  370. {
  371.     int i;
  372.     int new_bw;
  373.     static const int bw_tab[] = { 0, 1610612736, 1932735283, 2104533975 };
  374.     int64_t accu;
  375.  
  376.     for (i = 0; i < sbr->n_q; i++) {
  377.         if (ch_data->bs_invf_mode[0][i] + ch_data->bs_invf_mode[1][i] == 1)
  378.             new_bw = 1288490189;
  379.         else
  380.             new_bw = bw_tab[ch_data->bs_invf_mode[0][i]];
  381.  
  382.         if (new_bw < ch_data->bw_array[i]){
  383.             accu  = (int64_t)new_bw * 1610612736;
  384.             accu += (int64_t)ch_data->bw_array[i] * 0x20000000;
  385.             new_bw = (int)((accu + 0x40000000) >> 31);
  386.         } else {
  387.             accu  = (int64_t)new_bw * 1946157056;
  388.             accu += (int64_t)ch_data->bw_array[i] * 201326592;
  389.             new_bw = (int)((accu + 0x40000000) >> 31);
  390.         }
  391.         ch_data->bw_array[i] = new_bw < 0x2000000 ? 0 : new_bw;
  392.     }
  393. }
  394.  
  395. /**
  396.  * Calculation of levels of additional HF signal components (14496-3 sp04 p219)
  397.  * and Calculation of gain (14496-3 sp04 p219)
  398.  */
  399. static void sbr_gain_calc(AACContext *ac, SpectralBandReplication *sbr,
  400.                           SBRData *ch_data, const int e_a[2])
  401. {
  402.     int e, k, m;
  403.     // max gain limits : -3dB, 0dB, 3dB, inf dB (limiter off)
  404.     static const SoftFloat limgain[4] = { { 760155524,  0 }, { 0x20000000,  1 },
  405.                                             { 758351638,  1 }, { 625000000, 34 } };
  406.  
  407.     for (e = 0; e < ch_data->bs_num_env; e++) {
  408.         int delta = !((e == e_a[1]) || (e == e_a[0]));
  409.         for (k = 0; k < sbr->n_lim; k++) {
  410.             SoftFloat gain_boost, gain_max;
  411.             SoftFloat sum[2];
  412.             sum[0] = sum[1] = FLOAT_0;
  413.             for (m = sbr->f_tablelim[k] - sbr->kx[1]; m < sbr->f_tablelim[k + 1] - sbr->kx[1]; m++) {
  414.                 const SoftFloat temp = av_div_sf(sbr->e_origmapped[e][m],
  415.                                             av_add_sf(FLOAT_1, sbr->q_mapped[e][m]));
  416.                 sbr->q_m[e][m] = av_sqrt_sf(av_mul_sf(temp, sbr->q_mapped[e][m]));
  417.                 sbr->s_m[e][m] = av_sqrt_sf(av_mul_sf(temp, av_int2sf(ch_data->s_indexmapped[e + 1][m], 0)));
  418.                 if (!sbr->s_mapped[e][m]) {
  419.                     if (delta) {
  420.                       sbr->gain[e][m] = av_sqrt_sf(av_div_sf(sbr->e_origmapped[e][m],
  421.                                             av_mul_sf(av_add_sf(FLOAT_1, sbr->e_curr[e][m]),
  422.                                             av_add_sf(FLOAT_1, sbr->q_mapped[e][m]))));
  423.                     } else {
  424.                       sbr->gain[e][m] = av_sqrt_sf(av_div_sf(sbr->e_origmapped[e][m],
  425.                                             av_add_sf(FLOAT_1, sbr->e_curr[e][m])));
  426.                     }
  427.                 } else {
  428.                     sbr->gain[e][m] = av_sqrt_sf(
  429.                                         av_div_sf(
  430.                                             av_mul_sf(sbr->e_origmapped[e][m], sbr->q_mapped[e][m]),
  431.                                             av_mul_sf(
  432.                                                 av_add_sf(FLOAT_1, sbr->e_curr[e][m]),
  433.                                                 av_add_sf(FLOAT_1, sbr->q_mapped[e][m]))));
  434.                 }
  435.             }
  436.             for (m = sbr->f_tablelim[k] - sbr->kx[1]; m < sbr->f_tablelim[k + 1] - sbr->kx[1]; m++) {
  437.                 sum[0] = av_add_sf(sum[0], sbr->e_origmapped[e][m]);
  438.                 sum[1] = av_add_sf(sum[1], sbr->e_curr[e][m]);
  439.             }
  440.             gain_max = av_mul_sf(limgain[sbr->bs_limiter_gains],
  441.                             av_sqrt_sf(
  442.                                 av_div_sf(
  443.                                     av_add_sf(FLOAT_EPSILON, sum[0]),
  444.                                     av_add_sf(FLOAT_EPSILON, sum[1]))));
  445.             if (av_gt_sf(gain_max, FLOAT_100000))
  446.               gain_max = FLOAT_100000;
  447.             for (m = sbr->f_tablelim[k] - sbr->kx[1]; m < sbr->f_tablelim[k + 1] - sbr->kx[1]; m++) {
  448.                 SoftFloat q_m_max = av_div_sf(
  449.                                         av_mul_sf(sbr->q_m[e][m], gain_max),
  450.                                         sbr->gain[e][m]);
  451.                 if (av_gt_sf(sbr->q_m[e][m], q_m_max))
  452.                   sbr->q_m[e][m] = q_m_max;
  453.                 if (av_gt_sf(sbr->gain[e][m], gain_max))
  454.                   sbr->gain[e][m] = gain_max;
  455.             }
  456.             sum[0] = sum[1] = FLOAT_0;
  457.             for (m = sbr->f_tablelim[k] - sbr->kx[1]; m < sbr->f_tablelim[k + 1] - sbr->kx[1]; m++) {
  458.                 sum[0] = av_add_sf(sum[0], sbr->e_origmapped[e][m]);
  459.                 sum[1] = av_add_sf(sum[1],
  460.                             av_mul_sf(
  461.                                 av_mul_sf(sbr->e_curr[e][m],
  462.                                           sbr->gain[e][m]),
  463.                                 sbr->gain[e][m]));
  464.                 sum[1] = av_add_sf(sum[1],
  465.                             av_mul_sf(sbr->s_m[e][m], sbr->s_m[e][m]));
  466.                 if (delta && !sbr->s_m[e][m].mant)
  467.                   sum[1] = av_add_sf(sum[1],
  468.                                 av_mul_sf(sbr->q_m[e][m], sbr->q_m[e][m]));
  469.             }
  470.             gain_boost = av_sqrt_sf(
  471.                             av_div_sf(
  472.                                 av_add_sf(FLOAT_EPSILON, sum[0]),
  473.                                 av_add_sf(FLOAT_EPSILON, sum[1])));
  474.             if (av_gt_sf(gain_boost, FLOAT_1584893192))
  475.               gain_boost = FLOAT_1584893192;
  476.  
  477.             for (m = sbr->f_tablelim[k] - sbr->kx[1]; m < sbr->f_tablelim[k + 1] - sbr->kx[1]; m++) {
  478.                 sbr->gain[e][m] = av_mul_sf(sbr->gain[e][m], gain_boost);
  479.                 sbr->q_m[e][m]  = av_mul_sf(sbr->q_m[e][m], gain_boost);
  480.                 sbr->s_m[e][m]  = av_mul_sf(sbr->s_m[e][m], gain_boost);
  481.             }
  482.         }
  483.     }
  484. }
  485.  
  486. /// Assembling HF Signals (14496-3 sp04 p220)
  487. static void sbr_hf_assemble(int Y1[38][64][2],
  488.                             const int X_high[64][40][2],
  489.                             SpectralBandReplication *sbr, SBRData *ch_data,
  490.                             const int e_a[2])
  491. {
  492.     int e, i, j, m;
  493.     const int h_SL = 4 * !sbr->bs_smoothing_mode;
  494.     const int kx = sbr->kx[1];
  495.     const int m_max = sbr->m[1];
  496.     static const SoftFloat h_smooth[5] = {
  497.       { 715827883, -1 },
  498.       { 647472402, -1 },
  499.       { 937030863, -2 },
  500.       { 989249804, -3 },
  501.       { 546843842, -4 },
  502.     };
  503.     SoftFloat (*g_temp)[48] = ch_data->g_temp, (*q_temp)[48] = ch_data->q_temp;
  504.     int indexnoise = ch_data->f_indexnoise;
  505.     int indexsine  = ch_data->f_indexsine;
  506.  
  507.     if (sbr->reset) {
  508.         for (i = 0; i < h_SL; i++) {
  509.             memcpy(g_temp[i + 2*ch_data->t_env[0]], sbr->gain[0], m_max * sizeof(sbr->gain[0][0]));
  510.             memcpy(q_temp[i + 2*ch_data->t_env[0]], sbr->q_m[0],  m_max * sizeof(sbr->q_m[0][0]));
  511.         }
  512.     } else if (h_SL) {
  513.         for (i = 0; i < 4; i++) {
  514.             memcpy(g_temp[i + 2 * ch_data->t_env[0]],
  515.                    g_temp[i + 2 * ch_data->t_env_num_env_old],
  516.                    sizeof(g_temp[0]));
  517.             memcpy(q_temp[i + 2 * ch_data->t_env[0]],
  518.                    q_temp[i + 2 * ch_data->t_env_num_env_old],
  519.                    sizeof(q_temp[0]));
  520.         }
  521.     }
  522.  
  523.     for (e = 0; e < ch_data->bs_num_env; e++) {
  524.         for (i = 2 * ch_data->t_env[e]; i < 2 * ch_data->t_env[e + 1]; i++) {
  525.             memcpy(g_temp[h_SL + i], sbr->gain[e], m_max * sizeof(sbr->gain[0][0]));
  526.             memcpy(q_temp[h_SL + i], sbr->q_m[e],  m_max * sizeof(sbr->q_m[0][0]));
  527.         }
  528.     }
  529.  
  530.     for (e = 0; e < ch_data->bs_num_env; e++) {
  531.         for (i = 2 * ch_data->t_env[e]; i < 2 * ch_data->t_env[e + 1]; i++) {
  532.             SoftFloat g_filt_tab[48];
  533.             SoftFloat q_filt_tab[48];
  534.             SoftFloat *g_filt, *q_filt;
  535.  
  536.             if (h_SL && e != e_a[0] && e != e_a[1]) {
  537.                 g_filt = g_filt_tab;
  538.                 q_filt = q_filt_tab;
  539.                 for (m = 0; m < m_max; m++) {
  540.                     const int idx1 = i + h_SL;
  541.                     g_filt[m].mant = g_filt[m].exp = 0;
  542.                     q_filt[m].mant = q_filt[m].exp = 0;
  543.                     for (j = 0; j <= h_SL; j++) {
  544.                         g_filt[m] = av_add_sf(g_filt[m],
  545.                                         av_mul_sf(g_temp[idx1 - j][m],
  546.                                             h_smooth[j]));
  547.                         q_filt[m] = av_add_sf(q_filt[m],
  548.                                         av_mul_sf(q_temp[idx1 - j][m],
  549.                                             h_smooth[j]));
  550.                     }
  551.                 }
  552.             } else {
  553.                 g_filt = g_temp[i + h_SL];
  554.                 q_filt = q_temp[i];
  555.             }
  556.  
  557.             sbr->dsp.hf_g_filt(Y1[i] + kx, X_high + kx, g_filt, m_max,
  558.                                i + ENVELOPE_ADJUSTMENT_OFFSET);
  559.  
  560.             if (e != e_a[0] && e != e_a[1]) {
  561.                 sbr->dsp.hf_apply_noise[indexsine](Y1[i] + kx, sbr->s_m[e],
  562.                                                    q_filt, indexnoise,
  563.                                                    kx, m_max);
  564.             } else {
  565.                 int idx = indexsine&1;
  566.                 int A = (1-((indexsine+(kx & 1))&2));
  567.                 int B = (A^(-idx)) + idx;
  568.                 int *out = &Y1[i][kx][idx];
  569.                 int shift, round;
  570.  
  571.                 SoftFloat *in  = sbr->s_m[e];
  572.                 for (m = 0; m+1 < m_max; m+=2) {
  573.                   shift = 22 - in[m  ].exp;
  574.                   round = 1 << (shift-1);
  575.                   out[2*m  ] += (in[m  ].mant * A + round) >> shift;
  576.  
  577.                   shift = 22 - in[m+1].exp;
  578.                   round = 1 << (shift-1);
  579.                   out[2*m+2] += (in[m+1].mant * B + round) >> shift;
  580.                 }
  581.                 if(m_max&1)
  582.                 {
  583.                   shift = 22 - in[m  ].exp;
  584.                   round = 1 << (shift-1);
  585.  
  586.                   out[2*m  ] += (in[m  ].mant * A + round) >> shift;
  587.                 }
  588.             }
  589.             indexnoise = (indexnoise + m_max) & 0x1ff;
  590.             indexsine = (indexsine + 1) & 3;
  591.         }
  592.     }
  593.     ch_data->f_indexnoise = indexnoise;
  594.     ch_data->f_indexsine  = indexsine;
  595. }
  596.  
  597. #include "aacsbr_template.c"
  598.