Subversion Repositories Kolibri OS

Rev

Go to most recent revision | Blame | Last modification | View Log | Download | RSS feed

  1. /* sf_erf.c -- float version of s_erf.c.
  2.  * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
  3.  */
  4.  
  5. /*
  6.  * ====================================================
  7.  * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
  8.  *
  9.  * Developed at SunPro, a Sun Microsystems, Inc. business.
  10.  * Permission to use, copy, modify, and distribute this
  11.  * software is freely granted, provided that this notice
  12.  * is preserved.
  13.  * ====================================================
  14.  */
  15.  
  16. /*
  17. #include "fdlibm.h"
  18. */
  19. #include <math.h>
  20. #include <stdint.h>
  21. #include <errno.h>
  22.  
  23. #define __ieee754_expf expf
  24.  
  25.  
  26.  
  27. typedef union
  28. {
  29.   float value;
  30.   uint32_t word;
  31. } ieee_float_shape_type;
  32.  
  33. /* Get a 32 bit int from a float.  */
  34.  
  35. static inline int
  36. __get_float_word(float d)
  37. {
  38.   ieee_float_shape_type u;
  39.   u.value = d;
  40.   return u.word;
  41. }
  42.  
  43. /* Set a float from a 32 bit int.  */
  44.  
  45. #define SET_FLOAT_WORD(d,i)                                     \
  46. do {                                                            \
  47.   ieee_float_shape_type sf_u;                                   \
  48.   sf_u.word = (i);                                              \
  49.   (d) = sf_u.value;                                             \
  50. } while (0)
  51.  
  52. static inline void __trunc_float_word(float * x)
  53. {
  54.   ieee_float_shape_type u;
  55.   u.value = * x;         
  56.   u.word &= 0xfffff000;
  57. }
  58.  
  59. #ifdef __v810__
  60. #define const
  61. #endif
  62.  
  63. #ifdef __STDC__
  64. static const float
  65. #else
  66. static float
  67. #endif
  68. tiny        = 1e-30,
  69. half=  5.0000000000e-01, /* 0x3F000000 */
  70. one =  1.0000000000e+00, /* 0x3F800000 */
  71. two =  2.0000000000e+00, /* 0x40000000 */
  72.         /* c = (subfloat)0.84506291151 */
  73. erx =  8.4506291151e-01, /* 0x3f58560b */
  74. /*
  75.  * Coefficients for approximation to  erf on [0,0.84375]
  76.  */
  77. efx =  1.2837916613e-01, /* 0x3e0375d4 */
  78. efx8=  1.0270333290e+00, /* 0x3f8375d4 */
  79. pp0  =  1.2837916613e-01, /* 0x3e0375d4 */
  80. pp1  = -3.2504209876e-01, /* 0xbea66beb */
  81. pp2  = -2.8481749818e-02, /* 0xbce9528f */
  82. pp3  = -5.7702702470e-03, /* 0xbbbd1489 */
  83. pp4  = -2.3763017452e-05, /* 0xb7c756b1 */
  84. qq1  =  3.9791721106e-01, /* 0x3ecbbbce */
  85. qq2  =  6.5022252500e-02, /* 0x3d852a63 */
  86. qq3  =  5.0813062117e-03, /* 0x3ba68116 */
  87. qq4  =  1.3249473704e-04, /* 0x390aee49 */
  88. qq5  = -3.9602282413e-06, /* 0xb684e21a */
  89. /*
  90.  * Coefficients for approximation to  erf  in [0.84375,1.25]
  91.  */
  92. pa0  = -2.3621185683e-03, /* 0xbb1acdc6 */
  93. pa1  =  4.1485610604e-01, /* 0x3ed46805 */
  94. pa2  = -3.7220788002e-01, /* 0xbebe9208 */
  95. pa3  =  3.1834661961e-01, /* 0x3ea2fe54 */
  96. pa4  = -1.1089469492e-01, /* 0xbde31cc2 */
  97. pa5  =  3.5478305072e-02, /* 0x3d1151b3 */
  98. pa6  = -2.1663755178e-03, /* 0xbb0df9c0 */
  99. qa1  =  1.0642088205e-01, /* 0x3dd9f331 */
  100. qa2  =  5.4039794207e-01, /* 0x3f0a5785 */
  101. qa3  =  7.1828655899e-02, /* 0x3d931ae7 */
  102. qa4  =  1.2617121637e-01, /* 0x3e013307 */
  103. qa5  =  1.3637083583e-02, /* 0x3c5f6e13 */
  104. qa6  =  1.1984500103e-02, /* 0x3c445aa3 */
  105. /*
  106.  * Coefficients for approximation to  erfc in [1.25,1/0.35]
  107.  */
  108. ra0  = -9.8649440333e-03, /* 0xbc21a093 */
  109. ra1  = -6.9385856390e-01, /* 0xbf31a0b7 */
  110. ra2  = -1.0558626175e+01, /* 0xc128f022 */
  111. ra3  = -6.2375331879e+01, /* 0xc2798057 */
  112. ra4  = -1.6239666748e+02, /* 0xc322658c */
  113. ra5  = -1.8460508728e+02, /* 0xc3389ae7 */
  114. ra6  = -8.1287437439e+01, /* 0xc2a2932b */
  115. ra7  = -9.8143291473e+00, /* 0xc11d077e */
  116. sa1  =  1.9651271820e+01, /* 0x419d35ce */
  117. sa2  =  1.3765776062e+02, /* 0x4309a863 */
  118. sa3  =  4.3456588745e+02, /* 0x43d9486f */
  119. sa4  =  6.4538726807e+02, /* 0x442158c9 */
  120. sa5  =  4.2900814819e+02, /* 0x43d6810b */
  121. sa6  =  1.0863500214e+02, /* 0x42d9451f */
  122. sa7  =  6.5702495575e+00, /* 0x40d23f7c */
  123. sa8  = -6.0424413532e-02, /* 0xbd777f97 */
  124. /*
  125.  * Coefficients for approximation to  erfc in [1/.35,28]
  126.  */
  127. rb0  = -9.8649431020e-03, /* 0xbc21a092 */
  128. rb1  = -7.9928326607e-01, /* 0xbf4c9dd4 */
  129. rb2  = -1.7757955551e+01, /* 0xc18e104b */
  130. rb3  = -1.6063638306e+02, /* 0xc320a2ea */
  131. rb4  = -6.3756646729e+02, /* 0xc41f6441 */
  132. rb5  = -1.0250950928e+03, /* 0xc480230b */
  133. rb6  = -4.8351919556e+02, /* 0xc3f1c275 */
  134. sb1  =  3.0338060379e+01, /* 0x41f2b459 */
  135. sb2  =  3.2579251099e+02, /* 0x43a2e571 */
  136. sb3  =  1.5367296143e+03, /* 0x44c01759 */
  137. sb4  =  3.1998581543e+03, /* 0x4547fdbb */
  138. sb5  =  2.5530502930e+03, /* 0x451f90ce */
  139. sb6  =  4.7452853394e+02, /* 0x43ed43a7 */
  140. sb7  = -2.2440952301e+01; /* 0xc1b38712 */
  141.  
  142. #ifdef __STDC__
  143.         float erff(float x)
  144. #else
  145.         float erff(x)
  146.         float x;
  147. #endif
  148. {
  149.         int32_t hx,ix,i;
  150.         float R,S,P,Q,s,y,z,r;
  151.         hx = __get_float_word(x);
  152.         ix = hx&0x7fffffff;
  153.         if(!(ix<0x7f800000L)) {         /* erf(nan)=nan */
  154.             i = ((uint32_t)hx>>31)<<1;
  155.             return (float)(1-i)+one/x;  /* erf(+-inf)=+-1 */
  156.         }
  157.  
  158.         if(ix < 0x3f580000) {           /* |x|<0.84375 */
  159.             if(ix < 0x31800000) {       /* |x|<2**-28 */
  160.                 if (ix < 0x04000000)
  161.                     /*avoid underflow */
  162.                     return (float)0.125*((float)8.0*x+efx8*x);
  163.                 return x + efx*x;
  164.             }
  165.             z = x*x;
  166.             r = pp0+z*(pp1+z*(pp2+z*(pp3+z*pp4)));
  167.             s = one+z*(qq1+z*(qq2+z*(qq3+z*(qq4+z*qq5))));
  168.             y = r/s;
  169.             return x + x*y;
  170.         }
  171.         if(ix < 0x3fa00000) {           /* 0.84375 <= |x| < 1.25 */
  172.             s = fabsf(x)-one;
  173.             P = pa0+s*(pa1+s*(pa2+s*(pa3+s*(pa4+s*(pa5+s*pa6)))));
  174.             Q = one+s*(qa1+s*(qa2+s*(qa3+s*(qa4+s*(qa5+s*qa6)))));
  175.             if(hx>=0) return erx + P/Q; else return -erx - P/Q;
  176.         }
  177.         if (ix >= 0x40c00000) {         /* inf>|x|>=6 */
  178.             if(hx>=0) return one-tiny; else return tiny-one;
  179.         }
  180.         x = fabsf(x);
  181.         s = one/(x*x);
  182.         if(ix< 0x4036DB6E) {    /* |x| < 1/0.35 */
  183.             R=ra0+s*(ra1+s*(ra2+s*(ra3+s*(ra4+s*(
  184.                                 ra5+s*(ra6+s*ra7))))));
  185.             S=one+s*(sa1+s*(sa2+s*(sa3+s*(sa4+s*(
  186.                                 sa5+s*(sa6+s*(sa7+s*sa8)))))));
  187.         } else {        /* |x| >= 1/0.35 */
  188.             R=rb0+s*(rb1+s*(rb2+s*(rb3+s*(rb4+s*(
  189.                                 rb5+s*rb6)))));
  190.             S=one+s*(sb1+s*(sb2+s*(sb3+s*(sb4+s*(
  191.                                 sb5+s*(sb6+s*sb7))))));
  192.         }
  193.  
  194.         z = x;
  195.         __trunc_float_word (&z);
  196.         r  =  __ieee754_expf(-z*z-(float)0.5625)*__ieee754_expf((z-x)*(z+x)+R/S);
  197.         if(hx>=0) return one-r/x; else return  r/x-one;
  198. }
  199.  
  200. #ifdef __STDC__
  201.         float erfcf(float x)
  202. #else
  203.         float erfcf(x)
  204.         float x;
  205. #endif
  206. {
  207.         int32_t hx,ix;
  208.         float R,S,P,Q,s,y,z,r;
  209.         hx = __get_float_word(x);
  210.         ix = hx&0x7fffffff;
  211.         if(!(ix<0x7f800000L)) {                 /* erfc(nan)=nan */
  212.                                                 /* erfc(+-inf)=0,2 */
  213.             return (float)(((uint32_t)hx>>31)<<1)+one/x;
  214.         }
  215.  
  216.         if(ix < 0x3f580000) {           /* |x|<0.84375 */
  217.             if(ix < 0x23800000)         /* |x|<2**-56 */
  218.                 return one-x;
  219.             z = x*x;
  220.             r = pp0+z*(pp1+z*(pp2+z*(pp3+z*pp4)));
  221.             s = one+z*(qq1+z*(qq2+z*(qq3+z*(qq4+z*qq5))));
  222.             y = r/s;
  223.             if(hx < 0x3e800000) {       /* x<1/4 */
  224.                 return one-(x+x*y);
  225.             } else {
  226.                 r = x*y;
  227.                 r += (x-half);
  228.                 return half - r ;
  229.             }
  230.         }
  231.         if(ix < 0x3fa00000) {           /* 0.84375 <= |x| < 1.25 */
  232.             s = fabsf(x)-one;
  233.             P = pa0+s*(pa1+s*(pa2+s*(pa3+s*(pa4+s*(pa5+s*pa6)))));
  234.             Q = one+s*(qa1+s*(qa2+s*(qa3+s*(qa4+s*(qa5+s*qa6)))));
  235.             if(hx>=0) {
  236.                 z  = one-erx; return z - P/Q;
  237.             } else {
  238.                 z = erx+P/Q; return one+z;
  239.             }
  240.         }
  241.  
  242.         if (ix < 0x41e00000) {          /* |x|<28 */
  243.             x = fabsf(x);
  244.             s = one/(x*x);
  245.             if(ix< 0x4036DB6D) {        /* |x| < 1/.35 ~ 2.857143*/
  246.                 R=ra0+s*(ra1+s*(ra2+s*(ra3+s*(ra4+s*(
  247.                                 ra5+s*(ra6+s*ra7))))));
  248.                 S=one+s*(sa1+s*(sa2+s*(sa3+s*(sa4+s*(
  249.                                 sa5+s*(sa6+s*(sa7+s*sa8)))))));
  250.             } else {                    /* |x| >= 1/.35 ~ 2.857143 */
  251.                 if(hx<0&&ix>=0x40c00000) return two-tiny;/* x < -6 */
  252.                 R=rb0+s*(rb1+s*(rb2+s*(rb3+s*(rb4+s*(
  253.                                 rb5+s*rb6)))));
  254.                 S=one+s*(sb1+s*(sb2+s*(sb3+s*(sb4+s*(
  255.                                 sb5+s*(sb6+s*sb7))))));
  256.             }
  257.             z = x;  
  258.             __trunc_float_word (&z);
  259.             r  =  __ieee754_expf(-z*z-(float)0.5625)*
  260.                         __ieee754_expf((z-x)*(z+x)+R/S);
  261.             if(hx>0) return r/x; else return two-r/x;
  262.         } else {
  263.             /* set range error */
  264.             errno = ERANGE;
  265.             if(hx>0) return tiny*tiny; else return two-tiny;
  266.         }
  267. }
  268.