sys/arch/m68k/fpsp/ssin.sa - annotate

Return to ssin.sa CVS log
Up to [local] / sys / arch / m68k / fpsp
Annotation of sys/arch/m68k/fpsp/ssin.sa, Revision 1.1

1.1     ! nbrk        1: *      $OpenBSD: ssin.sa,v 1.3 2003/11/07 10:36:10 miod Exp $
        !             2: *      $NetBSD: ssin.sa,v 1.3 1994/10/26 07:50:01 cgd Exp $
        !             3:
        !             4: *      MOTOROLA MICROPROCESSOR & MEMORY TECHNOLOGY GROUP
        !             5: *      M68000 Hi-Performance Microprocessor Division
        !             6: *      M68040 Software Package
        !             7: *
        !             8: *      M68040 Software Package Copyright (c) 1993, 1994 Motorola Inc.
        !             9: *      All rights reserved.
        !            10: *
        !            11: *      THE SOFTWARE is provided on an "AS IS" basis and without warranty.
        !            12: *      To the maximum extent permitted by applicable law,
        !            13: *      MOTOROLA DISCLAIMS ALL WARRANTIES WHETHER EXPRESS OR IMPLIED,
        !            14: *      INCLUDING IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A
        !            15: *      PARTICULAR PURPOSE and any warranty against infringement with
        !            16: *      regard to the SOFTWARE (INCLUDING ANY MODIFIED VERSIONS THEREOF)
        !            17: *      and any accompanying written materials.
        !            18: *
        !            19: *      To the maximum extent permitted by applicable law,
        !            20: *      IN NO EVENT SHALL MOTOROLA BE LIABLE FOR ANY DAMAGES WHATSOEVER
        !            21: *      (INCLUDING WITHOUT LIMITATION, DAMAGES FOR LOSS OF BUSINESS
        !            22: *      PROFITS, BUSINESS INTERRUPTION, LOSS OF BUSINESS INFORMATION, OR
        !            23: *      OTHER PECUNIARY LOSS) ARISING OF THE USE OR INABILITY TO USE THE
        !            24: *      SOFTWARE.  Motorola assumes no responsibility for the maintenance
        !            25: *      and support of the SOFTWARE.
        !            26: *
        !            27: *      You are hereby granted a copyright license to use, modify, and
        !            28: *      distribute the SOFTWARE so long as this entire notice is retained
        !            29: *      without alteration in any modified and/or redistributed versions,
        !            30: *      and that such modified versions are clearly identified as such.
        !            31: *      No licenses are granted by implication, estoppel or otherwise
        !            32: *      under any patents or trademarks of Motorola, Inc.
        !            33:
        !            34: *
        !            35: *      ssin.sa 3.3 7/29/91
        !            36: *
        !            37: *      The entry point sSIN computes the sine of an input argument
        !            38: *      sCOS computes the cosine, and sSINCOS computes both. The
        !            39: *      corresponding entry points with a "d" computes the same
        !            40: *      corresponding function values for denormalized inputs.
        !            41: *
        !            42: *      Input: Double-extended number X in location pointed to
        !            43: *              by address register a0.
        !            44: *
        !            45: *      Output: The funtion value sin(X) or cos(X) returned in Fp0 if SIN or
        !            46: *              COS is requested. Otherwise, for SINCOS, sin(X) is returned
        !            47: *              in Fp0, and cos(X) is returned in Fp1.
        !            48: *
        !            49: *      Modifies: Fp0 for SIN or COS; both Fp0 and Fp1 for SINCOS.
        !            50: *
        !            51: *      Accuracy and Monotonicity: The returned result is within 1 ulp in
        !            52: *              64 significant bit, i.e. within 0.5001 ulp to 53 bits if the
        !            53: *              result is subsequently rounded to double precision. The
        !            54: *              result is provably monotonic in double precision.
        !            55: *
        !            56: *      Speed: The programs sSIN and sCOS take approximately 150 cycles for
        !            57: *              input argument X such that |X| < 15Pi, which is the usual
        !            58: *              situation. The speed for sSINCOS is approximately 190 cycles.
        !            59: *
        !            60: *      Algorithm:
        !            61: *
        !            62: *      SIN and COS:
        !            63: *      1. If SIN is invoked, set AdjN := 0; otherwise, set AdjN := 1.
        !            64: *
        !            65: *      2. If |X| >= 15Pi or |X| < 2**(-40), go to 7.
        !            66: *
        !            67: *      3. Decompose X as X = N(Pi/2) + r where |r| <= Pi/4. Let
        !            68: *              k = N mod 4, so in particular, k = 0,1,2,or 3. Overwirte
        !            69: *              k by k := k + AdjN.
        !            70: *
        !            71: *      4. If k is even, go to 6.
        !            72: *
        !            73: *      5. (k is odd) Set j := (k-1)/2, sgn := (-1)**j. Return sgn*cos(r)
        !            74: *              where cos(r) is approximated by an even polynomial in r,
        !            75: *              1 + r*r*(B1+s*(B2+ ... + s*B8)),        s = r*r.
        !            76: *              Exit.
        !            77: *
        !            78: *      6. (k is even) Set j := k/2, sgn := (-1)**j. Return sgn*sin(r)
        !            79: *              where sin(r) is approximated by an odd polynomial in r
        !            80: *              r + r*s*(A1+s*(A2+ ... + s*A7)),        s = r*r.
        !            81: *              Exit.
        !            82: *
        !            83: *      7. If |X| > 1, go to 9.
        !            84: *
        !            85: *      8. (|X|<2**(-40)) If SIN is invoked, return X; otherwise return 1.
        !            86: *
        !            87: *      9. Overwrite X by X := X rem 2Pi. Now that |X| <= Pi, go back to 3.
        !            88: *
        !            89: *      SINCOS:
        !            90: *      1. If |X| >= 15Pi or |X| < 2**(-40), go to 6.
        !            91: *
        !            92: *      2. Decompose X as X = N(Pi/2) + r where |r| <= Pi/4. Let
        !            93: *              k = N mod 4, so in particular, k = 0,1,2,or 3.
        !            94: *
        !            95: *      3. If k is even, go to 5.
        !            96: *
        !            97: *      4. (k is odd) Set j1 := (k-1)/2, j2 := j1 (EOR) (k mod 2), i.e.
        !            98: *              j1 exclusive or with the l.s.b. of k.
        !            99: *              sgn1 := (-1)**j1, sgn2 := (-1)**j2.
        !           100: *              SIN(X) = sgn1 * cos(r) and COS(X) = sgn2*sin(r) where
        !           101: *              sin(r) and cos(r) are computed as odd and even polynomials
        !           102: *              in r, respectively. Exit
        !           103: *
        !           104: *      5. (k is even) Set j1 := k/2, sgn1 := (-1)**j1.
        !           105: *              SIN(X) = sgn1 * sin(r) and COS(X) = sgn1*cos(r) where
        !           106: *              sin(r) and cos(r) are computed as odd and even polynomials
        !           107: *              in r, respectively. Exit
        !           108: *
        !           109: *      6. If |X| > 1, go to 8.
        !           110: *
        !           111: *      7. (|X|<2**(-40)) SIN(X) = X and COS(X) = 1. Exit.
        !           112: *
        !           113: *      8. Overwrite X by X := X rem 2Pi. Now that |X| <= Pi, go back to 2.
        !           114: *
        !           115:
        !           116: SSIN   IDNT    2,1 Motorola 040 Floating Point Software Package
        !           117:
        !           118:        section 8
        !           119:
        !           120:        include fpsp.h
        !           121:
        !           122: BOUNDS1        DC.L $3FD78000,$4004BC7E
        !           123: TWOBYPI        DC.L $3FE45F30,$6DC9C883
        !           124:
        !           125: SINA7  DC.L $BD6AAA77,$CCC994F5
        !           126: SINA6  DC.L $3DE61209,$7AAE8DA1
        !           127:
        !           128: SINA5  DC.L $BE5AE645,$2A118AE4
        !           129: SINA4  DC.L $3EC71DE3,$A5341531
        !           130:
        !           131: SINA3  DC.L $BF2A01A0,$1A018B59,$00000000,$00000000
        !           132:
        !           133: SINA2  DC.L $3FF80000,$88888888,$888859AF,$00000000
        !           134:
        !           135: SINA1  DC.L $BFFC0000,$AAAAAAAA,$AAAAAA99,$00000000
        !           136:
        !           137: COSB8  DC.L $3D2AC4D0,$D6011EE3
        !           138: COSB7  DC.L $BDA9396F,$9F45AC19
        !           139:
        !           140: COSB6  DC.L $3E21EED9,$0612C972
        !           141: COSB5  DC.L $BE927E4F,$B79D9FCF
        !           142:
        !           143: COSB4  DC.L $3EFA01A0,$1A01D423,$00000000,$00000000
        !           144:
        !           145: COSB3  DC.L $BFF50000,$B60B60B6,$0B61D438,$00000000
        !           146:
        !           147: COSB2  DC.L $3FFA0000,$AAAAAAAA,$AAAAAB5E
        !           148: COSB1  DC.L $BF000000
        !           149:
        !           150: INVTWOPI DC.L $3FFC0000,$A2F9836E,$4E44152A
        !           151:
        !           152: TWOPI1 DC.L $40010000,$C90FDAA2,$00000000,$00000000
        !           153: TWOPI2 DC.L $3FDF0000,$85A308D4,$00000000,$00000000
        !           154:
        !           155:        xref    PITBL
        !           156:
        !           157: INARG  equ     FP_SCR4
        !           158:
        !           159: X      equ     FP_SCR5
        !           160: XDCARE equ     X+2
        !           161: XFRAC  equ     X+4
        !           162:
        !           163: RPRIME equ     FP_SCR1
        !           164: SPRIME equ     FP_SCR2
        !           165:
        !           166: POSNEG1        equ     L_SCR1
        !           167: TWOTO63        equ     L_SCR1
        !           168:
        !           169: ENDFLAG        equ     L_SCR2
        !           170: N      equ     L_SCR2
        !           171:
        !           172: ADJN   equ     L_SCR3
        !           173:
        !           174:        xref    t_frcinx
        !           175:        xref    t_extdnrm
        !           176:        xref    sto_cos
        !           177:
        !           178:        xdef    ssind
        !           179: ssind:
        !           180: *--SIN(X) = X FOR DENORMALIZED X
        !           181:        bra             t_extdnrm
        !           182:
        !           183:        xdef    scosd
        !           184: scosd:
        !           185: *--COS(X) = 1 FOR DENORMALIZED X
        !           186:
        !           187:        FMOVE.S         #:3F800000,FP0
        !           188: *
        !           189: *      9D25B Fix: Sometimes the previous fmove.s sets fpsr bits
        !           190: *
        !           191:        fmove.l         #0,fpsr
        !           192: *
        !           193:        bra             t_frcinx
        !           194:
        !           195:        xdef    ssin
        !           196: ssin:
        !           197: *--SET ADJN TO 0
        !           198:        CLR.L           ADJN(a6)
        !           199:        BRA.B           SINBGN
        !           200:
        !           201:        xdef    scos
        !           202: scos:
        !           203: *--SET ADJN TO 1
        !           204:        MOVE.L          #1,ADJN(a6)
        !           205:
        !           206: SINBGN:
        !           207: *--SAVE FPCR, FP1. CHECK IF |X| IS TOO SMALL OR LARGE
        !           208:
        !           209:        FMOVE.X         (a0),FP0        ...LOAD INPUT
        !           210:
        !           211:        MOVE.L          (A0),D0
        !           212:        MOVE.W          4(A0),D0
        !           213:        FMOVE.X         FP0,X(a6)
        !           214:        ANDI.L          #$7FFFFFFF,D0           ...COMPACTIFY X
        !           215:
        !           216:        CMPI.L          #$3FD78000,D0           ...|X| >= 2**(-40)?
        !           217:        BGE.B           SOK1
        !           218:        BRA.W           SINSM
        !           219:
        !           220: SOK1:
        !           221:        CMPI.L          #$4004BC7E,D0           ...|X| < 15 PI?
        !           222:        BLT.B           SINMAIN
        !           223:        BRA.W           REDUCEX
        !           224:
        !           225: SINMAIN:
        !           226: *--THIS IS THE USUAL CASE, |X| <= 15 PI.
        !           227: *--THE ARGUMENT REDUCTION IS DONE BY TABLE LOOK UP.
        !           228:        FMOVE.X         FP0,FP1
        !           229:        FMUL.D          TWOBYPI,FP1     ...X*2/PI
        !           230:
        !           231: *--HIDE THE NEXT THREE INSTRUCTIONS
        !           232:        LEA             PITBL+$200,A1 ...TABLE OF N*PI/2, N = -32,...,32
        !           233:
        !           234:
        !           235: *--FP1 IS NOW READY
        !           236:        FMOVE.L         FP1,N(a6)               ...CONVERT TO INTEGER
        !           237:
        !           238:        MOVE.L          N(a6),D0
        !           239:        ASL.L           #4,D0
        !           240:        ADDA.L          D0,A1   ...A1 IS THE ADDRESS OF N*PIBY2
        !           241: *                              ...WHICH IS IN TWO PIECES Y1 & Y2
        !           242:
        !           243:        FSUB.X          (A1)+,FP0       ...X-Y1
        !           244: *--HIDE THE NEXT ONE
        !           245:        FSUB.S          (A1),FP0        ...FP0 IS R = (X-Y1)-Y2
        !           246:
        !           247: SINCONT:
        !           248: *--continuation from REDUCEX
        !           249:
        !           250: *--GET N+ADJN AND SEE IF SIN(R) OR COS(R) IS NEEDED
        !           251:        MOVE.L          N(a6),D0
        !           252:        ADD.L           ADJN(a6),D0     ...SEE IF D0 IS ODD OR EVEN
        !           253:        ROR.L           #1,D0   ...D0 WAS ODD IFF D0 IS NEGATIVE
        !           254:        TST.L           D0
        !           255:        BLT.W           COSPOLY
        !           256:
        !           257: SINPOLY:
        !           258: *--LET J BE THE LEAST SIG. BIT OF D0, LET SGN := (-1)**J.
        !           259: *--THEN WE RETURN      SGN*SIN(R). SGN*SIN(R) IS COMPUTED BY
        !           260: *--R' + R'*S*(A1 + S(A2 + S(A3 + S(A4 + ... + SA7)))), WHERE
        !           261: *--R' = SGN*R, S=R*R. THIS CAN BE REWRITTEN AS
        !           262: *--R' + R'*S*( [A1+T(A3+T(A5+TA7))] + [S(A2+T(A4+TA6))])
        !           263: *--WHERE T=S*S.
        !           264: *--NOTE THAT A3 THROUGH A7 ARE STORED IN DOUBLE PRECISION
        !           265: *--WHILE A1 AND A2 ARE IN DOUBLE-EXTENDED FORMAT.
        !           266:        FMOVE.X         FP0,X(a6)       ...X IS R
        !           267:        FMUL.X          FP0,FP0 ...FP0 IS S
        !           268: *---HIDE THE NEXT TWO WHILE WAITING FOR FP0
        !           269:        FMOVE.D         SINA7,FP3
        !           270:        FMOVE.D         SINA6,FP2
        !           271: *--FP0 IS NOW READY
        !           272:        FMOVE.X         FP0,FP1
        !           273:        FMUL.X          FP1,FP1 ...FP1 IS T
        !           274: *--HIDE THE NEXT TWO WHILE WAITING FOR FP1
        !           275:
        !           276:        ROR.L           #1,D0
        !           277:        ANDI.L          #$80000000,D0
        !           278: *                              ...LEAST SIG. BIT OF D0 IN SIGN POSITION
        !           279:        EOR.L           D0,X(a6)        ...X IS NOW R'= SGN*R
        !           280:
        !           281:        FMUL.X          FP1,FP3 ...TA7
        !           282:        FMUL.X          FP1,FP2 ...TA6
        !           283:
        !           284:        FADD.D          SINA5,FP3 ...A5+TA7
        !           285:        FADD.D          SINA4,FP2 ...A4+TA6
        !           286:
        !           287:        FMUL.X          FP1,FP3 ...T(A5+TA7)
        !           288:        FMUL.X          FP1,FP2 ...T(A4+TA6)
        !           289:
        !           290:        FADD.D          SINA3,FP3 ...A3+T(A5+TA7)
        !           291:        FADD.X          SINA2,FP2 ...A2+T(A4+TA6)
        !           292:
        !           293:        FMUL.X          FP3,FP1 ...T(A3+T(A5+TA7))
        !           294:
        !           295:        FMUL.X          FP0,FP2 ...S(A2+T(A4+TA6))
        !           296:        FADD.X          SINA1,FP1 ...A1+T(A3+T(A5+TA7))
        !           297:        FMUL.X          X(a6),FP0       ...R'*S
        !           298:
        !           299:        FADD.X          FP2,FP1 ...[A1+T(A3+T(A5+TA7))]+[S(A2+T(A4+TA6))]
        !           300: *--FP3 RELEASED, RESTORE NOW AND TAKE SOME ADVANTAGE OF HIDING
        !           301: *--FP2 RELEASED, RESTORE NOW AND TAKE FULL ADVANTAGE OF HIDING
        !           302:
        !           303:
        !           304:        FMUL.X          FP1,FP0         ...SIN(R')-R'
        !           305: *--FP1 RELEASED.
        !           306:
        !           307:        FMOVE.L         d1,FPCR         ;restore users exceptions
        !           308:        FADD.X          X(a6),FP0               ;last inst - possible exception set
        !           309:        bra             t_frcinx
        !           310:
        !           311:
        !           312: COSPOLY:
        !           313: *--LET J BE THE LEAST SIG. BIT OF D0, LET SGN := (-1)**J.
        !           314: *--THEN WE RETURN      SGN*COS(R). SGN*COS(R) IS COMPUTED BY
        !           315: *--SGN + S'*(B1 + S(B2 + S(B3 + S(B4 + ... + SB8)))), WHERE
        !           316: *--S=R*R AND S'=SGN*S. THIS CAN BE REWRITTEN AS
        !           317: *--SGN + S'*([B1+T(B3+T(B5+TB7))] + [S(B2+T(B4+T(B6+TB8)))])
        !           318: *--WHERE T=S*S.
        !           319: *--NOTE THAT B4 THROUGH B8 ARE STORED IN DOUBLE PRECISION
        !           320: *--WHILE B2 AND B3 ARE IN DOUBLE-EXTENDED FORMAT, B1 IS -1/2
        !           321: *--AND IS THEREFORE STORED AS SINGLE PRECISION.
        !           322:
        !           323:        FMUL.X          FP0,FP0 ...FP0 IS S
        !           324: *---HIDE THE NEXT TWO WHILE WAITING FOR FP0
        !           325:        FMOVE.D         COSB8,FP2
        !           326:        FMOVE.D         COSB7,FP3
        !           327: *--FP0 IS NOW READY
        !           328:        FMOVE.X         FP0,FP1
        !           329:        FMUL.X          FP1,FP1 ...FP1 IS T
        !           330: *--HIDE THE NEXT TWO WHILE WAITING FOR FP1
        !           331:        FMOVE.X         FP0,X(a6)       ...X IS S
        !           332:        ROR.L           #1,D0
        !           333:        ANDI.L          #$80000000,D0
        !           334: *                      ...LEAST SIG. BIT OF D0 IN SIGN POSITION
        !           335:
        !           336:        FMUL.X          FP1,FP2 ...TB8
        !           337: *--HIDE THE NEXT TWO WHILE WAITING FOR THE XU
        !           338:        EOR.L           D0,X(a6)        ...X IS NOW S'= SGN*S
        !           339:        ANDI.L          #$80000000,D0
        !           340:
        !           341:        FMUL.X          FP1,FP3 ...TB7
        !           342: *--HIDE THE NEXT TWO WHILE WAITING FOR THE XU
        !           343:        ORI.L           #$3F800000,D0   ...D0 IS SGN IN SINGLE
        !           344:        MOVE.L          D0,POSNEG1(a6)
        !           345:
        !           346:        FADD.D          COSB6,FP2 ...B6+TB8
        !           347:        FADD.D          COSB5,FP3 ...B5+TB7
        !           348:
        !           349:        FMUL.X          FP1,FP2 ...T(B6+TB8)
        !           350:        FMUL.X          FP1,FP3 ...T(B5+TB7)
        !           351:
        !           352:        FADD.D          COSB4,FP2 ...B4+T(B6+TB8)
        !           353:        FADD.X          COSB3,FP3 ...B3+T(B5+TB7)
        !           354:
        !           355:        FMUL.X          FP1,FP2 ...T(B4+T(B6+TB8))
        !           356:        FMUL.X          FP3,FP1 ...T(B3+T(B5+TB7))
        !           357:
        !           358:        FADD.X          COSB2,FP2 ...B2+T(B4+T(B6+TB8))
        !           359:        FADD.S          COSB1,FP1 ...B1+T(B3+T(B5+TB7))
        !           360:
        !           361:        FMUL.X          FP2,FP0 ...S(B2+T(B4+T(B6+TB8)))
        !           362: *--FP3 RELEASED, RESTORE NOW AND TAKE SOME ADVANTAGE OF HIDING
        !           363: *--FP2 RELEASED.
        !           364:
        !           365:
        !           366:        FADD.X          FP1,FP0
        !           367: *--FP1 RELEASED
        !           368:
        !           369:        FMUL.X          X(a6),FP0
        !           370:
        !           371:        FMOVE.L         d1,FPCR         ;restore users exceptions
        !           372:        FADD.S          POSNEG1(a6),FP0 ;last inst - possible exception set
        !           373:        bra             t_frcinx
        !           374:
        !           375:
        !           376: SINBORS:
        !           377: *--IF |X| > 15PI, WE USE THE GENERAL ARGUMENT REDUCTION.
        !           378: *--IF |X| < 2**(-40), RETURN X OR 1.
        !           379:        CMPI.L          #$3FFF8000,D0
        !           380:        BGT.B           REDUCEX
        !           381:
        !           382:
        !           383: SINSM:
        !           384:        MOVE.L          ADJN(a6),D0
        !           385:        TST.L           D0
        !           386:        BGT.B           COSTINY
        !           387:
        !           388: SINTINY:
        !           389:        CLR.W           XDCARE(a6)      ...JUST IN CASE
        !           390:        FMOVE.L         d1,FPCR         ;restore users exceptions
        !           391:        FMOVE.X         X(a6),FP0               ;last inst - possible exception set
        !           392:        bra             t_frcinx
        !           393:
        !           394:
        !           395: COSTINY:
        !           396:        FMOVE.S         #:3F800000,FP0
        !           397:
        !           398:        FMOVE.L         d1,FPCR         ;restore users exceptions
        !           399:        FSUB.S          #:00800000,FP0  ;last inst - possible exception set
        !           400:        bra             t_frcinx
        !           401:
        !           402:
        !           403: REDUCEX:
        !           404: *--WHEN REDUCEX IS USED, THE CODE WILL INEVITABLY BE SLOW.
        !           405: *--THIS REDUCTION METHOD, HOWEVER, IS MUCH FASTER THAN USING
        !           406: *--THE REMAINDER INSTRUCTION WHICH IS NOW IN SOFTWARE.
        !           407:
        !           408:        FMOVEM.X        FP2-FP5,-(A7)   ...save FP2 through FP5
        !           409:        MOVE.L          D2,-(A7)
        !           410:         FMOVE.S         #:00000000,FP1
        !           411: *--If compact form of abs(arg) in d0=$7ffeffff, argument is so large that
        !           412: *--there is a danger of unwanted overflow in first LOOP iteration.  In this
        !           413: *--case, reduce argument by one remainder step to make subsequent reduction
        !           414: *--safe.
        !           415:        cmpi.l  #$7ffeffff,d0           ;is argument dangerously large?
        !           416:        bne.b   LOOP
        !           417:        move.l  #$7ffe0000,FP_SCR2(a6)  ;yes
        !           418: *                                      ;create 2**16383*PI/2
        !           419:        move.l  #$c90fdaa2,FP_SCR2+4(a6)
        !           420:        clr.l   FP_SCR2+8(a6)
        !           421:        ftst.x  fp0                     ;test sign of argument
        !           422:        move.l  #$7fdc0000,FP_SCR3(a6)  ;create low half of 2**16383*
        !           423: *                                      ;PI/2 at FP_SCR3
        !           424:        move.l  #$85a308d3,FP_SCR3+4(a6)
        !           425:        clr.l   FP_SCR3+8(a6)
        !           426:        fblt.w  red_neg
        !           427:        or.w    #$8000,FP_SCR2(a6)      ;positive arg
        !           428:        or.w    #$8000,FP_SCR3(a6)
        !           429: red_neg:
        !           430:        fadd.x  FP_SCR2(a6),fp0         ;high part of reduction is exact
        !           431:        fmove.x  fp0,fp1                ;save high result in fp1
        !           432:        fadd.x  FP_SCR3(a6),fp0         ;low part of reduction
        !           433:        fsub.x  fp0,fp1                 ;determine low component of result
        !           434:        fadd.x  FP_SCR3(a6),fp1         ;fp0/fp1 are reduced argument.
        !           435:
        !           436: *--ON ENTRY, FP0 IS X, ON RETURN, FP0 IS X REM PI/2, |X| <= PI/4.
        !           437: *--integer quotient will be stored in N
        !           438: *--Intermeditate remainder is 66-bit long; (R,r) in (FP0,FP1)
        !           439:
        !           440: LOOP:
        !           441:        FMOVE.X         FP0,INARG(a6)   ...+-2**K * F, 1 <= F < 2
        !           442:        MOVE.W          INARG(a6),D0
        !           443:         MOVE.L          D0,A1          ...save a copy of D0
        !           444:        ANDI.L          #$00007FFF,D0
        !           445:        SUBI.L          #$00003FFF,D0   ...D0 IS K
        !           446:        CMPI.L          #28,D0
        !           447:        BLE.B           LASTLOOP
        !           448: CONTLOOP:
        !           449:        SUBI.L          #27,D0   ...D0 IS L := K-27
        !           450:        CLR.L           ENDFLAG(a6)
        !           451:        BRA.B           WORK
        !           452: LASTLOOP:
        !           453:        CLR.L           D0              ...D0 IS L := 0
        !           454:        MOVE.L          #1,ENDFLAG(a6)
        !           455:
        !           456: WORK:
        !           457: *--FIND THE REMAINDER OF (R,r) W.R.T.  2**L * (PI/2). L IS SO CHOSEN
        !           458: *--THAT        INT( X * (2/PI) / 2**(L) ) < 2**29.
        !           459:
        !           460: *--CREATE 2**(-L) * (2/PI), SIGN(INARG)*2**(63),
        !           461: *--2**L * (PIby2_1), 2**L * (PIby2_2)
        !           462:
        !           463:        MOVE.L          #$00003FFE,D2   ...BIASED EXPO OF 2/PI
        !           464:        SUB.L           D0,D2           ...BIASED EXPO OF 2**(-L)*(2/PI)
        !           465:
        !           466:        MOVE.L          #$A2F9836E,FP_SCR1+4(a6)
        !           467:        MOVE.L          #$4E44152A,FP_SCR1+8(a6)
        !           468:        MOVE.W          D2,FP_SCR1(a6)  ...FP_SCR1 is 2**(-L)*(2/PI)
        !           469:
        !           470:        FMOVE.X         FP0,FP2
        !           471:        FMUL.X          FP_SCR1(a6),FP2
        !           472: *--WE MUST NOW FIND INT(FP2). SINCE WE NEED THIS VALUE IN
        !           473: *--FLOATING POINT FORMAT, THE TWO FMOVE'S      FMOVE.L FP <--> N
        !           474: *--WILL BE TOO INEFFICIENT. THE WAY AROUND IT IS THAT
        !           475: *--(SIGN(INARG)*2**63  +       FP2) - SIGN(INARG)*2**63 WILL GIVE
        !           476: *--US THE DESIRED VALUE IN FLOATING POINT.
        !           477:
        !           478: *--HIDE SIX CYCLES OF INSTRUCTION
        !           479:         MOVE.L         A1,D2
        !           480:         SWAP           D2
        !           481:        ANDI.L          #$80000000,D2
        !           482:        ORI.L           #$5F000000,D2   ...D2 IS SIGN(INARG)*2**63 IN SGL
        !           483:        MOVE.L          D2,TWOTO63(a6)
        !           484:
        !           485:        MOVE.L          D0,D2
        !           486:        ADDI.L          #$00003FFF,D2   ...BIASED EXPO OF 2**L * (PI/2)
        !           487:
        !           488: *--FP2 IS READY
        !           489:        FADD.S          TWOTO63(a6),FP2 ...THE FRACTIONAL PART OF FP1 IS ROUNDED
        !           490:
        !           491: *--HIDE 4 CYCLES OF INSTRUCTION; creating 2**(L)*Piby2_1  and  2**(L)*Piby2_2
        !           492:         MOVE.W         D2,FP_SCR2(a6)
        !           493:        CLR.W           FP_SCR2+2(a6)
        !           494:        MOVE.L          #$C90FDAA2,FP_SCR2+4(a6)
        !           495:        CLR.L           FP_SCR2+8(a6)           ...FP_SCR2 is  2**(L) * Piby2_1
        !           496:
        !           497: *--FP2 IS READY
        !           498:        FSUB.S          TWOTO63(a6),FP2         ...FP2 is N
        !           499:
        !           500:        ADDI.L          #$00003FDD,D0
        !           501:         MOVE.W         D0,FP_SCR3(a6)
        !           502:        CLR.W           FP_SCR3+2(a6)
        !           503:        MOVE.L          #$85A308D3,FP_SCR3+4(a6)
        !           504:        CLR.L           FP_SCR3+8(a6)           ...FP_SCR3 is 2**(L) * Piby2_2
        !           505:
        !           506:        MOVE.L          ENDFLAG(a6),D0
        !           507:
        !           508: *--We are now ready to perform (R+r) - N*P1 - N*P2, P1 = 2**(L) * Piby2_1 and
        !           509: *--P2 = 2**(L) * Piby2_2
        !           510:        FMOVE.X         FP2,FP4
        !           511:        FMul.X          FP_SCR2(a6),FP4         ...W = N*P1
        !           512:        FMove.X         FP2,FP5
        !           513:        FMul.X          FP_SCR3(a6),FP5         ...w = N*P2
        !           514:        FMove.X         FP4,FP3
        !           515: *--we want P+p = W+w  but  |p| <= half ulp of P
        !           516: *--Then, we need to compute  A := R-P   and  a := r-p
        !           517:        FAdd.X          FP5,FP3                 ...FP3 is P
        !           518:        FSub.X          FP3,FP4                 ...W-P
        !           519:
        !           520:        FSub.X          FP3,FP0                 ...FP0 is A := R - P
        !           521:         FAdd.X         FP5,FP4                 ...FP4 is p = (W-P)+w
        !           522:
        !           523:        FMove.X         FP0,FP3                 ...FP3 A
        !           524:        FSub.X          FP4,FP1                 ...FP1 is a := r - p
        !           525:
        !           526: *--Now we need to normalize (A,a) to  "new (R,r)" where R+r = A+a but
        !           527: *--|r| <= half ulp of R.
        !           528:        FAdd.X          FP1,FP0                 ...FP0 is R := A+a
        !           529: *--No need to calculate r if this is the last loop
        !           530:        TST.L           D0
        !           531:        BGT.W           RESTORE
        !           532:
        !           533: *--Need to calculate r
        !           534:        FSub.X          FP0,FP3                 ...A-R
        !           535:        FAdd.X          FP3,FP1                 ...FP1 is r := (A-R)+a
        !           536:        BRA.W           LOOP
        !           537:
        !           538: RESTORE:
        !           539:         FMOVE.L                FP2,N(a6)
        !           540:        MOVE.L          (A7)+,D2
        !           541:        FMOVEM.X        (A7)+,FP2-FP5
        !           542:
        !           543:
        !           544:        MOVE.L          ADJN(a6),D0
        !           545:        CMPI.L          #4,D0
        !           546:
        !           547:        BLT.W           SINCONT
        !           548:        BRA.B           SCCONT
        !           549:
        !           550:        xdef    ssincosd
        !           551: ssincosd:
        !           552: *--SIN AND COS OF X FOR DENORMALIZED X
        !           553:
        !           554:        FMOVE.S         #:3F800000,FP1
        !           555:        bsr             sto_cos         ;store cosine result
        !           556:        bra             t_extdnrm
        !           557:
        !           558:        xdef    ssincos
        !           559: ssincos:
        !           560: *--SET ADJN TO 4
        !           561:        MOVE.L          #4,ADJN(a6)
        !           562:
        !           563:        FMOVE.X         (a0),FP0        ...LOAD INPUT
        !           564:
        !           565:        MOVE.L          (A0),D0
        !           566:        MOVE.W          4(A0),D0
        !           567:        FMOVE.X         FP0,X(a6)
        !           568:        ANDI.L          #$7FFFFFFF,D0           ...COMPACTIFY X
        !           569:
        !           570:        CMPI.L          #$3FD78000,D0           ...|X| >= 2**(-40)?
        !           571:        BGE.B           SCOK1
        !           572:        BRA.W           SCSM
        !           573:
        !           574: SCOK1:
        !           575:        CMPI.L          #$4004BC7E,D0           ...|X| < 15 PI?
        !           576:        BLT.B           SCMAIN
        !           577:        BRA.W           REDUCEX
        !           578:
        !           579:
        !           580: SCMAIN:
        !           581: *--THIS IS THE USUAL CASE, |X| <= 15 PI.
        !           582: *--THE ARGUMENT REDUCTION IS DONE BY TABLE LOOK UP.
        !           583:        FMOVE.X         FP0,FP1
        !           584:        FMUL.D          TWOBYPI,FP1     ...X*2/PI
        !           585:
        !           586: *--HIDE THE NEXT THREE INSTRUCTIONS
        !           587:        LEA             PITBL+$200,A1 ...TABLE OF N*PI/2, N = -32,...,32
        !           588:
        !           589:
        !           590: *--FP1 IS NOW READY
        !           591:        FMOVE.L         FP1,N(a6)               ...CONVERT TO INTEGER
        !           592:
        !           593:        MOVE.L          N(a6),D0
        !           594:        ASL.L           #4,D0
        !           595:        ADDA.L          D0,A1           ...ADDRESS OF N*PIBY2, IN Y1, Y2
        !           596:
        !           597:        FSUB.X          (A1)+,FP0       ...X-Y1
        !           598:         FSUB.S         (A1),FP0        ...FP0 IS R = (X-Y1)-Y2
        !           599:
        !           600: SCCONT:
        !           601: *--continuation point from REDUCEX
        !           602:
        !           603: *--HIDE THE NEXT TWO
        !           604:        MOVE.L          N(a6),D0
        !           605:        ROR.L           #1,D0
        !           606:
        !           607:        TST.L           D0              ...D0 < 0 IFF N IS ODD
        !           608:        BGE.W           NEVEN
        !           609:
        !           610: NODD:
        !           611: *--REGISTERS SAVED SO FAR: D0, A0, FP2.
        !           612:
        !           613:        FMOVE.X         FP0,RPRIME(a6)
        !           614:        FMUL.X          FP0,FP0  ...FP0 IS S = R*R
        !           615:        FMOVE.D         SINA7,FP1       ...A7
        !           616:        FMOVE.D         COSB8,FP2       ...B8
        !           617:        FMUL.X          FP0,FP1  ...SA7
        !           618:        MOVE.L          d2,-(A7)
        !           619:        MOVE.L          D0,d2
        !           620:        FMUL.X          FP0,FP2  ...SB8
        !           621:        ROR.L           #1,d2
        !           622:        ANDI.L          #$80000000,d2
        !           623:
        !           624:        FADD.D          SINA6,FP1       ...A6+SA7
        !           625:        EOR.L           D0,d2
        !           626:        ANDI.L          #$80000000,d2
        !           627:        FADD.D          COSB7,FP2       ...B7+SB8
        !           628:
        !           629:        FMUL.X          FP0,FP1  ...S(A6+SA7)
        !           630:        EOR.L           d2,RPRIME(a6)
        !           631:        MOVE.L          (A7)+,d2
        !           632:        FMUL.X          FP0,FP2  ...S(B7+SB8)
        !           633:        ROR.L           #1,D0
        !           634:        ANDI.L          #$80000000,D0
        !           635:
        !           636:        FADD.D          SINA5,FP1       ...A5+S(A6+SA7)
        !           637:        MOVE.L          #$3F800000,POSNEG1(a6)
        !           638:        EOR.L           D0,POSNEG1(a6)
        !           639:        FADD.D          COSB6,FP2       ...B6+S(B7+SB8)
        !           640:
        !           641:        FMUL.X          FP0,FP1  ...S(A5+S(A6+SA7))
        !           642:        FMUL.X          FP0,FP2  ...S(B6+S(B7+SB8))
        !           643:        FMOVE.X         FP0,SPRIME(a6)
        !           644:
        !           645:        FADD.D          SINA4,FP1       ...A4+S(A5+S(A6+SA7))
        !           646:        EOR.L           D0,SPRIME(a6)
        !           647:        FADD.D          COSB5,FP2       ...B5+S(B6+S(B7+SB8))
        !           648:
        !           649:        FMUL.X          FP0,FP1  ...S(A4+...)
        !           650:        FMUL.X          FP0,FP2  ...S(B5+...)
        !           651:
        !           652:        FADD.D          SINA3,FP1       ...A3+S(A4+...)
        !           653:        FADD.D          COSB4,FP2       ...B4+S(B5+...)
        !           654:
        !           655:        FMUL.X          FP0,FP1  ...S(A3+...)
        !           656:        FMUL.X          FP0,FP2  ...S(B4+...)
        !           657:
        !           658:        FADD.X          SINA2,FP1       ...A2+S(A3+...)
        !           659:        FADD.X          COSB3,FP2       ...B3+S(B4+...)
        !           660:
        !           661:        FMUL.X          FP0,FP1  ...S(A2+...)
        !           662:        FMUL.X          FP0,FP2  ...S(B3+...)
        !           663:
        !           664:        FADD.X          SINA1,FP1       ...A1+S(A2+...)
        !           665:        FADD.X          COSB2,FP2       ...B2+S(B3+...)
        !           666:
        !           667:        FMUL.X          FP0,FP1  ...S(A1+...)
        !           668:        FMUL.X          FP2,FP0  ...S(B2+...)
        !           669:
        !           670:
        !           671:
        !           672:        FMUL.X          RPRIME(a6),FP1  ...R'S(A1+...)
        !           673:        FADD.S          COSB1,FP0       ...B1+S(B2...)
        !           674:        FMUL.X          SPRIME(a6),FP0  ...S'(B1+S(B2+...))
        !           675:
        !           676:        move.l          d1,-(sp)        ;restore users mode & precision
        !           677:        andi.l          #$ff,d1         ;mask off all exceptions
        !           678:        fmove.l         d1,FPCR
        !           679:        FADD.X          RPRIME(a6),FP1  ...COS(X)
        !           680:        bsr             sto_cos         ;store cosine result
        !           681:        FMOVE.L         (sp)+,FPCR      ;restore users exceptions
        !           682:        FADD.S          POSNEG1(a6),FP0 ...SIN(X)
        !           683:
        !           684:        bra             t_frcinx
        !           685:
        !           686:
        !           687: NEVEN:
        !           688: *--REGISTERS SAVED SO FAR: FP2.
        !           689:
        !           690:        FMOVE.X         FP0,RPRIME(a6)
        !           691:        FMUL.X          FP0,FP0  ...FP0 IS S = R*R
        !           692:        FMOVE.D         COSB8,FP1                       ...B8
        !           693:        FMOVE.D         SINA7,FP2                       ...A7
        !           694:        FMUL.X          FP0,FP1  ...SB8
        !           695:        FMOVE.X         FP0,SPRIME(a6)
        !           696:        FMUL.X          FP0,FP2  ...SA7
        !           697:        ROR.L           #1,D0
        !           698:        ANDI.L          #$80000000,D0
        !           699:        FADD.D          COSB7,FP1       ...B7+SB8
        !           700:        FADD.D          SINA6,FP2       ...A6+SA7
        !           701:        EOR.L           D0,RPRIME(a6)
        !           702:        EOR.L           D0,SPRIME(a6)
        !           703:        FMUL.X          FP0,FP1  ...S(B7+SB8)
        !           704:        ORI.L           #$3F800000,D0
        !           705:        MOVE.L          D0,POSNEG1(a6)
        !           706:        FMUL.X          FP0,FP2  ...S(A6+SA7)
        !           707:
        !           708:        FADD.D          COSB6,FP1       ...B6+S(B7+SB8)
        !           709:        FADD.D          SINA5,FP2       ...A5+S(A6+SA7)
        !           710:
        !           711:        FMUL.X          FP0,FP1  ...S(B6+S(B7+SB8))
        !           712:        FMUL.X          FP0,FP2  ...S(A5+S(A6+SA7))
        !           713:
        !           714:        FADD.D          COSB5,FP1       ...B5+S(B6+S(B7+SB8))
        !           715:        FADD.D          SINA4,FP2       ...A4+S(A5+S(A6+SA7))
        !           716:
        !           717:        FMUL.X          FP0,FP1  ...S(B5+...)
        !           718:        FMUL.X          FP0,FP2  ...S(A4+...)
        !           719:
        !           720:        FADD.D          COSB4,FP1       ...B4+S(B5+...)
        !           721:        FADD.D          SINA3,FP2       ...A3+S(A4+...)
        !           722:
        !           723:        FMUL.X          FP0,FP1  ...S(B4+...)
        !           724:        FMUL.X          FP0,FP2  ...S(A3+...)
        !           725:
        !           726:        FADD.X          COSB3,FP1       ...B3+S(B4+...)
        !           727:        FADD.X          SINA2,FP2       ...A2+S(A3+...)
        !           728:
        !           729:        FMUL.X          FP0,FP1  ...S(B3+...)
        !           730:        FMUL.X          FP0,FP2  ...S(A2+...)
        !           731:
        !           732:        FADD.X          COSB2,FP1       ...B2+S(B3+...)
        !           733:        FADD.X          SINA1,FP2       ...A1+S(A2+...)
        !           734:
        !           735:        FMUL.X          FP0,FP1  ...S(B2+...)
        !           736:        fmul.x          fp2,fp0  ...s(a1+...)
        !           737:
        !           738:
        !           739:
        !           740:        FADD.S          COSB1,FP1       ...B1+S(B2...)
        !           741:        FMUL.X          RPRIME(a6),FP0  ...R'S(A1+...)
        !           742:        FMUL.X          SPRIME(a6),FP1  ...S'(B1+S(B2+...))
        !           743:
        !           744:        move.l          d1,-(sp)        ;save users mode & precision
        !           745:        andi.l          #$ff,d1         ;mask off all exceptions
        !           746:        fmove.l         d1,FPCR
        !           747:        FADD.S          POSNEG1(a6),FP1 ...COS(X)
        !           748:        bsr             sto_cos         ;store cosine result
        !           749:        FMOVE.L         (sp)+,FPCR      ;restore users exceptions
        !           750:        FADD.X          RPRIME(a6),FP0  ...SIN(X)
        !           751:
        !           752:        bra             t_frcinx
        !           753:
        !           754: SCBORS:
        !           755:        CMPI.L          #$3FFF8000,D0
        !           756:        BGT.W           REDUCEX
        !           757:
        !           758:
        !           759: SCSM:
        !           760:        CLR.W           XDCARE(a6)
        !           761:        FMOVE.S         #:3F800000,FP1
        !           762:
        !           763:        move.l          d1,-(sp)        ;save users mode & precision
        !           764:        andi.l          #$ff,d1         ;mask off all exceptions
        !           765:        fmove.l         d1,FPCR
        !           766:        FSUB.S          #:00800000,FP1
        !           767:        bsr             sto_cos         ;store cosine result
        !           768:        FMOVE.L         (sp)+,FPCR      ;restore users exceptions
        !           769:        FMOVE.X         X(a6),FP0
        !           770:        bra             t_frcinx
        !           771:
        !           772:        end
CVSweb