0.pre7.60:
[sbcl.git] / src / assembly / x86 / arith.lisp
1 ;;;; simple cases for generic arithmetic
2
3 ;;;; This software is part of the SBCL system. See the README file for
4 ;;;; more information.
5 ;;;;
6 ;;;; This software is derived from the CMU CL system, which was
7 ;;;; written at Carnegie Mellon University and released into the
8 ;;;; public domain. The software is in the public domain and is
9 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
10 ;;;; files for more information.
11
12 (in-package "SB!VM")
13 \f
14 ;;;; addition, subtraction, and multiplication
15
16 (macrolet ((define-generic-arith-routine ((fun cost) &body body)
17              `(define-assembly-routine (,(symbolicate "GENERIC-" fun)
18                                         (:cost ,cost)
19                                         (:return-style :full-call)
20                                         (:translate ,fun)
21                                         (:policy :safe)
22                                         (:save-p t))
23                 ((:arg x (descriptor-reg any-reg) edx-offset)
24                  (:arg y (descriptor-reg any-reg)
25                        ;; this seems wrong esi-offset -- FIXME: What's it mean?
26                        edi-offset)
27
28                  (:res res (descriptor-reg any-reg) edx-offset)
29
30                  (:temp eax unsigned-reg eax-offset)
31                  (:temp ebx unsigned-reg ebx-offset)
32                  (:temp ecx unsigned-reg ecx-offset))
33
34                 (declare (ignorable ebx))
35
36                 (inst test x 3)  ; fixnum?
37                 (inst jmp :nz DO-STATIC-FUN) ; no - do generic
38                 (inst test y 3)  ; fixnum?
39                 (inst jmp :z DO-BODY)   ; yes - doit here
40
41                 DO-STATIC-FUN
42                 (inst pop eax)
43                 (inst push ebp-tn)
44                 (inst lea
45                       ebp-tn
46                       (make-ea :dword :base esp-tn :disp n-word-bytes))
47                 (inst sub esp-tn (fixnumize 2))
48                 (inst push eax)  ; callers return addr
49                 (inst mov ecx (fixnumize 2)) ; arg count
50                 (inst jmp
51                       (make-ea :dword
52                                :disp (+ nil-value
53                                         (static-function-offset
54                                          ',(symbolicate "TWO-ARG-" fun)))))
55
56                 DO-BODY
57                 ,@body)))
58
59   (define-generic-arith-routine (+ 10)
60     (move res x)
61     (inst add res y)
62     (inst jmp :no OKAY)
63     (inst rcr res 1)                  ; carry has correct sign
64     (inst sar res 1)                  ; remove type bits
65
66     (move ecx res)
67
68     (with-fixed-allocation (res bignum-widetag (1+ bignum-digits-offset))
69       (storew ecx res bignum-digits-offset other-pointer-lowtag))
70
71     OKAY)
72
73   (define-generic-arith-routine (- 10)
74     ;; FIXME: This is screwed up.
75       ;;; I can't figure out the flags on subtract. Overflow never gets
76       ;;; set and carry always does. (- 0 most-negative-fixnum) can't be
77       ;;; easily detected so just let the upper level stuff do it.
78     (inst jmp DO-STATIC-FUN)
79
80     (move res x)
81     (inst sub res y)
82     (inst jmp :no OKAY)
83     (inst rcr res 1)
84     (inst sar res 1)                  ; remove type bits
85
86     (move ecx res)
87
88     (with-fixed-allocation (res bignum-widetag (1+ bignum-digits-offset))
89       (storew ecx res bignum-digits-offset other-pointer-lowtag))
90     OKAY)
91
92   (define-generic-arith-routine (* 30)
93     (move eax x)                          ; must use eax for 64-bit result
94     (inst sar eax 2)                  ; remove *4 fixnum bias
95     (inst imul y)                        ; result in edx:eax
96     (inst jmp :no okay)            ; still fixnum
97
98     ;; zzz jrd changed edx to ebx in here, as edx isn't listed as a temp, above
99     ;;     pfw says that loses big -- edx is target for arg x and result res
100     ;;     note that 'edx' is not defined -- using x
101     (inst shrd eax x 2)            ; high bits from edx
102     (inst sar x 2)                      ; now shift edx too
103
104     (move ecx x)                          ; save high bits from cdq
105     (inst cdq)                      ; edx:eax <- sign-extend of eax
106     (inst cmp x ecx)
107     (inst jmp :e SINGLE-WORD-BIGNUM)
108
109     (with-fixed-allocation (res bignum-widetag (+ bignum-digits-offset 2))
110       (storew eax res bignum-digits-offset other-pointer-lowtag)
111       (storew ecx res (1+ bignum-digits-offset) other-pointer-lowtag))
112     (inst jmp DONE)
113
114     SINGLE-WORD-BIGNUM
115
116     (with-fixed-allocation (res bignum-widetag (1+ bignum-digits-offset))
117       (storew eax res bignum-digits-offset other-pointer-lowtag))
118     (inst jmp DONE)
119
120     OKAY
121     (move res eax)
122     DONE))
123 \f
124 ;;;; negation
125
126 (define-assembly-routine (generic-negate
127                           (:cost 10)
128                           (:return-style :full-call)
129                           (:policy :safe)
130                           (:translate %negate)
131                           (:save-p t))
132                          ((:arg x (descriptor-reg any-reg) edx-offset)
133                           (:res res (descriptor-reg any-reg) edx-offset)
134
135                           (:temp eax unsigned-reg eax-offset)
136                           (:temp ecx unsigned-reg ecx-offset))
137   (inst test x 3)
138   (inst jmp :z FIXNUM)
139
140   (inst pop eax)
141   (inst push ebp-tn)
142   (inst lea ebp-tn (make-ea :dword :base esp-tn :disp n-word-bytes))
143   (inst sub esp-tn (fixnumize 2))
144   (inst push eax)
145   (inst mov ecx (fixnumize 1))    ; arg count
146   (inst jmp (make-ea :dword
147                      :disp (+ nil-value (static-function-offset '%negate))))
148
149   FIXNUM
150   (move res x)
151   (inst neg res)                        ; (- most-negative-fixnum) is BIGNUM
152   (inst jmp :no OKAY)
153   (inst shr res 2)                    ; sign bit is data - remove type bits
154   (move ecx res)
155
156   (with-fixed-allocation (res bignum-widetag (1+ bignum-digits-offset))
157     (storew ecx res bignum-digits-offset other-pointer-lowtag))
158
159   OKAY)
160 \f
161 ;;;; comparison
162
163 (macrolet ((define-cond-assem-rtn (name translate static-fn test)
164              `(define-assembly-routine (,name
165                                         (:cost 10)
166                                         (:return-style :full-call)
167                                         (:policy :safe)
168                                         (:translate ,translate)
169                                         (:save-p t))
170                 ((:arg x (descriptor-reg any-reg) edx-offset)
171                  (:arg y (descriptor-reg any-reg) edi-offset)
172
173                  (:res res descriptor-reg edx-offset)
174
175                  (:temp eax unsigned-reg eax-offset)
176                  (:temp ecx unsigned-reg ecx-offset))
177
178                 ;; KLUDGE: The "3" here is a mask for the bits which will be
179                 ;; zero in a fixnum. It should have a symbolic name. (Actually,
180                 ;; it might already have a symbolic name which the coder
181                 ;; couldn't be bothered to use..) -- WHN 19990917
182                 (inst test x 3)
183                 (inst jmp :nz TAIL-CALL-TO-STATIC-FN)
184                 (inst test y 3)
185                 (inst jmp :z INLINE-FIXNUM-COMPARE)
186
187                 TAIL-CALL-TO-STATIC-FN
188                 (inst pop eax)
189                 (inst push ebp-tn)
190                 (inst lea ebp-tn (make-ea :dword
191                                           :base esp-tn
192                                           :disp n-word-bytes))
193                 (inst sub esp-tn (fixnumize 2)) ; FIXME: Push 2 words on stack,
194                                                 ; weirdly?
195                 (inst push eax)
196                 (inst mov ecx (fixnumize 2)) ; FIXME: FIXNUMIZE and
197                                         ; SINGLE-FLOAT-BITS are parallel,
198                                         ; should be named parallelly.
199                 (inst jmp (make-ea :dword
200                                    :disp (+ nil-value
201                                             (static-function-offset
202                                              ',static-fn))))
203
204                 INLINE-FIXNUM-COMPARE
205                 (inst cmp x y)
206                 (inst jmp ,test RETURN-TRUE)
207                 (inst mov res nil-value)
208                 ;; FIXME: A note explaining this return convention, or a
209                 ;; symbolic name for it, would be nice. (It looks as though we
210                 ;; should be hand-crafting the same return sequence as would be
211                 ;; produced by GENERATE-RETURN-SEQUENCE, but in that case it's
212                 ;; not clear why we don't just jump to the end of this function
213                 ;; to share the return sequence there.
214                 (inst pop eax)
215                 (inst add eax 2)
216                 (inst jmp eax)
217
218                 RETURN-TRUE
219                 (load-symbol res t))))
220
221   (define-cond-assem-rtn generic-< < two-arg-< :l)
222   (define-cond-assem-rtn generic-> > two-arg-> :g))
223
224 (define-assembly-routine (generic-eql
225                           (:cost 10)
226                           (:return-style :full-call)
227                           (:policy :safe)
228                           (:translate eql)
229                           (:save-p t))
230                          ((:arg x (descriptor-reg any-reg) edx-offset)
231                           (:arg y (descriptor-reg any-reg) edi-offset)
232
233                           (:res res descriptor-reg edx-offset)
234
235                           (:temp eax unsigned-reg eax-offset)
236                           (:temp ecx unsigned-reg ecx-offset))
237   (inst cmp x y)
238   (inst jmp :e RETURN-T)
239   (inst test x 3)
240   (inst jmp :z RETURN-NIL)
241   (inst test y 3)
242   (inst jmp :nz DO-STATIC-FN)
243
244   RETURN-NIL
245   (inst mov res nil-value)
246   (inst pop eax)
247   (inst add eax 2)
248   (inst jmp eax)
249
250   DO-STATIC-FN
251   (inst pop eax)
252   (inst push ebp-tn)
253   (inst lea ebp-tn (make-ea :dword :base esp-tn :disp n-word-bytes))
254   (inst sub esp-tn (fixnumize 2))
255   (inst push eax)
256   (inst mov ecx (fixnumize 2))
257   (inst jmp (make-ea :dword
258                      :disp (+ nil-value (static-function-offset 'eql))))
259
260   RETURN-T
261   (load-symbol res t)
262   ;; FIXME: I don't understand how we return from here..
263   )
264
265 (define-assembly-routine (generic-=
266                           (:cost 10)
267                           (:return-style :full-call)
268                           (:policy :safe)
269                           (:translate =)
270                           (:save-p t))
271                          ((:arg x (descriptor-reg any-reg) edx-offset)
272                           (:arg y (descriptor-reg any-reg) edi-offset)
273
274                           (:res res descriptor-reg edx-offset)
275
276                           (:temp eax unsigned-reg eax-offset)
277                           (:temp ecx unsigned-reg ecx-offset)
278                           )
279   (inst test x 3)                      ; descriptor?
280   (inst jmp :nz DO-STATIC-FN)          ; yes, do it here
281   (inst test y 3)                      ; descriptor?
282   (inst jmp :nz DO-STATIC-FN)
283   (inst cmp x y)
284   (inst jmp :e RETURN-T)                ; ok
285
286   (inst mov res nil-value)
287   (inst pop eax)
288   (inst add eax 2)
289   (inst jmp eax)
290
291   DO-STATIC-FN
292   (inst pop eax)
293   (inst push ebp-tn)
294   (inst lea ebp-tn (make-ea :dword :base esp-tn :disp n-word-bytes))
295   (inst sub esp-tn (fixnumize 2))
296   (inst push eax)
297   (inst mov ecx (fixnumize 2))
298   (inst jmp (make-ea :dword
299                      :disp (+ nil-value (static-function-offset 'two-arg-=))))
300
301   RETURN-T
302   (load-symbol res t))
303
304 \f
305 ;;; Support for the Mersenne Twister, MT19937, random number generator
306 ;;; due to Matsumoto and Nishimura.
307 ;;;
308 ;;; Makoto Matsumoto and T. Nishimura, "Mersenne twister: A
309 ;;; 623-dimensionally equidistributed uniform pseudorandom number
310 ;;; generator.", ACM Transactions on Modeling and Computer Simulation,
311 ;;; 1997, to appear.
312 ;;;
313 ;;; State:
314 ;;;  0-1:   Constant matrix A. [0, #x9908b0df] (not used here)
315 ;;;  2:     Index; init. to 1.
316 ;;;  3-626: State.
317
318 ;;; This assembly routine is called from the inline VOP and updates
319 ;;; the state vector with new random numbers. The state vector is
320 ;;; passed in the EAX register.
321 #+sb-assembling ; We don't want a vop for this one.
322 (define-assembly-routine
323     (random-mt19937-update)
324     ((:temp state unsigned-reg eax-offset)
325      (:temp k unsigned-reg ebx-offset)
326      (:temp y unsigned-reg ecx-offset)
327      (:temp tmp unsigned-reg edx-offset))
328
329   ;; Save the temporary registers.
330   (inst push k)
331   (inst push y)
332   (inst push tmp)
333
334   ;; Generate a new set of results.
335   (inst xor k k)
336   LOOP1
337   (inst mov y (make-ea :dword :base state :index k :scale 4
338                        :disp (- (* (+ 3 vector-data-offset)
339                                    n-word-bytes)
340                                 other-pointer-lowtag)))
341   (inst mov tmp (make-ea :dword :base state :index k :scale 4
342                          :disp (- (* (+ 1 3 vector-data-offset)
343                                      n-word-bytes)
344                                   other-pointer-lowtag)))
345   (inst and y #x80000000)
346   (inst and tmp #x7fffffff)
347   (inst or y tmp)
348   (inst shr y 1)
349   (inst jmp :nc skip1)
350   (inst xor y #x9908b0df)
351   SKIP1
352   (inst xor y (make-ea :dword :base state :index k :scale 4
353                        :disp (- (* (+ 397 3 vector-data-offset)
354                                    n-word-bytes)
355                                 other-pointer-lowtag)))
356   (inst mov (make-ea :dword :base state :index k :scale 4
357                      :disp (- (* (+ 3 vector-data-offset)
358                                  n-word-bytes)
359                               other-pointer-lowtag))
360         y)
361   (inst inc k)
362   (inst cmp k (- 624 397))
363   (inst jmp :b loop1)
364   LOOP2
365   (inst mov y (make-ea :dword :base state :index k :scale 4
366                        :disp (- (* (+ 3 vector-data-offset)
367                                    n-word-bytes)
368                                 other-pointer-lowtag)))
369   (inst mov tmp (make-ea :dword :base state :index k :scale 4
370                          :disp (- (* (+ 1 3 vector-data-offset)
371                                      n-word-bytes)
372                                   other-pointer-lowtag)))
373   (inst and y #x80000000)
374   (inst and tmp #x7fffffff)
375   (inst or y tmp)
376   (inst shr y 1)
377   (inst jmp :nc skip2)
378   (inst xor y #x9908b0df)
379   SKIP2
380   (inst xor y (make-ea :dword :base state :index k :scale 4
381                        :disp (- (* (+ (- 397 624) 3 vector-data-offset)
382                                    n-word-bytes)
383                                 other-pointer-lowtag)))
384   (inst mov (make-ea :dword :base state :index k :scale 4
385                      :disp (- (* (+ 3 vector-data-offset)
386                                  n-word-bytes)
387                               other-pointer-lowtag))
388         y)
389   (inst inc k)
390   (inst cmp k (- 624 1))
391   (inst jmp :b loop2)
392
393   (inst mov y (make-ea :dword :base state
394                        :disp (- (* (+ (- 624 1) 3 vector-data-offset)
395                                    n-word-bytes)
396                                 other-pointer-lowtag)))
397   (inst mov tmp (make-ea :dword :base state
398                          :disp (- (* (+ 0 3 vector-data-offset)
399                                      n-word-bytes)
400                                   other-pointer-lowtag)))
401   (inst and y #x80000000)
402   (inst and tmp #x7fffffff)
403   (inst or y tmp)
404   (inst shr y 1)
405   (inst jmp :nc skip3)
406   (inst xor y #x9908b0df)
407   SKIP3
408   (inst xor y (make-ea :dword :base state
409                        :disp (- (* (+ (- 397 1) 3 vector-data-offset)
410                                    n-word-bytes)
411                                 other-pointer-lowtag)))
412   (inst mov (make-ea :dword :base state
413                      :disp (- (* (+ (- 624 1) 3 vector-data-offset)
414                                  n-word-bytes)
415                               other-pointer-lowtag))
416         y)
417
418   ;; Restore the temporary registers and return.
419   (inst pop tmp)
420   (inst pop y)
421   (inst pop k)
422   (inst ret))