03da6d7df6a87881aedb28d954788bc12530d5d8
[sbcl.git] / src / compiler / x86-64 / macros.lisp
1 ;;;; a bunch of handy macros for the x86
2
3 ;;;; This software is part of the SBCL system. See the README file for
4 ;;;; more information.
5 ;;;;
6 ;;;; This software is derived from the CMU CL system, which was
7 ;;;; written at Carnegie Mellon University and released into the
8 ;;;; public domain. The software is in the public domain and is
9 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
10 ;;;; files for more information.
11
12 (in-package "SB!VM")
13
14 ;;;; instruction-like macros
15
16 (defmacro move (dst src)
17   #!+sb-doc
18   "Move SRC into DST unless they are location=."
19   (once-only ((n-dst dst)
20               (n-src src))
21     `(unless (location= ,n-dst ,n-src)
22        (sc-case ,n-dst
23          (single-reg
24           (inst movss ,n-dst ,n-src))
25          (double-reg
26           (inst movsd ,n-dst ,n-src))
27          (t
28           (inst mov ,n-dst ,n-src))))))
29
30 (defmacro make-ea-for-object-slot (ptr slot lowtag)
31   `(make-ea :qword :base ,ptr :disp (- (* ,slot n-word-bytes) ,lowtag)))
32 (defmacro make-ea-for-object-slot-half (ptr slot lowtag)
33   `(make-ea :dword :base ,ptr :disp (- (* ,slot n-word-bytes) ,lowtag)))
34
35 (defmacro loadw (value ptr &optional (slot 0) (lowtag 0))
36   `(inst mov ,value (make-ea-for-object-slot ,ptr ,slot ,lowtag)))
37
38 (defmacro storew (value ptr &optional (slot 0) (lowtag 0))
39   (once-only ((value value))
40     `(cond ((and (integerp ,value)
41                  (not (typep ,value '(signed-byte 32))))
42             (multiple-value-bind (lo hi) (dwords-for-quad ,value)
43               (inst mov (make-ea-for-object-slot-half
44                          ,ptr ,slot ,lowtag) lo)
45               (inst mov (make-ea-for-object-slot-half
46                          ,ptr (+ ,slot 1/2) ,lowtag) hi)))
47            (t
48             (inst mov (make-ea-for-object-slot ,ptr ,slot ,lowtag) ,value)))))
49
50 (defmacro pushw (ptr &optional (slot 0) (lowtag 0))
51   `(inst push (make-ea-for-object-slot ,ptr ,slot ,lowtag)))
52
53 (defmacro popw (ptr &optional (slot 0) (lowtag 0))
54   `(inst pop (make-ea-for-object-slot ,ptr ,slot ,lowtag)))
55 \f
56 ;;;; macros to generate useful values
57
58 (defmacro load-symbol (reg symbol)
59   `(inst mov ,reg (+ nil-value (static-symbol-offset ,symbol))))
60
61 (defmacro make-ea-for-symbol-value (symbol)
62   `(make-ea :qword
63     :disp (+ nil-value
64            (static-symbol-offset ',symbol)
65            (ash symbol-value-slot word-shift)
66            (- other-pointer-lowtag))))
67
68 (defmacro load-symbol-value (reg symbol)
69   `(inst mov ,reg (make-ea-for-symbol-value ,symbol)))
70
71 (defmacro store-symbol-value (reg symbol)
72   `(inst mov (make-ea-for-symbol-value ,symbol) ,reg))
73
74 #!+sb-thread
75 (defmacro make-ea-for-symbol-tls-index (symbol)
76   `(make-ea :qword
77     :disp (+ nil-value
78            (static-symbol-offset ',symbol)
79            (ash symbol-tls-index-slot word-shift)
80            (- other-pointer-lowtag))))
81
82 #!+sb-thread
83 (defmacro load-tl-symbol-value (reg symbol)
84   `(progn
85     (inst mov ,reg (make-ea-for-symbol-tls-index ,symbol))
86     (inst mov ,reg (make-ea :qword :base thread-base-tn :scale 1 :index ,reg))))
87 #!-sb-thread
88 (defmacro load-tl-symbol-value (reg symbol) `(load-symbol-value ,reg ,symbol))
89
90 #!+sb-thread
91 (defmacro store-tl-symbol-value (reg symbol temp)
92   `(progn
93     (inst mov ,temp (make-ea-for-symbol-tls-index ,symbol))
94     (inst mov (make-ea :qword :base thread-base-tn :scale 1 :index ,temp) ,reg)))
95 #!-sb-thread
96 (defmacro store-tl-symbol-value (reg symbol temp)
97   (declare (ignore temp))
98   `(store-symbol-value ,reg ,symbol))
99
100 (defmacro load-binding-stack-pointer (reg)
101   #!+sb-thread
102   `(inst mov ,reg (make-ea :qword :base thread-base-tn
103                    :disp (* 8 thread-binding-stack-pointer-slot)))
104   #!-sb-thread
105   `(load-symbol-value ,reg *binding-stack-pointer*))
106
107 (defmacro store-binding-stack-pointer (reg)
108   #!+sb-thread
109   `(inst mov (make-ea :qword :base thread-base-tn
110               :disp (* 8 thread-binding-stack-pointer-slot))
111     ,reg)
112   #!-sb-thread
113   `(store-symbol-value ,reg *binding-stack-pointer*))
114
115 (defmacro load-type (target source &optional (offset 0))
116   #!+sb-doc
117   "Loads the type bits of a pointer into target independent of
118    byte-ordering issues."
119   (once-only ((n-target target)
120               (n-source source)
121               (n-offset offset))
122     (ecase *backend-byte-order*
123       (:little-endian
124        `(inst mov ,n-target
125               (make-ea :byte :base ,n-source :disp ,n-offset)))
126       (:big-endian
127        `(inst mov ,n-target
128               (make-ea :byte :base ,n-source
129                              :disp (+ ,n-offset (1- n-word-bytes))))))))
130 \f
131 ;;;; allocation helpers
132
133 ;;; All allocation is done by calls to assembler routines that
134 ;;; eventually invoke the C alloc() function.
135
136 ;;; Emit code to allocate an object with a size in bytes given by
137 ;;; Size. The size may be an integer of a TN. If Inline is a VOP
138 ;;; node-var then it is used to make an appropriate speed vs size
139 ;;; decision.
140
141 (defun allocation-dynamic-extent (alloc-tn size lowtag)
142   (inst sub rsp-tn size)
143   ;; see comment in x86/macros.lisp implementation of this
144   (inst and rsp-tn #.(lognot lowtag-mask))
145   (aver (not (location= alloc-tn rsp-tn)))
146   (inst lea alloc-tn (make-ea :byte :base rsp-tn :disp lowtag))
147   (values))
148
149 ;;; This macro should only be used inside a pseudo-atomic section,
150 ;;; which should also cover subsequent initialization of the
151 ;;; object.
152 (defun allocation-tramp (alloc-tn size lowtag)
153   (inst push size)
154   (inst lea temp-reg-tn (make-ea :qword
155                             :disp (make-fixup "alloc_tramp" :foreign)))
156   (inst call temp-reg-tn)
157   (inst pop alloc-tn)
158   (when lowtag
159     (inst lea alloc-tn (make-ea :byte :base alloc-tn :disp lowtag)))
160   (values))
161
162 (defun allocation (alloc-tn size &optional ignored dynamic-extent lowtag)
163   (declare (ignore ignored))
164   (when dynamic-extent
165     (allocation-dynamic-extent alloc-tn size lowtag)
166     (return-from allocation (values)))
167   (let ((NOT-INLINE (gen-label))
168         (DONE (gen-label))
169         ;; Yuck.
170         (in-elsewhere (eq *elsewhere* sb!assem::**current-segment**))
171         ;; thread->alloc_region.free_pointer
172         (free-pointer
173          #!+sb-thread
174          (make-ea :qword
175                   :base thread-base-tn :scale 1
176                   :disp (* n-word-bytes thread-alloc-region-slot))
177          #!-sb-thread
178          (make-ea :qword
179                   :scale 1 :disp
180                   (make-fixup "boxed_region" :foreign)))
181         ;; thread->alloc_region.end_addr
182         (end-addr
183          #!+sb-thread
184          (make-ea :qword
185                   :base thread-base-tn :scale 1
186                   :disp (* n-word-bytes (1+ thread-alloc-region-slot)))
187          #!-sb-thread
188          (make-ea :qword
189                   :scale 1 :disp
190                   (make-fixup "boxed_region" :foreign 8))))
191     (cond (in-elsewhere
192            (allocation-tramp alloc-tn size lowtag))
193           (t
194            (inst mov temp-reg-tn free-pointer)
195            (if (tn-p size)
196                (if (location= alloc-tn size)
197                    (inst add alloc-tn temp-reg-tn)
198                    (inst lea alloc-tn
199                          (make-ea :qword :base temp-reg-tn :index size)))
200                (inst lea alloc-tn
201                      (make-ea :qword :base temp-reg-tn :disp size)))
202            (inst cmp end-addr alloc-tn)
203            (inst jmp :be NOT-INLINE)
204            (inst mov free-pointer alloc-tn)
205            (if lowtag
206                (inst lea alloc-tn (make-ea :byte :base temp-reg-tn :disp lowtag))
207                (inst mov alloc-tn temp-reg-tn))
208            (emit-label DONE)
209            (assemble (*elsewhere*)
210              (emit-label NOT-INLINE)
211              (cond ((numberp size)
212                     (allocation-tramp alloc-tn size lowtag))
213                    (t
214                     (inst sub alloc-tn free-pointer)
215                     (allocation-tramp alloc-tn alloc-tn lowtag)))
216              (inst jmp DONE))))
217     (values)))
218
219 ;;; Allocate an other-pointer object of fixed SIZE with a single word
220 ;;; header having the specified WIDETAG value. The result is placed in
221 ;;; RESULT-TN.
222 (defmacro with-fixed-allocation ((result-tn widetag size &optional inline stack-allocate-p)
223                                  &body forms)
224   (unless forms
225     (bug "empty &body in WITH-FIXED-ALLOCATION"))
226   (once-only ((result-tn result-tn) (size size) (stack-allocate-p stack-allocate-p))
227     `(maybe-pseudo-atomic ,stack-allocate-p
228       (allocation ,result-tn (pad-data-block ,size) ,inline ,stack-allocate-p
229                   other-pointer-lowtag)
230       (storew (logior (ash (1- ,size) n-widetag-bits) ,widetag)
231               ,result-tn 0 other-pointer-lowtag)
232       ,@forms)))
233 \f
234 ;;;; error code
235 (defun emit-error-break (vop kind code values)
236   (assemble ()
237     #!-darwin
238     (inst int 3)                  ; i386 breakpoint instruction
239     ;; On Darwin, we need to use #x0b0f instead of int3 in order
240     ;; to generate a SIGILL instead of a SIGTRAP as darwin/x86
241     ;; doesn't seem to be reliably firing SIGTRAP
242     ;; handlers. Hopefully this will be fixed by Apple at a
243     ;; later date. Do the same on x86-64 as we do on x86 until this gets
244     ;; sorted out.
245     #!+darwin
246     (inst word #x0b0f)
247     ;; The return PC points here; note the location for the debugger.
248     (when vop
249       (note-this-location vop :internal-error))
250     (inst byte kind)                       ; eg trap_Xyyy
251     (with-adjustable-vector (vector)       ; interr arguments
252       (write-var-integer code vector)
253       (dolist (tn values)
254         ;; classic CMU CL comment:
255         ;;   zzzzz jrd here. tn-offset is zero for constant
256         ;;   tns.
257         (write-var-integer (make-sc-offset (sc-number (tn-sc tn))
258                                            (or (tn-offset tn) 0))
259                            vector))
260       (inst byte (length vector))
261       (dotimes (i (length vector))
262         (inst byte (aref vector i))))))
263
264 (defun error-call (vop error-code &rest values)
265   #!+sb-doc
266   "Cause an error. ERROR-CODE is the error to cause."
267   (emit-error-break vop error-trap (error-number-or-lose error-code) values))
268
269 (defun generate-error-code (vop error-code &rest values)
270   #!+sb-doc
271   "Generate-Error-Code Error-code Value*
272   Emit code for an error with the specified Error-Code and context Values."
273   (assemble (*elsewhere*)
274     (let ((start-lab (gen-label)))
275       (emit-label start-lab)
276       (emit-error-break vop error-trap (error-number-or-lose error-code) values)
277        start-lab)))
278
279 \f
280 ;;;; PSEUDO-ATOMIC
281
282 ;;; This is used to wrap operations which leave untagged memory lying
283 ;;; around.  It's an operation which the AOP weenies would describe as
284 ;;; having "cross-cutting concerns", meaning it appears all over the
285 ;;; place and there's no logical single place to attach documentation.
286 ;;; grep (mostly in src/runtime) is your friend
287
288 (defmacro maybe-pseudo-atomic (not-really-p &body body)
289   `(if ,not-really-p
290        (progn ,@body)
291        (pseudo-atomic ,@body)))
292
293 #!+sb-thread
294 (defmacro pseudo-atomic (&rest forms)
295   (with-unique-names (label)
296     `(let ((,label (gen-label)))
297       (inst or (make-ea :byte
298                  :base thread-base-tn
299                  :disp (* 8 thread-pseudo-atomic-bits-slot))
300             (fixnumize 1))
301       ,@forms
302       (inst xor (make-ea :byte
303                  :base thread-base-tn
304                  :disp (* 8 thread-pseudo-atomic-bits-slot))
305             (fixnumize 1))
306       (inst jmp :z ,label)
307       ;; if PAI was set, interrupts were disabled at the same
308       ;; time using the process signal mask.
309       (inst break pending-interrupt-trap)
310       (emit-label ,label))))
311
312
313 #!-sb-thread
314 (defmacro pseudo-atomic (&rest forms)
315   (with-unique-names (label)
316     `(let ((,label (gen-label)))
317       ;; FIXME: The MAKE-EA noise should become a MACROLET macro or
318       ;; something. (perhaps SVLB, for static variable low byte)
319       (inst or (make-ea :byte :disp (+ nil-value
320                                        (static-symbol-offset
321                                         '*pseudo-atomic-bits*)
322                                        (ash symbol-value-slot word-shift)
323                                        (- other-pointer-lowtag)))
324             (fixnumize 1))
325       ,@forms
326       (inst xor (make-ea :byte :disp (+ nil-value
327                                         (static-symbol-offset
328                                          '*pseudo-atomic-bits*)
329                                         (ash symbol-value-slot word-shift)
330                                         (- other-pointer-lowtag)))
331             (fixnumize 1))
332       (inst jmp :z ,label)
333       ;; if PAI was set, interrupts were disabled at the same time
334       ;; using the process signal mask.
335       (inst break pending-interrupt-trap)
336       (emit-label ,label))))
337
338
339 \f
340 ;;;; indexed references
341
342 (defmacro define-full-compare-and-swap
343     (name type offset lowtag scs el-type &optional translate)
344   `(progn
345      (define-vop (,name)
346          ,@(when translate `((:translate ,translate)))
347        (:policy :fast-safe)
348        (:args (object :scs (descriptor-reg) :to :eval)
349               (index :scs (any-reg) :to :result)
350               (old-value :scs ,scs :target rax)
351               (new-value :scs ,scs))
352        (:arg-types ,type tagged-num ,el-type ,el-type)
353        (:temporary (:sc descriptor-reg :offset rax-offset
354                         :from (:argument 2) :to :result :target value)  rax)
355        (:results (value :scs ,scs))
356        (:result-types ,el-type)
357        (:generator 5
358          (move rax old-value)
359          (inst cmpxchg (make-ea :qword :base object :index index
360                                 :disp (- (* ,offset n-word-bytes) ,lowtag))
361                new-value :lock)
362          (move value rax)))))
363
364 (defmacro define-full-reffer (name type offset lowtag scs el-type &optional translate)
365   `(progn
366      (define-vop (,name)
367        ,@(when translate
368            `((:translate ,translate)))
369        (:policy :fast-safe)
370        (:args (object :scs (descriptor-reg))
371               (index :scs (any-reg)))
372        (:arg-types ,type tagged-num)
373        (:results (value :scs ,scs))
374        (:result-types ,el-type)
375        (:generator 3                    ; pw was 5
376          (inst mov value (make-ea :qword :base object :index index
377                                   :disp (- (* ,offset n-word-bytes)
378                                            ,lowtag)))))
379      (define-vop (,(symbolicate name "-C"))
380        ,@(when translate
381            `((:translate ,translate)))
382        (:policy :fast-safe)
383        (:args (object :scs (descriptor-reg)))
384        (:info index)
385        (:arg-types ,type
386                    (:constant (load/store-index ,n-word-bytes ,(eval lowtag)
387                                                 ,(eval offset))))
388        (:results (value :scs ,scs))
389        (:result-types ,el-type)
390        (:generator 2                    ; pw was 5
391          (inst mov value (make-ea :qword :base object
392                                   :disp (- (* (+ ,offset index) n-word-bytes)
393                                            ,lowtag)))))))
394
395 (defmacro define-full-reffer+offset (name type offset lowtag scs el-type &optional translate)
396   `(progn
397      (define-vop (,name)
398        ,@(when translate
399            `((:translate ,translate)))
400        (:policy :fast-safe)
401        (:args (object :scs (descriptor-reg))
402               (index :scs (any-reg)))
403        (:info offset)
404        (:arg-types ,type tagged-num
405                    (:constant (constant-displacement other-pointer-lowtag
406                                                      n-word-bytes vector-data-offset)))
407        (:results (value :scs ,scs))
408        (:result-types ,el-type)
409        (:generator 3                    ; pw was 5
410          (inst mov value (make-ea :qword :base object :index index
411                                   :disp (- (* (+ ,offset offset) n-word-bytes)
412                                            ,lowtag)))))
413      (define-vop (,(symbolicate name "-C"))
414        ,@(when translate
415            `((:translate ,translate)))
416        (:policy :fast-safe)
417        (:args (object :scs (descriptor-reg)))
418        (:info index offset)
419        (:arg-types ,type
420                    (:constant (load/store-index ,n-word-bytes ,(eval lowtag)
421                                                 ,(eval offset)))
422                    (:constant (constant-displacement other-pointer-lowtag
423                                                      n-word-bytes vector-data-offset)))
424        (:results (value :scs ,scs))
425        (:result-types ,el-type)
426        (:generator 2                    ; pw was 5
427          (inst mov value (make-ea :qword :base object
428                                   :disp (- (* (+ ,offset index offset) n-word-bytes)
429                                            ,lowtag)))))))
430
431 (defmacro define-full-setter (name type offset lowtag scs el-type &optional translate)
432   `(progn
433      (define-vop (,name)
434        ,@(when translate
435            `((:translate ,translate)))
436        (:policy :fast-safe)
437        (:args (object :scs (descriptor-reg))
438               (index :scs (any-reg))
439               (value :scs ,scs :target result))
440        (:arg-types ,type tagged-num ,el-type)
441        (:results (result :scs ,scs))
442        (:result-types ,el-type)
443        (:generator 4                    ; was 5
444          (inst mov (make-ea :qword :base object :index index
445                             :disp (- (* ,offset n-word-bytes) ,lowtag))
446                value)
447          (move result value)))
448      (define-vop (,(symbolicate name "-C"))
449        ,@(when translate
450            `((:translate ,translate)))
451        (:policy :fast-safe)
452        (:args (object :scs (descriptor-reg))
453               (value :scs ,scs :target result))
454        (:info index)
455        (:arg-types ,type
456                    (:constant (load/store-index ,n-word-bytes ,(eval lowtag)
457                                                 ,(eval offset)))
458                    ,el-type)
459        (:results (result :scs ,scs))
460        (:result-types ,el-type)
461        (:generator 3                    ; was 5
462          (inst mov (make-ea :qword :base object
463                             :disp (- (* (+ ,offset index) n-word-bytes)
464                                      ,lowtag))
465                value)
466          (move result value)))))
467
468 (defmacro define-full-setter+offset (name type offset lowtag scs el-type &optional translate)
469   `(progn
470      (define-vop (,name)
471        ,@(when translate
472            `((:translate ,translate)))
473        (:policy :fast-safe)
474        (:args (object :scs (descriptor-reg))
475               (index :scs (any-reg))
476               (value :scs ,scs :target result))
477        (:info offset)
478        (:arg-types ,type tagged-num
479                    (:constant (constant-displacement other-pointer-lowtag
480                                                      n-word-bytes
481                                                      vector-data-offset))
482                    ,el-type)
483        (:results (result :scs ,scs))
484        (:result-types ,el-type)
485        (:generator 4                    ; was 5
486          (inst mov (make-ea :qword :base object :index index
487                             :disp (- (* (+ ,offset offset) n-word-bytes) ,lowtag))
488                value)
489          (move result value)))
490      (define-vop (,(symbolicate name "-C"))
491        ,@(when translate
492            `((:translate ,translate)))
493        (:policy :fast-safe)
494        (:args (object :scs (descriptor-reg))
495               (value :scs ,scs :target result))
496        (:info index offset)
497        (:arg-types ,type
498                    (:constant (load/store-index ,n-word-bytes ,(eval lowtag)
499                                                 ,(eval offset)))
500                    (:constant (constant-displacement other-pointer-lowtag
501                                                      n-word-bytes
502                                                      vector-data-offset))
503                    ,el-type)
504        (:results (result :scs ,scs))
505        (:result-types ,el-type)
506        (:generator 3                    ; was 5
507          (inst mov (make-ea :qword :base object
508                             :disp (- (* (+ ,offset index offset) n-word-bytes)
509                                      ,lowtag))
510                value)
511          (move result value)))))
512
513 ;;; helper for alien stuff.
514
515 (def!macro with-pinned-objects ((&rest objects) &body body)
516   "Arrange with the garbage collector that the pages occupied by
517 OBJECTS will not be moved in memory for the duration of BODY.
518 Useful for e.g. foreign calls where another thread may trigger
519 collection."
520   (if objects
521       (let ((pins (make-gensym-list (length objects)))
522             (wpo (block-gensym "WPO")))
523         ;; BODY is stuffed in a function to preserve the lexical
524         ;; environment.
525         `(flet ((,wpo () (progn ,@body)))
526            ;; PINS are dx-allocated in case the compiler for some
527            ;; unfathomable reason decides to allocate value-cells
528            ;; for them -- since we have DX value-cells on x86oid
529            ;; platforms this still forces them on the stack.
530            (dx-let ,(mapcar #'list pins objects)
531              (multiple-value-prog1 (,wpo)
532                ;; TOUCH-OBJECT has a VOP with an empty body: compiler
533                ;; thinks we're using the argument and doesn't flush
534                ;; the variable, but we don't have to pay any extra
535                ;; beyond that -- and MULTIPLE-VALUE-PROG1 keeps them
536                ;; live till the body has finished. *whew*
537                ,@(mapcar (lambda (pin)
538                            `(touch-object ,pin))
539                          pins)))))
540       `(progn ,@body)))