1.0.19.7: refactor stack allocation decisions
[sbcl.git] / src / compiler / x86-64 / alloc.lisp
1 ;;;; allocation VOPs for the x86-64
2
3 ;;;; This software is part of the SBCL system. See the README file for
4 ;;;; more information.
5 ;;;;
6 ;;;; This software is derived from the CMU CL system, which was
7 ;;;; written at Carnegie Mellon University and released into the
8 ;;;; public domain. The software is in the public domain and is
9 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
10 ;;;; files for more information.
11
12 (in-package "SB!VM")
13 \f
14 ;;;; CONS, LIST and LIST*
15 (define-vop (list-or-list*)
16   (:args (things :more t))
17   (:temporary (:sc unsigned-reg) ptr temp)
18   (:temporary (:sc unsigned-reg :to (:result 0) :target result) res)
19   (:info num)
20   (:results (result :scs (descriptor-reg)))
21   (:variant-vars star)
22   (:policy :safe)
23   (:node-var node)
24   (:generator 0
25     (cond ((zerop num)
26            ;; (move result nil-value)
27            (inst mov result nil-value))
28           ((and star (= num 1))
29            (move result (tn-ref-tn things)))
30           (t
31            (macrolet
32                ((store-car (tn list &optional (slot cons-car-slot))
33                   `(let ((reg
34                           (sc-case ,tn
35                             ((any-reg descriptor-reg) ,tn)
36                             ((control-stack)
37                              (move temp ,tn)
38                              temp))))
39                      (storew reg ,list ,slot list-pointer-lowtag))))
40              (let ((cons-cells (if star (1- num) num))
41                    (stack-allocate-p (awhen (sb!c::node-lvar node)
42                                        (sb!c::lvar-dynamic-extent it))))
43                (maybe-pseudo-atomic stack-allocate-p
44                 (allocation res (* (pad-data-block cons-size) cons-cells) node
45                             stack-allocate-p list-pointer-lowtag)
46                 (move ptr res)
47                 (dotimes (i (1- cons-cells))
48                   (store-car (tn-ref-tn things) ptr)
49                   (setf things (tn-ref-across things))
50                   (inst add ptr (pad-data-block cons-size))
51                   (storew ptr ptr (- cons-cdr-slot cons-size)
52                           list-pointer-lowtag))
53                 (store-car (tn-ref-tn things) ptr)
54                 (cond (star
55                        (setf things (tn-ref-across things))
56                        (store-car (tn-ref-tn things) ptr cons-cdr-slot))
57                       (t
58                        (storew nil-value ptr cons-cdr-slot
59                                list-pointer-lowtag)))
60                 (aver (null (tn-ref-across things)))))
61              (move result res))))))
62
63 (define-vop (list list-or-list*)
64   (:variant nil))
65
66 (define-vop (list* list-or-list*)
67   (:variant t))
68 \f
69 ;;;; special-purpose inline allocators
70
71 ;;; ALLOCATE-VECTOR
72 (define-vop (allocate-vector-on-heap)
73   (:args (type :scs (unsigned-reg))
74          (length :scs (any-reg))
75          (words :scs (any-reg)))
76   (:results (result :scs (descriptor-reg) :from :load))
77   (:arg-types positive-fixnum
78               positive-fixnum
79               positive-fixnum)
80   (:policy :fast-safe)
81   (:generator 100
82     (inst lea result (make-ea :byte :base words :disp
83                               (+ (1- (ash 1 n-lowtag-bits))
84                                  (* vector-data-offset n-word-bytes))))
85     (inst and result (lognot lowtag-mask))
86     (pseudo-atomic
87       (allocation result result)
88       (inst lea result (make-ea :byte :base result :disp other-pointer-lowtag))
89       (storew type result 0 other-pointer-lowtag)
90       (storew length result vector-length-slot other-pointer-lowtag))))
91
92 (define-vop (allocate-vector-on-stack)
93   (:args (type :scs (unsigned-reg))
94          (length :scs (any-reg))
95          (words :scs (any-reg) :target ecx))
96   (:temporary (:sc any-reg :offset ecx-offset :from (:argument 2)) ecx)
97   (:temporary (:sc any-reg :offset eax-offset :from (:argument 2)) zero)
98   (:temporary (:sc any-reg :offset edi-offset :from (:argument 0)) res)
99   (:results (result :scs (descriptor-reg) :from :load))
100   (:arg-types positive-fixnum
101               positive-fixnum
102               positive-fixnum)
103   (:translate allocate-vector)
104   (:policy :fast-safe)
105   (:node-var node)
106   (:generator 100
107     (inst lea result (make-ea :byte :base words :disp
108                               (+ (1- (ash 1 n-lowtag-bits))
109                                  (* vector-data-offset n-word-bytes))))
110     (inst and result (lognot lowtag-mask))
111     ;; FIXME: It would be good to check for stack overflow here.
112     (move ecx words)
113     (inst shr ecx n-fixnum-tag-bits)
114     (allocation result result node t other-pointer-lowtag)
115     (inst cld)
116     (inst lea res
117           (make-ea :byte :base result :disp (- (* vector-data-offset n-word-bytes)
118                                                other-pointer-lowtag)))
119     (storew type result 0 other-pointer-lowtag)
120     (storew length result vector-length-slot other-pointer-lowtag)
121     (zeroize zero)
122     (inst rep)
123     (inst stos zero)))
124
125 (in-package "SB!VM")
126
127 ;;;
128 (define-vop (allocate-code-object)
129   (:args (boxed-arg :scs (any-reg) :target boxed)
130          (unboxed-arg :scs (any-reg) :target unboxed))
131   (:results (result :scs (descriptor-reg) :from :eval))
132   (:temporary (:sc unsigned-reg :from (:argument 0)) boxed)
133   (:temporary (:sc unsigned-reg :from (:argument 1)) unboxed)
134   (:node-var node)
135   (:generator 100
136     (move boxed boxed-arg)
137     (inst add boxed (fixnumize (1+ code-trace-table-offset-slot)))
138     (inst and boxed (lognot lowtag-mask))
139     (move unboxed unboxed-arg)
140     (inst shr unboxed word-shift)
141     (inst add unboxed lowtag-mask)
142     (inst and unboxed (lognot lowtag-mask))
143     (inst mov result boxed)
144     (inst add result unboxed)
145     (pseudo-atomic
146      (allocation result result node)
147      (inst lea result (make-ea :byte :base result :disp other-pointer-lowtag))
148      (inst shl boxed (- n-widetag-bits word-shift))
149      (inst or boxed code-header-widetag)
150      (storew boxed result 0 other-pointer-lowtag)
151      (storew unboxed result code-code-size-slot other-pointer-lowtag)
152      (storew nil-value result code-entry-points-slot other-pointer-lowtag))
153     (storew nil-value result code-debug-info-slot other-pointer-lowtag)))
154 \f
155 (define-vop (make-fdefn)
156   (:policy :fast-safe)
157   (:translate make-fdefn)
158   (:args (name :scs (descriptor-reg) :to :eval))
159   (:results (result :scs (descriptor-reg) :from :argument))
160   (:node-var node)
161   (:generator 37
162     (with-fixed-allocation (result fdefn-widetag fdefn-size node)
163       (storew name result fdefn-name-slot other-pointer-lowtag)
164       (storew nil-value result fdefn-fun-slot other-pointer-lowtag)
165       (storew (make-fixup "undefined_tramp" :foreign)
166               result fdefn-raw-addr-slot other-pointer-lowtag))))
167
168 (define-vop (make-closure)
169   (:args (function :to :save :scs (descriptor-reg)))
170   (:info length stack-allocate-p)
171   (:temporary (:sc any-reg) temp)
172   (:results (result :scs (descriptor-reg)))
173   (:node-var node)
174   (:generator 10
175    (maybe-pseudo-atomic stack-allocate-p
176     (let ((size (+ length closure-info-offset)))
177       (allocation result (pad-data-block size) node stack-allocate-p
178                   fun-pointer-lowtag)
179       (storew (logior (ash (1- size) n-widetag-bits) closure-header-widetag)
180               result 0 fun-pointer-lowtag))
181     (loadw temp function closure-fun-slot fun-pointer-lowtag)
182     (storew temp result closure-fun-slot fun-pointer-lowtag))))
183
184 ;;; The compiler likes to be able to directly make value cells.
185 (define-vop (make-value-cell)
186   (:args (value :scs (descriptor-reg any-reg) :to :result))
187   (:results (result :scs (descriptor-reg) :from :eval))
188   (:info stack-allocate-p)
189   (:node-var node)
190   (:generator 10
191     (with-fixed-allocation
192         (result value-cell-header-widetag value-cell-size node stack-allocate-p)
193       (storew value result value-cell-value-slot other-pointer-lowtag))))
194 \f
195 ;;;; automatic allocators for primitive objects
196
197 (define-vop (make-unbound-marker)
198   (:args)
199   (:results (result :scs (any-reg)))
200   (:generator 1
201     (inst mov result unbound-marker-widetag)))
202
203 (define-vop (make-funcallable-instance-tramp)
204   (:args)
205   (:results (result :scs (any-reg)))
206   (:generator 1
207     (inst lea result (make-fixup "funcallable_instance_tramp" :foreign))))
208
209 (define-vop (fixed-alloc)
210   (:args)
211   (:info name words type lowtag stack-allocate-p)
212   (:ignore name)
213   (:results (result :scs (descriptor-reg)))
214   (:node-var node)
215   (:generator 50
216     (maybe-pseudo-atomic stack-allocate-p
217      (allocation result (pad-data-block words) node stack-allocate-p lowtag)
218      (when type
219        (storew (logior (ash (1- words) n-widetag-bits) type)
220                result
221                0
222                lowtag)))))
223
224 (define-vop (var-alloc)
225   (:args (extra :scs (any-reg)))
226   (:arg-types positive-fixnum)
227   (:info name words type lowtag)
228   (:ignore name)
229   (:results (result :scs (descriptor-reg) :from (:eval 1)))
230   (:temporary (:sc any-reg :from :eval :to (:eval 1)) bytes)
231   (:temporary (:sc any-reg :from :eval :to :result) header)
232   (:node-var node)
233   (:generator 50
234     (inst lea bytes
235           (make-ea :qword :base extra :disp (* (1+ words) n-word-bytes)))
236     (inst mov header bytes)
237     (inst shl header (- n-widetag-bits 3)) ; w+1 to length field
238     (inst lea header                    ; (w-1 << 8) | type
239           (make-ea :qword :base header :disp (+ (ash -2 n-widetag-bits) type)))
240     (inst and bytes (lognot lowtag-mask))
241     (pseudo-atomic
242      (allocation result bytes node)
243      (inst lea result (make-ea :byte :base result :disp lowtag))
244      (storew header result 0 lowtag))))
245
246 (define-vop (%make-symbol)
247   (:policy :fast-safe)
248   (:translate %make-symbol)
249   (:args (name :scs (descriptor-reg) :to :eval))
250   (:temporary (:sc unsigned-reg :from :eval) temp)
251   (:results (result :scs (descriptor-reg) :from :argument))
252   (:node-var node)
253   (:generator 37
254     (with-fixed-allocation (result symbol-header-widetag symbol-size node)
255       (storew name result symbol-name-slot other-pointer-lowtag)
256       (storew unbound-marker-widetag
257               result
258               symbol-value-slot
259               other-pointer-lowtag)
260       ;; Set up a random hash value for the symbol. Perhaps the object
261       ;; address could be used for even faster and smaller code!
262       ;; FIXME: We don't mind the symbol hash not being repeatable, so
263       ;; we might as well add in the object address here, too. (Adding entropy
264       ;; is good, even if ANSI doesn't understand that.)
265       (inst imul temp
266             (make-fixup "fast_random_state" :foreign)
267             1103515245)
268       (inst add temp 12345)
269       (inst mov (make-fixup "fast_random_state" :foreign)
270             temp)
271       ;; We want a positive fixnum for the hash value, so discard the LS bits.
272       ;;
273       ;; FIXME: OK, who wants to tell me (CSR) why these two
274       ;; instructions aren't replaced by (INST AND TEMP #x8FFFFFFC)?
275       ;; Are the following two instructions actually faster?  Does the
276       ;; difference in behaviour really matter?
277       (inst shr temp 1)
278       (inst and temp #xfffffffc)
279       (storew temp result symbol-hash-slot other-pointer-lowtag)
280       (storew nil-value result symbol-plist-slot other-pointer-lowtag)
281       (storew nil-value result symbol-package-slot other-pointer-lowtag))))