1.0.4.63: Don't zeroize dynamic-extent simple-unboxed-arrays on x86 and x86-64
[sbcl.git] / src / compiler / x86-64 / alloc.lisp
1 ;;;; allocation VOPs for the x86-64
2
3 ;;;; This software is part of the SBCL system. See the README file for
4 ;;;; more information.
5 ;;;;
6 ;;;; This software is derived from the CMU CL system, which was
7 ;;;; written at Carnegie Mellon University and released into the
8 ;;;; public domain. The software is in the public domain and is
9 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
10 ;;;; files for more information.
11
12 (in-package "SB!VM")
13 \f
14 ;;;; LIST and LIST*
15 (defoptimizer (list stack-allocate-result) ((&rest args))
16   (not (null args)))
17 (defoptimizer (list* stack-allocate-result) ((&rest args))
18   (not (null (rest args))))
19
20 (define-vop (list-or-list*)
21   (:args (things :more t))
22   (:temporary (:sc unsigned-reg) ptr temp)
23   (:temporary (:sc unsigned-reg :to (:result 0) :target result) res)
24   (:info num)
25   (:results (result :scs (descriptor-reg)))
26   (:variant-vars star)
27   (:policy :safe)
28   (:node-var node)
29   (:generator 0
30     (cond ((zerop num)
31            ;; (move result nil-value)
32            (inst mov result nil-value))
33           ((and star (= num 1))
34            (move result (tn-ref-tn things)))
35           (t
36            (macrolet
37                ((store-car (tn list &optional (slot cons-car-slot))
38                   `(let ((reg
39                           (sc-case ,tn
40                             ((any-reg descriptor-reg) ,tn)
41                             ((control-stack)
42                              (move temp ,tn)
43                              temp))))
44                      (storew reg ,list ,slot list-pointer-lowtag))))
45              (let ((cons-cells (if star (1- num) num)))
46                (pseudo-atomic
47                 (allocation res (* (pad-data-block cons-size) cons-cells) node
48                             (awhen (sb!c::node-lvar node)
49                               (sb!c::lvar-dynamic-extent it)))
50                 (inst lea res
51                       (make-ea :byte :base res :disp list-pointer-lowtag))
52                 (move ptr res)
53                 (dotimes (i (1- cons-cells))
54                   (store-car (tn-ref-tn things) ptr)
55                   (setf things (tn-ref-across things))
56                   (inst add ptr (pad-data-block cons-size))
57                   (storew ptr ptr (- cons-cdr-slot cons-size)
58                           list-pointer-lowtag))
59                 (store-car (tn-ref-tn things) ptr)
60                 (cond (star
61                        (setf things (tn-ref-across things))
62                        (store-car (tn-ref-tn things) ptr cons-cdr-slot))
63                       (t
64                        (storew nil-value ptr cons-cdr-slot
65                                list-pointer-lowtag)))
66                 (aver (null (tn-ref-across things)))))
67              (move result res))))))
68
69 (define-vop (list list-or-list*)
70   (:variant nil))
71
72 (define-vop (list* list-or-list*)
73   (:variant t))
74 \f
75 ;;;; special-purpose inline allocators
76
77 ;;; ALLOCATE-VECTOR
78 (define-vop (allocate-vector-on-heap)
79   (:args (type :scs (unsigned-reg))
80          (length :scs (any-reg))
81          (words :scs (any-reg)))
82   (:results (result :scs (descriptor-reg) :from :load))
83   (:arg-types positive-fixnum
84               positive-fixnum
85               positive-fixnum)
86   (:policy :fast-safe)
87   (:generator 100
88     (inst lea result (make-ea :byte :base words :disp
89                               (+ (1- (ash 1 n-lowtag-bits))
90                                  (* vector-data-offset n-word-bytes))))
91     (inst and result (lognot lowtag-mask))
92     (pseudo-atomic
93       (allocation result result)
94       (inst lea result (make-ea :byte :base result :disp other-pointer-lowtag))
95       (storew type result 0 other-pointer-lowtag)
96       (storew length result vector-length-slot other-pointer-lowtag))))
97
98 (define-vop (allocate-vector-on-stack)
99   (:args (type :scs (unsigned-reg immediate))
100          (length :scs (any-reg))
101          (words :scs (any-reg) :target ecx))
102   (:temporary (:sc any-reg :offset ecx-offset :from (:argument 2)) ecx)
103   (:temporary (:sc any-reg :offset eax-offset :from (:argument 2)) zero)
104   (:temporary (:sc any-reg :offset edi-offset :from (:argument 0)) res)
105   (:results (result :scs (descriptor-reg) :from :load))
106   (:arg-types positive-fixnum
107               positive-fixnum
108               positive-fixnum)
109   (:translate allocate-vector)
110   (:policy :fast-safe)
111   (:node-var node)
112   (:generator 100
113     (when (sc-is type immediate)
114       (aver (typep (tn-value type) '(unsigned-byte 8))))
115     (let ((unboxed-elements-p (and (sc-is type immediate)
116                                    (/= (tn-value type)
117                                        simple-vector-widetag))))
118       (inst lea result (make-ea :byte :base words :disp
119                                 (+ (1- (ash 1 n-lowtag-bits))
120                                    (* vector-data-offset n-word-bytes))))
121       (inst and result (lognot lowtag-mask))
122       ;; FIXME: It would be good to check for stack overflow here.
123       (move ecx words)
124       (inst shr ecx n-fixnum-tag-bits)
125       (allocation result result node t)
126       (unless unboxed-elements-p
127         (inst cld))
128       (inst lea res
129             (make-ea :byte :base result :disp (* vector-data-offset n-word-bytes)))
130       (inst lea result (make-ea :byte :base result :disp other-pointer-lowtag))
131       (storew type result 0 other-pointer-lowtag)
132       (storew length result vector-length-slot other-pointer-lowtag)
133       (unless unboxed-elements-p
134         (zeroize zero)
135         (inst rep)
136         (inst stos zero)))))
137
138 (in-package "SB!C")
139
140 (defoptimizer (allocate-vector stack-allocate-result)
141     ((type length words) node)
142   (ecase (policy node stack-allocate-vector)
143     (0 nil)
144     ((1 2)
145      ;; a vector object should fit in one page
146      (values-subtypep (lvar-derived-type words)
147                       (load-time-value
148                        (specifier-type `(integer 0 ,(- (/ sb!vm::*backend-page-size*
149                                                           sb!vm:n-word-bytes)
150                                                        sb!vm:vector-data-offset))))))
151     (3 t)))
152
153 (defoptimizer (allocate-vector ltn-annotate) ((type length words) call ltn-policy)
154   (let ((args (basic-combination-args call))
155         (template (template-or-lose (if (awhen (node-lvar call)
156                                           (lvar-dynamic-extent it))
157                                         'sb!vm::allocate-vector-on-stack
158                                         'sb!vm::allocate-vector-on-heap))))
159     (dolist (arg args)
160       (setf (lvar-info arg)
161             (make-ir2-lvar (primitive-type (lvar-type arg)))))
162     (unless (is-ok-template-use template call (ltn-policy-safe-p ltn-policy))
163       (ltn-default-call call)
164       (return-from allocate-vector-ltn-annotate-optimizer (values)))
165     (setf (basic-combination-info call) template)
166     (setf (node-tail-p call) nil)
167
168     (dolist (arg args)
169       (annotate-1-value-lvar arg))))
170
171 (in-package "SB!VM")
172
173 ;;;
174 (define-vop (allocate-code-object)
175   (:args (boxed-arg :scs (any-reg) :target boxed)
176          (unboxed-arg :scs (any-reg) :target unboxed))
177   (:results (result :scs (descriptor-reg) :from :eval))
178   (:temporary (:sc unsigned-reg :from (:argument 0)) boxed)
179   (:temporary (:sc unsigned-reg :from (:argument 1)) unboxed)
180   (:node-var node)
181   (:generator 100
182     (move boxed boxed-arg)
183     (inst add boxed (fixnumize (1+ code-trace-table-offset-slot)))
184     (inst and boxed (lognot lowtag-mask))
185     (move unboxed unboxed-arg)
186     (inst shr unboxed word-shift)
187     (inst add unboxed lowtag-mask)
188     (inst and unboxed (lognot lowtag-mask))
189     (inst mov result boxed)
190     (inst add result unboxed)
191     (pseudo-atomic
192      (allocation result result node)
193      (inst lea result (make-ea :byte :base result :disp other-pointer-lowtag))
194      (inst shl boxed (- n-widetag-bits word-shift))
195      (inst or boxed code-header-widetag)
196      (storew boxed result 0 other-pointer-lowtag)
197      (storew unboxed result code-code-size-slot other-pointer-lowtag)
198      (storew nil-value result code-entry-points-slot other-pointer-lowtag))
199     (storew nil-value result code-debug-info-slot other-pointer-lowtag)))
200 \f
201 (define-vop (make-fdefn)
202   (:policy :fast-safe)
203   (:translate make-fdefn)
204   (:args (name :scs (descriptor-reg) :to :eval))
205   (:results (result :scs (descriptor-reg) :from :argument))
206   (:node-var node)
207   (:generator 37
208     (with-fixed-allocation (result fdefn-widetag fdefn-size node)
209       (storew name result fdefn-name-slot other-pointer-lowtag)
210       (storew nil-value result fdefn-fun-slot other-pointer-lowtag)
211       (storew (make-fixup "undefined_tramp" :foreign)
212               result fdefn-raw-addr-slot other-pointer-lowtag))))
213
214 (define-vop (make-closure)
215   (:args (function :to :save :scs (descriptor-reg)))
216   (:info length stack-allocate-p)
217   (:temporary (:sc any-reg) temp)
218   (:results (result :scs (descriptor-reg)))
219   (:node-var node)
220   (:generator 10
221    (maybe-pseudo-atomic stack-allocate-p
222     (let ((size (+ length closure-info-offset)))
223       (allocation result (pad-data-block size) node stack-allocate-p)
224       (inst lea result
225             (make-ea :byte :base result :disp fun-pointer-lowtag))
226       (storew (logior (ash (1- size) n-widetag-bits) closure-header-widetag)
227               result 0 fun-pointer-lowtag))
228     (loadw temp function closure-fun-slot fun-pointer-lowtag)
229     (storew temp result closure-fun-slot fun-pointer-lowtag))))
230
231 ;;; The compiler likes to be able to directly make value cells.
232 (define-vop (make-value-cell)
233   (:args (value :scs (descriptor-reg any-reg) :to :result))
234   (:results (result :scs (descriptor-reg) :from :eval))
235   (:node-var node)
236   (:generator 10
237     (with-fixed-allocation
238         (result value-cell-header-widetag value-cell-size node)
239       (storew value result value-cell-value-slot other-pointer-lowtag))))
240 \f
241 ;;;; automatic allocators for primitive objects
242
243 (define-vop (make-unbound-marker)
244   (:args)
245   (:results (result :scs (any-reg)))
246   (:generator 1
247     (inst mov result unbound-marker-widetag)))
248
249 (define-vop (make-funcallable-instance-tramp)
250   (:args)
251   (:results (result :scs (any-reg)))
252   (:generator 1
253     (inst lea result (make-fixup "funcallable_instance_tramp" :foreign))))
254
255 (define-vop (fixed-alloc)
256   (:args)
257   (:info name words type lowtag)
258   (:ignore name)
259   (:results (result :scs (descriptor-reg)))
260   (:node-var node)
261   (:generator 50
262     (pseudo-atomic
263      (allocation result (pad-data-block words) node)
264      (inst lea result (make-ea :byte :base result :disp lowtag))
265      (when type
266        (storew (logior (ash (1- words) n-widetag-bits) type)
267                result
268                0
269                lowtag)))))
270
271 (define-vop (var-alloc)
272   (:args (extra :scs (any-reg)))
273   (:arg-types positive-fixnum)
274   (:info name words type lowtag)
275   (:ignore name)
276   (:results (result :scs (descriptor-reg) :from (:eval 1)))
277   (:temporary (:sc any-reg :from :eval :to (:eval 1)) bytes)
278   (:temporary (:sc any-reg :from :eval :to :result) header)
279   (:node-var node)
280   (:generator 50
281     (inst lea bytes
282           (make-ea :qword :base extra :disp (* (1+ words) n-word-bytes)))
283     (inst mov header bytes)
284     (inst shl header (- n-widetag-bits 3)) ; w+1 to length field
285     (inst lea header                    ; (w-1 << 8) | type
286           (make-ea :qword :base header :disp (+ (ash -2 n-widetag-bits) type)))
287     (inst and bytes (lognot lowtag-mask))
288     (pseudo-atomic
289      (allocation result bytes node)
290      (inst lea result (make-ea :byte :base result :disp lowtag))
291      (storew header result 0 lowtag))))
292
293 (define-vop (%make-symbol)
294   (:policy :fast-safe)
295   (:translate %make-symbol)
296   (:args (name :scs (descriptor-reg) :to :eval))
297   (:temporary (:sc unsigned-reg :from :eval) temp)
298   (:results (result :scs (descriptor-reg) :from :argument))
299   (:node-var node)
300   (:generator 37
301     (with-fixed-allocation (result symbol-header-widetag symbol-size node)
302       (storew name result symbol-name-slot other-pointer-lowtag)
303       (storew unbound-marker-widetag
304               result
305               symbol-value-slot
306               other-pointer-lowtag)
307       ;; Set up a random hash value for the symbol. Perhaps the object
308       ;; address could be used for even faster and smaller code!
309       ;; FIXME: We don't mind the symbol hash not being repeatable, so
310       ;; we might as well add in the object address here, too. (Adding entropy
311       ;; is good, even if ANSI doesn't understand that.)
312       (inst imul temp
313             (make-fixup "fast_random_state" :foreign)
314             1103515245)
315       (inst add temp 12345)
316       (inst mov (make-fixup "fast_random_state" :foreign)
317             temp)
318       ;; We want a positive fixnum for the hash value, so discard the LS bits.
319       ;;
320       ;; FIXME: OK, who wants to tell me (CSR) why these two
321       ;; instructions aren't replaced by (INST AND TEMP #x8FFFFFFC)?
322       ;; Are the following two instructions actually faster?  Does the
323       ;; difference in behaviour really matter?
324       (inst shr temp 1)
325       (inst and temp #xfffffffc)
326       (storew temp result symbol-hash-slot other-pointer-lowtag)
327       (storew nil-value result symbol-plist-slot other-pointer-lowtag)
328       (storew nil-value result symbol-package-slot other-pointer-lowtag))))