10ebc3d5c4d5202e7d9f6f4530729d3b32ee9bc0
[sbcl.git] / src / compiler / generic / genesis.lisp
1 ;;;; "cold" core image builder: This is how we create a target Lisp
2 ;;;; system from scratch, by converting from fasl files to an image
3 ;;;; file in the cross-compilation host, without the help of the
4 ;;;; target Lisp system.
5 ;;;;
6 ;;;; As explained by Rob MacLachlan on the CMU CL mailing list Wed, 06
7 ;;;; Jan 1999 11:05:02 -0500, this cold load generator more or less
8 ;;;; fakes up static function linking. I.e. it makes sure that all the
9 ;;;; DEFUN-defined functions in the fasl files it reads are bound to the
10 ;;;; corresponding symbols before execution starts. It doesn't do
11 ;;;; anything to initialize variable values; instead it just arranges
12 ;;;; for !COLD-INIT to be called at cold load time. !COLD-INIT is
13 ;;;; responsible for explicitly initializing anything which has to be
14 ;;;; initialized early before it transfers control to the ordinary
15 ;;;; top level forms.
16 ;;;;
17 ;;;; (In CMU CL, and in SBCL as of 0.6.9 anyway, functions not defined
18 ;;;; by DEFUN aren't set up specially by GENESIS. In particular,
19 ;;;; structure slot accessors are not set up. Slot accessors are
20 ;;;; available at cold init time because they're usually compiled
21 ;;;; inline. They're not available as out-of-line functions until the
22 ;;;; toplevel forms installing them have run.)
23
24 ;;;; This software is part of the SBCL system. See the README file for
25 ;;;; more information.
26 ;;;;
27 ;;;; This software is derived from the CMU CL system, which was
28 ;;;; written at Carnegie Mellon University and released into the
29 ;;;; public domain. The software is in the public domain and is
30 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
31 ;;;; files for more information.
32
33 (in-package "SB!FASL")
34
35 ;;; a magic number used to identify our core files
36 (defconstant core-magic
37   (logior (ash (sb!xc:char-code #\S) 24)
38           (ash (sb!xc:char-code #\B) 16)
39           (ash (sb!xc:char-code #\C) 8)
40           (sb!xc:char-code #\L)))
41
42 ;;; the current version of SBCL core files
43 ;;;
44 ;;; FIXME: This is left over from CMU CL, and not well thought out.
45 ;;; It's good to make sure that the runtime doesn't try to run core
46 ;;; files from the wrong version, but a single number is not the ideal
47 ;;; way to do this in high level data like this (as opposed to e.g. in
48 ;;; IP packets), and in fact the CMU CL version number never ended up
49 ;;; being incremented past 0. A better approach might be to use a
50 ;;; string which is set from CVS data. (Though now as of sbcl-0.7.8 or
51 ;;; so, we have another problem that the core incompatibility
52 ;;; detection mechanisms are on such a hair trigger -- with even
53 ;;; different builds from the same sources being considered
54 ;;; incompatible -- that any coarser-grained versioning mechanisms
55 ;;; like this are largely irrelevant as long as the hair-triggering
56 ;;; persists.)
57 ;;;
58 ;;; 0: inherited from CMU CL
59 ;;; 1: rearranged static symbols for sbcl-0.6.8
60 ;;; 2: eliminated non-ANSI %DEFCONSTANT/%%DEFCONSTANT support,
61 ;;;    deleted a slot from DEBUG-SOURCE structure
62 ;;; 3: added build ID to cores to discourage sbcl/.core mismatch
63 ;;; 4: added gc page table data
64 (defconstant sbcl-core-version-integer 4)
65
66 (defun round-up (number size)
67   #!+sb-doc
68   "Round NUMBER up to be an integral multiple of SIZE."
69   (* size (ceiling number size)))
70 \f
71 ;;;; implementing the concept of "vector" in (almost) portable
72 ;;;; Common Lisp
73 ;;;;
74 ;;;; "If you only need to do such simple things, it doesn't really
75 ;;;; matter which language you use." -- _ANSI Common Lisp_, p. 1, Paul
76 ;;;; Graham (evidently not considering the abstraction "vector" to be
77 ;;;; such a simple thing:-)
78
79 (eval-when (:compile-toplevel :load-toplevel :execute)
80   (defconstant +smallvec-length+
81     (expt 2 16)))
82
83 ;;; an element of a BIGVEC -- a vector small enough that we have
84 ;;; a good chance of it being portable to other Common Lisps
85 (deftype smallvec ()
86   `(simple-array (unsigned-byte 8) (,+smallvec-length+)))
87
88 (defun make-smallvec ()
89   (make-array +smallvec-length+ :element-type '(unsigned-byte 8)
90               :initial-element 0))
91
92 ;;; a big vector, implemented as a vector of SMALLVECs
93 ;;;
94 ;;; KLUDGE: This implementation seems portable enough for our
95 ;;; purposes, since realistically every modern implementation is
96 ;;; likely to support vectors of at least 2^16 elements. But if you're
97 ;;; masochistic enough to read this far into the contortions imposed
98 ;;; on us by ANSI and the Lisp community, for daring to use the
99 ;;; abstraction of a large linearly addressable memory space, which is
100 ;;; after all only directly supported by the underlying hardware of at
101 ;;; least 99% of the general-purpose computers in use today, then you
102 ;;; may be titillated to hear that in fact this code isn't really
103 ;;; portable, because as of sbcl-0.7.4 we need somewhat more than
104 ;;; 16Mbytes to represent a core, and ANSI only guarantees that
105 ;;; ARRAY-DIMENSION-LIMIT is not less than 1024. -- WHN 2002-06-13
106 (defstruct bigvec
107   (outer-vector (vector (make-smallvec)) :type (vector smallvec)))
108
109 ;;; analogous to SVREF, but into a BIGVEC
110 (defun bvref (bigvec index)
111   (multiple-value-bind (outer-index inner-index)
112       (floor index +smallvec-length+)
113     (aref (the smallvec
114             (svref (bigvec-outer-vector bigvec) outer-index))
115           inner-index)))
116 (defun (setf bvref) (new-value bigvec index)
117   (multiple-value-bind (outer-index inner-index)
118       (floor index +smallvec-length+)
119     (setf (aref (the smallvec
120                   (svref (bigvec-outer-vector bigvec) outer-index))
121                 inner-index)
122           new-value)))
123
124 ;;; analogous to LENGTH, but for a BIGVEC
125 ;;;
126 ;;; the length of BIGVEC, measured in the number of BVREFable bytes it
127 ;;; can hold
128 (defun bvlength (bigvec)
129   (* (length (bigvec-outer-vector bigvec))
130      +smallvec-length+))
131
132 ;;; analogous to WRITE-SEQUENCE, but for a BIGVEC
133 (defun write-bigvec-as-sequence (bigvec stream &key (start 0) end)
134   (loop for i of-type index from start below (or end (bvlength bigvec)) do
135         (write-byte (bvref bigvec i)
136                     stream)))
137
138 ;;; analogous to READ-SEQUENCE-OR-DIE, but for a BIGVEC
139 (defun read-bigvec-as-sequence-or-die (bigvec stream &key (start 0) end)
140   (loop for i of-type index from start below (or end (bvlength bigvec)) do
141         (setf (bvref bigvec i)
142               (read-byte stream))))
143
144 ;;; Grow BIGVEC (exponentially, so that large increases in size have
145 ;;; asymptotic logarithmic cost per byte).
146 (defun expand-bigvec (bigvec)
147   (let* ((old-outer-vector (bigvec-outer-vector bigvec))
148          (length-old-outer-vector (length old-outer-vector))
149          (new-outer-vector (make-array (* 2 length-old-outer-vector))))
150     (dotimes (i length-old-outer-vector)
151       (setf (svref new-outer-vector i)
152             (svref old-outer-vector i)))
153     (loop for i from length-old-outer-vector below (length new-outer-vector) do
154           (setf (svref new-outer-vector i)
155                 (make-smallvec)))
156     (setf (bigvec-outer-vector bigvec)
157           new-outer-vector))
158   bigvec)
159 \f
160 ;;;; looking up bytes and multi-byte values in a BIGVEC (considering
161 ;;;; it as an image of machine memory on the cross-compilation target)
162
163 ;;; BVREF-32 and friends. These are like SAP-REF-n, except that
164 ;;; instead of a SAP we use a BIGVEC.
165 (macrolet ((make-bvref-n
166             (n)
167             (let* ((name (intern (format nil "BVREF-~A" n)))
168                    (number-octets (/ n 8))
169                    (ash-list-le
170                     (loop for i from 0 to (1- number-octets)
171                           collect `(ash (bvref bigvec (+ byte-index ,i))
172                                         ,(* i 8))))
173                    (ash-list-be
174                     (loop for i from 0 to (1- number-octets)
175                           collect `(ash (bvref bigvec
176                                                (+ byte-index
177                                                   ,(- number-octets 1 i)))
178                                         ,(* i 8))))
179                    (setf-list-le
180                     (loop for i from 0 to (1- number-octets)
181                           append
182                           `((bvref bigvec (+ byte-index ,i))
183                             (ldb (byte 8 ,(* i 8)) new-value))))
184                    (setf-list-be
185                     (loop for i from 0 to (1- number-octets)
186                           append
187                           `((bvref bigvec (+ byte-index ,i))
188                             (ldb (byte 8 ,(- n 8 (* i 8))) new-value)))))
189               `(progn
190                  (defun ,name (bigvec byte-index)
191                    (logior ,@(ecase sb!c:*backend-byte-order*
192                                (:little-endian ash-list-le)
193                                (:big-endian ash-list-be))))
194                  (defun (setf ,name) (new-value bigvec byte-index)
195                    (setf ,@(ecase sb!c:*backend-byte-order*
196                              (:little-endian setf-list-le)
197                              (:big-endian setf-list-be))))))))
198   (make-bvref-n 8)
199   (make-bvref-n 16)
200   (make-bvref-n 32)
201   (make-bvref-n 64))
202
203 ;; lispobj-sized word, whatever that may be
204 ;; hopefully nobody ever wants a 128-bit SBCL...
205 #!+#.(cl:if (cl:= 64 sb!vm:n-word-bits) '(and) '(or))
206 (progn
207 (defun bvref-word (bytes index)
208   (bvref-64 bytes index))
209 (defun (setf bvref-word) (new-val bytes index)
210   (setf (bvref-64 bytes index) new-val)))
211
212 #!+#.(cl:if (cl:= 32 sb!vm:n-word-bits) '(and) '(or))
213 (progn
214 (defun bvref-word (bytes index)
215   (bvref-32 bytes index))
216 (defun (setf bvref-word) (new-val bytes index)
217   (setf (bvref-32 bytes index) new-val)))
218
219 \f
220 ;;;; representation of spaces in the core
221
222 ;;; If there is more than one dynamic space in memory (i.e., if a
223 ;;; copying GC is in use), then only the active dynamic space gets
224 ;;; dumped to core.
225 (defvar *dynamic*)
226 (defconstant dynamic-core-space-id 1)
227
228 (defvar *static*)
229 (defconstant static-core-space-id 2)
230
231 (defvar *read-only*)
232 (defconstant read-only-core-space-id 3)
233
234 (defconstant descriptor-low-bits 16
235   "the number of bits in the low half of the descriptor")
236 (defconstant target-space-alignment (ash 1 descriptor-low-bits)
237   "the alignment requirement for spaces in the target.
238   Must be at least (ASH 1 DESCRIPTOR-LOW-BITS)")
239
240 ;;; a GENESIS-time representation of a memory space (e.g. read-only
241 ;;; space, dynamic space, or static space)
242 (defstruct (gspace (:constructor %make-gspace)
243                    (:copier nil))
244   ;; name and identifier for this GSPACE
245   (name (missing-arg) :type symbol :read-only t)
246   (identifier (missing-arg) :type fixnum :read-only t)
247   ;; the word address where the data will be loaded
248   (word-address (missing-arg) :type unsigned-byte :read-only t)
249   ;; the data themselves. (Note that in CMU CL this was a pair of
250   ;; fields SAP and WORDS-ALLOCATED, but that wasn't very portable.)
251   ;; (And then in SBCL this was a VECTOR, but turned out to be
252   ;; unportable too, since ANSI doesn't think that arrays longer than
253   ;; 1024 (!) should needed by portable CL code...)
254   (bytes (make-bigvec) :read-only t)
255   ;; the index of the next unwritten word (i.e. chunk of
256   ;; SB!VM:N-WORD-BYTES bytes) in BYTES, or equivalently the number of
257   ;; words actually written in BYTES. In order to convert to an actual
258   ;; index into BYTES, thus must be multiplied by SB!VM:N-WORD-BYTES.
259   (free-word-index 0))
260
261 (defun gspace-byte-address (gspace)
262   (ash (gspace-word-address gspace) sb!vm:word-shift))
263
264 (def!method print-object ((gspace gspace) stream)
265   (print-unreadable-object (gspace stream :type t)
266     (format stream "~S" (gspace-name gspace))))
267
268 (defun make-gspace (name identifier byte-address)
269   (unless (zerop (rem byte-address target-space-alignment))
270     (error "The byte address #X~X is not aligned on a #X~X-byte boundary."
271            byte-address
272            target-space-alignment))
273   (%make-gspace :name name
274                 :identifier identifier
275                 :word-address (ash byte-address (- sb!vm:word-shift))))
276 \f
277 ;;;; representation of descriptors
278
279 (defstruct (descriptor
280             (:constructor make-descriptor
281                           (high low &optional gspace word-offset))
282             (:copier nil))
283   ;; the GSPACE that this descriptor is allocated in, or NIL if not set yet.
284   (gspace nil :type (or gspace (eql :load-time-value) null))
285   ;; the offset in words from the start of GSPACE, or NIL if not set yet
286   (word-offset nil :type (or sb!vm:word null))
287   ;; the high and low halves of the descriptor
288   ;;
289   ;; KLUDGE: Judging from the comments in genesis.lisp of the CMU CL
290   ;; old-rt compiler, this split dates back from a very early version
291   ;; of genesis where 32-bit integers were represented as conses of
292   ;; two 16-bit integers. In any system with nice (UNSIGNED-BYTE 32)
293   ;; structure slots, like CMU CL >= 17 or any version of SBCL, there
294   ;; seems to be no reason to persist in this. -- WHN 19990917
295   high
296   low)
297 (def!method print-object ((des descriptor) stream)
298   (let ((lowtag (descriptor-lowtag des)))
299     (print-unreadable-object (des stream :type t)
300       (cond ((or (= lowtag sb!vm:even-fixnum-lowtag)
301                  (= lowtag sb!vm:odd-fixnum-lowtag))
302              (let ((unsigned (logior (ash (descriptor-high des)
303                                           (1+ (- descriptor-low-bits
304                                                  sb!vm:n-lowtag-bits)))
305                                      (ash (descriptor-low des)
306                                           (- 1 sb!vm:n-lowtag-bits)))))
307                (format stream
308                        "for fixnum: ~W"
309                        (if (> unsigned #x1FFFFFFF)
310                            (- unsigned #x40000000)
311                            unsigned))))
312             ((or (= lowtag sb!vm:other-immediate-0-lowtag)
313                  (= lowtag sb!vm:other-immediate-1-lowtag)
314                  #!+#.(cl:if (cl:= 64 sb!vm:n-word-bits) '(and) '(or))
315                  (= lowtag sb!vm:other-immediate-2-lowtag)
316                  #!+#.(cl:if (cl:= 64 sb!vm:n-word-bits) '(and) '(or))
317                  (= lowtag sb!vm:other-immediate-3-lowtag))
318              (format stream
319                      "for other immediate: #X~X, type #b~8,'0B"
320                      (ash (descriptor-bits des) (- sb!vm:n-widetag-bits))
321                      (logand (descriptor-low des) sb!vm:widetag-mask)))
322             (t
323              (format stream
324                      "for pointer: #X~X, lowtag #b~3,'0B, ~A"
325                      (logior (ash (descriptor-high des) descriptor-low-bits)
326                              (logandc2 (descriptor-low des) sb!vm:lowtag-mask))
327                      lowtag
328                      (let ((gspace (descriptor-gspace des)))
329                        (if gspace
330                            (gspace-name gspace)
331                            "unknown"))))))))
332
333 ;;; Return a descriptor for a block of LENGTH bytes out of GSPACE. The
334 ;;; free word index is boosted as necessary, and if additional memory
335 ;;; is needed, we grow the GSPACE. The descriptor returned is a
336 ;;; pointer of type LOWTAG.
337 (defun allocate-cold-descriptor (gspace length lowtag)
338   (let* ((bytes (round-up length (ash 1 sb!vm:n-lowtag-bits)))
339          (old-free-word-index (gspace-free-word-index gspace))
340          (new-free-word-index (+ old-free-word-index
341                                  (ash bytes (- sb!vm:word-shift)))))
342     ;; Grow GSPACE as necessary until it's big enough to handle
343     ;; NEW-FREE-WORD-INDEX.
344     (do ()
345         ((>= (bvlength (gspace-bytes gspace))
346              (* new-free-word-index sb!vm:n-word-bytes)))
347       (expand-bigvec (gspace-bytes gspace)))
348     ;; Now that GSPACE is big enough, we can meaningfully grab a chunk of it.
349     (setf (gspace-free-word-index gspace) new-free-word-index)
350     (let ((ptr (+ (gspace-word-address gspace) old-free-word-index)))
351       (make-descriptor (ash ptr (- sb!vm:word-shift descriptor-low-bits))
352                        (logior (ash (logand ptr
353                                             (1- (ash 1
354                                                      (- descriptor-low-bits
355                                                         sb!vm:word-shift))))
356                                     sb!vm:word-shift)
357                                lowtag)
358                        gspace
359                        old-free-word-index))))
360
361 (defun descriptor-lowtag (des)
362   #!+sb-doc
363   "the lowtag bits for DES"
364   (logand (descriptor-low des) sb!vm:lowtag-mask))
365
366 (defun descriptor-bits (des)
367   (logior (ash (descriptor-high des) descriptor-low-bits)
368           (descriptor-low des)))
369
370 (defun descriptor-fixnum (des)
371   (let ((bits (descriptor-bits des)))
372     (if (logbitp (1- sb!vm:n-word-bits) bits)
373         ;; KLUDGE: The (- SB!VM:N-WORD-BITS 2) term here looks right to
374         ;; me, and it works, but in CMU CL it was (1- SB!VM:N-WORD-BITS),
375         ;; and although that doesn't make sense for me, or work for me,
376         ;; it's hard to see how it could have been wrong, since CMU CL
377         ;; genesis worked. It would be nice to understand how this came
378         ;; to be.. -- WHN 19990901
379         (logior (ash bits (- 1 sb!vm:n-lowtag-bits))
380                 (ash -1 (1+ sb!vm:n-positive-fixnum-bits)))
381         (ash bits (- 1 sb!vm:n-lowtag-bits)))))
382
383 (defun descriptor-word-sized-integer (des)
384   ;; Extract an (unsigned-byte 32), from either its fixnum or bignum
385   ;; representation.
386   (let ((lowtag (descriptor-lowtag des)))
387     (if (or (= lowtag sb!vm:even-fixnum-lowtag)
388             (= lowtag sb!vm:odd-fixnum-lowtag))
389         (make-random-descriptor (descriptor-fixnum des))
390         (read-wordindexed des 1))))
391
392 ;;; common idioms
393 (defun descriptor-bytes (des)
394   (gspace-bytes (descriptor-intuit-gspace des)))
395 (defun descriptor-byte-offset (des)
396   (ash (descriptor-word-offset des) sb!vm:word-shift))
397
398 ;;; If DESCRIPTOR-GSPACE is already set, just return that. Otherwise,
399 ;;; figure out a GSPACE which corresponds to DES, set it into
400 ;;; (DESCRIPTOR-GSPACE DES), set a consistent value into
401 ;;; (DESCRIPTOR-WORD-OFFSET DES), and return the GSPACE.
402 (declaim (ftype (function (descriptor) gspace) descriptor-intuit-gspace))
403 (defun descriptor-intuit-gspace (des)
404   (or (descriptor-gspace des)
405
406       ;; gspace wasn't set, now we have to search for it.
407       (let ((lowtag (descriptor-lowtag des))
408             (high (descriptor-high des))
409             (low (descriptor-low des)))
410
411         ;; Non-pointer objects don't have a gspace.
412         (unless (or (eql lowtag sb!vm:fun-pointer-lowtag)
413                     (eql lowtag sb!vm:instance-pointer-lowtag)
414                     (eql lowtag sb!vm:list-pointer-lowtag)
415                     (eql lowtag sb!vm:other-pointer-lowtag))
416           (error "don't even know how to look for a GSPACE for ~S" des))
417
418         (dolist (gspace (list *dynamic* *static* *read-only*)
419                  (error "couldn't find a GSPACE for ~S" des))
420           ;; Bounds-check the descriptor against the allocated area
421           ;; within each gspace.
422           ;;
423           ;; Most of the faffing around in here involving ash and
424           ;; various computed shift counts is due to the high/low
425           ;; split representation of the descriptor bits and an
426           ;; apparent disinclination to create intermediate values
427           ;; larger than a target fixnum.
428           ;;
429           ;; This code relies on the fact that GSPACEs are aligned
430           ;; such that the descriptor-low-bits low bits are zero.
431           (when (and (>= high (ash (gspace-word-address gspace)
432                                    (- sb!vm:word-shift descriptor-low-bits)))
433                      (<= high (ash (+ (gspace-word-address gspace)
434                                       (gspace-free-word-index gspace))
435                                    (- sb!vm:word-shift descriptor-low-bits))))
436             ;; Update the descriptor with the correct gspace and the
437             ;; offset within the gspace and return the gspace.
438             (setf (descriptor-gspace des) gspace)
439             (setf (descriptor-word-offset des)
440                   (+ (ash (- high (ash (gspace-word-address gspace)
441                                        (- sb!vm:word-shift
442                                           descriptor-low-bits)))
443                           (- descriptor-low-bits sb!vm:word-shift))
444                      (ash (logandc2 low sb!vm:lowtag-mask)
445                           (- sb!vm:word-shift))))
446             (return gspace))))))
447
448 (defun make-random-descriptor (value)
449   (make-descriptor (logand (ash value (- descriptor-low-bits))
450                            (1- (ash 1
451                                     (- sb!vm:n-word-bits
452                                        descriptor-low-bits))))
453                    (logand value (1- (ash 1 descriptor-low-bits)))))
454
455 (defun make-fixnum-descriptor (num)
456   (when (>= (integer-length num)
457             (1+ (- sb!vm:n-word-bits sb!vm:n-lowtag-bits)))
458     (error "~W is too big for a fixnum." num))
459   (make-random-descriptor (ash num (1- sb!vm:n-lowtag-bits))))
460
461 (defun make-other-immediate-descriptor (data type)
462   (make-descriptor (ash data (- sb!vm:n-widetag-bits descriptor-low-bits))
463                    (logior (logand (ash data (- descriptor-low-bits
464                                                 sb!vm:n-widetag-bits))
465                                    (1- (ash 1 descriptor-low-bits)))
466                            type)))
467
468 (defun make-character-descriptor (data)
469   (make-other-immediate-descriptor data sb!vm:character-widetag))
470
471 (defun descriptor-beyond (des offset type)
472   (let* ((low (logior (+ (logandc2 (descriptor-low des) sb!vm:lowtag-mask)
473                          offset)
474                       type))
475          (high (+ (descriptor-high des)
476                   (ash low (- descriptor-low-bits)))))
477     (make-descriptor high (logand low (1- (ash 1 descriptor-low-bits))))))
478 \f
479 ;;;; miscellaneous variables and other noise
480
481 ;;; a numeric value to be returned for undefined foreign symbols, or NIL if
482 ;;; undefined foreign symbols are to be treated as an error.
483 ;;; (In the first pass of GENESIS, needed to create a header file before
484 ;;; the C runtime can be built, various foreign symbols will necessarily
485 ;;; be undefined, but we don't need actual values for them anyway, and
486 ;;; we can just use 0 or some other placeholder. In the second pass of
487 ;;; GENESIS, all foreign symbols should be defined, so any undefined
488 ;;; foreign symbol is a problem.)
489 ;;;
490 ;;; KLUDGE: It would probably be cleaner to rewrite GENESIS so that it
491 ;;; never tries to look up foreign symbols in the first place unless
492 ;;; it's actually creating a core file (as in the second pass) instead
493 ;;; of using this hack to allow it to go through the motions without
494 ;;; causing an error. -- WHN 20000825
495 (defvar *foreign-symbol-placeholder-value*)
496
497 ;;; a handle on the trap object
498 (defvar *unbound-marker*)
499 ;; was:  (make-other-immediate-descriptor 0 sb!vm:unbound-marker-widetag)
500
501 ;;; a handle on the NIL object
502 (defvar *nil-descriptor*)
503
504 ;;; the head of a list of TOPLEVEL-THINGs describing stuff to be done
505 ;;; when the target Lisp starts up
506 ;;;
507 ;;; Each TOPLEVEL-THING can be a function to be executed or a fixup or
508 ;;; loadtime value, represented by (CONS KEYWORD ..). The FILENAME
509 ;;; tells which fasl file each list element came from, for debugging
510 ;;; purposes.
511 (defvar *current-reversed-cold-toplevels*)
512
513 ;;; the head of a list of DEBUG-SOURCEs which need to be patched when
514 ;;; the cold core starts up
515 (defvar *current-debug-sources*)
516
517 ;;; the name of the object file currently being cold loaded (as a string, not a
518 ;;; pathname), or NIL if we're not currently cold loading any object file
519 (defvar *cold-load-filename* nil)
520 (declaim (type (or string null) *cold-load-filename*))
521 \f
522 ;;;; miscellaneous stuff to read and write the core memory
523
524 ;;; FIXME: should be DEFINE-MODIFY-MACRO
525 (defmacro cold-push (thing list)
526   #!+sb-doc
527   "Push THING onto the given cold-load LIST."
528   `(setq ,list (cold-cons ,thing ,list)))
529
530 (declaim (ftype (function (descriptor sb!vm:word) descriptor) read-wordindexed))
531 (defun read-wordindexed (address index)
532   #!+sb-doc
533   "Return the value which is displaced by INDEX words from ADDRESS."
534   (let* ((gspace (descriptor-intuit-gspace address))
535          (bytes (gspace-bytes gspace))
536          (byte-index (ash (+ index (descriptor-word-offset address))
537                           sb!vm:word-shift))
538          (value (bvref-word bytes byte-index)))
539     (make-random-descriptor value)))
540
541 (declaim (ftype (function (descriptor) descriptor) read-memory))
542 (defun read-memory (address)
543   #!+sb-doc
544   "Return the value at ADDRESS."
545   (read-wordindexed address 0))
546
547 ;;; (Note: In CMU CL, this function expected a SAP-typed ADDRESS
548 ;;; value, instead of the object-and-offset we use here.)
549 (declaim (ftype (function (descriptor sb!vm:word descriptor) (values))
550                 note-load-time-value-reference))
551 (defun note-load-time-value-reference (address offset marker)
552   (cold-push (cold-cons
553               (cold-intern :load-time-value-fixup)
554               (cold-cons address
555                          (cold-cons (number-to-core offset)
556                                     (cold-cons
557                                      (number-to-core (descriptor-word-offset marker))
558                                      *nil-descriptor*))))
559              *current-reversed-cold-toplevels*)
560   (values))
561
562 (declaim (ftype (function (descriptor sb!vm:word descriptor)) write-wordindexed))
563 (defun write-wordindexed (address index value)
564   #!+sb-doc
565   "Write VALUE displaced INDEX words from ADDRESS."
566   (if (eql (descriptor-gspace value) :load-time-value)
567     (note-load-time-value-reference address
568                                     (- (ash index sb!vm:word-shift)
569                                        (logand (descriptor-bits address)
570                                                sb!vm:lowtag-mask))
571                                     value)
572     (let* ((bytes (gspace-bytes (descriptor-intuit-gspace address)))
573            (byte-index (ash (+ index (descriptor-word-offset address))
574                                sb!vm:word-shift)))
575       (setf (bvref-word bytes byte-index)
576             (descriptor-bits value)))))
577
578 (declaim (ftype (function (descriptor descriptor)) write-memory))
579 (defun write-memory (address value)
580   #!+sb-doc
581   "Write VALUE (a DESCRIPTOR) at ADDRESS (also a DESCRIPTOR)."
582   (write-wordindexed address 0 value))
583 \f
584 ;;;; allocating images of primitive objects in the cold core
585
586 ;;; There are three kinds of blocks of memory in the type system:
587 ;;; * Boxed objects (cons cells, structures, etc): These objects have no
588 ;;;   header as all slots are descriptors.
589 ;;; * Unboxed objects (bignums): There is a single header word that contains
590 ;;;   the length.
591 ;;; * Vector objects: There is a header word with the type, then a word for
592 ;;;   the length, then the data.
593 (defun allocate-boxed-object (gspace length lowtag)
594   #!+sb-doc
595   "Allocate LENGTH words in GSPACE and return a new descriptor of type LOWTAG
596   pointing to them."
597   (allocate-cold-descriptor gspace (ash length sb!vm:word-shift) lowtag))
598 (defun allocate-unboxed-object (gspace element-bits length type)
599   #!+sb-doc
600   "Allocate LENGTH units of ELEMENT-BITS bits plus a header word in GSPACE and
601   return an ``other-pointer'' descriptor to them. Initialize the header word
602   with the resultant length and TYPE."
603   (let* ((bytes (/ (* element-bits length) sb!vm:n-byte-bits))
604          (des (allocate-cold-descriptor gspace
605                                         (+ bytes sb!vm:n-word-bytes)
606                                         sb!vm:other-pointer-lowtag)))
607     (write-memory des
608                   (make-other-immediate-descriptor (ash bytes
609                                                         (- sb!vm:word-shift))
610                                                    type))
611     des))
612 (defun allocate-vector-object (gspace element-bits length type)
613   #!+sb-doc
614   "Allocate LENGTH units of ELEMENT-BITS size plus a header plus a length slot in
615   GSPACE and return an ``other-pointer'' descriptor to them. Initialize the
616   header word with TYPE and the length slot with LENGTH."
617   ;; FIXME: Here and in ALLOCATE-UNBOXED-OBJECT, BYTES is calculated using
618   ;; #'/ instead of #'CEILING, which seems wrong.
619   (let* ((bytes (/ (* element-bits length) sb!vm:n-byte-bits))
620          (des (allocate-cold-descriptor gspace
621                                         (+ bytes (* 2 sb!vm:n-word-bytes))
622                                         sb!vm:other-pointer-lowtag)))
623     (write-memory des (make-other-immediate-descriptor 0 type))
624     (write-wordindexed des
625                        sb!vm:vector-length-slot
626                        (make-fixnum-descriptor length))
627     des))
628 \f
629 ;;;; copying simple objects into the cold core
630
631 (defun base-string-to-core (string &optional (gspace *dynamic*))
632   #!+sb-doc
633   "Copy STRING (which must only contain STANDARD-CHARs) into the cold
634 core and return a descriptor to it."
635   ;; (Remember that the system convention for storage of strings leaves an
636   ;; extra null byte at the end to aid in call-out to C.)
637   (let* ((length (length string))
638          (des (allocate-vector-object gspace
639                                       sb!vm:n-byte-bits
640                                       (1+ length)
641                                       sb!vm:simple-base-string-widetag))
642          (bytes (gspace-bytes gspace))
643          (offset (+ (* sb!vm:vector-data-offset sb!vm:n-word-bytes)
644                     (descriptor-byte-offset des))))
645     (write-wordindexed des
646                        sb!vm:vector-length-slot
647                        (make-fixnum-descriptor length))
648     (dotimes (i length)
649       (setf (bvref bytes (+ offset i))
650             (sb!xc:char-code (aref string i))))
651     (setf (bvref bytes (+ offset length))
652           0) ; null string-termination character for C
653     des))
654
655 (defun bignum-to-core (n)
656   #!+sb-doc
657   "Copy a bignum to the cold core."
658   (let* ((words (ceiling (1+ (integer-length n)) sb!vm:n-word-bits))
659          (handle (allocate-unboxed-object *dynamic*
660                                           sb!vm:n-word-bits
661                                           words
662                                           sb!vm:bignum-widetag)))
663     (declare (fixnum words))
664     (do ((index 1 (1+ index))
665          (remainder n (ash remainder (- sb!vm:n-word-bits))))
666         ((> index words)
667          (unless (zerop (integer-length remainder))
668            ;; FIXME: Shouldn't this be a fatal error?
669            (warn "~W words of ~W were written, but ~W bits were left over."
670                  words n remainder)))
671       (let ((word (ldb (byte sb!vm:n-word-bits 0) remainder)))
672         (write-wordindexed handle index
673                            (make-descriptor (ash word (- descriptor-low-bits))
674                                             (ldb (byte descriptor-low-bits 0)
675                                                  word)))))
676     handle))
677
678 (defun number-pair-to-core (first second type)
679   #!+sb-doc
680   "Makes a number pair of TYPE (ratio or complex) and fills it in."
681   (let ((des (allocate-unboxed-object *dynamic* sb!vm:n-word-bits 2 type)))
682     (write-wordindexed des 1 first)
683     (write-wordindexed des 2 second)
684     des))
685
686 (defun write-double-float-bits (address index x)
687   (let ((hi (double-float-high-bits x))
688         (lo (double-float-low-bits x)))
689     (ecase sb!vm::n-word-bits
690       (32
691        (let ((high-bits (make-random-descriptor hi))
692              (low-bits (make-random-descriptor lo)))
693          (ecase sb!c:*backend-byte-order*
694            (:little-endian
695             (write-wordindexed address index low-bits)
696             (write-wordindexed address (1+ index) high-bits))
697            (:big-endian
698             (write-wordindexed address index high-bits)
699             (write-wordindexed address (1+ index) low-bits)))))
700       (64
701        (let ((bits (make-random-descriptor
702                     (ecase sb!c:*backend-byte-order*
703                       (:little-endian (logior lo (ash hi 32)))
704                       ;; Just guessing.
705                       #+nil (:big-endian (logior (logand hi #xffffffff)
706                                                  (ash lo 32)))))))
707          (write-wordindexed address index bits))))
708     address))
709
710 (defun float-to-core (x)
711   (etypecase x
712     (single-float
713      ;; 64-bit platforms have immediate single-floats.
714      #!+#.(cl:if (cl:= sb!vm:n-word-bits 64) '(and) '(or))
715      (make-random-descriptor (logior (ash (single-float-bits x) 32)
716                                      sb!vm::single-float-widetag))
717      #!-#.(cl:if (cl:= sb!vm:n-word-bits 64) '(and) '(or))
718      (let ((des (allocate-unboxed-object *dynamic*
719                                          sb!vm:n-word-bits
720                                          (1- sb!vm:single-float-size)
721                                          sb!vm:single-float-widetag)))
722        (write-wordindexed des
723                           sb!vm:single-float-value-slot
724                           (make-random-descriptor (single-float-bits x)))
725        des))
726     (double-float
727      (let ((des (allocate-unboxed-object *dynamic*
728                                          sb!vm:n-word-bits
729                                          (1- sb!vm:double-float-size)
730                                          sb!vm:double-float-widetag)))
731        (write-double-float-bits des sb!vm:double-float-value-slot x)))))
732
733 (defun complex-single-float-to-core (num)
734   (declare (type (complex single-float) num))
735   (let ((des (allocate-unboxed-object *dynamic* sb!vm:n-word-bits
736                                       (1- sb!vm:complex-single-float-size)
737                                       sb!vm:complex-single-float-widetag)))
738     #!-x86-64
739     (progn
740       (write-wordindexed des sb!vm:complex-single-float-real-slot
741                          (make-random-descriptor (single-float-bits (realpart num))))
742       (write-wordindexed des sb!vm:complex-single-float-imag-slot
743                          (make-random-descriptor (single-float-bits (imagpart num)))))
744     #!+x86-64
745     (write-wordindexed des sb!vm:complex-single-float-data-slot
746                        (make-random-descriptor
747                         (logior (ldb (byte 32 0) (single-float-bits (realpart num)))
748                                 (ash (single-float-bits (imagpart num)) 32))))
749     des))
750
751 (defun complex-double-float-to-core (num)
752   (declare (type (complex double-float) num))
753   (let ((des (allocate-unboxed-object *dynamic* sb!vm:n-word-bits
754                                       (1- sb!vm:complex-double-float-size)
755                                       sb!vm:complex-double-float-widetag)))
756     (write-double-float-bits des sb!vm:complex-double-float-real-slot
757                              (realpart num))
758     (write-double-float-bits des sb!vm:complex-double-float-imag-slot
759                              (imagpart num))))
760
761 ;;; Copy the given number to the core.
762 (defun number-to-core (number)
763   (typecase number
764     (integer (if (< (integer-length number)
765                     (- (1+ sb!vm:n-word-bits) sb!vm:n-lowtag-bits))
766                  (make-fixnum-descriptor number)
767                  (bignum-to-core number)))
768     (ratio (number-pair-to-core (number-to-core (numerator number))
769                                 (number-to-core (denominator number))
770                                 sb!vm:ratio-widetag))
771     ((complex single-float) (complex-single-float-to-core number))
772     ((complex double-float) (complex-double-float-to-core number))
773     #!+long-float
774     ((complex long-float)
775      (error "~S isn't a cold-loadable number at all!" number))
776     (complex (number-pair-to-core (number-to-core (realpart number))
777                                   (number-to-core (imagpart number))
778                                   sb!vm:complex-widetag))
779     (float (float-to-core number))
780     (t (error "~S isn't a cold-loadable number at all!" number))))
781
782 (declaim (ftype (function (sb!vm:word) descriptor) sap-int-to-core))
783 (defun sap-int-to-core (sap-int)
784   (let ((des (allocate-unboxed-object *dynamic*
785                                       sb!vm:n-word-bits
786                                       (1- sb!vm:sap-size)
787                                       sb!vm:sap-widetag)))
788     (write-wordindexed des
789                        sb!vm:sap-pointer-slot
790                        (make-random-descriptor sap-int))
791     des))
792
793 ;;; Allocate a cons cell in GSPACE and fill it in with CAR and CDR.
794 (defun cold-cons (car cdr &optional (gspace *dynamic*))
795   (let ((dest (allocate-boxed-object gspace 2 sb!vm:list-pointer-lowtag)))
796     (write-memory dest car)
797     (write-wordindexed dest 1 cdr)
798     dest))
799
800 ;;; Make a simple-vector on the target that holds the specified
801 ;;; OBJECTS, and return its descriptor.
802 (defun vector-in-core (&rest objects)
803   (let* ((size (length objects))
804          (result (allocate-vector-object *dynamic* sb!vm:n-word-bits size
805                                          sb!vm:simple-vector-widetag)))
806     (dotimes (index size)
807       (write-wordindexed result (+ index sb!vm:vector-data-offset)
808                          (pop objects)))
809     result))
810 \f
811 ;;;; symbol magic
812
813 ;;; Allocate (and initialize) a symbol.
814 (defun allocate-symbol (name &key (gspace *dynamic*))
815   (declare (simple-string name))
816   (let ((symbol (allocate-unboxed-object gspace
817                                          sb!vm:n-word-bits
818                                          (1- sb!vm:symbol-size)
819                                          sb!vm:symbol-header-widetag)))
820     (write-wordindexed symbol sb!vm:symbol-value-slot *unbound-marker*)
821     (write-wordindexed symbol
822                        sb!vm:symbol-hash-slot
823                        (make-fixnum-descriptor 0))
824     (write-wordindexed symbol sb!vm:symbol-plist-slot *nil-descriptor*)
825     (write-wordindexed symbol sb!vm:symbol-name-slot
826                        (base-string-to-core name *dynamic*))
827     (write-wordindexed symbol sb!vm:symbol-package-slot *nil-descriptor*)
828     symbol))
829
830 ;;; Set the cold symbol value of SYMBOL-OR-SYMBOL-DES, which can be either a
831 ;;; descriptor of a cold symbol or (in an abbreviation for the
832 ;;; most common usage pattern) an ordinary symbol, which will be
833 ;;; automatically cold-interned.
834 (declaim (ftype (function ((or descriptor symbol) descriptor)) cold-set))
835 (defun cold-set (symbol-or-symbol-des value)
836   (let ((symbol-des (etypecase symbol-or-symbol-des
837                       (descriptor symbol-or-symbol-des)
838                       (symbol (cold-intern symbol-or-symbol-des)))))
839     (write-wordindexed symbol-des sb!vm:symbol-value-slot value)))
840 \f
841 ;;;; layouts and type system pre-initialization
842
843 ;;; Since we want to be able to dump structure constants and
844 ;;; predicates with reference layouts, we need to create layouts at
845 ;;; cold-load time. We use the name to intern layouts by, and dump a
846 ;;; list of all cold layouts in *!INITIAL-LAYOUTS* so that type system
847 ;;; initialization can find them. The only thing that's tricky [sic --
848 ;;; WHN 19990816] is initializing layout's layout, which must point to
849 ;;; itself.
850
851 ;;; a map from class names to lists of
852 ;;;    `(,descriptor ,name ,length ,inherits ,depth)
853 ;;; KLUDGE: It would be more understandable and maintainable to use
854 ;;; DEFSTRUCT (:TYPE LIST) here. -- WHN 19990823
855 (defvar *cold-layouts* (make-hash-table :test 'equal))
856
857 ;;; a map from DESCRIPTOR-BITS of cold layouts to the name, for inverting
858 ;;; mapping
859 (defvar *cold-layout-names* (make-hash-table :test 'eql))
860
861 ;;; FIXME: *COLD-LAYOUTS* and *COLD-LAYOUT-NAMES* should be
862 ;;; initialized by binding in GENESIS.
863
864 ;;; the descriptor for layout's layout (needed when making layouts)
865 (defvar *layout-layout*)
866
867 (defconstant target-layout-length
868   (layout-length (find-layout 'layout)))
869
870 (defun target-layout-index (slot-name)
871   ;; KLUDGE: this is a little bit sleazy, but the tricky thing is that
872   ;; structure slots don't have a terribly firm idea of their names.
873   ;; At least here if we change LAYOUT's package of definition, we
874   ;; only have to change one thing...
875   (let* ((name (find-symbol (symbol-name slot-name) "SB!KERNEL"))
876          (layout (find-layout 'layout))
877          (dd (layout-info layout))
878          (slots (dd-slots dd))
879          (dsd (find name slots :key #'dsd-name)))
880     (aver dsd)
881     (dsd-index dsd)))
882
883 (defun cold-set-layout-slot (cold-layout slot-name value)
884   (write-wordindexed
885    cold-layout
886    (+ sb!vm:instance-slots-offset (target-layout-index slot-name))
887    value))
888
889 ;;; Return a list of names created from the cold layout INHERITS data
890 ;;; in X.
891 (defun listify-cold-inherits (x)
892   (let ((len (descriptor-fixnum (read-wordindexed x
893                                                   sb!vm:vector-length-slot))))
894     (collect ((res))
895       (dotimes (index len)
896         (let* ((des (read-wordindexed x (+ sb!vm:vector-data-offset index)))
897                (found (gethash (descriptor-bits des) *cold-layout-names*)))
898           (if found
899             (res found)
900             (error "unknown descriptor at index ~S (bits = ~8,'0X)"
901                    index
902                    (descriptor-bits des)))))
903       (res))))
904
905 (declaim (ftype (function (symbol descriptor descriptor descriptor descriptor)
906                           descriptor)
907                 make-cold-layout))
908 (defun make-cold-layout (name length inherits depthoid nuntagged)
909   (let ((result (allocate-boxed-object *dynamic*
910                                        ;; KLUDGE: Why 1+? -- WHN 19990901
911                                        ;; header word? -- CSR 20051204
912                                        (1+ target-layout-length)
913                                        sb!vm:instance-pointer-lowtag)))
914     (write-memory result
915                   (make-other-immediate-descriptor
916                    target-layout-length sb!vm:instance-header-widetag))
917
918     ;; KLUDGE: The offsets into LAYOUT below should probably be pulled out
919     ;; of the cross-compiler's tables at genesis time instead of inserted
920     ;; by hand as bare numeric constants. -- WHN ca. 19990901
921
922     ;; Set slot 0 = the layout of the layout.
923     (write-wordindexed result sb!vm:instance-slots-offset *layout-layout*)
924
925     ;; Don't set the CLOS hash value: done in cold-init instead.
926     ;;
927     ;; Set other slot values.
928     ;;
929     ;; leave CLASSOID uninitialized for now
930     (cold-set-layout-slot result 'invalid *nil-descriptor*)
931     (cold-set-layout-slot result 'inherits inherits)
932     (cold-set-layout-slot result 'depthoid depthoid)
933     (cold-set-layout-slot result 'length length)
934     (cold-set-layout-slot result 'info *nil-descriptor*)
935     (cold-set-layout-slot result 'pure *nil-descriptor*)
936     (cold-set-layout-slot result 'n-untagged-slots nuntagged)
937     (cold-set-layout-slot result 'for-std-class-p *nil-descriptor*)
938
939     (setf (gethash name *cold-layouts*)
940           (list result
941                 name
942                 (descriptor-fixnum length)
943                 (listify-cold-inherits inherits)
944                 (descriptor-fixnum depthoid)
945                 (descriptor-fixnum nuntagged)))
946     (setf (gethash (descriptor-bits result) *cold-layout-names*) name)
947
948     result))
949
950 (defun initialize-layouts ()
951
952   (clrhash *cold-layouts*)
953
954   ;; We initially create the layout of LAYOUT itself with NIL as the LAYOUT and
955   ;; #() as INHERITS,
956   (setq *layout-layout* *nil-descriptor*)
957   (let ((xlayout-layout (find-layout 'layout)))
958     (aver (= 0 (layout-n-untagged-slots xlayout-layout)))
959     (setq *layout-layout*
960           (make-cold-layout 'layout
961                             (number-to-core target-layout-length)
962                             (vector-in-core)
963                             (number-to-core (layout-depthoid xlayout-layout))
964                             (number-to-core 0)))
965   (write-wordindexed
966    *layout-layout* sb!vm:instance-slots-offset *layout-layout*)
967
968   ;; Then we create the layouts that we'll need to make a correct INHERITS
969   ;; vector for the layout of LAYOUT itself..
970   ;;
971   ;; FIXME: The various LENGTH and DEPTHOID numbers should be taken from
972   ;; the compiler's tables, not set by hand.
973   (let* ((t-layout
974           (make-cold-layout 't
975                             (number-to-core 0)
976                             (vector-in-core)
977                             (number-to-core 0)
978                             (number-to-core 0)))
979          (so-layout
980           (make-cold-layout 'structure-object
981                             (number-to-core 1)
982                             (vector-in-core t-layout)
983                             (number-to-core 1)
984                             (number-to-core 0)))
985          (bso-layout
986           (make-cold-layout 'structure!object
987                             (number-to-core 1)
988                             (vector-in-core t-layout so-layout)
989                             (number-to-core 2)
990                             (number-to-core 0)))
991          (layout-inherits (vector-in-core t-layout
992                                           so-layout
993                                           bso-layout)))
994
995     ;; ..and return to backpatch the layout of LAYOUT.
996     (setf (fourth (gethash 'layout *cold-layouts*))
997           (listify-cold-inherits layout-inherits))
998     (cold-set-layout-slot *layout-layout* 'inherits layout-inherits))))
999 \f
1000 ;;;; interning symbols in the cold image
1001
1002 ;;; In order to avoid having to know about the package format, we
1003 ;;; build a data structure in *COLD-PACKAGE-SYMBOLS* that holds all
1004 ;;; interned symbols along with info about their packages. The data
1005 ;;; structure is a list of sublists, where the sublists have the
1006 ;;; following format:
1007 ;;;   (<make-package-arglist>
1008 ;;;    <internal-symbols>
1009 ;;;    <external-symbols>
1010 ;;;    <imported-internal-symbols>
1011 ;;;    <imported-external-symbols>
1012 ;;;    <shadowing-symbols>
1013 ;;;    <package-documentation>)
1014 ;;;
1015 ;;; KLUDGE: It would be nice to implement the sublists as instances of
1016 ;;; a DEFSTRUCT (:TYPE LIST). (They'd still be lists, but at least we'd be
1017 ;;; using mnemonically-named operators to access them, instead of trying
1018 ;;; to remember what THIRD and FIFTH mean, and hoping that we never
1019 ;;; need to change the list layout..) -- WHN 19990825
1020
1021 ;;; an alist from packages to lists of that package's symbols to be dumped
1022 (defvar *cold-package-symbols*)
1023 (declaim (type list *cold-package-symbols*))
1024
1025 ;;; a map from descriptors to symbols, so that we can back up. The key
1026 ;;; is the address in the target core.
1027 (defvar *cold-symbols*)
1028 (declaim (type hash-table *cold-symbols*))
1029
1030 ;;; sanity check for a symbol we're about to create on the target
1031 ;;;
1032 ;;; Make sure that the symbol has an appropriate package. In
1033 ;;; particular, catch the so-easy-to-make error of typing something
1034 ;;; like SB-KERNEL:%BYTE-BLT in cold sources when what you really
1035 ;;; need is SB!KERNEL:%BYTE-BLT.
1036 (defun package-ok-for-target-symbol-p (package)
1037   (let ((package-name (package-name package)))
1038     (or
1039      ;; Cold interning things in these standard packages is OK. (Cold
1040      ;; interning things in the other standard package, CL-USER, isn't
1041      ;; OK. We just use CL-USER to expose symbols whose homes are in
1042      ;; other packages. Thus, trying to cold intern a symbol whose
1043      ;; home package is CL-USER probably means that a coding error has
1044      ;; been made somewhere.)
1045      (find package-name '("COMMON-LISP" "KEYWORD") :test #'string=)
1046      ;; Cold interning something in one of our target-code packages,
1047      ;; which are ever-so-rigorously-and-elegantly distinguished by
1048      ;; this prefix on their names, is OK too.
1049      (string= package-name "SB!" :end1 3 :end2 3)
1050      ;; This one is OK too, since it ends up being COMMON-LISP on the
1051      ;; target.
1052      (string= package-name "SB-XC")
1053      ;; Anything else looks bad. (maybe COMMON-LISP-USER? maybe an extension
1054      ;; package in the xc host? something we can't think of
1055      ;; a valid reason to cold intern, anyway...)
1056      )))
1057
1058 ;;; like SYMBOL-PACKAGE, but safe for symbols which end up on the target
1059 ;;;
1060 ;;; Most host symbols we dump onto the target are created by SBCL
1061 ;;; itself, so that as long as we avoid gratuitously
1062 ;;; cross-compilation-unfriendly hacks, it just happens that their
1063 ;;; SYMBOL-PACKAGE in the host system corresponds to their
1064 ;;; SYMBOL-PACKAGE in the target system. However, that's not the case
1065 ;;; in the COMMON-LISP package, where we don't get to create the
1066 ;;; symbols but instead have to use the ones that the xc host created.
1067 ;;; In particular, while ANSI specifies which symbols are exported
1068 ;;; from COMMON-LISP, it doesn't specify that their home packages are
1069 ;;; COMMON-LISP, so the xc host can keep them in random packages which
1070 ;;; don't exist on the target (e.g. CLISP keeping some CL-exported
1071 ;;; symbols in the CLOS package).
1072 (defun symbol-package-for-target-symbol (symbol)
1073   ;; We want to catch weird symbols like CLISP's
1074   ;; CL:FIND-METHOD=CLOS::FIND-METHOD, but we don't want to get
1075   ;; sidetracked by ordinary symbols like :CHARACTER which happen to
1076   ;; have the same SYMBOL-NAME as exports from COMMON-LISP.
1077   (multiple-value-bind (cl-symbol cl-status)
1078       (find-symbol (symbol-name symbol) *cl-package*)
1079     (if (and (eq symbol cl-symbol)
1080              (eq cl-status :external))
1081         ;; special case, to work around possible xc host weirdness
1082         ;; in COMMON-LISP package
1083         *cl-package*
1084         ;; ordinary case
1085         (let ((result (symbol-package symbol)))
1086           (unless (package-ok-for-target-symbol-p result)
1087             (bug "~A in bad package for target: ~A" symbol result))
1088           result))))
1089
1090 ;;; Return a handle on an interned symbol. If necessary allocate the
1091 ;;; symbol and record which package the symbol was referenced in. When
1092 ;;; we allocate the symbol, make sure we record a reference to the
1093 ;;; symbol in the home package so that the package gets set.
1094 (defun cold-intern (symbol
1095                     &key
1096                     (package (symbol-package-for-target-symbol symbol))
1097                     (gspace *dynamic*))
1098
1099   (aver (package-ok-for-target-symbol-p package))
1100
1101   ;; Anything on the cross-compilation host which refers to the target
1102   ;; machinery through the host SB-XC package should be translated to
1103   ;; something on the target which refers to the same machinery
1104   ;; through the target COMMON-LISP package.
1105   (let ((p (find-package "SB-XC")))
1106     (when (eq package p)
1107       (setf package *cl-package*))
1108     (when (eq (symbol-package symbol) p)
1109       (setf symbol (intern (symbol-name symbol) *cl-package*))))
1110
1111   (let (;; Information about each cold-interned symbol is stored
1112         ;; in COLD-INTERN-INFO.
1113         ;;   (CAR COLD-INTERN-INFO) = descriptor of symbol
1114         ;;   (CDR COLD-INTERN-INFO) = list of packages, other than symbol's
1115         ;;                            own package, referring to symbol
1116         ;; (*COLD-PACKAGE-SYMBOLS* and *COLD-SYMBOLS* store basically the
1117         ;; same information, but with the mapping running the opposite way.)
1118         (cold-intern-info (get symbol 'cold-intern-info)))
1119     (unless cold-intern-info
1120       (cond ((eq (symbol-package-for-target-symbol symbol) package)
1121              (let ((handle (allocate-symbol (symbol-name symbol) :gspace gspace)))
1122                (setf (gethash (descriptor-bits handle) *cold-symbols*) symbol)
1123                (when (eq package *keyword-package*)
1124                  (cold-set handle handle))
1125                (setq cold-intern-info
1126                      (setf (get symbol 'cold-intern-info) (cons handle nil)))))
1127             (t
1128              (cold-intern symbol)
1129              (setq cold-intern-info (get symbol 'cold-intern-info)))))
1130     (unless (or (null package)
1131                 (member package (cdr cold-intern-info)))
1132       (push package (cdr cold-intern-info))
1133       (let* ((old-cps-entry (assoc package *cold-package-symbols*))
1134              (cps-entry (or old-cps-entry
1135                             (car (push (list package)
1136                                        *cold-package-symbols*)))))
1137         (unless old-cps-entry
1138           (/show "created *COLD-PACKAGE-SYMBOLS* entry for" package symbol))
1139         (push symbol (rest cps-entry))))
1140     (car cold-intern-info)))
1141
1142 ;;; Construct and return a value for use as *NIL-DESCRIPTOR*.
1143 (defun make-nil-descriptor ()
1144   (let* ((des (allocate-unboxed-object
1145                *static*
1146                sb!vm:n-word-bits
1147                sb!vm:symbol-size
1148                0))
1149          (result (make-descriptor (descriptor-high des)
1150                                   (+ (descriptor-low des)
1151                                      (* 2 sb!vm:n-word-bytes)
1152                                      (- sb!vm:list-pointer-lowtag
1153                                         sb!vm:other-pointer-lowtag)))))
1154     (write-wordindexed des
1155                        1
1156                        (make-other-immediate-descriptor
1157                         0
1158                         sb!vm:symbol-header-widetag))
1159     (write-wordindexed des
1160                        (+ 1 sb!vm:symbol-value-slot)
1161                        result)
1162     (write-wordindexed des
1163                        (+ 2 sb!vm:symbol-value-slot)
1164                        result)
1165     (write-wordindexed des
1166                        (+ 1 sb!vm:symbol-plist-slot)
1167                        result)
1168     (write-wordindexed des
1169                        (+ 1 sb!vm:symbol-name-slot)
1170                        ;; This is *DYNAMIC*, and DES is *STATIC*,
1171                        ;; because that's the way CMU CL did it; I'm
1172                        ;; not sure whether there's an underlying
1173                        ;; reason. -- WHN 1990826
1174                        (base-string-to-core "NIL" *dynamic*))
1175     (write-wordindexed des
1176                        (+ 1 sb!vm:symbol-package-slot)
1177                        result)
1178     (setf (get nil 'cold-intern-info)
1179           (cons result nil))
1180     (cold-intern nil)
1181     result))
1182
1183 ;;; Since the initial symbols must be allocated before we can intern
1184 ;;; anything else, we intern those here. We also set the value of T.
1185 (defun initialize-non-nil-symbols ()
1186   #!+sb-doc
1187   "Initialize the cold load symbol-hacking data structures."
1188   ;; Intern the others.
1189   (dolist (symbol sb!vm:*static-symbols*)
1190     (let* ((des (cold-intern symbol :gspace *static*))
1191            (offset-wanted (sb!vm:static-symbol-offset symbol))
1192            (offset-found (- (descriptor-low des)
1193                             (descriptor-low *nil-descriptor*))))
1194       (unless (= offset-wanted offset-found)
1195         ;; FIXME: should be fatal
1196         (warn "Offset from ~S to ~S is ~W, not ~W"
1197               symbol
1198               nil
1199               offset-found
1200               offset-wanted))))
1201   ;; Establish the value of T.
1202   (let ((t-symbol (cold-intern t :gspace *static*)))
1203     (cold-set t-symbol t-symbol))
1204   ;; Establish the value of *PSEUDO-ATOMIC-BITS* so that the
1205   ;; allocation sequences that expect it to be zero upon entrance
1206   ;; actually find it to be so.
1207   #!+(or x86-64 x86)
1208   (let ((p-a-a-symbol (cold-intern 'sb!kernel:*pseudo-atomic-bits*
1209                                    :gspace *static*)))
1210     (cold-set p-a-a-symbol (make-fixnum-descriptor 0))))
1211
1212 ;;; a helper function for FINISH-SYMBOLS: Return a cold alist suitable
1213 ;;; to be stored in *!INITIAL-LAYOUTS*.
1214 (defun cold-list-all-layouts ()
1215   (let ((layouts nil)
1216         (result *nil-descriptor*))
1217     (maphash (lambda (key stuff)
1218                (push (cons key (first stuff)) layouts))
1219              *cold-layouts*)
1220     (flet ((sorter (x y)
1221              (let ((xpn (package-name (symbol-package-for-target-symbol x)))
1222                    (ypn (package-name (symbol-package-for-target-symbol y))))
1223                (cond
1224                  ((string= x y) (string< xpn ypn))
1225                  (t (string< x y))))))
1226       (setq layouts (sort layouts #'sorter :key #'car)))
1227     (dolist (layout layouts result)
1228       (cold-push (cold-cons (cold-intern (car layout)) (cdr layout))
1229                  result))))
1230
1231 ;;; Establish initial values for magic symbols.
1232 ;;;
1233 ;;; Scan over all the symbols referenced in each package in
1234 ;;; *COLD-PACKAGE-SYMBOLS* making that for each one there's an
1235 ;;; appropriate entry in the *!INITIAL-SYMBOLS* data structure to
1236 ;;; intern it.
1237 (defun finish-symbols ()
1238
1239   ;; I think the point of setting these functions into SYMBOL-VALUEs
1240   ;; here, instead of using SYMBOL-FUNCTION, is that in CMU CL
1241   ;; SYMBOL-FUNCTION reduces to FDEFINITION, which is a pretty
1242   ;; hairy operation (involving globaldb.lisp etc.) which we don't
1243   ;; want to invoke early in cold init. -- WHN 2001-12-05
1244   ;;
1245   ;; FIXME: So OK, that's a reasonable reason to do something weird like
1246   ;; this, but this is still a weird thing to do, and we should change
1247   ;; the names to highlight that something weird is going on. Perhaps
1248   ;; *MAYBE-GC-FUN*, *INTERNAL-ERROR-FUN*, *HANDLE-BREAKPOINT-FUN*,
1249   ;; and *HANDLE-FUN-END-BREAKPOINT-FUN*...
1250   (dolist (symbol sb!vm::*c-callable-static-symbols*)
1251     (cold-set symbol (cold-fdefinition-object (cold-intern symbol))))
1252
1253   (cold-set 'sb!vm::*current-catch-block*          (make-fixnum-descriptor 0))
1254   (cold-set 'sb!vm::*current-unwind-protect-block* (make-fixnum-descriptor 0))
1255
1256   (cold-set '*free-interrupt-context-index* (make-fixnum-descriptor 0))
1257
1258   (cold-set '*!initial-layouts* (cold-list-all-layouts))
1259
1260   (/show "dumping packages" (mapcar #'car *cold-package-symbols*))
1261   (let ((initial-symbols *nil-descriptor*))
1262     (dolist (cold-package-symbols-entry *cold-package-symbols*)
1263       (let* ((cold-package (car cold-package-symbols-entry))
1264              (symbols (cdr cold-package-symbols-entry))
1265              (shadows (package-shadowing-symbols cold-package))
1266              (documentation (base-string-to-core
1267                              ;; KLUDGE: NIL punned as 0-length string.
1268                              (unless
1269                                  ;; don't propagate the arbitrary
1270                                  ;; docstring from host packages into
1271                                  ;; the core
1272                                  (or (eql cold-package *cl-package*)
1273                                      (eql cold-package *keyword-package*))
1274                                (documentation cold-package t))))
1275              (internal-count 0)
1276              (external-count 0)
1277              (internal *nil-descriptor*)
1278              (external *nil-descriptor*)
1279              (imported-internal *nil-descriptor*)
1280              (imported-external *nil-descriptor*)
1281              (shadowing *nil-descriptor*))
1282         (declare (type package cold-package)) ; i.e. not a target descriptor
1283         (/show "dumping" cold-package symbols)
1284
1285         ;; FIXME: Add assertions here to make sure that inappropriate stuff
1286         ;; isn't being dumped:
1287         ;;   * the CL-USER package
1288         ;;   * the SB-COLD package
1289         ;;   * any internal symbols in the CL package
1290         ;;   * basically any package other than CL, KEYWORD, or the packages
1291         ;;     in package-data-list.lisp-expr
1292         ;; and that the structure of the KEYWORD package (e.g. whether
1293         ;; any symbols are internal to it) matches what we want in the
1294         ;; target SBCL.
1295
1296         ;; FIXME: It seems possible that by looking at the contents of
1297         ;; packages in the target SBCL we could find which symbols in
1298         ;; package-data-lisp.lisp-expr are now obsolete. (If I
1299         ;; understand correctly, only symbols which actually have
1300         ;; definitions or which are otherwise referred to actually end
1301         ;; up in the target packages.)
1302
1303         (dolist (symbol symbols)
1304           (let ((handle (car (get symbol 'cold-intern-info)))
1305                 (imported-p (not (eq (symbol-package-for-target-symbol symbol)
1306                                      cold-package))))
1307             (multiple-value-bind (found where)
1308                 (find-symbol (symbol-name symbol) cold-package)
1309               (unless (and where (eq found symbol))
1310                 (error "The symbol ~S is not available in ~S."
1311                        symbol
1312                        cold-package))
1313               (when (memq symbol shadows)
1314                 (cold-push handle shadowing))
1315               (case where
1316                 (:internal (if imported-p
1317                                (cold-push handle imported-internal)
1318                                (progn
1319                                  (cold-push handle internal)
1320                                  (incf internal-count))))
1321                 (:external (if imported-p
1322                                (cold-push handle imported-external)
1323                                (progn
1324                                  (cold-push handle external)
1325                                  (incf external-count))))))))
1326         (let ((r *nil-descriptor*))
1327           (cold-push documentation r)
1328           (cold-push shadowing r)
1329           (cold-push imported-external r)
1330           (cold-push imported-internal r)
1331           (cold-push external r)
1332           (cold-push internal r)
1333           (cold-push (make-make-package-args cold-package
1334                                              internal-count
1335                                              external-count)
1336                      r)
1337           ;; FIXME: It would be more space-efficient to use vectors
1338           ;; instead of lists here, and space-efficiency here would be
1339           ;; nice, since it would reduce the peak memory usage in
1340           ;; genesis and cold init.
1341           (cold-push r initial-symbols))))
1342     (cold-set '*!initial-symbols* initial-symbols))
1343
1344   (cold-set '*!initial-fdefn-objects* (list-all-fdefn-objects))
1345
1346   (cold-set '*!reversed-cold-toplevels* *current-reversed-cold-toplevels*)
1347   (cold-set '*!initial-debug-sources* *current-debug-sources*)
1348
1349   #!+(or x86 x86-64)
1350   (progn
1351     (cold-set 'sb!vm::*fp-constant-0d0* (number-to-core 0d0))
1352     (cold-set 'sb!vm::*fp-constant-1d0* (number-to-core 1d0))
1353     (cold-set 'sb!vm::*fp-constant-0f0* (number-to-core 0f0))
1354     (cold-set 'sb!vm::*fp-constant-1f0* (number-to-core 1f0))))
1355
1356 ;;; Make a cold list that can be used as the arg list to MAKE-PACKAGE in
1357 ;;; order to make a package that is similar to PKG.
1358 (defun make-make-package-args (pkg internal-count external-count)
1359   (let* ((use *nil-descriptor*)
1360          (cold-nicknames *nil-descriptor*)
1361          (res *nil-descriptor*))
1362     (dolist (u (package-use-list pkg))
1363       (when (assoc u *cold-package-symbols*)
1364         (cold-push (base-string-to-core (package-name u)) use)))
1365     (let* ((pkg-name (package-name pkg))
1366            ;; Make the package nickname lists for the standard packages
1367            ;; be the minimum specified by ANSI, regardless of what value
1368            ;; the cross-compilation host happens to use.
1369            (warm-nicknames (cond ((string= pkg-name "COMMON-LISP")
1370                                   '("CL"))
1371                                  ((string= pkg-name "COMMON-LISP-USER")
1372                                   '("CL-USER"))
1373                                  ((string= pkg-name "KEYWORD")
1374                                   '())
1375                                  ;; For packages other than the
1376                                  ;; standard packages, the nickname
1377                                  ;; list was specified by our package
1378                                  ;; setup code, not by properties of
1379                                  ;; what cross-compilation host we
1380                                  ;; happened to use, and we can just
1381                                  ;; propagate it into the target.
1382                                  (t
1383                                   (package-nicknames pkg)))))
1384       (dolist (warm-nickname warm-nicknames)
1385         (cold-push (base-string-to-core warm-nickname) cold-nicknames)))
1386
1387     ;; INTERNAL-COUNT and EXTERNAL-COUNT are the number of symbols that
1388     ;; the package contains in the core. We arrange for the package
1389     ;; symbol tables to be created somewhat larger so that they don't
1390     ;; need to be rehashed so easily when additional symbols are
1391     ;; interned during the warm build.
1392     (cold-push (number-to-core (truncate internal-count 0.8)) res)
1393     (cold-push (cold-intern :internal-symbols) res)
1394     (cold-push (number-to-core (truncate external-count 0.8)) res)
1395     (cold-push (cold-intern :external-symbols) res)
1396
1397     (cold-push cold-nicknames res)
1398     (cold-push (cold-intern :nicknames) res)
1399
1400     (cold-push use res)
1401     (cold-push (cold-intern :use) res)
1402
1403     (cold-push (base-string-to-core (package-name pkg)) res)
1404     res))
1405 \f
1406 ;;;; functions and fdefinition objects
1407
1408 ;;; a hash table mapping from fdefinition names to descriptors of cold
1409 ;;; objects
1410 ;;;
1411 ;;; Note: Since fdefinition names can be lists like '(SETF FOO), and
1412 ;;; we want to have only one entry per name, this must be an 'EQUAL
1413 ;;; hash table, not the default 'EQL.
1414 (defvar *cold-fdefn-objects*)
1415
1416 (defvar *cold-fdefn-gspace* nil)
1417
1418 ;;; Given a cold representation of a symbol, return a warm
1419 ;;; representation.
1420 (defun warm-symbol (des)
1421   ;; Note that COLD-INTERN is responsible for keeping the
1422   ;; *COLD-SYMBOLS* table up to date, so if DES happens to refer to an
1423   ;; uninterned symbol, the code below will fail. But as long as we
1424   ;; don't need to look up uninterned symbols during bootstrapping,
1425   ;; that's OK..
1426   (multiple-value-bind (symbol found-p)
1427       (gethash (descriptor-bits des) *cold-symbols*)
1428     (declare (type symbol symbol))
1429     (unless found-p
1430       (error "no warm symbol"))
1431     symbol))
1432
1433 ;;; like CL:CAR, CL:CDR, and CL:NULL but for cold values
1434 (defun cold-car (des)
1435   (aver (= (descriptor-lowtag des) sb!vm:list-pointer-lowtag))
1436   (read-wordindexed des sb!vm:cons-car-slot))
1437 (defun cold-cdr (des)
1438   (aver (= (descriptor-lowtag des) sb!vm:list-pointer-lowtag))
1439   (read-wordindexed des sb!vm:cons-cdr-slot))
1440 (defun cold-null (des)
1441   (= (descriptor-bits des)
1442      (descriptor-bits *nil-descriptor*)))
1443
1444 ;;; Given a cold representation of a function name, return a warm
1445 ;;; representation.
1446 (declaim (ftype (function (descriptor) (or symbol list)) warm-fun-name))
1447 (defun warm-fun-name (des)
1448   (let ((result
1449          (ecase (descriptor-lowtag des)
1450            (#.sb!vm:list-pointer-lowtag
1451             (aver (not (cold-null des))) ; function named NIL? please no..
1452             ;; Do cold (DESTRUCTURING-BIND (COLD-CAR COLD-CADR) DES ..).
1453             (let* ((car-des (cold-car des))
1454                    (cdr-des (cold-cdr des))
1455                    (cadr-des (cold-car cdr-des))
1456                    (cddr-des (cold-cdr cdr-des)))
1457               (aver (cold-null cddr-des))
1458               (list (warm-symbol car-des)
1459                     (warm-symbol cadr-des))))
1460            (#.sb!vm:other-pointer-lowtag
1461             (warm-symbol des)))))
1462     (legal-fun-name-or-type-error result)
1463     result))
1464
1465 (defun cold-fdefinition-object (cold-name &optional leave-fn-raw)
1466   (declare (type descriptor cold-name))
1467   (/show0 "/cold-fdefinition-object")
1468   (let ((warm-name (warm-fun-name cold-name)))
1469     (or (gethash warm-name *cold-fdefn-objects*)
1470         (let ((fdefn (allocate-boxed-object (or *cold-fdefn-gspace* *dynamic*)
1471                                             (1- sb!vm:fdefn-size)
1472                                             sb!vm:other-pointer-lowtag)))
1473
1474           (setf (gethash warm-name *cold-fdefn-objects*) fdefn)
1475           (write-memory fdefn (make-other-immediate-descriptor
1476                                (1- sb!vm:fdefn-size) sb!vm:fdefn-widetag))
1477           (write-wordindexed fdefn sb!vm:fdefn-name-slot cold-name)
1478           (unless leave-fn-raw
1479             (write-wordindexed fdefn sb!vm:fdefn-fun-slot
1480                                *nil-descriptor*)
1481             (write-wordindexed fdefn
1482                                sb!vm:fdefn-raw-addr-slot
1483                                (make-random-descriptor
1484                                 (cold-foreign-symbol-address "undefined_tramp"))))
1485           fdefn))))
1486
1487 ;;; Handle the at-cold-init-time, fset-for-static-linkage operation
1488 ;;; requested by FOP-FSET.
1489 (defun static-fset (cold-name defn)
1490   (declare (type descriptor cold-name))
1491   (let ((fdefn (cold-fdefinition-object cold-name t))
1492         (type (logand (descriptor-low (read-memory defn)) sb!vm:widetag-mask)))
1493     (write-wordindexed fdefn sb!vm:fdefn-fun-slot defn)
1494     (write-wordindexed fdefn
1495                        sb!vm:fdefn-raw-addr-slot
1496                        (ecase type
1497                          (#.sb!vm:simple-fun-header-widetag
1498                           (/show0 "static-fset (simple-fun)")
1499                           #!+sparc
1500                           defn
1501                           #!-sparc
1502                           (make-random-descriptor
1503                            (+ (logandc2 (descriptor-bits defn)
1504                                         sb!vm:lowtag-mask)
1505                               (ash sb!vm:simple-fun-code-offset
1506                                    sb!vm:word-shift))))
1507                          (#.sb!vm:closure-header-widetag
1508                           (/show0 "/static-fset (closure)")
1509                           (make-random-descriptor
1510                            (cold-foreign-symbol-address "closure_tramp")))))
1511     fdefn))
1512
1513 (defun initialize-static-fns ()
1514   (let ((*cold-fdefn-gspace* *static*))
1515     (dolist (sym sb!vm:*static-funs*)
1516       (let* ((fdefn (cold-fdefinition-object (cold-intern sym)))
1517              (offset (- (+ (- (descriptor-low fdefn)
1518                               sb!vm:other-pointer-lowtag)
1519                            (* sb!vm:fdefn-raw-addr-slot sb!vm:n-word-bytes))
1520                         (descriptor-low *nil-descriptor*)))
1521              (desired (sb!vm:static-fun-offset sym)))
1522         (unless (= offset desired)
1523           ;; FIXME: should be fatal
1524           (error "Offset from FDEFN ~S to ~S is ~W, not ~W."
1525                  sym nil offset desired))))))
1526
1527 (defun list-all-fdefn-objects ()
1528   (let ((fdefns nil)
1529         (result *nil-descriptor*))
1530     (maphash (lambda (key value)
1531                (push (cons key value) fdefns))
1532              *cold-fdefn-objects*)
1533     (flet ((sorter (x y)
1534              (let* ((xbn (fun-name-block-name x))
1535                     (ybn (fun-name-block-name y))
1536                     (xbnpn (package-name (symbol-package-for-target-symbol xbn)))
1537                     (ybnpn (package-name (symbol-package-for-target-symbol ybn))))
1538                (cond
1539                  ((eql xbn ybn) (consp x))
1540                  ((string= xbn ybn) (string< xbnpn ybnpn))
1541                  (t (string< xbn ybn))))))
1542       (setq fdefns (sort fdefns #'sorter :key #'car)))
1543     (dolist (fdefn fdefns result)
1544       (cold-push (cdr fdefn) result))))
1545 \f
1546 ;;;; fixups and related stuff
1547
1548 ;;; an EQUAL hash table
1549 (defvar *cold-foreign-symbol-table*)
1550 (declaim (type hash-table *cold-foreign-symbol-table*))
1551
1552 ;; Read the sbcl.nm file to find the addresses for foreign-symbols in
1553 ;; the C runtime.
1554 (defun load-cold-foreign-symbol-table (filename)
1555   (/show "load-cold-foreign-symbol-table" filename)
1556   (with-open-file (file filename)
1557     (loop for line = (read-line file nil nil)
1558           while line do
1559           ;; UNIX symbol tables might have tabs in them, and tabs are
1560           ;; not in Common Lisp STANDARD-CHAR, so there seems to be no
1561           ;; nice portable way to deal with them within Lisp, alas.
1562           ;; Fortunately, it's easy to use UNIX command line tools like
1563           ;; sed to remove the problem, so it's not too painful for us
1564           ;; to push responsibility for converting tabs to spaces out to
1565           ;; the caller.
1566           ;;
1567           ;; Other non-STANDARD-CHARs are problematic for the same reason.
1568           ;; Make sure that there aren't any..
1569           (let ((ch (find-if (lambda (char)
1570                                (not (typep char 'standard-char)))
1571                              line)))
1572             (when ch
1573               (error "non-STANDARD-CHAR ~S found in foreign symbol table:~%~S"
1574                      ch
1575                      line)))
1576           (setf line (string-trim '(#\space) line))
1577           (let ((p1 (position #\space line :from-end nil))
1578                 (p2 (position #\space line :from-end t)))
1579             (if (not (and p1 p2 (< p1 p2)))
1580                 ;; KLUDGE: It's too messy to try to understand all
1581                 ;; possible output from nm, so we just punt the lines we
1582                 ;; don't recognize. We realize that there's some chance
1583                 ;; that might get us in trouble someday, so we warn
1584                 ;; about it.
1585                 (warn "ignoring unrecognized line ~S in ~A" line filename)
1586                 (multiple-value-bind (value name)
1587                     (if (string= "0x" line :end2 2)
1588                         (values (parse-integer line :start 2 :end p1 :radix 16)
1589                                 (subseq line (1+ p2)))
1590                         (values (parse-integer line :end p1 :radix 16)
1591                                 (subseq line (1+ p2))))
1592                   (multiple-value-bind (old-value found)
1593                       (gethash name *cold-foreign-symbol-table*)
1594                     (when (and found
1595                                (not (= old-value value)))
1596                       (warn "redefining ~S from #X~X to #X~X"
1597                             name old-value value)))
1598                   (/show "adding to *cold-foreign-symbol-table*:" name value)
1599                   (setf (gethash name *cold-foreign-symbol-table*) value))))))
1600   (values))     ;; PROGN
1601
1602 (defun cold-foreign-symbol-address (name)
1603   (or (find-foreign-symbol-in-table name *cold-foreign-symbol-table*)
1604       *foreign-symbol-placeholder-value*
1605       (progn
1606         (format *error-output* "~&The foreign symbol table is:~%")
1607         (maphash (lambda (k v)
1608                    (format *error-output* "~&~S = #X~8X~%" k v))
1609                  *cold-foreign-symbol-table*)
1610         (error "The foreign symbol ~S is undefined." name))))
1611
1612 (defvar *cold-assembler-routines*)
1613
1614 (defvar *cold-assembler-fixups*)
1615
1616 (defun record-cold-assembler-routine (name address)
1617   (/xhow "in RECORD-COLD-ASSEMBLER-ROUTINE" name address)
1618   (push (cons name address)
1619         *cold-assembler-routines*))
1620
1621 (defun record-cold-assembler-fixup (routine
1622                                     code-object
1623                                     offset
1624                                     &optional
1625                                     (kind :both))
1626   (push (list routine code-object offset kind)
1627         *cold-assembler-fixups*))
1628
1629 (defun lookup-assembler-reference (symbol)
1630   (let ((value (cdr (assoc symbol *cold-assembler-routines*))))
1631     ;; FIXME: Should this be ERROR instead of WARN?
1632     (unless value
1633       (warn "Assembler routine ~S not defined." symbol))
1634     value))
1635
1636 ;;; The x86 port needs to store code fixups along with code objects if
1637 ;;; they are to be moved, so fixups for code objects in the dynamic
1638 ;;; heap need to be noted.
1639 #!+x86
1640 (defvar *load-time-code-fixups*)
1641
1642 #!+x86
1643 (defun note-load-time-code-fixup (code-object offset)
1644   ;; If CODE-OBJECT might be moved
1645   (when (= (gspace-identifier (descriptor-intuit-gspace code-object))
1646            dynamic-core-space-id)
1647     (push offset (gethash (descriptor-bits code-object)
1648                           *load-time-code-fixups*
1649                           nil)))
1650   (values))
1651
1652 #!+x86
1653 (defun output-load-time-code-fixups ()
1654   (let ((fixup-infos nil))
1655     (maphash
1656      (lambda (code-object-address fixup-offsets)
1657        (push (cons code-object-address fixup-offsets) fixup-infos))
1658      *load-time-code-fixups*)
1659     (setq fixup-infos (sort fixup-infos #'< :key #'car))
1660     (dolist (fixup-info fixup-infos)
1661       (let ((code-object-address (car fixup-info))
1662             (fixup-offsets (cdr fixup-info)))
1663         (let ((fixup-vector
1664                (allocate-vector-object
1665                 *dynamic* sb!vm:n-word-bits (length fixup-offsets)
1666                 sb!vm:simple-array-unsigned-byte-32-widetag)))
1667           (do ((index sb!vm:vector-data-offset (1+ index))
1668                (fixups fixup-offsets (cdr fixups)))
1669               ((null fixups))
1670             (write-wordindexed fixup-vector index
1671                                (make-random-descriptor (car fixups))))
1672           ;; KLUDGE: The fixup vector is stored as the first constant,
1673           ;; not as a separately-named slot.
1674           (write-wordindexed (make-random-descriptor code-object-address)
1675                              sb!vm:code-constants-offset
1676                              fixup-vector))))))
1677
1678 ;;; Given a pointer to a code object and an offset relative to the
1679 ;;; tail of the code object's header, return an offset relative to the
1680 ;;; (beginning of the) code object.
1681 ;;;
1682 ;;; FIXME: It might be clearer to reexpress
1683 ;;;    (LET ((X (CALC-OFFSET CODE-OBJECT OFFSET0))) ..)
1684 ;;; as
1685 ;;;    (LET ((X (+ OFFSET0 (CODE-OBJECT-HEADER-N-BYTES CODE-OBJECT)))) ..).
1686 (declaim (ftype (function (descriptor sb!vm:word)) calc-offset))
1687 (defun calc-offset (code-object offset-from-tail-of-header)
1688   (let* ((header (read-memory code-object))
1689          (header-n-words (ash (descriptor-bits header)
1690                               (- sb!vm:n-widetag-bits)))
1691          (header-n-bytes (ash header-n-words sb!vm:word-shift))
1692          (result (+ offset-from-tail-of-header header-n-bytes)))
1693     result))
1694
1695 (declaim (ftype (function (descriptor sb!vm:word sb!vm:word keyword))
1696                 do-cold-fixup))
1697 (defun do-cold-fixup (code-object after-header value kind)
1698   (let* ((offset-within-code-object (calc-offset code-object after-header))
1699          (gspace-bytes (descriptor-bytes code-object))
1700          (gspace-byte-offset (+ (descriptor-byte-offset code-object)
1701                                 offset-within-code-object))
1702          (gspace-byte-address (gspace-byte-address
1703                                (descriptor-gspace code-object))))
1704     (ecase +backend-fasl-file-implementation+
1705       ;; See CMU CL source for other formerly-supported architectures
1706       ;; (and note that you have to rewrite them to use BVREF-X
1707       ;; instead of SAP-REF).
1708       (:alpha
1709          (ecase kind
1710          (:jmp-hint
1711           (assert (zerop (ldb (byte 2 0) value))))
1712          (:bits-63-48
1713           (let* ((value (if (logbitp 15 value) (+ value (ash 1 16)) value))
1714                  (value (if (logbitp 31 value) (+ value (ash 1 32)) value))
1715                  (value (if (logbitp 47 value) (+ value (ash 1 48)) value)))
1716             (setf (bvref-8 gspace-bytes gspace-byte-offset)
1717                   (ldb (byte 8 48) value)
1718                   (bvref-8 gspace-bytes (1+ gspace-byte-offset))
1719                   (ldb (byte 8 56) value))))
1720          (:bits-47-32
1721           (let* ((value (if (logbitp 15 value) (+ value (ash 1 16)) value))
1722                  (value (if (logbitp 31 value) (+ value (ash 1 32)) value)))
1723             (setf (bvref-8 gspace-bytes gspace-byte-offset)
1724                   (ldb (byte 8 32) value)
1725                   (bvref-8 gspace-bytes (1+ gspace-byte-offset))
1726                   (ldb (byte 8 40) value))))
1727          (:ldah
1728           (let ((value (if (logbitp 15 value) (+ value (ash 1 16)) value)))
1729             (setf (bvref-8 gspace-bytes gspace-byte-offset)
1730                   (ldb (byte 8 16) value)
1731                   (bvref-8 gspace-bytes (1+ gspace-byte-offset))
1732                   (ldb (byte 8 24) value))))
1733          (:lda
1734           (setf (bvref-8 gspace-bytes gspace-byte-offset)
1735                 (ldb (byte 8 0) value)
1736                 (bvref-8 gspace-bytes (1+ gspace-byte-offset))
1737                 (ldb (byte 8 8) value)))))
1738       (:hppa
1739        (ecase kind
1740          (:load
1741           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1742                 (logior (mask-field (byte 18 14)
1743                                     (bvref-32 gspace-bytes gspace-byte-offset))
1744                         (if (< value 0)
1745                           (1+ (ash (ldb (byte 13 0) value) 1))
1746                           (ash (ldb (byte 13 0) value) 1)))))
1747          (:load11u
1748           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1749                 (logior (mask-field (byte 18 14)
1750                                     (bvref-32 gspace-bytes gspace-byte-offset))
1751                         (if (< value 0)
1752                           (1+ (ash (ldb (byte 10 0) value) 1))
1753                           (ash (ldb (byte 11 0) value) 1)))))
1754          (:load-short
1755           (let ((low-bits (ldb (byte 11 0) value)))
1756             (assert (<= 0 low-bits (1- (ash 1 4)))))
1757           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1758                 (logior (ash (dpb (ldb (byte 4 0) value)
1759                                   (byte 4 1)
1760                                   (ldb (byte 1 4) value)) 17)
1761                         (logand (bvref-32 gspace-bytes gspace-byte-offset)
1762                                 #xffe0ffff))))
1763          (:hi
1764           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1765                 (logior (mask-field (byte 11 21)
1766                                     (bvref-32 gspace-bytes gspace-byte-offset))
1767                         (ash (ldb (byte 5 13) value) 16)
1768                         (ash (ldb (byte 2 18) value) 14)
1769                         (ash (ldb (byte 2 11) value) 12)
1770                         (ash (ldb (byte 11 20) value) 1)
1771                         (ldb (byte 1 31) value))))
1772          (:branch
1773           (let ((bits (ldb (byte 9 2) value)))
1774             (assert (zerop (ldb (byte 2 0) value)))
1775             (setf (bvref-32 gspace-bytes gspace-byte-offset)
1776                   (logior (ash bits 3)
1777                           (mask-field (byte 1 1) (bvref-32 gspace-bytes gspace-byte-offset))
1778                           (mask-field (byte 3 13) (bvref-32 gspace-bytes gspace-byte-offset))
1779                           (mask-field (byte 11 21) (bvref-32 gspace-bytes gspace-byte-offset))))))))
1780       (:mips
1781        (ecase kind
1782          (:jump
1783           (assert (zerop (ash value -28)))
1784           (setf (ldb (byte 26 0)
1785                      (bvref-32 gspace-bytes gspace-byte-offset))
1786                 (ash value -2)))
1787          (:lui
1788           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1789                 (logior (mask-field (byte 16 16)
1790                                     (bvref-32 gspace-bytes gspace-byte-offset))
1791                         (ash (1+ (ldb (byte 17 15) value)) -1))))
1792          (:addi
1793           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1794                 (logior (mask-field (byte 16 16)
1795                                     (bvref-32 gspace-bytes gspace-byte-offset))
1796                         (ldb (byte 16 0) value))))))
1797        ;; FIXME: PowerPC Fixups are not fully implemented. The bit
1798        ;; here starts to set things up to work properly, but there
1799        ;; needs to be corresponding code in ppc-vm.lisp
1800        (:ppc
1801         (ecase kind
1802           (:ba
1803            (setf (bvref-32 gspace-bytes gspace-byte-offset)
1804                  (dpb (ash value -2) (byte 24 2)
1805                       (bvref-32 gspace-bytes gspace-byte-offset))))
1806           (:ha
1807            (let* ((un-fixed-up (bvref-16 gspace-bytes
1808                                          (+ gspace-byte-offset 2)))
1809                   (fixed-up (+ un-fixed-up value))
1810                   (h (ldb (byte 16 16) fixed-up))
1811                   (l (ldb (byte 16 0) fixed-up)))
1812              (setf (bvref-16 gspace-bytes (+ gspace-byte-offset 2))
1813                    (if (logbitp 15 l) (ldb (byte 16 0) (1+ h)) h))))
1814           (:l
1815            (let* ((un-fixed-up (bvref-16 gspace-bytes
1816                                          (+ gspace-byte-offset 2)))
1817                   (fixed-up (+ un-fixed-up value)))
1818              (setf (bvref-16 gspace-bytes (+ gspace-byte-offset 2))
1819                    (ldb (byte 16 0) fixed-up))))))
1820       (:sparc
1821        (ecase kind
1822          (:call
1823           (error "can't deal with call fixups yet"))
1824          (:sethi
1825           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1826                 (dpb (ldb (byte 22 10) value)
1827                      (byte 22 0)
1828                      (bvref-32 gspace-bytes gspace-byte-offset))))
1829          (:add
1830           (setf (bvref-32 gspace-bytes gspace-byte-offset)
1831                 (dpb (ldb (byte 10 0) value)
1832                      (byte 10 0)
1833                      (bvref-32 gspace-bytes gspace-byte-offset))))))
1834       ((:x86 :x86-64)
1835        ;; XXX: Note that un-fixed-up is read via bvref-word, which is
1836        ;; 64 bits wide on x86-64, but the fixed-up value is written
1837        ;; via bvref-32.  This would make more sense if we supported
1838        ;; :absolute64 fixups, but apparently the cross-compiler
1839        ;; doesn't dump them.
1840        (let* ((un-fixed-up (bvref-word gspace-bytes
1841                                                gspace-byte-offset))
1842               (code-object-start-addr (logandc2 (descriptor-bits code-object)
1843                                                 sb!vm:lowtag-mask)))
1844          (assert (= code-object-start-addr
1845                   (+ gspace-byte-address
1846                      (descriptor-byte-offset code-object))))
1847          (ecase kind
1848            (:absolute
1849             (let ((fixed-up (+ value un-fixed-up)))
1850               (setf (bvref-32 gspace-bytes gspace-byte-offset)
1851                     fixed-up)
1852               ;; comment from CMU CL sources:
1853               ;;
1854               ;; Note absolute fixups that point within the object.
1855               ;; KLUDGE: There seems to be an implicit assumption in
1856               ;; the old CMU CL code here, that if it doesn't point
1857               ;; before the object, it must point within the object
1858               ;; (not beyond it). It would be good to add an
1859               ;; explanation of why that's true, or an assertion that
1860               ;; it's really true, or both.
1861               ;;
1862               ;; One possible explanation is that all absolute fixups
1863               ;; point either within the code object, within the
1864               ;; runtime, within read-only or static-space, or within
1865               ;; the linkage-table space.  In all x86 configurations,
1866               ;; these areas are prior to the start of dynamic space,
1867               ;; where all the code-objects are loaded.
1868               #!+x86
1869               (unless (< fixed-up code-object-start-addr)
1870                 (note-load-time-code-fixup code-object
1871                                            after-header))))
1872            (:relative ; (used for arguments to X86 relative CALL instruction)
1873             (let ((fixed-up (- (+ value un-fixed-up)
1874                                gspace-byte-address
1875                                gspace-byte-offset
1876                                4))) ; "length of CALL argument"
1877               (setf (bvref-32 gspace-bytes gspace-byte-offset)
1878                     fixed-up)
1879               ;; Note relative fixups that point outside the code
1880               ;; object, which is to say all relative fixups, since
1881               ;; relative addressing within a code object never needs
1882               ;; a fixup.
1883               #!+x86
1884               (note-load-time-code-fixup code-object
1885                                          after-header))))))))
1886   (values))
1887
1888 (defun resolve-assembler-fixups ()
1889   (dolist (fixup *cold-assembler-fixups*)
1890     (let* ((routine (car fixup))
1891            (value (lookup-assembler-reference routine)))
1892       (when value
1893         (do-cold-fixup (second fixup) (third fixup) value (fourth fixup))))))
1894
1895 ;;; *COLD-FOREIGN-SYMBOL-TABLE* becomes *!INITIAL-FOREIGN-SYMBOLS* in
1896 ;;; the core. When the core is loaded, !LOADER-COLD-INIT uses this to
1897 ;;; create *STATIC-FOREIGN-SYMBOLS*, which the code in
1898 ;;; target-load.lisp refers to.
1899 (defun foreign-symbols-to-core ()
1900   (let ((symbols nil)
1901         (result *nil-descriptor*))
1902     (maphash (lambda (symbol value)
1903                (push (cons symbol value) symbols))
1904              *cold-foreign-symbol-table*)
1905     (setq symbols (sort symbols #'string< :key #'car))
1906     (dolist (symbol symbols)
1907       (cold-push (cold-cons (base-string-to-core (car symbol))
1908                             (number-to-core (cdr symbol)))
1909                  result))
1910     (cold-set (cold-intern 'sb!kernel:*!initial-foreign-symbols*) result))
1911   (let ((result *nil-descriptor*))
1912     (dolist (rtn (sort (copy-list *cold-assembler-routines*) #'string< :key #'car))
1913       (cold-push (cold-cons (cold-intern (car rtn))
1914                             (number-to-core (cdr rtn)))
1915                  result))
1916     (cold-set (cold-intern '*!initial-assembler-routines*) result)))
1917
1918 \f
1919 ;;;; general machinery for cold-loading FASL files
1920
1921 ;;; FOP functions for cold loading
1922 (defvar *cold-fop-funs*
1923   ;; We start out with a copy of the ordinary *FOP-FUNS*. The ones
1924   ;; which aren't appropriate for cold load will be destructively
1925   ;; modified.
1926   (copy-seq *fop-funs*))
1927
1928 (defvar *normal-fop-funs*)
1929
1930 ;;; Cause a fop to have a special definition for cold load.
1931 ;;;
1932 ;;; This is similar to DEFINE-FOP, but unlike DEFINE-FOP, this version
1933 ;;;   (1) looks up the code for this name (created by a previous
1934 ;;        DEFINE-FOP) instead of creating a code, and
1935 ;;;   (2) stores its definition in the *COLD-FOP-FUNS* vector,
1936 ;;;       instead of storing in the *FOP-FUNS* vector.
1937 (defmacro define-cold-fop ((name &key (pushp t) (stackp t)) &rest forms)
1938   (aver (member pushp '(nil t)))
1939   (aver (member stackp '(nil t)))
1940   (let ((code (get name 'fop-code))
1941         (fname (symbolicate "COLD-" name)))
1942     (unless code
1943       (error "~S is not a defined FOP." name))
1944     `(progn
1945        (defun ,fname ()
1946          ,@(if stackp
1947                `((with-fop-stack ,pushp ,@forms))
1948                forms))
1949        (setf (svref *cold-fop-funs* ,code) #',fname))))
1950
1951 (defmacro clone-cold-fop ((name &key (pushp t) (stackp t))
1952                           (small-name)
1953                           &rest forms)
1954   (aver (member pushp '(nil t)))
1955   (aver (member stackp '(nil t)))
1956   `(progn
1957     (macrolet ((clone-arg () '(read-word-arg)))
1958       (define-cold-fop (,name :pushp ,pushp :stackp ,stackp) ,@forms))
1959     (macrolet ((clone-arg () '(read-byte-arg)))
1960       (define-cold-fop (,small-name :pushp ,pushp :stackp ,stackp) ,@forms))))
1961
1962 ;;; Cause a fop to be undefined in cold load.
1963 (defmacro not-cold-fop (name)
1964   `(define-cold-fop (,name)
1965      (error "The fop ~S is not supported in cold load." ',name)))
1966
1967 ;;; COLD-LOAD loads stuff into the core image being built by calling
1968 ;;; LOAD-AS-FASL with the fop function table rebound to a table of cold
1969 ;;; loading functions.
1970 (defun cold-load (filename)
1971   #!+sb-doc
1972   "Load the file named by FILENAME into the cold load image being built."
1973   (let* ((*normal-fop-funs* *fop-funs*)
1974          (*fop-funs* *cold-fop-funs*)
1975          (*cold-load-filename* (etypecase filename
1976                                  (string filename)
1977                                  (pathname (namestring filename)))))
1978     (with-open-file (s filename :element-type '(unsigned-byte 8))
1979       (load-as-fasl s nil nil))))
1980 \f
1981 ;;;; miscellaneous cold fops
1982
1983 (define-cold-fop (fop-misc-trap) *unbound-marker*)
1984
1985 (define-cold-fop (fop-short-character)
1986   (make-character-descriptor (read-byte-arg)))
1987
1988 (define-cold-fop (fop-empty-list) *nil-descriptor*)
1989 (define-cold-fop (fop-truth) (cold-intern t))
1990
1991 (define-cold-fop (fop-normal-load :stackp nil)
1992   (setq *fop-funs* *normal-fop-funs*))
1993
1994 (define-fop (fop-maybe-cold-load 82 :stackp nil)
1995   (when *cold-load-filename*
1996     (setq *fop-funs* *cold-fop-funs*)))
1997
1998 (define-cold-fop (fop-maybe-cold-load :stackp nil))
1999
2000 (clone-cold-fop (fop-struct)
2001                 (fop-small-struct)
2002   (let* ((size (clone-arg))
2003          (result (allocate-boxed-object *dynamic*
2004                                         (1+ size)
2005                                         sb!vm:instance-pointer-lowtag))
2006          (layout (pop-stack))
2007          (nuntagged
2008           (descriptor-fixnum
2009            (read-wordindexed
2010             layout
2011             (+ sb!vm:instance-slots-offset
2012                (target-layout-index 'n-untagged-slots)))))
2013          (ntagged (- size nuntagged)))
2014     (write-memory result (make-other-immediate-descriptor
2015                           size sb!vm:instance-header-widetag))
2016     (write-wordindexed result sb!vm:instance-slots-offset layout)
2017     (do ((index 1 (1+ index)))
2018         ((eql index size))
2019       (declare (fixnum index))
2020       (write-wordindexed result
2021                          (+ index sb!vm:instance-slots-offset)
2022                          (if (>= index ntagged)
2023                              (descriptor-word-sized-integer (pop-stack))
2024                              (pop-stack))))
2025     result))
2026
2027 (define-cold-fop (fop-layout)
2028   (let* ((nuntagged-des (pop-stack))
2029          (length-des (pop-stack))
2030          (depthoid-des (pop-stack))
2031          (cold-inherits (pop-stack))
2032          (name (pop-stack))
2033          (old (gethash name *cold-layouts*)))
2034     (declare (type descriptor length-des depthoid-des cold-inherits))
2035     (declare (type symbol name))
2036     ;; If a layout of this name has been defined already
2037     (if old
2038       ;; Enforce consistency between the previous definition and the
2039       ;; current definition, then return the previous definition.
2040       (destructuring-bind
2041           ;; FIXME: This would be more maintainable if we used
2042           ;; DEFSTRUCT (:TYPE LIST) to define COLD-LAYOUT. -- WHN 19990825
2043           (old-layout-descriptor
2044            old-name
2045            old-length
2046            old-inherits-list
2047            old-depthoid
2048            old-nuntagged)
2049           old
2050         (declare (type descriptor old-layout-descriptor))
2051         (declare (type index old-length old-nuntagged))
2052         (declare (type fixnum old-depthoid))
2053         (declare (type list old-inherits-list))
2054         (aver (eq name old-name))
2055         (let ((length (descriptor-fixnum length-des))
2056               (inherits-list (listify-cold-inherits cold-inherits))
2057               (depthoid (descriptor-fixnum depthoid-des))
2058               (nuntagged (descriptor-fixnum nuntagged-des)))
2059           (unless (= length old-length)
2060             (error "cold loading a reference to class ~S when the compile~%~
2061                     time length was ~S and current length is ~S"
2062                    name
2063                    length
2064                    old-length))
2065           (unless (equal inherits-list old-inherits-list)
2066             (error "cold loading a reference to class ~S when the compile~%~
2067                     time inherits were ~S~%~
2068                     and current inherits are ~S"
2069                    name
2070                    inherits-list
2071                    old-inherits-list))
2072           (unless (= depthoid old-depthoid)
2073             (error "cold loading a reference to class ~S when the compile~%~
2074                     time inheritance depthoid was ~S and current inheritance~%~
2075                     depthoid is ~S"
2076                    name
2077                    depthoid
2078                    old-depthoid))
2079           (unless (= nuntagged old-nuntagged)
2080             (error "cold loading a reference to class ~S when the compile~%~
2081                     time number of untagged slots was ~S and is currently ~S"
2082                    name
2083                    nuntagged
2084                    old-nuntagged)))
2085         old-layout-descriptor)
2086       ;; Make a new definition from scratch.
2087       (make-cold-layout name length-des cold-inherits depthoid-des
2088                         nuntagged-des))))
2089 \f
2090 ;;;; cold fops for loading symbols
2091
2092 ;;; Load a symbol SIZE characters long from *FASL-INPUT-STREAM* and
2093 ;;; intern that symbol in PACKAGE.
2094 (defun cold-load-symbol (size package)
2095   (let ((string (make-string size)))
2096     (read-string-as-bytes *fasl-input-stream* string)
2097     (cold-intern (intern string package))))
2098
2099 (macrolet ((frob (name pname-len package-len)
2100              `(define-cold-fop (,name)
2101                 (let ((index (read-arg ,package-len)))
2102                   (push-fop-table
2103                    (cold-load-symbol (read-arg ,pname-len)
2104                                      (svref *current-fop-table* index)))))))
2105   (frob fop-symbol-in-package-save #.sb!vm:n-word-bytes #.sb!vm:n-word-bytes)
2106   (frob fop-small-symbol-in-package-save 1 #.sb!vm:n-word-bytes)
2107   (frob fop-symbol-in-byte-package-save #.sb!vm:n-word-bytes 1)
2108   (frob fop-small-symbol-in-byte-package-save 1 1))
2109
2110 (clone-cold-fop (fop-lisp-symbol-save)
2111                 (fop-lisp-small-symbol-save)
2112   (push-fop-table (cold-load-symbol (clone-arg) *cl-package*)))
2113
2114 (clone-cold-fop (fop-keyword-symbol-save)
2115                 (fop-keyword-small-symbol-save)
2116   (push-fop-table (cold-load-symbol (clone-arg) *keyword-package*)))
2117
2118 (clone-cold-fop (fop-uninterned-symbol-save)
2119                 (fop-uninterned-small-symbol-save)
2120   (let* ((size (clone-arg))
2121          (name (make-string size)))
2122     (read-string-as-bytes *fasl-input-stream* name)
2123     (let ((symbol-des (allocate-symbol name)))
2124       (push-fop-table symbol-des))))
2125 \f
2126 ;;;; cold fops for loading lists
2127
2128 ;;; Make a list of the top LENGTH things on the fop stack. The last
2129 ;;; cdr of the list is set to LAST.
2130 (defmacro cold-stack-list (length last)
2131   `(do* ((index ,length (1- index))
2132          (result ,last (cold-cons (pop-stack) result)))
2133         ((= index 0) result)
2134      (declare (fixnum index))))
2135
2136 (define-cold-fop (fop-list)
2137   (cold-stack-list (read-byte-arg) *nil-descriptor*))
2138 (define-cold-fop (fop-list*)
2139   (cold-stack-list (read-byte-arg) (pop-stack)))
2140 (define-cold-fop (fop-list-1)
2141   (cold-stack-list 1 *nil-descriptor*))
2142 (define-cold-fop (fop-list-2)
2143   (cold-stack-list 2 *nil-descriptor*))
2144 (define-cold-fop (fop-list-3)
2145   (cold-stack-list 3 *nil-descriptor*))
2146 (define-cold-fop (fop-list-4)
2147   (cold-stack-list 4 *nil-descriptor*))
2148 (define-cold-fop (fop-list-5)
2149   (cold-stack-list 5 *nil-descriptor*))
2150 (define-cold-fop (fop-list-6)
2151   (cold-stack-list 6 *nil-descriptor*))
2152 (define-cold-fop (fop-list-7)
2153   (cold-stack-list 7 *nil-descriptor*))
2154 (define-cold-fop (fop-list-8)
2155   (cold-stack-list 8 *nil-descriptor*))
2156 (define-cold-fop (fop-list*-1)
2157   (cold-stack-list 1 (pop-stack)))
2158 (define-cold-fop (fop-list*-2)
2159   (cold-stack-list 2 (pop-stack)))
2160 (define-cold-fop (fop-list*-3)
2161   (cold-stack-list 3 (pop-stack)))
2162 (define-cold-fop (fop-list*-4)
2163   (cold-stack-list 4 (pop-stack)))
2164 (define-cold-fop (fop-list*-5)
2165   (cold-stack-list 5 (pop-stack)))
2166 (define-cold-fop (fop-list*-6)
2167   (cold-stack-list 6 (pop-stack)))
2168 (define-cold-fop (fop-list*-7)
2169   (cold-stack-list 7 (pop-stack)))
2170 (define-cold-fop (fop-list*-8)
2171   (cold-stack-list 8 (pop-stack)))
2172 \f
2173 ;;;; cold fops for loading vectors
2174
2175 (clone-cold-fop (fop-base-string)
2176                 (fop-small-base-string)
2177   (let* ((len (clone-arg))
2178          (string (make-string len)))
2179     (read-string-as-bytes *fasl-input-stream* string)
2180     (base-string-to-core string)))
2181
2182 #!+sb-unicode
2183 (clone-cold-fop (fop-character-string)
2184                 (fop-small-character-string)
2185   (bug "CHARACTER-STRING dumped by cross-compiler."))
2186
2187 (clone-cold-fop (fop-vector)
2188                 (fop-small-vector)
2189   (let* ((size (clone-arg))
2190          (result (allocate-vector-object *dynamic*
2191                                          sb!vm:n-word-bits
2192                                          size
2193                                          sb!vm:simple-vector-widetag)))
2194     (do ((index (1- size) (1- index)))
2195         ((minusp index))
2196       (declare (fixnum index))
2197       (write-wordindexed result
2198                          (+ index sb!vm:vector-data-offset)
2199                          (pop-stack)))
2200     result))
2201
2202 (define-cold-fop (fop-int-vector)
2203   (let* ((len (read-word-arg))
2204          (sizebits (read-byte-arg))
2205          (type (case sizebits
2206                  (0 sb!vm:simple-array-nil-widetag)
2207                  (1 sb!vm:simple-bit-vector-widetag)
2208                  (2 sb!vm:simple-array-unsigned-byte-2-widetag)
2209                  (4 sb!vm:simple-array-unsigned-byte-4-widetag)
2210                  (7 (prog1 sb!vm:simple-array-unsigned-byte-7-widetag
2211                       (setf sizebits 8)))
2212                  (8 sb!vm:simple-array-unsigned-byte-8-widetag)
2213                  (15 (prog1 sb!vm:simple-array-unsigned-byte-15-widetag
2214                        (setf sizebits 16)))
2215                  (16 sb!vm:simple-array-unsigned-byte-16-widetag)
2216                  (31 (prog1 sb!vm:simple-array-unsigned-byte-31-widetag
2217                        (setf sizebits 32)))
2218                  (32 sb!vm:simple-array-unsigned-byte-32-widetag)
2219                  #!+#.(cl:if (cl:= 64 sb!vm:n-word-bits) '(and) '(or))
2220                  (63 (prog1 sb!vm:simple-array-unsigned-byte-63-widetag
2221                        (setf sizebits 64)))
2222                  #!+#.(cl:if (cl:= 64 sb!vm:n-word-bits) '(and) '(or))
2223                  (64 sb!vm:simple-array-unsigned-byte-64-widetag)
2224                  (t (error "losing element size: ~W" sizebits))))
2225          (result (allocate-vector-object *dynamic* sizebits len type))
2226          (start (+ (descriptor-byte-offset result)
2227                    (ash sb!vm:vector-data-offset sb!vm:word-shift)))
2228          (end (+ start
2229                  (ceiling (* len sizebits)
2230                           sb!vm:n-byte-bits))))
2231     (read-bigvec-as-sequence-or-die (descriptor-bytes result)
2232                                     *fasl-input-stream*
2233                                     :start start
2234                                     :end end)
2235     result))
2236
2237 (define-cold-fop (fop-single-float-vector)
2238   (let* ((len (read-word-arg))
2239          (result (allocate-vector-object
2240                   *dynamic*
2241                   sb!vm:n-word-bits
2242                   len
2243                   sb!vm:simple-array-single-float-widetag))
2244          (start (+ (descriptor-byte-offset result)
2245                    (ash sb!vm:vector-data-offset sb!vm:word-shift)))
2246          (end (+ start (* len 4))))
2247     (read-bigvec-as-sequence-or-die (descriptor-bytes result)
2248                                     *fasl-input-stream*
2249                                     :start start
2250                                     :end end)
2251     result))
2252
2253 (not-cold-fop fop-double-float-vector)
2254 #!+long-float (not-cold-fop fop-long-float-vector)
2255 (not-cold-fop fop-complex-single-float-vector)
2256 (not-cold-fop fop-complex-double-float-vector)
2257 #!+long-float (not-cold-fop fop-complex-long-float-vector)
2258
2259 (define-cold-fop (fop-array)
2260   (let* ((rank (read-word-arg))
2261          (data-vector (pop-stack))
2262          (result (allocate-boxed-object *dynamic*
2263                                         (+ sb!vm:array-dimensions-offset rank)
2264                                         sb!vm:other-pointer-lowtag)))
2265     (write-memory result
2266                   (make-other-immediate-descriptor rank
2267                                                    sb!vm:simple-array-widetag))
2268     (write-wordindexed result sb!vm:array-fill-pointer-slot *nil-descriptor*)
2269     (write-wordindexed result sb!vm:array-data-slot data-vector)
2270     (write-wordindexed result sb!vm:array-displacement-slot *nil-descriptor*)
2271     (write-wordindexed result sb!vm:array-displaced-p-slot *nil-descriptor*)
2272     (write-wordindexed result sb!vm:array-displaced-from-slot *nil-descriptor*)
2273     (let ((total-elements 1))
2274       (dotimes (axis rank)
2275         (let ((dim (pop-stack)))
2276           (unless (or (= (descriptor-lowtag dim) sb!vm:even-fixnum-lowtag)
2277                       (= (descriptor-lowtag dim) sb!vm:odd-fixnum-lowtag))
2278             (error "non-fixnum dimension? (~S)" dim))
2279           (setf total-elements
2280                 (* total-elements
2281                    (logior (ash (descriptor-high dim)
2282                                 (- descriptor-low-bits
2283                                    (1- sb!vm:n-lowtag-bits)))
2284                            (ash (descriptor-low dim)
2285                                 (- 1 sb!vm:n-lowtag-bits)))))
2286           (write-wordindexed result
2287                              (+ sb!vm:array-dimensions-offset axis)
2288                              dim)))
2289       (write-wordindexed result
2290                          sb!vm:array-elements-slot
2291                          (make-fixnum-descriptor total-elements)))
2292     result))
2293
2294 \f
2295 ;;;; cold fops for loading numbers
2296
2297 (defmacro define-cold-number-fop (fop)
2298   `(define-cold-fop (,fop :stackp nil)
2299      ;; Invoke the ordinary warm version of this fop to push the
2300      ;; number.
2301      (,fop)
2302      ;; Replace the warm fop result with the cold image of the warm
2303      ;; fop result.
2304      (with-fop-stack t
2305        (let ((number (pop-stack)))
2306          (number-to-core number)))))
2307
2308 (define-cold-number-fop fop-single-float)
2309 (define-cold-number-fop fop-double-float)
2310 (define-cold-number-fop fop-integer)
2311 (define-cold-number-fop fop-small-integer)
2312 (define-cold-number-fop fop-word-integer)
2313 (define-cold-number-fop fop-byte-integer)
2314 (define-cold-number-fop fop-complex-single-float)
2315 (define-cold-number-fop fop-complex-double-float)
2316
2317 (define-cold-fop (fop-ratio)
2318   (let ((den (pop-stack)))
2319     (number-pair-to-core (pop-stack) den sb!vm:ratio-widetag)))
2320
2321 (define-cold-fop (fop-complex)
2322   (let ((im (pop-stack)))
2323     (number-pair-to-core (pop-stack) im sb!vm:complex-widetag)))
2324 \f
2325 ;;;; cold fops for calling (or not calling)
2326
2327 (not-cold-fop fop-eval)
2328 (not-cold-fop fop-eval-for-effect)
2329
2330 (defvar *load-time-value-counter*)
2331
2332 (define-cold-fop (fop-funcall)
2333   (unless (= (read-byte-arg) 0)
2334     (error "You can't FOP-FUNCALL arbitrary stuff in cold load."))
2335   (let ((counter *load-time-value-counter*))
2336     (cold-push (cold-cons
2337                 (cold-intern :load-time-value)
2338                 (cold-cons
2339                  (pop-stack)
2340                  (cold-cons
2341                   (number-to-core counter)
2342                   *nil-descriptor*)))
2343                *current-reversed-cold-toplevels*)
2344     (setf *load-time-value-counter* (1+ counter))
2345     (make-descriptor 0 0 :load-time-value counter)))
2346
2347 (defun finalize-load-time-value-noise ()
2348   (cold-set (cold-intern '*!load-time-values*)
2349             (allocate-vector-object *dynamic*
2350                                     sb!vm:n-word-bits
2351                                     *load-time-value-counter*
2352                                     sb!vm:simple-vector-widetag)))
2353
2354 (define-cold-fop (fop-funcall-for-effect :pushp nil)
2355   (if (= (read-byte-arg) 0)
2356       (cold-push (pop-stack)
2357                  *current-reversed-cold-toplevels*)
2358       (error "You can't FOP-FUNCALL arbitrary stuff in cold load.")))
2359 \f
2360 ;;;; cold fops for fixing up circularities
2361
2362 (define-cold-fop (fop-rplaca :pushp nil)
2363   (let ((obj (svref *current-fop-table* (read-word-arg)))
2364         (idx (read-word-arg)))
2365     (write-memory (cold-nthcdr idx obj) (pop-stack))))
2366
2367 (define-cold-fop (fop-rplacd :pushp nil)
2368   (let ((obj (svref *current-fop-table* (read-word-arg)))
2369         (idx (read-word-arg)))
2370     (write-wordindexed (cold-nthcdr idx obj) 1 (pop-stack))))
2371
2372 (define-cold-fop (fop-svset :pushp nil)
2373   (let ((obj (svref *current-fop-table* (read-word-arg)))
2374         (idx (read-word-arg)))
2375     (write-wordindexed obj
2376                    (+ idx
2377                       (ecase (descriptor-lowtag obj)
2378                         (#.sb!vm:instance-pointer-lowtag 1)
2379                         (#.sb!vm:other-pointer-lowtag 2)))
2380                    (pop-stack))))
2381
2382 (define-cold-fop (fop-structset :pushp nil)
2383   (let ((obj (svref *current-fop-table* (read-word-arg)))
2384         (idx (read-word-arg)))
2385     (write-wordindexed obj (1+ idx) (pop-stack))))
2386
2387 ;;; In the original CMUCL code, this actually explicitly declared PUSHP
2388 ;;; to be T, even though that's what it defaults to in DEFINE-COLD-FOP.
2389 (define-cold-fop (fop-nthcdr)
2390   (cold-nthcdr (read-word-arg) (pop-stack)))
2391
2392 (defun cold-nthcdr (index obj)
2393   (dotimes (i index)
2394     (setq obj (read-wordindexed obj 1)))
2395   obj)
2396 \f
2397 ;;;; cold fops for loading code objects and functions
2398
2399 ;;; the names of things which have had COLD-FSET used on them already
2400 ;;; (used to make sure that we don't try to statically link a name to
2401 ;;; more than one definition)
2402 (defparameter *cold-fset-warm-names*
2403   ;; This can't be an EQL hash table because names can be conses, e.g.
2404   ;; (SETF CAR).
2405   (make-hash-table :test 'equal))
2406
2407 (define-cold-fop (fop-fset :pushp nil)
2408   (let* ((fn (pop-stack))
2409          (cold-name (pop-stack))
2410          (warm-name (warm-fun-name cold-name)))
2411     (if (gethash warm-name *cold-fset-warm-names*)
2412         (error "duplicate COLD-FSET for ~S" warm-name)
2413         (setf (gethash warm-name *cold-fset-warm-names*) t))
2414     (static-fset cold-name fn)))
2415
2416 (define-cold-fop (fop-note-debug-source :pushp nil)
2417   (let ((debug-source (pop-stack)))
2418     (cold-push debug-source *current-debug-sources*)))
2419
2420 (define-cold-fop (fop-fdefinition)
2421   (cold-fdefinition-object (pop-stack)))
2422
2423 (define-cold-fop (fop-sanctify-for-execution)
2424   (pop-stack))
2425
2426 ;;; Setting this variable shows what code looks like before any
2427 ;;; fixups (or function headers) are applied.
2428 #!+sb-show (defvar *show-pre-fixup-code-p* nil)
2429
2430 ;;; FIXME: The logic here should be converted into a function
2431 ;;; COLD-CODE-FOP-GUTS (NCONST CODE-SIZE) called by DEFINE-COLD-FOP
2432 ;;; FOP-CODE and DEFINE-COLD-FOP FOP-SMALL-CODE, so that
2433 ;;; variable-capture nastiness like (LET ((NCONST ,NCONST) ..) ..)
2434 ;;; doesn't keep me awake at night.
2435 (defmacro define-cold-code-fop (name nconst code-size)
2436   `(define-cold-fop (,name)
2437      (let* ((nconst ,nconst)
2438             (code-size ,code-size)
2439             (raw-header-n-words (+ sb!vm:code-trace-table-offset-slot nconst))
2440             (header-n-words
2441              ;; Note: we round the number of constants up to ensure
2442              ;; that the code vector will be properly aligned.
2443              (round-up raw-header-n-words 2))
2444             (des (allocate-cold-descriptor *dynamic*
2445                                            (+ (ash header-n-words
2446                                                    sb!vm:word-shift)
2447                                               code-size)
2448                                            sb!vm:other-pointer-lowtag)))
2449        (write-memory des
2450                      (make-other-immediate-descriptor
2451                       header-n-words sb!vm:code-header-widetag))
2452        (write-wordindexed des
2453                           sb!vm:code-code-size-slot
2454                           (make-fixnum-descriptor
2455                            (ash (+ code-size (1- (ash 1 sb!vm:word-shift)))
2456                                 (- sb!vm:word-shift))))
2457        (write-wordindexed des sb!vm:code-entry-points-slot *nil-descriptor*)
2458        (write-wordindexed des sb!vm:code-debug-info-slot (pop-stack))
2459        (when (oddp raw-header-n-words)
2460          (write-wordindexed des
2461                             raw-header-n-words
2462                             (make-random-descriptor 0)))
2463        (do ((index (1- raw-header-n-words) (1- index)))
2464            ((< index sb!vm:code-trace-table-offset-slot))
2465          (write-wordindexed des index (pop-stack)))
2466        (let* ((start (+ (descriptor-byte-offset des)
2467                         (ash header-n-words sb!vm:word-shift)))
2468               (end (+ start code-size)))
2469          (read-bigvec-as-sequence-or-die (descriptor-bytes des)
2470                                          *fasl-input-stream*
2471                                          :start start
2472                                          :end end)
2473          #!+sb-show
2474          (when *show-pre-fixup-code-p*
2475            (format *trace-output*
2476                    "~&/raw code from code-fop ~W ~W:~%"
2477                    nconst
2478                    code-size)
2479            (do ((i start (+ i sb!vm:n-word-bytes)))
2480                ((>= i end))
2481              (format *trace-output*
2482                      "/#X~8,'0x: #X~8,'0x~%"
2483                      (+ i (gspace-byte-address (descriptor-gspace des)))
2484                      (bvref-32 (descriptor-bytes des) i)))))
2485        des)))
2486
2487 (define-cold-code-fop fop-code (read-word-arg) (read-word-arg))
2488
2489 (define-cold-code-fop fop-small-code (read-byte-arg) (read-halfword-arg))
2490
2491 (clone-cold-fop (fop-alter-code :pushp nil)
2492                 (fop-byte-alter-code)
2493   (let ((slot (clone-arg))
2494         (value (pop-stack))
2495         (code (pop-stack)))
2496     (write-wordindexed code slot value)))
2497
2498 (define-cold-fop (fop-fun-entry)
2499   (let* ((info (pop-stack))
2500          (type (pop-stack))
2501          (arglist (pop-stack))
2502          (name (pop-stack))
2503          (code-object (pop-stack))
2504          (offset (calc-offset code-object (read-word-arg)))
2505          (fn (descriptor-beyond code-object
2506                                 offset
2507                                 sb!vm:fun-pointer-lowtag))
2508          (next (read-wordindexed code-object sb!vm:code-entry-points-slot)))
2509     (unless (zerop (logand offset sb!vm:lowtag-mask))
2510       (error "unaligned function entry: ~S at #X~X" name offset))
2511     (write-wordindexed code-object sb!vm:code-entry-points-slot fn)
2512     (write-memory fn
2513                   (make-other-immediate-descriptor
2514                    (ash offset (- sb!vm:word-shift))
2515                    sb!vm:simple-fun-header-widetag))
2516     (write-wordindexed fn
2517                        sb!vm:simple-fun-self-slot
2518                        ;; KLUDGE: Wiring decisions like this in at
2519                        ;; this level ("if it's an x86") instead of a
2520                        ;; higher level of abstraction ("if it has such
2521                        ;; and such relocation peculiarities (which
2522                        ;; happen to be confined to the x86)") is bad.
2523                        ;; It would be nice if the code were instead
2524                        ;; conditional on some more descriptive
2525                        ;; feature, :STICKY-CODE or
2526                        ;; :LOAD-GC-INTERACTION or something.
2527                        ;;
2528                        ;; FIXME: The X86 definition of the function
2529                        ;; self slot breaks everything object.tex says
2530                        ;; about it. (As far as I can tell, the X86
2531                        ;; definition makes it a pointer to the actual
2532                        ;; code instead of a pointer back to the object
2533                        ;; itself.) Ask on the mailing list whether
2534                        ;; this is documented somewhere, and if not,
2535                        ;; try to reverse engineer some documentation.
2536                        #!-(or x86 x86-64)
2537                        ;; a pointer back to the function object, as
2538                        ;; described in CMU CL
2539                        ;; src/docs/internals/object.tex
2540                        fn
2541                        #!+(or x86 x86-64)
2542                        ;; KLUDGE: a pointer to the actual code of the
2543                        ;; object, as described nowhere that I can find
2544                        ;; -- WHN 19990907
2545                        (make-random-descriptor
2546                         (+ (descriptor-bits fn)
2547                            (- (ash sb!vm:simple-fun-code-offset
2548                                    sb!vm:word-shift)
2549                               ;; FIXME: We should mask out the type
2550                               ;; bits, not assume we know what they
2551                               ;; are and subtract them out this way.
2552                               sb!vm:fun-pointer-lowtag))))
2553     (write-wordindexed fn sb!vm:simple-fun-next-slot next)
2554     (write-wordindexed fn sb!vm:simple-fun-name-slot name)
2555     (write-wordindexed fn sb!vm:simple-fun-arglist-slot arglist)
2556     (write-wordindexed fn sb!vm:simple-fun-type-slot type)
2557     (write-wordindexed fn sb!vm::simple-fun-info-slot info)
2558     fn))
2559
2560 (define-cold-fop (fop-foreign-fixup)
2561   (let* ((kind (pop-stack))
2562          (code-object (pop-stack))
2563          (len (read-byte-arg))
2564          (sym (make-string len)))
2565     (read-string-as-bytes *fasl-input-stream* sym)
2566     (let ((offset (read-word-arg))
2567           (value (cold-foreign-symbol-address sym)))
2568       (do-cold-fixup code-object offset value kind))
2569    code-object))
2570
2571 #!+linkage-table
2572 (define-cold-fop (fop-foreign-dataref-fixup)
2573   (let* ((kind (pop-stack))
2574          (code-object (pop-stack))
2575          (len (read-byte-arg))
2576          (sym (make-string len)))
2577     (read-string-as-bytes *fasl-input-stream* sym)
2578     (maphash (lambda (k v)
2579                (format *error-output* "~&~S = #X~8X~%" k v))
2580              *cold-foreign-symbol-table*)
2581     (error "shared foreign symbol in cold load: ~S (~S)" sym kind)))
2582
2583 (define-cold-fop (fop-assembler-code)
2584   (let* ((length (read-word-arg))
2585          (header-n-words
2586           ;; Note: we round the number of constants up to ensure that
2587           ;; the code vector will be properly aligned.
2588           (round-up sb!vm:code-constants-offset 2))
2589          (des (allocate-cold-descriptor *read-only*
2590                                         (+ (ash header-n-words
2591                                                 sb!vm:word-shift)
2592                                            length)
2593                                         sb!vm:other-pointer-lowtag)))
2594     (write-memory des
2595                   (make-other-immediate-descriptor
2596                    header-n-words sb!vm:code-header-widetag))
2597     (write-wordindexed des
2598                        sb!vm:code-code-size-slot
2599                        (make-fixnum-descriptor
2600                         (ash (+ length (1- (ash 1 sb!vm:word-shift)))
2601                              (- sb!vm:word-shift))))
2602     (write-wordindexed des sb!vm:code-entry-points-slot *nil-descriptor*)
2603     (write-wordindexed des sb!vm:code-debug-info-slot *nil-descriptor*)
2604
2605     (let* ((start (+ (descriptor-byte-offset des)
2606                      (ash header-n-words sb!vm:word-shift)))
2607            (end (+ start length)))
2608       (read-bigvec-as-sequence-or-die (descriptor-bytes des)
2609                                       *fasl-input-stream*
2610                                       :start start
2611                                       :end end))
2612     des))
2613
2614 (define-cold-fop (fop-assembler-routine)
2615   (let* ((routine (pop-stack))
2616          (des (pop-stack))
2617          (offset (calc-offset des (read-word-arg))))
2618     (record-cold-assembler-routine
2619      routine
2620      (+ (logandc2 (descriptor-bits des) sb!vm:lowtag-mask) offset))
2621     des))
2622
2623 (define-cold-fop (fop-assembler-fixup)
2624   (let* ((routine (pop-stack))
2625          (kind (pop-stack))
2626          (code-object (pop-stack))
2627          (offset (read-word-arg)))
2628     (record-cold-assembler-fixup routine code-object offset kind)
2629     code-object))
2630
2631 (define-cold-fop (fop-code-object-fixup)
2632   (let* ((kind (pop-stack))
2633          (code-object (pop-stack))
2634          (offset (read-word-arg))
2635          (value (descriptor-bits code-object)))
2636     (do-cold-fixup code-object offset value kind)
2637     code-object))
2638 \f
2639 ;;;; sanity checking space layouts
2640
2641 (defun check-spaces ()
2642   ;;; Co-opt type machinery to check for intersections...
2643   (let (types)
2644     (flet ((check (start end space)
2645              (unless (< start end)
2646                (error "Bogus space: ~A" space))
2647              (let ((type (specifier-type `(integer ,start ,end))))
2648                (dolist (other types)
2649                  (unless (eq *empty-type* (type-intersection (cdr other) type))
2650                    (error "Space overlap: ~A with ~A" space (car other))))
2651                (push (cons space type) types))))
2652       (check sb!vm:read-only-space-start sb!vm:read-only-space-end :read-only)
2653       (check sb!vm:static-space-start sb!vm:static-space-end :static)
2654       #!+gencgc
2655       (check sb!vm:dynamic-space-start sb!vm:dynamic-space-end :dynamic)
2656       #!-gencgc
2657       (progn
2658         (check sb!vm:dynamic-0-space-start sb!vm:dynamic-0-space-end :dynamic-0)
2659         (check sb!vm:dynamic-1-space-start sb!vm:dynamic-1-space-end :dynamic-1))
2660       #!+linkage-table
2661       (check sb!vm:linkage-table-space-start sb!vm:linkage-table-space-end :linkage-table))))
2662 \f
2663 ;;;; emitting C header file
2664
2665 (defun tailwise-equal (string tail)
2666   (and (>= (length string) (length tail))
2667        (string= string tail :start1 (- (length string) (length tail)))))
2668
2669 (defun write-boilerplate ()
2670   (format t "/*~%")
2671   (dolist (line
2672            '("This is a machine-generated file. Please do not edit it by hand."
2673              "(As of sbcl-0.8.14, it came from WRITE-CONFIG-H in genesis.lisp.)"
2674              nil
2675              "This file contains low-level information about the"
2676              "internals of a particular version and configuration"
2677              "of SBCL. It is used by the C compiler to create a runtime"
2678              "support environment, an executable program in the host"
2679              "operating system's native format, which can then be used to"
2680              "load and run 'core' files, which are basically programs"
2681              "in SBCL's own format."))
2682     (format t " *~@[ ~A~]~%" line))
2683   (format t " */~%"))
2684
2685 (defun c-name (string &optional strip)
2686   (delete #\+
2687           (substitute-if #\_ (lambda (c) (member c '(#\- #\/ #\%)))
2688                          (remove-if (lambda (c) (position c strip))
2689                                     string))))
2690
2691 (defun c-symbol-name (symbol &optional strip)
2692   (c-name (symbol-name symbol) strip))
2693
2694 (defun write-makefile-features ()
2695   ;; propagating *SHEBANG-FEATURES* into the Makefiles
2696   (dolist (shebang-feature-name (sort (mapcar #'c-symbol-name
2697                                               sb-cold:*shebang-features*)
2698                                       #'string<))
2699     (format t "LISP_FEATURE_~A=1~%" shebang-feature-name)))
2700
2701 (defun write-config-h ()
2702   ;; propagating *SHEBANG-FEATURES* into C-level #define's
2703   (dolist (shebang-feature-name (sort (mapcar #'c-symbol-name
2704                                               sb-cold:*shebang-features*)
2705                                       #'string<))
2706     (format t "#define LISP_FEATURE_~A~%" shebang-feature-name))
2707   (terpri)
2708   ;; and miscellaneous constants
2709   (format t "#define SBCL_CORE_VERSION_INTEGER ~D~%" sbcl-core-version-integer)
2710   (format t
2711           "#define SBCL_VERSION_STRING ~S~%"
2712           (sb!xc:lisp-implementation-version))
2713   (format t "#define CORE_MAGIC 0x~X~%" core-magic)
2714   (format t "#ifndef LANGUAGE_ASSEMBLY~2%")
2715   (format t "#define LISPOBJ(x) ((lispobj)x)~2%")
2716   (format t "#else /* LANGUAGE_ASSEMBLY */~2%")
2717   (format t "#define LISPOBJ(thing) thing~2%")
2718   (format t "#endif /* LANGUAGE_ASSEMBLY */~2%")
2719   (terpri))
2720
2721 (defun write-constants-h ()
2722   ;; writing entire families of named constants
2723   (let ((constants nil))
2724     (dolist (package-name '( ;; Even in CMU CL, constants from VM
2725                             ;; were automatically propagated
2726                             ;; into the runtime.
2727                             "SB!VM"
2728                             ;; In SBCL, we also propagate various
2729                             ;; magic numbers related to file format,
2730                             ;; which live here instead of SB!VM.
2731                             "SB!FASL"))
2732       (do-external-symbols (symbol (find-package package-name))
2733         (when (constantp symbol)
2734           (let ((name (symbol-name symbol)))
2735             (labels ( ;; shared machinery
2736                      (record (string priority suffix)
2737                        (push (list string
2738                                    priority
2739                                    (symbol-value symbol)
2740                                    suffix
2741                                    (documentation symbol 'variable))
2742                              constants))
2743                      ;; machinery for old-style CMU CL Lisp-to-C
2744                      ;; arbitrary renaming, being phased out in favor of
2745                      ;; the newer systematic RECORD-WITH-TRANSLATED-NAME
2746                      ;; renaming
2747                      (record-with-munged-name (prefix string priority)
2748                        (record (concatenate
2749                                 'simple-string
2750                                 prefix
2751                                 (delete #\- (string-capitalize string)))
2752                                priority
2753                                ""))
2754                      (maybe-record-with-munged-name (tail prefix priority)
2755                        (when (tailwise-equal name tail)
2756                          (record-with-munged-name prefix
2757                                                   (subseq name 0
2758                                                           (- (length name)
2759                                                              (length tail)))
2760                                                   priority)))
2761                      ;; machinery for new-style SBCL Lisp-to-C naming
2762                      (record-with-translated-name (priority large)
2763                        (record (c-name name) priority (if large "LU" "")))
2764                      (maybe-record-with-translated-name (suffixes priority &key large)
2765                        (when (some (lambda (suffix)
2766                                      (tailwise-equal name suffix))
2767                                    suffixes)
2768                          (record-with-translated-name priority large))))
2769               (maybe-record-with-translated-name '("-LOWTAG") 0)
2770               (maybe-record-with-translated-name '("-WIDETAG" "-SHIFT") 1)
2771               (maybe-record-with-munged-name "-FLAG" "flag_" 2)
2772               (maybe-record-with-munged-name "-TRAP" "trap_" 3)
2773               (maybe-record-with-munged-name "-SUBTYPE" "subtype_" 4)
2774               (maybe-record-with-munged-name "-SC-NUMBER" "sc_" 5)
2775               (maybe-record-with-translated-name '("-SIZE") 6)
2776               (maybe-record-with-translated-name '("-START" "-END" "-PAGE-BYTES") 7 :large t)
2777               (maybe-record-with-translated-name '("-CORE-ENTRY-TYPE-CODE") 8)
2778               (maybe-record-with-translated-name '("-CORE-SPACE-ID") 9)
2779               (maybe-record-with-translated-name '("-GENERATION+") 10))))))
2780     ;; KLUDGE: these constants are sort of important, but there's no
2781     ;; pleasing way to inform the code above about them.  So we fake
2782     ;; it for now.  nikodemus on #lisp (2004-08-09) suggested simply
2783     ;; exporting every numeric constant from SB!VM; that would work,
2784     ;; but the C runtime would have to be altered to use Lisp-like names
2785     ;; rather than the munged names currently exported.  --njf, 2004-08-09
2786     (dolist (c '(sb!vm:n-word-bits sb!vm:n-word-bytes
2787                  sb!vm:n-lowtag-bits sb!vm:lowtag-mask
2788                  sb!vm:n-widetag-bits sb!vm:widetag-mask
2789                  sb!vm:n-fixnum-tag-bits sb!vm:fixnum-tag-mask))
2790       (push (list (c-symbol-name c)
2791                   -1                    ; invent a new priority
2792                   (symbol-value c)
2793                   ""
2794                   nil)
2795             constants))
2796     ;; One more symbol that doesn't fit into the code above.
2797     (let ((c 'sb!impl::+magic-hash-vector-value+))
2798       (push (list (c-symbol-name c)
2799                   9
2800                   (symbol-value c)
2801                   "LU"
2802                   nil)
2803             constants))
2804     (setf constants
2805           (sort constants
2806                 (lambda (const1 const2)
2807                   (if (= (second const1) (second const2))
2808                       (if (= (third const1) (third const2))
2809                           (string< (first const1) (first const2))
2810                           (< (third const1) (third const2)))
2811                       (< (second const1) (second const2))))))
2812     (let ((prev-priority (second (car constants))))
2813       (dolist (const constants)
2814         (destructuring-bind (name priority value suffix doc) const
2815           (unless (= prev-priority priority)
2816             (terpri)
2817             (setf prev-priority priority))
2818           (when (minusp value)
2819             (error "stub: negative values unsupported"))
2820           (format t "#define ~A ~A~A /* 0x~X ~@[ -- ~A ~]*/~%" name value suffix value doc))))
2821     (terpri))
2822
2823   ;; writing information about internal errors
2824   (let ((internal-errors sb!c:*backend-internal-errors*))
2825     (dotimes (i (length internal-errors))
2826       (let ((current-error (aref internal-errors i)))
2827         ;; FIXME: this UNLESS should go away (see also FIXME in
2828         ;; interr.lisp) -- APD, 2002-03-05
2829         (unless (eq nil (car current-error))
2830           (format t "#define ~A ~D~%"
2831                   (c-symbol-name (car current-error))
2832                   i))))
2833     (format t "#define INTERNAL_ERROR_NAMES \\~%~{~S~#[~:;, \\~%~]~}~%"
2834             (map 'list #'cdr internal-errors)))
2835   (terpri)
2836
2837   ;; I'm not really sure why this is in SB!C, since it seems
2838   ;; conceptually like something that belongs to SB!VM. In any case,
2839   ;; it's needed C-side.
2840   (format t "#define BACKEND_PAGE_BYTES ~DLU~%" sb!c:*backend-page-bytes*)
2841
2842   (terpri)
2843
2844   ;; FIXME: The SPARC has a PSEUDO-ATOMIC-TRAP that differs between
2845   ;; platforms. If we export this from the SB!VM package, it gets
2846   ;; written out as #define trap_PseudoAtomic, which is confusing as
2847   ;; the runtime treats trap_ as the prefix for illegal instruction
2848   ;; type things. We therefore don't export it, but instead do
2849   #!+sparc
2850   (when (boundp 'sb!vm::pseudo-atomic-trap)
2851     (format t
2852             "#define PSEUDO_ATOMIC_TRAP ~D /* 0x~:*~X */~%"
2853             sb!vm::pseudo-atomic-trap)
2854     (terpri))
2855   ;; possibly this is another candidate for a rename (to
2856   ;; pseudo-atomic-trap-number or pseudo-atomic-magic-constant
2857   ;; [possibly applicable to other platforms])
2858
2859   (dolist (symbol '(sb!vm::float-traps-byte
2860                     sb!vm::float-exceptions-byte
2861                     sb!vm::float-sticky-bits
2862                     sb!vm::float-rounding-mode))
2863     (format t "#define ~A_POSITION ~A /* ~:*0x~X */~%"
2864             (c-symbol-name symbol)
2865             (sb!xc:byte-position (symbol-value symbol)))
2866     (format t "#define ~A_MASK 0x~X /* ~:*~A */~%"
2867             (c-symbol-name symbol)
2868             (sb!xc:mask-field (symbol-value symbol) -1))))
2869
2870 #!+sb-ldb
2871 (defun write-tagnames-h (&optional (out *standard-output*))
2872   (labels
2873       ((pretty-name (symbol strip)
2874          (let ((name (string-downcase symbol)))
2875            (substitute #\Space #\-
2876                        (subseq name 0 (- (length name) (length strip))))))
2877        (list-sorted-tags (tail)
2878          (loop for symbol being the external-symbols of "SB!VM"
2879                when (and (constantp symbol)
2880                          (tailwise-equal (string symbol) tail))
2881                collect symbol into tags
2882                finally (return (sort tags #'< :key #'symbol-value))))
2883        (write-tags (kind limit ash-count)
2884          (format out "~%static const char *~(~A~)_names[] = {~%"
2885                  (subseq kind 1))
2886          (let ((tags (list-sorted-tags kind)))
2887            (dotimes (i limit)
2888              (if (eql i (ash (or (symbol-value (first tags)) -1) ash-count))
2889                  (format out "    \"~A\"" (pretty-name (pop tags) kind))
2890                  (format out "    \"unknown [~D]\"" i))
2891              (unless (eql i (1- limit))
2892                (write-string "," out))
2893              (terpri out)))
2894          (write-line "};" out)))
2895     (write-tags "-LOWTAG" sb!vm:lowtag-limit 0)
2896     ;; this -2 shift depends on every OTHER-IMMEDIATE-?-LOWTAG
2897     ;; ending with the same 2 bits. (#b10)
2898     (write-tags "-WIDETAG" (ash (1+ sb!vm:widetag-mask) -2) -2))
2899   (values))
2900
2901 (defun write-primitive-object (obj)
2902   ;; writing primitive object layouts
2903   (format t "#ifndef LANGUAGE_ASSEMBLY~2%")
2904   (format t
2905           "struct ~A {~%"
2906           (c-name (string-downcase (string (sb!vm:primitive-object-name obj)))))
2907   (when (sb!vm:primitive-object-widetag obj)
2908     (format t "    lispobj header;~%"))
2909   (dolist (slot (sb!vm:primitive-object-slots obj))
2910     (format t "    ~A ~A~@[[1]~];~%"
2911             (getf (sb!vm:slot-options slot) :c-type "lispobj")
2912             (c-name (string-downcase (string (sb!vm:slot-name slot))))
2913             (sb!vm:slot-rest-p slot)))
2914   (format t "};~2%")
2915   (format t "#else /* LANGUAGE_ASSEMBLY */~2%")
2916   (format t "/* These offsets are SLOT-OFFSET * N-WORD-BYTES - LOWTAG~%")
2917   (format t " * so they work directly on tagged addresses. */~2%")
2918   (let ((name (sb!vm:primitive-object-name obj))
2919         (lowtag (eval (sb!vm:primitive-object-lowtag obj))))
2920     (when lowtag
2921       (dolist (slot (sb!vm:primitive-object-slots obj))
2922         (format t "#define ~A_~A_OFFSET ~D~%"
2923                 (c-symbol-name name)
2924                 (c-symbol-name (sb!vm:slot-name slot))
2925                 (- (* (sb!vm:slot-offset slot) sb!vm:n-word-bytes) lowtag)))
2926       (terpri)))
2927   (format t "#endif /* LANGUAGE_ASSEMBLY */~2%"))
2928
2929 (defun write-structure-object (dd)
2930   (flet ((cstring (designator)
2931            (c-name (string-downcase (string designator)))))
2932     (format t "#ifndef LANGUAGE_ASSEMBLY~2%")
2933     (format t "struct ~A {~%" (cstring (dd-name dd)))
2934     (format t "    lispobj header;~%")
2935     (format t "    lispobj layout;~%")
2936     (dolist (slot (dd-slots dd))
2937       (when (eq t (dsd-raw-type slot))
2938         (format t "    lispobj ~A;~%" (cstring (dsd-name slot)))))
2939     (unless (oddp (+ (dd-length dd) (dd-raw-length dd)))
2940       (format t "    lispobj raw_slot_padding;~%"))
2941     (dotimes (n (dd-raw-length dd))
2942       (format t "    lispobj raw~D;~%" (- (dd-raw-length dd) n 1)))
2943     (format t "};~2%")
2944     (format t "#endif /* LANGUAGE_ASSEMBLY */~2%")))
2945
2946 (defun write-static-symbols ()
2947   (dolist (symbol (cons nil sb!vm:*static-symbols*))
2948     ;; FIXME: It would be nice to use longer names than NIL and
2949     ;; (particularly) T in #define statements.
2950     (format t "#define ~A LISPOBJ(0x~X)~%"
2951             ;; FIXME: It would be nice not to need to strip anything
2952             ;; that doesn't get stripped always by C-SYMBOL-NAME.
2953             (c-symbol-name symbol "%*.!")
2954             (if *static*                ; if we ran GENESIS
2955               ;; We actually ran GENESIS, use the real value.
2956               (descriptor-bits (cold-intern symbol))
2957               ;; We didn't run GENESIS, so guess at the address.
2958               (+ sb!vm:static-space-start
2959                  sb!vm:n-word-bytes
2960                  sb!vm:other-pointer-lowtag
2961                    (if symbol (sb!vm:static-symbol-offset symbol) 0))))))
2962
2963 \f
2964 ;;;; writing map file
2965
2966 ;;; Write a map file describing the cold load. Some of this
2967 ;;; information is subject to change due to relocating GC, but even so
2968 ;;; it can be very handy when attempting to troubleshoot the early
2969 ;;; stages of cold load.
2970 (defun write-map ()
2971   (let ((*print-pretty* nil)
2972         (*print-case* :upcase))
2973     (format t "assembler routines defined in core image:~2%")
2974     (dolist (routine (sort (copy-list *cold-assembler-routines*) #'<
2975                            :key #'cdr))
2976       (format t "#X~8,'0X: ~S~%" (cdr routine) (car routine)))
2977     (let ((funs nil)
2978           (undefs nil))
2979       (maphash (lambda (name fdefn)
2980                  (let ((fun (read-wordindexed fdefn
2981                                               sb!vm:fdefn-fun-slot)))
2982                    (if (= (descriptor-bits fun)
2983                           (descriptor-bits *nil-descriptor*))
2984                        (push name undefs)
2985                        (let ((addr (read-wordindexed
2986                                     fdefn sb!vm:fdefn-raw-addr-slot)))
2987                          (push (cons name (descriptor-bits addr))
2988                                funs)))))
2989                *cold-fdefn-objects*)
2990       (format t "~%~|~%initially defined functions:~2%")
2991       (setf funs (sort funs #'< :key #'cdr))
2992       (dolist (info funs)
2993         (format t "0x~8,'0X: ~S   #X~8,'0X~%" (cdr info) (car info)
2994                 (- (cdr info) #x17)))
2995       (format t
2996 "~%~|
2997 (a note about initially undefined function references: These functions
2998 are referred to by code which is installed by GENESIS, but they are not
2999 installed by GENESIS. This is not necessarily a problem; functions can
3000 be defined later, by cold init toplevel forms, or in files compiled and
3001 loaded at warm init, or elsewhere. As long as they are defined before
3002 they are called, everything should be OK. Things are also OK if the
3003 cross-compiler knew their inline definition and used that everywhere
3004 that they were called before the out-of-line definition is installed,
3005 as is fairly common for structure accessors.)
3006 initially undefined function references:~2%")
3007
3008       (setf undefs (sort undefs #'string< :key #'fun-name-block-name))
3009       (dolist (name undefs)
3010         (format t "~S~%" name)))
3011
3012     (format t "~%~|~%layout names:~2%")
3013     (collect ((stuff))
3014       (maphash (lambda (name gorp)
3015                  (declare (ignore name))
3016                  (stuff (cons (descriptor-bits (car gorp))
3017                               (cdr gorp))))
3018                *cold-layouts*)
3019       (dolist (x (sort (stuff) #'< :key #'car))
3020         (apply #'format t "~8,'0X: ~S[~D]~%~10T~S~%" x))))
3021
3022   (values))
3023 \f
3024 ;;;; writing core file
3025
3026 (defvar *core-file*)
3027 (defvar *data-page*)
3028
3029 ;;; magic numbers to identify entries in a core file
3030 ;;;
3031 ;;; (In case you were wondering: No, AFAIK there's no special magic about
3032 ;;; these which requires them to be in the 38xx range. They're just
3033 ;;; arbitrary words, tested not for being in a particular range but just
3034 ;;; for equality. However, if you ever need to look at a .core file and
3035 ;;; figure out what's going on, it's slightly convenient that they're
3036 ;;; all in an easily recognizable range, and displacing the range away from
3037 ;;; zero seems likely to reduce the chance that random garbage will be
3038 ;;; misinterpreted as a .core file.)
3039 (defconstant version-core-entry-type-code 3860)
3040 (defconstant build-id-core-entry-type-code 3899)
3041 (defconstant new-directory-core-entry-type-code 3861)
3042 (defconstant initial-fun-core-entry-type-code 3863)
3043 (defconstant page-table-core-entry-type-code 3880)
3044 #!+(and sb-lutex sb-thread)
3045 (defconstant lutex-table-core-entry-type-code 3887)
3046 (defconstant end-core-entry-type-code 3840)
3047
3048 (declaim (ftype (function (sb!vm:word) sb!vm:word) write-word))
3049 (defun write-word (num)
3050   (ecase sb!c:*backend-byte-order*
3051     (:little-endian
3052      (dotimes (i sb!vm:n-word-bytes)
3053        (write-byte (ldb (byte 8 (* i 8)) num) *core-file*)))
3054     (:big-endian
3055      (dotimes (i sb!vm:n-word-bytes)
3056        (write-byte (ldb (byte 8 (* (- (1- sb!vm:n-word-bytes) i) 8)) num)
3057                    *core-file*))))
3058   num)
3059
3060 (defun advance-to-page ()
3061   (force-output *core-file*)
3062   (file-position *core-file*
3063                  (round-up (file-position *core-file*)
3064                            sb!c:*backend-page-bytes*)))
3065
3066 (defun output-gspace (gspace)
3067   (force-output *core-file*)
3068   (let* ((posn (file-position *core-file*))
3069          (bytes (* (gspace-free-word-index gspace) sb!vm:n-word-bytes))
3070          (pages (ceiling bytes sb!c:*backend-page-bytes*))
3071          (total-bytes (* pages sb!c:*backend-page-bytes*)))
3072
3073     (file-position *core-file*
3074                    (* sb!c:*backend-page-bytes* (1+ *data-page*)))
3075     (format t
3076             "writing ~S byte~:P [~S page~:P] from ~S~%"
3077             total-bytes
3078             pages
3079             gspace)
3080     (force-output)
3081
3082     ;; Note: It is assumed that the GSPACE allocation routines always
3083     ;; allocate whole pages (of size *target-page-size*) and that any
3084     ;; empty gspace between the free pointer and the end of page will
3085     ;; be zero-filled. This will always be true under Mach on machines
3086     ;; where the page size is equal. (RT is 4K, PMAX is 4K, Sun 3 is
3087     ;; 8K).
3088     (write-bigvec-as-sequence (gspace-bytes gspace)
3089                               *core-file*
3090                               :end total-bytes)
3091     (force-output *core-file*)
3092     (file-position *core-file* posn)
3093
3094     ;; Write part of a (new) directory entry which looks like this:
3095     ;;   GSPACE IDENTIFIER
3096     ;;   WORD COUNT
3097     ;;   DATA PAGE
3098     ;;   ADDRESS
3099     ;;   PAGE COUNT
3100     (write-word (gspace-identifier gspace))
3101     (write-word (gspace-free-word-index gspace))
3102     (write-word *data-page*)
3103     (multiple-value-bind (floor rem)
3104         (floor (gspace-byte-address gspace) sb!c:*backend-page-bytes*)
3105       (aver (zerop rem))
3106       (write-word floor))
3107     (write-word pages)
3108
3109     (incf *data-page* pages)))
3110
3111 ;;; Create a core file created from the cold loaded image. (This is
3112 ;;; the "initial core file" because core files could be created later
3113 ;;; by executing SAVE-LISP in a running system, perhaps after we've
3114 ;;; added some functionality to the system.)
3115 (declaim (ftype (function (string)) write-initial-core-file))
3116 (defun write-initial-core-file (filename)
3117
3118   (let ((filenamestring (namestring filename))
3119         (*data-page* 0))
3120
3121     (format t
3122             "[building initial core file in ~S: ~%"
3123             filenamestring)
3124     (force-output)
3125
3126     (with-open-file (*core-file* filenamestring
3127                                  :direction :output
3128                                  :element-type '(unsigned-byte 8)
3129                                  :if-exists :rename-and-delete)
3130
3131       ;; Write the magic number.
3132       (write-word core-magic)
3133
3134       ;; Write the Version entry.
3135       (write-word version-core-entry-type-code)
3136       (write-word 3)
3137       (write-word sbcl-core-version-integer)
3138
3139       ;; Write the build ID.
3140       (write-word build-id-core-entry-type-code)
3141       (let ((build-id (with-open-file (s "output/build-id.tmp"
3142                                          :direction :input)
3143                         (read s))))
3144         (declare (type simple-string build-id))
3145         (/show build-id (length build-id))
3146         ;; Write length of build ID record: BUILD-ID-CORE-ENTRY-TYPE-CODE
3147         ;; word, this length word, and one word for each char of BUILD-ID.
3148         (write-word (+ 2 (length build-id)))
3149         (dovector (char build-id)
3150           ;; (We write each character as a word in order to avoid
3151           ;; having to think about word alignment issues in the
3152           ;; sbcl-0.7.8 version of coreparse.c.)
3153           (write-word (sb!xc:char-code char))))
3154
3155       ;; Write the New Directory entry header.
3156       (write-word new-directory-core-entry-type-code)
3157       (write-word 17) ; length = (5 words/space) * 3 spaces + 2 for header.
3158
3159       (output-gspace *read-only*)
3160       (output-gspace *static*)
3161       (output-gspace *dynamic*)
3162
3163       ;; Write the initial function.
3164       (write-word initial-fun-core-entry-type-code)
3165       (write-word 3)
3166       (let* ((cold-name (cold-intern '!cold-init))
3167              (cold-fdefn (cold-fdefinition-object cold-name))
3168              (initial-fun (read-wordindexed cold-fdefn
3169                                             sb!vm:fdefn-fun-slot)))
3170         (format t
3171                 "~&/(DESCRIPTOR-BITS INITIAL-FUN)=#X~X~%"
3172                 (descriptor-bits initial-fun))
3173         (write-word (descriptor-bits initial-fun)))
3174
3175       ;; Write the End entry.
3176       (write-word end-core-entry-type-code)
3177       (write-word 2)))
3178
3179   (format t "done]~%")
3180   (force-output)
3181   (/show "leaving WRITE-INITIAL-CORE-FILE")
3182   (values))
3183 \f
3184 ;;;; the actual GENESIS function
3185
3186 ;;; Read the FASL files in OBJECT-FILE-NAMES and produce a Lisp core,
3187 ;;; and/or information about a Lisp core, therefrom.
3188 ;;;
3189 ;;; input file arguments:
3190 ;;;   SYMBOL-TABLE-FILE-NAME names a UNIX-style .nm file *with* *any*
3191 ;;;     *tab* *characters* *converted* *to* *spaces*. (We push
3192 ;;;     responsibility for removing tabs out to the caller it's
3193 ;;;     trivial to remove them using UNIX command line tools like
3194 ;;;     sed, whereas it's a headache to do it portably in Lisp because
3195 ;;;     #\TAB is not a STANDARD-CHAR.) If this file is not supplied,
3196 ;;;     a core file cannot be built (but a C header file can be).
3197 ;;;
3198 ;;; output files arguments (any of which may be NIL to suppress output):
3199 ;;;   CORE-FILE-NAME gets a Lisp core.
3200 ;;;   C-HEADER-FILE-NAME gets a C header file, traditionally called
3201 ;;;     internals.h, which is used by the C compiler when constructing
3202 ;;;     the executable which will load the core.
3203 ;;;   MAP-FILE-NAME gets (?) a map file. (dunno about this -- WHN 19990815)
3204 ;;;
3205 ;;; FIXME: GENESIS doesn't belong in SB!VM. Perhaps in %KERNEL for now,
3206 ;;; perhaps eventually in SB-LD or SB-BOOT.
3207 (defun sb!vm:genesis (&key
3208                       object-file-names
3209                       symbol-table-file-name
3210                       core-file-name
3211                       map-file-name
3212                       c-header-dir-name)
3213
3214   (format t
3215           "~&beginning GENESIS, ~A~%"
3216           (if core-file-name
3217             ;; Note: This output summarizing what we're doing is
3218             ;; somewhat telegraphic in style, not meant to imply that
3219             ;; we're not e.g. also creating a header file when we
3220             ;; create a core.
3221             (format nil "creating core ~S" core-file-name)
3222             (format nil "creating headers in ~S" c-header-dir-name)))
3223
3224   (let ((*cold-foreign-symbol-table* (make-hash-table :test 'equal)))
3225
3226     (when core-file-name
3227       (if symbol-table-file-name
3228           (load-cold-foreign-symbol-table symbol-table-file-name)
3229           (error "can't output a core file without symbol table file input")))
3230
3231     ;; Now that we've successfully read our only input file (by
3232     ;; loading the symbol table, if any), it's a good time to ensure
3233     ;; that there'll be someplace for our output files to go when
3234     ;; we're done.
3235     (flet ((frob (filename)
3236              (when filename
3237                (ensure-directories-exist filename :verbose t))))
3238       (frob core-file-name)
3239       (frob map-file-name))
3240
3241     ;; (This shouldn't matter in normal use, since GENESIS normally
3242     ;; only runs once in any given Lisp image, but it could reduce
3243     ;; confusion if we ever experiment with running, tweaking, and
3244     ;; rerunning genesis interactively.)
3245     (do-all-symbols (sym)
3246       (remprop sym 'cold-intern-info))
3247
3248     (check-spaces)
3249
3250     (let* ((*foreign-symbol-placeholder-value* (if core-file-name nil 0))
3251            (*load-time-value-counter* 0)
3252            (*cold-fdefn-objects* (make-hash-table :test 'equal))
3253            (*cold-symbols* (make-hash-table :test 'equal))
3254            (*cold-package-symbols* nil)
3255            (*read-only* (make-gspace :read-only
3256                                      read-only-core-space-id
3257                                      sb!vm:read-only-space-start))
3258            (*static*    (make-gspace :static
3259                                      static-core-space-id
3260                                      sb!vm:static-space-start))
3261            (*dynamic*   (make-gspace :dynamic
3262                                      dynamic-core-space-id
3263                                      #!+gencgc sb!vm:dynamic-space-start
3264                                      #!-gencgc sb!vm:dynamic-0-space-start))
3265            (*nil-descriptor* (make-nil-descriptor))
3266            (*current-reversed-cold-toplevels* *nil-descriptor*)
3267            (*current-debug-sources* *nil-descriptor*)
3268            (*unbound-marker* (make-other-immediate-descriptor
3269                               0
3270                               sb!vm:unbound-marker-widetag))
3271            *cold-assembler-fixups*
3272            *cold-assembler-routines*
3273            #!+x86 (*load-time-code-fixups* (make-hash-table)))
3274
3275       ;; Prepare for cold load.
3276       (initialize-non-nil-symbols)
3277       (initialize-layouts)
3278       (initialize-static-fns)
3279
3280       ;; Initialize the *COLD-SYMBOLS* system with the information
3281       ;; from package-data-list.lisp-expr and
3282       ;; common-lisp-exports.lisp-expr.
3283       ;;
3284       ;; Why do things this way? Historically, the *COLD-SYMBOLS*
3285       ;; machinery was designed and implemented in CMU CL long before
3286       ;; I (WHN) ever heard of CMU CL. It dumped symbols and packages
3287       ;; iff they were used in the cold image. When I added the
3288       ;; package-data-list.lisp-expr mechanism, the idea was to
3289       ;; centralize all information about packages and exports. Thus,
3290       ;; it was the natural place for information even about packages
3291       ;; (such as SB!PCL and SB!WALKER) which aren't used much until
3292       ;; after cold load. This didn't quite match the CMU CL approach
3293       ;; of filling *COLD-SYMBOLS* with symbols which appear in the
3294       ;; cold image and then dumping only those symbols. By explicitly
3295       ;; putting all the symbols from package-data-list.lisp-expr and
3296       ;; from common-lisp-exports.lisp-expr into *COLD-SYMBOLS* here,
3297       ;; we feed our centralized symbol information into the old CMU
3298       ;; CL code without having to change the old CMU CL code too
3299       ;; much. (And the old CMU CL code is still useful for making
3300       ;; sure that the appropriate keywords and internal symbols end
3301       ;; up interned in the target Lisp, which is good, e.g. in order
3302       ;; to make &KEY arguments work right and in order to make
3303       ;; BACKTRACEs into target Lisp system code be legible.)
3304       (dolist (exported-name
3305                (sb-cold:read-from-file "common-lisp-exports.lisp-expr"))
3306         (cold-intern (intern exported-name *cl-package*)))
3307       (dolist (pd (sb-cold:read-from-file "package-data-list.lisp-expr"))
3308         (declare (type sb-cold:package-data pd))
3309         (let ((package (find-package (sb-cold:package-data-name pd))))
3310           (labels (;; Call FN on every node of the TREE.
3311                    (mapc-on-tree (fn tree)
3312                                  (declare (type function fn))
3313                                  (typecase tree
3314                                    (cons (mapc-on-tree fn (car tree))
3315                                          (mapc-on-tree fn (cdr tree)))
3316                                    (t (funcall fn tree)
3317                                       (values))))
3318                    ;; Make sure that information about the association
3319                    ;; between PACKAGE and the symbol named NAME gets
3320                    ;; recorded in the cold-intern system or (as a
3321                    ;; convenience when dealing with the tree structure
3322                    ;; allowed in the PACKAGE-DATA-EXPORTS slot) do
3323                    ;; nothing if NAME is NIL.
3324                    (chill (name)
3325                      (when name
3326                        (cold-intern (intern name package) :package package))))
3327             (mapc-on-tree #'chill (sb-cold:package-data-export pd))
3328             (mapc #'chill (sb-cold:package-data-reexport pd))
3329             (dolist (sublist (sb-cold:package-data-import-from pd))
3330               (destructuring-bind (package-name &rest symbol-names) sublist
3331                 (declare (ignore package-name))
3332                 (mapc #'chill symbol-names))))))
3333
3334       ;; Cold load.
3335       (dolist (file-name object-file-names)
3336         (write-line (namestring file-name))
3337         (cold-load file-name))
3338
3339       ;; Tidy up loose ends left by cold loading. ("Postpare from cold load?")
3340       (resolve-assembler-fixups)
3341       #!+x86 (output-load-time-code-fixups)
3342       (foreign-symbols-to-core)
3343       (finish-symbols)
3344       (/show "back from FINISH-SYMBOLS")
3345       (finalize-load-time-value-noise)
3346
3347       ;; Tell the target Lisp how much stuff we've allocated.
3348       (cold-set 'sb!vm:*read-only-space-free-pointer*
3349                 (allocate-cold-descriptor *read-only*
3350                                           0
3351                                           sb!vm:even-fixnum-lowtag))
3352       (cold-set 'sb!vm:*static-space-free-pointer*
3353                 (allocate-cold-descriptor *static*
3354                                           0
3355                                           sb!vm:even-fixnum-lowtag))
3356       (/show "done setting free pointers")
3357
3358       ;; Write results to files.
3359       ;;
3360       ;; FIXME: I dislike this approach of redefining
3361       ;; *STANDARD-OUTPUT* instead of putting the new stream in a
3362       ;; lexical variable, and it's annoying to have WRITE-MAP (to
3363       ;; *STANDARD-OUTPUT*) not be parallel to WRITE-INITIAL-CORE-FILE
3364       ;; (to a stream explicitly passed as an argument).
3365       (macrolet ((out-to (name &body body)
3366                    `(let ((fn (format nil "~A/~A.h" c-header-dir-name ,name)))
3367                      (ensure-directories-exist fn)
3368                      (with-open-file (*standard-output* fn
3369                                       :if-exists :supersede :direction :output)
3370                        (write-boilerplate)
3371                        (let ((n (c-name (string-upcase ,name))))
3372                          (format
3373                           t
3374                           "#ifndef SBCL_GENESIS_~A~%#define SBCL_GENESIS_~A 1~%"
3375                           n n))
3376                        ,@body
3377                        (format t
3378                         "#endif /* SBCL_GENESIS_~A */~%"
3379                         (string-upcase ,name))))))
3380         (when map-file-name
3381           (with-open-file (*standard-output* map-file-name
3382                                              :direction :output
3383                                              :if-exists :supersede)
3384             (write-map)))
3385         (out-to "config" (write-config-h))
3386         (out-to "constants" (write-constants-h))
3387         #!+sb-ldb
3388         (out-to "tagnames" (write-tagnames-h))
3389         (let ((structs (sort (copy-list sb!vm:*primitive-objects*) #'string<
3390                              :key (lambda (obj)
3391                                     (symbol-name
3392                                      (sb!vm:primitive-object-name obj))))))
3393           (dolist (obj structs)
3394             (out-to
3395              (string-downcase (string (sb!vm:primitive-object-name obj)))
3396              (write-primitive-object obj)))
3397           (out-to "primitive-objects"
3398                   (dolist (obj structs)
3399                     (format t "~&#include \"~A.h\"~%"
3400                             (string-downcase
3401                              (string (sb!vm:primitive-object-name obj)))))))
3402         (dolist (class '(hash-table
3403                          layout
3404                          sb!c::compiled-debug-info
3405                          sb!c::compiled-debug-fun
3406                          sb!xc:package))
3407           (out-to
3408            (string-downcase (string class))
3409            (write-structure-object
3410             (sb!kernel:layout-info (sb!kernel:find-layout class)))))
3411         (out-to "static-symbols" (write-static-symbols))
3412
3413         (let ((fn (format nil "~A/Makefile.features" c-header-dir-name)))
3414           (ensure-directories-exist fn)
3415           (with-open-file (*standard-output* fn :if-exists :supersede
3416                                              :direction :output)
3417             (write-makefile-features)))
3418
3419         (when core-file-name
3420           (write-initial-core-file core-file-name))))))