Clean up some SSE instruction format definitions on x86-64
[sbcl.git] / src / compiler / x86-64 / insts.lisp
1 ;;;; that part of the description of the x86-64 instruction set
2 ;;;; which can live on the cross-compilation host
3
4 ;;;; This software is part of the SBCL system. See the README file for
5 ;;;; more information.
6 ;;;;
7 ;;;; This software is derived from the CMU CL system, which was
8 ;;;; written at Carnegie Mellon University and released into the
9 ;;;; public domain. The software is in the public domain and is
10 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
11 ;;;; files for more information.
12
13 (in-package "SB!VM")
14 ;;; FIXME: SB!DISASSEM: prefixes are used so widely in this file that
15 ;;; I wonder whether the separation of the disassembler from the
16 ;;; virtual machine is valid or adds value.
17
18 ;;; Note: In CMU CL, this used to be a call to SET-DISASSEM-PARAMS.
19 (setf sb!disassem:*disassem-inst-alignment-bytes* 1)
20
21 ;;; This type is used mostly in disassembly and represents legacy
22 ;;; registers only. R8-R15 are handled separately.
23 (deftype reg () '(unsigned-byte 3))
24
25 ;;; This includes legacy registers and R8-R15.
26 (deftype full-reg () '(unsigned-byte 4))
27
28 ;;; The XMM registers XMM0 - XMM15.
29 (deftype xmmreg () '(unsigned-byte 4))
30
31 ;;; Default word size for the chip: if the operand size /= :dword
32 ;;; we need to output #x66 (or REX) prefix
33 (def!constant +default-operand-size+ :dword)
34
35 ;;; The default address size for the chip. It could be overwritten
36 ;;; to :dword with a #x67 prefix, but this is never needed by SBCL
37 ;;; and thus not supported by this assembler/disassembler.
38 (def!constant +default-address-size+ :qword)
39 \f
40 (eval-when (#-sb-xc :compile-toplevel :load-toplevel :execute)
41
42 (defun offset-next (value dstate)
43   (declare (type integer value)
44            (type sb!disassem:disassem-state dstate))
45   (+ (sb!disassem:dstate-next-addr dstate) value))
46
47 (defparameter *byte-reg-names*
48   #(al cl dl bl spl bpl sil dil r8b r9b r10b r11b r12b r13b r14b r15b))
49 (defparameter *high-byte-reg-names*
50   #(ah ch dh bh))
51 (defparameter *word-reg-names*
52   #(ax cx dx bx sp bp si di r8w r9w r10w r11w r12w r13w r14w r15w))
53 (defparameter *dword-reg-names*
54   #(eax ecx edx ebx esp ebp esi edi r8d r9d r10d r11d r12d r13d r14d r15d))
55 (defparameter *qword-reg-names*
56   #(rax rcx rdx rbx rsp rbp rsi rdi r8 r9 r10 r11 r12 r13 r14 r15))
57
58 ;;; The printers for registers, memory references and immediates need to
59 ;;; take into account the width bit in the instruction, whether a #x66
60 ;;; or a REX prefix was issued, and the contents of the REX prefix.
61 ;;; This is implemented using prefilters to put flags into the slot
62 ;;; INST-PROPERTIES of the DSTATE.  These flags are the following
63 ;;; symbols:
64 ;;;
65 ;;; OPERAND-SIZE-8   The width bit was zero
66 ;;; OPERAND-SIZE-16  The "operand size override" prefix (#x66) was found
67 ;;; REX              A REX prefix was found
68 ;;; REX-W            A REX prefix with the "operand width" bit set was
69 ;;;                  found
70 ;;; REX-R            A REX prefix with the "register" bit set was found
71 ;;; REX-X            A REX prefix with the "index" bit set was found
72 ;;; REX-B            A REX prefix with the "base" bit set was found
73
74 ;;; Return the operand size depending on the prefixes and width bit as
75 ;;; stored in DSTATE.
76 (defun inst-operand-size (dstate)
77   (declare (type sb!disassem:disassem-state dstate))
78   (cond ((sb!disassem:dstate-get-inst-prop dstate 'operand-size-8)
79          :byte)
80         ((sb!disassem:dstate-get-inst-prop dstate 'rex-w)
81          :qword)
82         ((sb!disassem:dstate-get-inst-prop dstate 'operand-size-16)
83          :word)
84         (t
85          +default-operand-size+)))
86
87 ;;; The same as INST-OPERAND-SIZE, but for those instructions (e.g.
88 ;;; PUSH, JMP) that have a default operand size of :qword. It can only
89 ;;; be overwritten to :word.
90 (defun inst-operand-size-default-qword (dstate)
91   (declare (type sb!disassem:disassem-state dstate))
92   (if (sb!disassem:dstate-get-inst-prop dstate 'operand-size-16)
93       :word
94       :qword))
95
96 ;;; Print to STREAM the name of the general-purpose register encoded by
97 ;;; VALUE and of size WIDTH. For robustness, the high byte registers
98 ;;; (AH, BH, CH, DH) are correctly detected, too, although the compiler
99 ;;; does not use them.
100 (defun print-reg-with-width (value width stream dstate)
101   (declare (type full-reg value)
102            (type stream stream)
103            (type sb!disassem:disassem-state dstate))
104   (princ (if (and (eq width :byte)
105                   (<= 4 value 7)
106                   (not (sb!disassem:dstate-get-inst-prop dstate 'rex)))
107              (aref *high-byte-reg-names* (- value 4))
108              (aref (ecase width
109                      (:byte *byte-reg-names*)
110                      (:word *word-reg-names*)
111                      (:dword *dword-reg-names*)
112                      (:qword *qword-reg-names*))
113                    value))
114          stream)
115   ;; XXX plus should do some source-var notes
116   )
117
118 (defun print-reg (value stream dstate)
119   (declare (type full-reg value)
120            (type stream stream)
121            (type sb!disassem:disassem-state dstate))
122   (print-reg-with-width value
123                         (inst-operand-size dstate)
124                         stream
125                         dstate))
126
127 (defun print-reg-default-qword (value stream dstate)
128   (declare (type full-reg value)
129            (type stream stream)
130            (type sb!disassem:disassem-state dstate))
131   (print-reg-with-width value
132                         (inst-operand-size-default-qword dstate)
133                         stream
134                         dstate))
135
136 (defun print-byte-reg (value stream dstate)
137   (declare (type full-reg value)
138            (type stream stream)
139            (type sb!disassem:disassem-state dstate))
140   (print-reg-with-width value :byte stream dstate))
141
142 (defun print-addr-reg (value stream dstate)
143   (declare (type full-reg value)
144            (type stream stream)
145            (type sb!disassem:disassem-state dstate))
146   (print-reg-with-width value +default-address-size+ stream dstate))
147
148 ;;; Print a register or a memory reference of the given WIDTH.
149 ;;; If SIZED-P is true, add an explicit size indicator for memory
150 ;;; references.
151 (defun print-reg/mem-with-width (value width sized-p stream dstate)
152   (declare (type (or list full-reg) value)
153            (type (member :byte :word :dword :qword) width)
154            (type boolean sized-p)
155            (type stream stream)
156            (type sb!disassem:disassem-state dstate))
157   (if (typep value 'full-reg)
158       (print-reg-with-width value width stream dstate)
159     (print-mem-access value (and sized-p width) stream dstate)))
160
161 ;;; Print a register or a memory reference. The width is determined by
162 ;;; calling INST-OPERAND-SIZE.
163 (defun print-reg/mem (value stream dstate)
164   (declare (type (or list full-reg) value)
165            (type stream stream)
166            (type sb!disassem:disassem-state dstate))
167   (print-reg/mem-with-width
168    value (inst-operand-size dstate) nil stream dstate))
169
170 ;; Same as print-reg/mem, but prints an explicit size indicator for
171 ;; memory references.
172 (defun print-sized-reg/mem (value stream dstate)
173   (declare (type (or list full-reg) value)
174            (type stream stream)
175            (type sb!disassem:disassem-state dstate))
176   (print-reg/mem-with-width
177    value (inst-operand-size dstate) t stream dstate))
178
179 ;;; Same as print-sized-reg/mem, but with a default operand size of
180 ;;; :qword.
181 (defun print-sized-reg/mem-default-qword (value stream dstate)
182   (declare (type (or list full-reg) value)
183            (type stream stream)
184            (type sb!disassem:disassem-state dstate))
185   (print-reg/mem-with-width
186    value (inst-operand-size-default-qword dstate) t stream dstate))
187
188 (defun print-sized-byte-reg/mem (value stream dstate)
189   (declare (type (or list full-reg) value)
190            (type stream stream)
191            (type sb!disassem:disassem-state dstate))
192   (print-reg/mem-with-width value :byte t stream dstate))
193
194 (defun print-sized-word-reg/mem (value stream dstate)
195   (declare (type (or list full-reg) value)
196            (type stream stream)
197            (type sb!disassem:disassem-state dstate))
198   (print-reg/mem-with-width value :word t stream dstate))
199
200 (defun print-sized-dword-reg/mem (value stream dstate)
201   (declare (type (or list full-reg) value)
202            (type stream stream)
203            (type sb!disassem:disassem-state dstate))
204   (print-reg/mem-with-width value :dword t stream dstate))
205
206 (defun print-label (value stream dstate)
207   (declare (ignore dstate))
208   (sb!disassem:princ16 value stream))
209
210 (defun print-xmmreg (value stream dstate)
211   (declare (type xmmreg value)
212            (type stream stream)
213            (ignore dstate))
214   (format stream "XMM~d" value))
215
216 (defun print-xmmreg/mem (value stream dstate)
217   (declare (type (or list xmmreg) value)
218            (type stream stream)
219            (type sb!disassem:disassem-state dstate))
220   (if (typep value 'xmmreg)
221       (print-xmmreg value stream dstate)
222     (print-mem-access value nil stream dstate)))
223
224 ;; Same as print-xmmreg/mem, but prints an explicit size indicator for
225 ;; memory references.
226 (defun print-sized-xmmreg/mem (value stream dstate)
227   (declare (type (or list xmmreg) value)
228            (type stream stream)
229            (type sb!disassem:disassem-state dstate))
230   (if (typep value 'xmmreg)
231       (print-xmmreg value stream dstate)
232     (print-mem-access value (inst-operand-size dstate) stream dstate)))
233
234 ;;; This prefilter is used solely for its side effects, namely to put
235 ;;; the bits found in the REX prefix into the DSTATE for use by other
236 ;;; prefilters and by printers.
237 (defun prefilter-wrxb (value dstate)
238   (declare (type (unsigned-byte 4) value)
239            (type sb!disassem:disassem-state dstate))
240   (sb!disassem:dstate-put-inst-prop dstate 'rex)
241   (when (plusp (logand value #b1000))
242     (sb!disassem:dstate-put-inst-prop dstate 'rex-w))
243   (when (plusp (logand value #b0100))
244     (sb!disassem:dstate-put-inst-prop dstate 'rex-r))
245   (when (plusp (logand value #b0010))
246     (sb!disassem:dstate-put-inst-prop dstate 'rex-x))
247   (when (plusp (logand value #b0001))
248     (sb!disassem:dstate-put-inst-prop dstate 'rex-b))
249   value)
250
251 ;;; This prefilter is used solely for its side effect, namely to put
252 ;;; the property OPERAND-SIZE-8 into the DSTATE if VALUE is 0.
253 (defun prefilter-width (value dstate)
254   (declare (type bit value)
255            (type sb!disassem:disassem-state dstate))
256   (when (zerop value)
257     (sb!disassem:dstate-put-inst-prop dstate 'operand-size-8))
258   value)
259
260 ;;; This prefilter is used solely for its side effect, namely to put
261 ;;; the property OPERAND-SIZE-16 into the DSTATE.
262 (defun prefilter-x66 (value dstate)
263   (declare (type (eql #x66) value)
264            (ignore value)
265            (type sb!disassem:disassem-state dstate))
266   (sb!disassem:dstate-put-inst-prop dstate 'operand-size-16))
267
268 ;;; A register field that can be extended by REX.R.
269 (defun prefilter-reg-r (value dstate)
270   (declare (type reg value)
271            (type sb!disassem:disassem-state dstate))
272   (if (sb!disassem::dstate-get-inst-prop dstate 'rex-r)
273       (+ value 8)
274       value))
275
276 ;;; A register field that can be extended by REX.B.
277 (defun prefilter-reg-b (value dstate)
278   (declare (type reg value)
279            (type sb!disassem:disassem-state dstate))
280   (if (sb!disassem::dstate-get-inst-prop dstate 'rex-b)
281       (+ value 8)
282       value))
283
284 ;;; Returns either an integer, meaning a register, or a list of
285 ;;; (BASE-REG OFFSET INDEX-REG INDEX-SCALE), where any component
286 ;;; may be missing or nil to indicate that it's not used or has the
287 ;;; obvious default value (e.g., 1 for the index-scale). VALUE is a list
288 ;;; of the mod and r/m field of the ModRM byte of the instruction.
289 ;;; Depending on VALUE a SIB byte and/or an offset may be read. The
290 ;;; REX.B bit from DSTATE is used to extend the sole register or the
291 ;;; BASE-REG to a full register, the REX.X bit does the same for the
292 ;;; INDEX-REG.
293 (defun prefilter-reg/mem (value dstate)
294   (declare (type list value)
295            (type sb!disassem:disassem-state dstate))
296   (let ((mod (first value))
297         (r/m (second value)))
298     (declare (type (unsigned-byte 2) mod)
299              (type (unsigned-byte 3) r/m))
300     (let ((full-reg (if (sb!disassem:dstate-get-inst-prop dstate 'rex-b)
301                         (+ r/m 8)
302                         r/m)))
303       (declare (type full-reg full-reg))
304       (cond ((= mod #b11)
305              ;; registers
306              full-reg)
307             ((= r/m #b100)
308              ;; sib byte
309              (let ((sib (sb!disassem:read-suffix 8 dstate)))
310                (declare (type (unsigned-byte 8) sib))
311                (let ((base-reg (ldb (byte 3 0) sib))
312                      (index-reg (ldb (byte 3 3) sib))
313                      (index-scale (ldb (byte 2 6) sib)))
314                  (declare (type (unsigned-byte 3) base-reg index-reg)
315                           (type (unsigned-byte 2) index-scale))
316                  (let* ((offset
317                          (case mod
318                                (#b00
319                                 (if (= base-reg #b101)
320                                     (sb!disassem:read-signed-suffix 32 dstate)
321                                   nil))
322                                (#b01
323                                 (sb!disassem:read-signed-suffix 8 dstate))
324                                (#b10
325                                 (sb!disassem:read-signed-suffix 32 dstate)))))
326                    (list (unless (and (= mod #b00) (= base-reg #b101))
327                            (if (sb!disassem:dstate-get-inst-prop dstate 'rex-b)
328                                (+ base-reg 8)
329                                base-reg))
330                          offset
331                          (unless (= index-reg #b100)
332                            (if (sb!disassem:dstate-get-inst-prop dstate 'rex-x)
333                                (+ index-reg 8)
334                                index-reg))
335                          (ash 1 index-scale))))))
336             ((and (= mod #b00) (= r/m #b101))
337              (list 'rip (sb!disassem:read-signed-suffix 32 dstate)))
338             ((= mod #b00)
339              (list full-reg))
340             ((= mod #b01)
341            (list full-reg (sb!disassem:read-signed-suffix 8 dstate)))
342           (t                            ; (= mod #b10)
343            (list full-reg (sb!disassem:read-signed-suffix 32 dstate)))))))
344
345 (defun read-address (value dstate)
346   (declare (ignore value))              ; always nil anyway
347   (sb!disassem:read-suffix (width-bits (inst-operand-size dstate)) dstate))
348
349 (defun width-bits (width)
350   (ecase width
351     (:byte 8)
352     (:word 16)
353     (:dword 32)
354     (:qword 64)))
355
356 ) ; EVAL-WHEN
357 \f
358 ;;;; disassembler argument types
359
360 ;;; Used to capture the lower four bits of the REX prefix.
361 (sb!disassem:define-arg-type wrxb
362   :prefilter #'prefilter-wrxb)
363
364 (sb!disassem:define-arg-type width
365   :prefilter #'prefilter-width
366   :printer (lambda (value stream dstate)
367              (declare (ignore value))
368              (princ (schar (symbol-name (inst-operand-size dstate)) 0)
369                     stream)))
370
371 ;;; Used to capture the effect of the #x66 operand size override prefix.
372 (sb!disassem:define-arg-type x66
373   :prefilter #'prefilter-x66)
374
375 (sb!disassem:define-arg-type displacement
376   :sign-extend t
377   :use-label #'offset-next
378   :printer (lambda (value stream dstate)
379              (sb!disassem:maybe-note-assembler-routine value nil dstate)
380              (print-label value stream dstate)))
381
382 (sb!disassem:define-arg-type accum
383   :printer (lambda (value stream dstate)
384              (declare (ignore value)
385                       (type stream stream)
386                       (type sb!disassem:disassem-state dstate))
387              (print-reg 0 stream dstate)))
388
389 (sb!disassem:define-arg-type reg
390   :prefilter #'prefilter-reg-r
391   :printer #'print-reg)
392
393 (sb!disassem:define-arg-type reg-b
394   :prefilter #'prefilter-reg-b
395   :printer #'print-reg)
396
397 (sb!disassem:define-arg-type reg-b-default-qword
398   :prefilter #'prefilter-reg-b
399   :printer #'print-reg-default-qword)
400
401 (sb!disassem:define-arg-type imm-addr
402   :prefilter #'read-address
403   :printer #'print-label)
404
405 ;;; Normally, immediate values for an operand size of :qword are of size
406 ;;; :dword and are sign-extended to 64 bits. For an exception, see the
407 ;;; argument type definition following this one.
408 (sb!disassem:define-arg-type signed-imm-data
409   :prefilter (lambda (value dstate)
410                (declare (ignore value)) ; always nil anyway
411                (let ((width (width-bits (inst-operand-size dstate))))
412                  (when (= width 64)
413                    (setf width 32))
414                  (sb!disassem:read-signed-suffix width dstate))))
415
416 ;;; Used by the variant of the MOV instruction with opcode B8 which can
417 ;;; move immediates of all sizes (i.e. including :qword) into a
418 ;;; register.
419 (sb!disassem:define-arg-type signed-imm-data-upto-qword
420   :prefilter (lambda (value dstate)
421                (declare (ignore value)) ; always nil anyway
422                (sb!disassem:read-signed-suffix
423                 (width-bits (inst-operand-size dstate))
424                 dstate)))
425
426 ;;; Used by those instructions that have a default operand size of
427 ;;; :qword. Nevertheless the immediate is at most of size :dword.
428 ;;; The only instruction of this kind having a variant with an immediate
429 ;;; argument is PUSH.
430 (sb!disassem:define-arg-type signed-imm-data-default-qword
431   :prefilter (lambda (value dstate)
432                (declare (ignore value)) ; always nil anyway
433                (let ((width (width-bits
434                              (inst-operand-size-default-qword dstate))))
435                  (when (= width 64)
436                    (setf width 32))
437                  (sb!disassem:read-signed-suffix width dstate))))
438
439 (sb!disassem:define-arg-type signed-imm-byte
440   :prefilter (lambda (value dstate)
441                (declare (ignore value)) ; always nil anyway
442                (sb!disassem:read-signed-suffix 8 dstate)))
443
444 (sb!disassem:define-arg-type imm-byte
445   :prefilter (lambda (value dstate)
446                (declare (ignore value)) ; always nil anyway
447                (sb!disassem:read-suffix 8 dstate)))
448
449 ;;; needed for the ret imm16 instruction
450 (sb!disassem:define-arg-type imm-word-16
451   :prefilter (lambda (value dstate)
452                (declare (ignore value)) ; always nil anyway
453                (sb!disassem:read-suffix 16 dstate)))
454
455 (sb!disassem:define-arg-type reg/mem
456   :prefilter #'prefilter-reg/mem
457   :printer #'print-reg/mem)
458 (sb!disassem:define-arg-type sized-reg/mem
459   ;; Same as reg/mem, but prints an explicit size indicator for
460   ;; memory references.
461   :prefilter #'prefilter-reg/mem
462   :printer #'print-sized-reg/mem)
463
464 ;;; Arguments of type reg/mem with a fixed size.
465 (sb!disassem:define-arg-type sized-byte-reg/mem
466   :prefilter #'prefilter-reg/mem
467   :printer #'print-sized-byte-reg/mem)
468 (sb!disassem:define-arg-type sized-word-reg/mem
469   :prefilter #'prefilter-reg/mem
470   :printer #'print-sized-word-reg/mem)
471 (sb!disassem:define-arg-type sized-dword-reg/mem
472   :prefilter #'prefilter-reg/mem
473   :printer #'print-sized-dword-reg/mem)
474
475 ;;; Same as sized-reg/mem, but with a default operand size of :qword.
476 (sb!disassem:define-arg-type sized-reg/mem-default-qword
477   :prefilter #'prefilter-reg/mem
478   :printer #'print-sized-reg/mem-default-qword)
479
480 ;;; XMM registers
481 (sb!disassem:define-arg-type xmmreg
482   :prefilter #'prefilter-reg-r
483   :printer #'print-xmmreg)
484
485 (sb!disassem:define-arg-type xmmreg-b
486   :prefilter #'prefilter-reg-b
487   :printer #'print-xmmreg)
488
489 (sb!disassem:define-arg-type xmmreg/mem
490   :prefilter #'prefilter-reg/mem
491   :printer #'print-xmmreg/mem)
492
493 (sb!disassem:define-arg-type sized-xmmreg/mem
494   :prefilter #'prefilter-reg/mem
495   :printer #'print-sized-xmmreg/mem)
496
497
498 (eval-when (:compile-toplevel :load-toplevel :execute)
499 (defparameter *conditions*
500   '((:o . 0)
501     (:no . 1)
502     (:b . 2) (:nae . 2) (:c . 2)
503     (:nb . 3) (:ae . 3) (:nc . 3)
504     (:eq . 4) (:e . 4) (:z . 4)
505     (:ne . 5) (:nz . 5)
506     (:be . 6) (:na . 6)
507     (:nbe . 7) (:a . 7)
508     (:s . 8)
509     (:ns . 9)
510     (:p . 10) (:pe . 10)
511     (:np . 11) (:po . 11)
512     (:l . 12) (:nge . 12)
513     (:nl . 13) (:ge . 13)
514     (:le . 14) (:ng . 14)
515     (:nle . 15) (:g . 15)))
516 (defparameter *condition-name-vec*
517   (let ((vec (make-array 16 :initial-element nil)))
518     (dolist (cond *conditions*)
519       (when (null (aref vec (cdr cond)))
520         (setf (aref vec (cdr cond)) (car cond))))
521     vec))
522 ) ; EVAL-WHEN
523
524 ;;; SSE shuffle patterns. The names end in the number of bits of the
525 ;;; immediate byte that are used to encode the pattern and the radix
526 ;;; in which to print the value.
527 (macrolet ((define-sse-shuffle-arg-type (name format-string)
528                `(sb!disassem:define-arg-type ,name
529                   :type 'imm-byte
530                   :printer (lambda (value stream dstate)
531                              (declare (type (unsigned-byte 8) value)
532                                       (type stream stream)
533                                       (ignore dstate))
534                              (format stream ,format-string value)))))
535   (define-sse-shuffle-arg-type sse-shuffle-pattern-2-2 "#b~2,'0B")
536   (define-sse-shuffle-arg-type sse-shuffle-pattern-8-4 "#4r~4,4,'0R"))
537
538 ;;; Set assembler parameters. (In CMU CL, this was done with
539 ;;; a call to a macro DEF-ASSEMBLER-PARAMS.)
540 (eval-when (:compile-toplevel :load-toplevel :execute)
541   (setf sb!assem:*assem-scheduler-p* nil))
542
543 (sb!disassem:define-arg-type condition-code
544   :printer *condition-name-vec*)
545
546 (defun conditional-opcode (condition)
547   (cdr (assoc condition *conditions* :test #'eq)))
548 \f
549 ;;;; disassembler instruction formats
550
551 (eval-when (:compile-toplevel :execute)
552   (defun swap-if (direction field1 separator field2)
553     `(:if (,direction :constant 0)
554           (,field1 ,separator ,field2)
555           (,field2 ,separator ,field1))))
556
557 (sb!disassem:define-instruction-format (byte 8 :default-printer '(:name))
558   (op    :field (byte 8 0))
559   ;; optional fields
560   (accum :type 'accum)
561   (imm))
562
563 (sb!disassem:define-instruction-format (two-bytes 16
564                                         :default-printer '(:name))
565   (op :fields (list (byte 8 0) (byte 8 8))))
566
567 (sb!disassem:define-instruction-format (three-bytes 24
568                                         :default-printer '(:name))
569   (op :fields (list (byte 8 0) (byte 8 8) (byte 8 16))))
570
571 ;;; A one-byte instruction with a #x66 prefix, used to indicate an
572 ;;; operand size of :word.
573 (sb!disassem:define-instruction-format (x66-byte 16
574                                         :default-printer '(:name))
575   (x66   :field (byte 8 0) :value #x66)
576   (op    :field (byte 8 8)))
577
578 ;;; A one-byte instruction with a REX prefix, used to indicate an
579 ;;; operand size of :qword. REX.W must be 1, the other three bits are
580 ;;; ignored.
581 (sb!disassem:define-instruction-format (rex-byte 16
582                                         :default-printer '(:name))
583   (rex   :field (byte 5 3) :value #b01001)
584   (op    :field (byte 8 8)))
585
586 (sb!disassem:define-instruction-format (simple 8)
587   (op    :field (byte 7 1))
588   (width :field (byte 1 0) :type 'width)
589   ;; optional fields
590   (accum :type 'accum)
591   (imm))
592
593 (sb!disassem:define-instruction-format (rex-simple 16)
594   (rex     :field (byte 4 4)    :value #b0100)
595   (wrxb    :field (byte 4 0)    :type 'wrxb)
596   (op    :field (byte 7 9))
597   (width :field (byte 1 8) :type 'width)
598   ;; optional fields
599   (accum :type 'accum)
600   (imm))
601
602 ;;; Same as simple, but with direction bit
603 (sb!disassem:define-instruction-format (simple-dir 8 :include 'simple)
604   (op :field (byte 6 2))
605   (dir :field (byte 1 1)))
606
607 ;;; Same as simple, but with the immediate value occurring by default,
608 ;;; and with an appropiate printer.
609 (sb!disassem:define-instruction-format (accum-imm 8
610                                      :include 'simple
611                                      :default-printer '(:name
612                                                         :tab accum ", " imm))
613   (imm :type 'signed-imm-data))
614
615 (sb!disassem:define-instruction-format (rex-accum-imm 16
616                                      :include 'rex-simple
617                                      :default-printer '(:name
618                                                         :tab accum ", " imm))
619   (imm :type 'signed-imm-data))
620
621 (sb!disassem:define-instruction-format (reg-no-width 8
622                                      :default-printer '(:name :tab reg))
623   (op    :field (byte 5 3))
624   (reg   :field (byte 3 0) :type 'reg-b)
625   ;; optional fields
626   (accum :type 'accum)
627   (imm))
628
629 (sb!disassem:define-instruction-format (rex-reg-no-width 16
630                                      :default-printer '(:name :tab reg))
631   (rex     :field (byte 4 4)    :value #b0100)
632   (wrxb    :field (byte 4 0)    :type 'wrxb)
633   (op      :field (byte 5 11))
634   (reg     :field (byte 3 8)    :type 'reg-b)
635   ;; optional fields
636   (accum :type 'accum)
637   (imm))
638
639 ;;; Same as reg-no-width, but with a default operand size of :qword.
640 (sb!disassem:define-instruction-format (reg-no-width-default-qword 8
641                                         :include 'reg-no-width
642                                         :default-printer '(:name :tab reg))
643   (reg   :type 'reg-b-default-qword))
644
645 ;;; Same as rex-reg-no-width, but with a default operand size of :qword.
646 (sb!disassem:define-instruction-format (rex-reg-no-width-default-qword 16
647                                         :include 'rex-reg-no-width
648                                         :default-printer '(:name :tab reg))
649   (reg     :type 'reg-b-default-qword))
650
651 ;;; Adds a width field to reg-no-width. Note that we can't use
652 ;;; :INCLUDE 'REG-NO-WIDTH here to save typing because that would put
653 ;;; the WIDTH field last, but the prefilter for WIDTH must run before
654 ;;; the one for IMM to be able to determine the correct size of IMM.
655 (sb!disassem:define-instruction-format (reg 8
656                                         :default-printer '(:name :tab reg))
657   (op    :field (byte 4 4))
658   (width :field (byte 1 3) :type 'width)
659   (reg   :field (byte 3 0) :type 'reg-b)
660   ;; optional fields
661   (accum :type 'accum)
662   (imm))
663
664 (sb!disassem:define-instruction-format (rex-reg 16
665                                         :default-printer '(:name :tab reg))
666   (rex     :field (byte 4 4)    :value #b0100)
667   (wrxb    :field (byte 4 0)    :type 'wrxb)
668   (width   :field (byte 1 11)   :type 'width)
669   (op      :field (byte 4 12))
670   (reg     :field (byte 3 8)    :type 'reg-b)
671   ;; optional fields
672   (accum   :type 'accum)
673   (imm))
674
675 (sb!disassem:define-instruction-format (two-bytes 16
676                                         :default-printer '(:name))
677   (op :fields (list (byte 8 0) (byte 8 8))))
678
679 (sb!disassem:define-instruction-format (reg-reg/mem 16
680                                         :default-printer
681                                         `(:name :tab reg ", " reg/mem))
682   (op      :field (byte 7 1))
683   (width   :field (byte 1 0)    :type 'width)
684   (reg/mem :fields (list (byte 2 14) (byte 3 8))
685                                 :type 'reg/mem)
686   (reg     :field (byte 3 11)   :type 'reg)
687   ;; optional fields
688   (imm))
689
690 (sb!disassem:define-instruction-format (rex-reg-reg/mem 24
691                                         :default-printer
692                                         `(:name :tab reg ", " reg/mem))
693   (rex     :field (byte 4 4)    :value #b0100)
694   (wrxb    :field (byte 4 0)    :type 'wrxb)
695   (width   :field (byte 1 8)    :type 'width)
696   (op      :field (byte 7 9))
697   (reg/mem :fields (list (byte 2 22) (byte 3 16))
698                                 :type 'reg/mem)
699   (reg     :field (byte 3 19)   :type 'reg)
700   ;; optional fields
701   (imm))
702
703 ;;; same as reg-reg/mem, but with direction bit
704 (sb!disassem:define-instruction-format (reg-reg/mem-dir 16
705                                         :include 'reg-reg/mem
706                                         :default-printer
707                                         `(:name
708                                           :tab
709                                           ,(swap-if 'dir 'reg/mem ", " 'reg)))
710   (op  :field (byte 6 2))
711   (dir :field (byte 1 1)))
712
713 (sb!disassem:define-instruction-format (rex-reg-reg/mem-dir 24
714                                         :include 'rex-reg-reg/mem
715                                         :default-printer
716                                         `(:name
717                                           :tab
718                                           ,(swap-if 'dir 'reg/mem ", " 'reg)))
719   (op  :field (byte 6 10))
720   (dir :field (byte 1 9)))
721
722 (sb!disassem:define-instruction-format (x66-reg-reg/mem-dir 24
723                                         :default-printer
724                                         `(:name
725                                           :tab
726                                           ,(swap-if 'dir 'reg/mem ", " 'reg)))
727   (x66     :field (byte 8 0)    :type 'x66 :value #x66)
728   (op      :field (byte 6 10))
729   (dir     :field (byte 1 9))
730   (width   :field (byte 1 8)    :type 'width)
731   (reg/mem :fields (list (byte 2 22) (byte 3 16))
732                                 :type 'reg/mem)
733   (reg     :field (byte 3 19)   :type 'reg))
734
735 (sb!disassem:define-instruction-format (x66-rex-reg-reg/mem-dir 32
736                                         :default-printer
737                                         `(:name
738                                           :tab
739                                           ,(swap-if 'dir 'reg/mem ", " 'reg)))
740   (x66     :field (byte 8 0)    :type 'x66 :value #x66)
741   (rex     :field (byte 4 12)   :value #b0100)
742   (wrxb    :field (byte 4 8)    :type 'wrxb)
743   (op      :field (byte 6 18))
744   (dir     :field (byte 1 17))
745   (width   :field (byte 1 16)   :type 'width)
746   (reg/mem :fields (list (byte 2 30) (byte 3 24))
747                                 :type 'reg/mem)
748   (reg     :field (byte 3 27)   :type 'reg))
749
750 ;;; Same as reg-reg/mem, but uses the reg field as a second op code.
751 (sb!disassem:define-instruction-format (reg/mem 16
752                                         :default-printer '(:name :tab reg/mem))
753   (op      :fields (list (byte 7 1) (byte 3 11)))
754   (width   :field (byte 1 0)    :type 'width)
755   (reg/mem :fields (list (byte 2 14) (byte 3 8))
756                                 :type 'sized-reg/mem)
757   ;; optional fields
758   (imm))
759
760 (sb!disassem:define-instruction-format (rex-reg/mem 24
761                                         :default-printer '(:name :tab reg/mem))
762   (rex     :field (byte 4 4)    :value #b0100)
763   (wrxb    :field (byte 4 0)    :type 'wrxb)
764   (op      :fields (list (byte 7 9) (byte 3 19)))
765   (width   :field (byte 1 8)    :type 'width)
766   (reg/mem :fields (list (byte 2 22) (byte 3 16))
767                                 :type 'sized-reg/mem)
768   ;; optional fields
769   (imm))
770
771 ;;; Same as reg/mem, but without a width field and with a default
772 ;;; operand size of :qword.
773 (sb!disassem:define-instruction-format (reg/mem-default-qword 16
774                                         :default-printer '(:name :tab reg/mem))
775   (op      :fields (list (byte 8 0) (byte 3 11)))
776   (reg/mem :fields (list (byte 2 14) (byte 3 8))
777                                 :type 'sized-reg/mem-default-qword))
778
779 (sb!disassem:define-instruction-format (rex-reg/mem-default-qword 24
780                                         :default-printer '(:name :tab reg/mem))
781   (rex     :field (byte 4 4)    :value #b0100)
782   (wrxb    :field (byte 4 0)    :type 'wrxb)
783   (op      :fields (list (byte 8 8) (byte 3 19)))
784   (reg/mem :fields (list (byte 2 22) (byte 3 16))
785                                 :type 'sized-reg/mem-default-qword))
786
787 ;;; Same as reg/mem, but with the immediate value occurring by default,
788 ;;; and with an appropiate printer.
789 (sb!disassem:define-instruction-format (reg/mem-imm 16
790                                         :include 'reg/mem
791                                         :default-printer
792                                         '(:name :tab reg/mem ", " imm))
793   (reg/mem :type 'sized-reg/mem)
794   (imm     :type 'signed-imm-data))
795
796 (sb!disassem:define-instruction-format (rex-reg/mem-imm 24
797                                         :include 'rex-reg/mem
798                                         :default-printer
799                                         '(:name :tab reg/mem ", " imm))
800   (reg/mem :type 'sized-reg/mem)
801   (imm     :type 'signed-imm-data))
802
803 ;;; Same as reg/mem, but with using the accumulator in the default printer
804 (sb!disassem:define-instruction-format
805     (accum-reg/mem 16
806      :include 'reg/mem :default-printer '(:name :tab accum ", " reg/mem))
807   (reg/mem :type 'reg/mem)              ; don't need a size
808   (accum :type 'accum))
809
810 (sb!disassem:define-instruction-format (rex-accum-reg/mem 24
811                                         :include 'rex-reg/mem
812                                         :default-printer
813                                         '(:name :tab accum ", " reg/mem))
814   (reg/mem :type 'reg/mem)              ; don't need a size
815   (accum   :type 'accum))
816
817 ;;; Same as reg-reg/mem, but with a prefix of #b00001111
818 (sb!disassem:define-instruction-format (ext-reg-reg/mem 24
819                                         :default-printer
820                                         `(:name :tab reg ", " reg/mem))
821   (prefix  :field (byte 8 0)    :value #b00001111)
822   (op      :field (byte 7 9))
823   (width   :field (byte 1 8)    :type 'width)
824   (reg/mem :fields (list (byte 2 22) (byte 3 16))
825                                 :type 'reg/mem)
826   (reg     :field (byte 3 19)   :type 'reg)
827   ;; optional fields
828   (imm))
829
830 (sb!disassem:define-instruction-format (ext-reg-reg/mem-no-width 24
831                                         :default-printer
832                                         `(:name :tab reg ", " reg/mem))
833   (prefix  :field (byte 8 0)    :value #b00001111)
834   (op      :field (byte 8 8))
835   (reg/mem :fields (list (byte 2 22) (byte 3 16))
836                                 :type 'reg/mem)
837   (reg     :field (byte 3 19)   :type 'reg))
838
839 (sb!disassem:define-instruction-format (rex-ext-reg-reg/mem-no-width 32
840                                         :default-printer
841                                         `(:name :tab reg ", " reg/mem))
842   (rex     :field (byte 4 4)    :value #b0100)
843   (wrxb    :field (byte 4 0)    :type 'wrxb)
844   (prefix  :field (byte 8 8)    :value #b00001111)
845   (op      :field (byte 8 16))
846   (reg/mem :fields (list (byte 2 30) (byte 3 24))
847                                 :type 'reg/mem)
848   (reg     :field (byte 3 27)   :type 'reg))
849
850 (sb!disassem:define-instruction-format (ext-reg/mem-no-width 24
851                                         :default-printer
852                                         `(:name :tab reg/mem))
853   (prefix  :field (byte 8 0)    :value #b00001111)
854   (op      :fields (list (byte 8 8) (byte 3 19)))
855   (reg/mem :fields (list (byte 2 22) (byte 3 16))
856                                 :type 'reg/mem))
857
858 (sb!disassem:define-instruction-format (rex-ext-reg/mem-no-width 32
859                                         :default-printer
860                                         `(:name :tab reg/mem))
861   (rex     :field (byte 4 4)    :value #b0100)
862   (wrxb    :field (byte 4 0)    :type 'wrxb)
863   (prefix  :field (byte 8 8)    :value #b00001111)
864   (op      :fields (list (byte 8 16) (byte 3 27)))
865   (reg/mem :fields (list (byte 2 30) (byte 3 24))
866                                 :type 'reg/mem))
867
868 ;;; reg-no-width with #x0f prefix
869 (sb!disassem:define-instruction-format (ext-reg-no-width 16
870                                         :default-printer '(:name :tab reg))
871   (prefix  :field (byte 8 0)    :value #b00001111)
872   (op    :field (byte 5 11))
873   (reg   :field (byte 3 8) :type 'reg-b))
874
875 ;;; Same as reg/mem, but with a prefix of #b00001111
876 (sb!disassem:define-instruction-format (ext-reg/mem 24
877                                         :default-printer '(:name :tab reg/mem))
878   (prefix  :field (byte 8 0)    :value #b00001111)
879   (op      :fields (list (byte 7 9) (byte 3 19)))
880   (width   :field (byte 1 8)    :type 'width)
881   (reg/mem :fields (list (byte 2 22) (byte 3 16))
882                                 :type 'sized-reg/mem)
883   ;; optional fields
884   (imm))
885
886 (sb!disassem:define-instruction-format (ext-reg/mem-imm 24
887                                         :include 'ext-reg/mem
888                                         :default-printer
889                                         '(:name :tab reg/mem ", " imm))
890   (imm :type 'signed-imm-data))
891 \f
892 ;;;; XMM instructions
893
894 ;;; All XMM instructions use an extended opcode (#x0F as the first
895 ;;; opcode byte). Therefore in the following "EXT" in the name of the
896 ;;; instruction formats refers to the formats that have an additional
897 ;;; prefix (#x66, #xF2 or #xF3).
898
899 ;;; Instructions having an XMM register as the destination operand
900 ;;; and an XMM register or a memory location as the source operand.
901 ;;; The size of the operands is implicitly given by the instruction.
902 (sb!disassem:define-instruction-format (xmm-xmm/mem 24
903                                         :default-printer
904                                         '(:name :tab reg ", " reg/mem))
905   (x0f     :field (byte 8 0)    :value #x0f)
906   (op      :field (byte 8 8))
907   (reg/mem :fields (list (byte 2 22) (byte 3 16))
908                                 :type 'xmmreg/mem)
909   (reg     :field (byte 3 19)   :type 'xmmreg)
910   ;; optional fields
911   (imm))
912
913 (sb!disassem:define-instruction-format (rex-xmm-xmm/mem 32
914                                         :default-printer
915                                         '(:name :tab reg ", " reg/mem))
916   (rex     :field (byte 4 4)    :value #b0100)
917   (wrxb    :field (byte 4 0)    :type 'wrxb)
918   (x0f     :field (byte 8 8)    :value #x0f)
919   (op      :field (byte 8 16))
920   (reg/mem :fields (list (byte 2 30) (byte 3 24))
921                                 :type 'xmmreg/mem)
922   (reg     :field (byte 3 27)   :type 'xmmreg)
923   (imm))
924
925 (sb!disassem:define-instruction-format (ext-xmm-xmm/mem 32
926                                         :default-printer
927                                         '(:name :tab reg ", " reg/mem))
928   (prefix  :field (byte 8 0))
929   (x0f     :field (byte 8 8)    :value #x0f)
930   (op      :field (byte 8 16))
931   (reg/mem :fields (list (byte 2 30) (byte 3 24))
932                                 :type 'xmmreg/mem)
933   (reg     :field (byte 3 27)   :type 'xmmreg)
934   (imm))
935
936 (sb!disassem:define-instruction-format (ext-rex-xmm-xmm/mem 40
937                                         :default-printer
938                                         '(:name :tab reg ", " reg/mem))
939   (prefix  :field (byte 8 0))
940   (rex     :field (byte 4 12)   :value #b0100)
941   (wrxb    :field (byte 4 8)    :type 'wrxb)
942   (x0f     :field (byte 8 16)   :value #x0f)
943   (op      :field (byte 8 24))
944   (reg/mem :fields (list (byte 2 38) (byte 3 32))
945                                 :type 'xmmreg/mem)
946   (reg     :field (byte 3 35)   :type 'xmmreg)
947   (imm))
948
949 ;;; Same as xmm-xmm/mem etc., but with direction bit.
950
951 (sb!disassem:define-instruction-format (ext-xmm-xmm/mem-dir 32
952                                         :include 'ext-xmm-xmm/mem
953                                         :default-printer
954                                         `(:name
955                                           :tab
956                                           ,(swap-if 'dir 'reg ", " 'reg/mem)))
957   (op      :field (byte 7 17))
958   (dir     :field (byte 1 16)))
959
960 (sb!disassem:define-instruction-format (ext-rex-xmm-xmm/mem-dir 40
961                                         :include 'ext-rex-xmm-xmm/mem
962                                         :default-printer
963                                         `(:name
964                                           :tab
965                                           ,(swap-if 'dir 'reg ", " 'reg/mem)))
966   (op      :field (byte 7 25))
967   (dir     :field (byte 1 24)))
968
969 ;;; Instructions having an XMM register as one operand
970 ;;; and a constant (unsigned) byte as the other.
971
972 (sb!disassem:define-instruction-format (ext-xmm-imm 32
973                                         :default-printer
974                                         '(:name :tab reg/mem ", " imm))
975   (prefix  :field (byte 8 0))
976   (x0f     :field (byte 8 8)   :value #x0f)
977   (op      :field (byte 8 16))
978   (/i      :field (byte 3 27))
979   (b11     :field (byte 2 30) :value #b11)
980   (reg/mem :field (byte 3 24)
981            :type 'xmmreg-b)
982   (imm     :type 'imm-byte))
983
984 (sb!disassem:define-instruction-format (ext-rex-xmm-imm 40
985                                         :default-printer
986                                         '(:name :tab reg/mem ", " imm))
987   (prefix  :field (byte 8 0))
988   (rex     :field (byte 4 12)   :value #b0100)
989   (wrxb    :field (byte 4 8)    :type 'wrxb)
990   (x0f     :field (byte 8 16)   :value #x0f)
991   (op      :field (byte 8 24))
992   (/i      :field (byte 3 35))
993   (b11     :field (byte 2 38) :value #b11)
994   (reg/mem :field (byte 3 32)
995            :type 'xmmreg-b)
996   (imm     :type 'imm-byte))
997
998 ;;; Instructions having an XMM register as one operand and a general-
999 ;;; -purpose register or a memory location as the other operand.
1000
1001 (sb!disassem:define-instruction-format (xmm-reg/mem 24
1002                                         :default-printer
1003                                         '(:name :tab reg ", " reg/mem))
1004   (x0f     :field (byte 8 0)    :value #x0f)
1005   (op      :field (byte 8 8))
1006   (reg/mem :fields (list (byte 2 22) (byte 3 16))
1007            :type 'sized-reg/mem)
1008   (reg     :field (byte 3 19)   :type 'xmmreg))
1009
1010 (sb!disassem:define-instruction-format (rex-xmm-reg/mem 32
1011                                         :default-printer
1012                                         '(:name :tab reg ", " reg/mem))
1013   (rex     :field (byte 4 4)   :value #b0100)
1014   (wrxb    :field (byte 4 0)    :type 'wrxb)
1015   (x0f     :field (byte 8 8)   :value #x0f)
1016   (op      :field (byte 8 16))
1017   (reg/mem :fields (list (byte 2 30) (byte 3 24))
1018                                 :type 'sized-reg/mem)
1019   (reg     :field (byte 3 27)   :type 'xmmreg))
1020
1021 (sb!disassem:define-instruction-format (ext-xmm-reg/mem 32
1022                                         :default-printer
1023                                         '(:name :tab reg ", " reg/mem))
1024   (prefix  :field (byte 8 0))
1025   (x0f     :field (byte 8 8)    :value #x0f)
1026   (op      :field (byte 8 16))
1027   (reg/mem :fields (list (byte 2 30) (byte 3 24))
1028                                 :type 'sized-reg/mem)
1029   (reg     :field (byte 3 27)   :type 'xmmreg))
1030
1031 (sb!disassem:define-instruction-format (ext-rex-xmm-reg/mem 40
1032                                         :default-printer
1033                                         '(:name :tab reg ", " reg/mem))
1034   (prefix  :field (byte 8 0))
1035   (rex     :field (byte 4 12)   :value #b0100)
1036   (wrxb    :field (byte 4 8)    :type 'wrxb)
1037   (x0f     :field (byte 8 16)   :value #x0f)
1038   (op      :field (byte 8 24))
1039   (reg/mem :fields (list (byte 2 38) (byte 3 32))
1040                                 :type 'sized-reg/mem)
1041   (reg     :field (byte 3 35)   :type 'xmmreg))
1042
1043 ;;; Instructions having a general-purpose register as one operand and an
1044 ;;; XMM register or a memory location as the other operand.
1045
1046 (sb!disassem:define-instruction-format (reg-xmm/mem 24
1047                                         :default-printer
1048                                         '(:name :tab reg ", " reg/mem))
1049   (x0f     :field (byte 8 0)    :value #x0f)
1050   (op      :field (byte 8 8))
1051   (reg/mem :fields (list (byte 2 22) (byte 3 16))
1052                                 :type 'sized-xmmreg/mem)
1053   (reg     :field (byte 3 19)   :type 'reg))
1054
1055 (sb!disassem:define-instruction-format (rex-reg-xmm/mem 32
1056                                         :default-printer
1057                                         '(:name :tab reg ", " reg/mem))
1058   (rex     :field (byte 4 4)   :value #b0100)
1059   (wrxb    :field (byte 4 0)    :type 'wrxb)
1060   (x0f     :field (byte 8 8)   :value #x0f)
1061   (op      :field (byte 8 16))
1062   (reg/mem :fields (list (byte 2 30) (byte 3 24))
1063                                 :type 'sized-xmmreg/mem)
1064   (reg     :field (byte 3 27)   :type 'reg))
1065
1066 (sb!disassem:define-instruction-format (ext-reg-xmm/mem 32
1067                                         :default-printer
1068                                         '(:name :tab reg ", " reg/mem))
1069   (prefix  :field (byte 8 0))
1070   (x0f     :field (byte 8 8)    :value #x0f)
1071   (op      :field (byte 8 16))
1072   (reg/mem :fields (list (byte 2 30) (byte 3 24))
1073                                 :type 'sized-xmmreg/mem)
1074   (reg     :field (byte 3 27)   :type 'reg))
1075
1076 (sb!disassem:define-instruction-format (ext-rex-reg-xmm/mem 40
1077                                         :default-printer
1078                                         '(:name :tab reg ", " reg/mem))
1079   (prefix  :field (byte 8 0))
1080   (rex     :field (byte 4 12)   :value #b0100)
1081   (wrxb    :field (byte 4 8)    :type 'wrxb)
1082   (x0f     :field (byte 8 16)   :value #x0f)
1083   (op      :field (byte 8 24))
1084   (reg/mem :fields (list (byte 2 38) (byte 3 32))
1085                                 :type 'sized-xmmreg/mem)
1086   (reg     :field (byte 3 35)   :type 'reg))
1087
1088 ;; XMM comparison instruction
1089
1090 (eval-when (:compile-toplevel :load-toplevel :execute)
1091   (defparameter *sse-conditions* #(:eq :lt :le :unord :neq :nlt :nle :ord)))
1092
1093 (sb!disassem:define-arg-type sse-condition-code
1094   ;; Inherit the prefilter from IMM-BYTE to READ-SUFFIX the byte.
1095   :type 'imm-byte
1096   :printer *sse-conditions*)
1097
1098 (sb!disassem:define-instruction-format (string-op 8
1099                                      :include 'simple
1100                                      :default-printer '(:name width)))
1101
1102 (sb!disassem:define-instruction-format (rex-string-op 16
1103                                      :include 'rex-simple
1104                                      :default-printer '(:name width)))
1105
1106 (sb!disassem:define-instruction-format (short-cond-jump 16)
1107   (op    :field (byte 4 4))
1108   (cc    :field (byte 4 0) :type 'condition-code)
1109   (label :field (byte 8 8) :type 'displacement))
1110
1111 (sb!disassem:define-instruction-format (short-jump 16
1112                                      :default-printer '(:name :tab label))
1113   (const :field (byte 4 4) :value #b1110)
1114   (op    :field (byte 4 0))
1115   (label :field (byte 8 8) :type 'displacement))
1116
1117 (sb!disassem:define-instruction-format (near-cond-jump 16)
1118   (op    :fields (list (byte 8 0) (byte 4 12)) :value '(#b00001111 #b1000))
1119   (cc    :field (byte 4 8) :type 'condition-code)
1120   ;; The disassembler currently doesn't let you have an instruction > 32 bits
1121   ;; long, so we fake it by using a prefilter to read the offset.
1122   (label :type 'displacement
1123          :prefilter (lambda (value dstate)
1124                       (declare (ignore value)) ; always nil anyway
1125                       (sb!disassem:read-signed-suffix 32 dstate))))
1126
1127 (sb!disassem:define-instruction-format (near-jump 8
1128                                      :default-printer '(:name :tab label))
1129   (op    :field (byte 8 0))
1130   ;; The disassembler currently doesn't let you have an instruction > 32 bits
1131   ;; long, so we fake it by using a prefilter to read the address.
1132   (label :type 'displacement
1133          :prefilter (lambda (value dstate)
1134                       (declare (ignore value)) ; always nil anyway
1135                       (sb!disassem:read-signed-suffix 32 dstate))))
1136
1137
1138 (sb!disassem:define-instruction-format (cond-set 24
1139                                      :default-printer '('set cc :tab reg/mem))
1140   (prefix :field (byte 8 0) :value #b00001111)
1141   (op    :field (byte 4 12) :value #b1001)
1142   (cc    :field (byte 4 8) :type 'condition-code)
1143   (reg/mem :fields (list (byte 2 22) (byte 3 16))
1144            :type 'sized-byte-reg/mem)
1145   (reg     :field (byte 3 19)   :value #b000))
1146
1147 (sb!disassem:define-instruction-format (cond-move 24
1148                                      :default-printer
1149                                         '('cmov cc :tab reg ", " reg/mem))
1150   (prefix  :field (byte 8 0)    :value #b00001111)
1151   (op      :field (byte 4 12)   :value #b0100)
1152   (cc      :field (byte 4 8)    :type 'condition-code)
1153   (reg/mem :fields (list (byte 2 22) (byte 3 16))
1154                                 :type 'reg/mem)
1155   (reg     :field (byte 3 19)   :type 'reg))
1156
1157 (sb!disassem:define-instruction-format (rex-cond-move 32
1158                                      :default-printer
1159                                         '('cmov cc :tab reg ", " reg/mem))
1160   (rex     :field (byte 4 4)   :value #b0100)
1161   (wrxb    :field (byte 4 0)    :type 'wrxb)
1162   (prefix  :field (byte 8 8)    :value #b00001111)
1163   (op      :field (byte 4 20)   :value #b0100)
1164   (cc      :field (byte 4 16)    :type 'condition-code)
1165   (reg/mem :fields (list (byte 2 30) (byte 3 24))
1166                                 :type 'reg/mem)
1167   (reg     :field (byte 3 27)   :type 'reg))
1168
1169 (sb!disassem:define-instruction-format (enter-format 32
1170                                      :default-printer '(:name
1171                                                         :tab disp
1172                                                         (:unless (:constant 0)
1173                                                           ", " level)))
1174   (op :field (byte 8 0))
1175   (disp :field (byte 16 8))
1176   (level :field (byte 8 24)))
1177
1178 ;;; Single byte instruction with an immediate byte argument.
1179 (sb!disassem:define-instruction-format (byte-imm 16
1180                                      :default-printer '(:name :tab code))
1181  (op :field (byte 8 0))
1182  (code :field (byte 8 8)))
1183
1184 ;;; Two byte instruction with an immediate byte argument.
1185 ;;;
1186 (sb!disassem:define-instruction-format (word-imm 24
1187                                      :default-printer '(:name :tab code))
1188   (op :field (byte 16 0))
1189   (code :field (byte 8 16)))
1190
1191 \f
1192 ;;;; primitive emitters
1193
1194 (define-bitfield-emitter emit-word 16
1195   (byte 16 0))
1196
1197 (define-bitfield-emitter emit-dword 32
1198   (byte 32 0))
1199
1200 ;;; Most uses of dwords are as displacements or as immediate values in
1201 ;;; 64-bit operations. In these cases they are sign-extended to 64 bits.
1202 ;;; EMIT-DWORD is unsuitable there because it accepts values of type
1203 ;;; (OR (SIGNED-BYTE 32) (UNSIGNED-BYTE 32)), so we provide a more
1204 ;;; restricted emitter here.
1205 (defun emit-signed-dword (segment value)
1206   (declare (type segment segment)
1207            (type (signed-byte 32) value))
1208   (declare (inline emit-dword))
1209   (emit-dword segment value))
1210
1211 (define-bitfield-emitter emit-qword 64
1212   (byte 64 0))
1213
1214 (define-bitfield-emitter emit-byte-with-reg 8
1215   (byte 5 3) (byte 3 0))
1216
1217 (define-bitfield-emitter emit-mod-reg-r/m-byte 8
1218   (byte 2 6) (byte 3 3) (byte 3 0))
1219
1220 (define-bitfield-emitter emit-sib-byte 8
1221   (byte 2 6) (byte 3 3) (byte 3 0))
1222
1223 (define-bitfield-emitter emit-rex-byte 8
1224   (byte 4 4) (byte 1 3) (byte 1 2) (byte 1 1) (byte 1 0))
1225
1226
1227 \f
1228 ;;;; fixup emitters
1229
1230 (defun emit-absolute-fixup (segment fixup &optional quad-p)
1231   (note-fixup segment (if quad-p :absolute64 :absolute) fixup)
1232   (let ((offset (fixup-offset fixup)))
1233     (if (label-p offset)
1234         (emit-back-patch segment
1235                          (if quad-p 8 4)
1236                          (lambda (segment posn)
1237                            (declare (ignore posn))
1238                            (let ((val  (- (+ (component-header-length)
1239                                              (or (label-position offset)
1240                                                  0))
1241                                           other-pointer-lowtag)))
1242                              (if quad-p
1243                                  (emit-qword segment val)
1244                                  (emit-signed-dword segment val)))))
1245         (if quad-p
1246             (emit-qword segment (or offset 0))
1247             (emit-signed-dword segment (or offset 0))))))
1248
1249 (defun emit-relative-fixup (segment fixup)
1250   (note-fixup segment :relative fixup)
1251   (emit-signed-dword segment (or (fixup-offset fixup) 0)))
1252
1253 \f
1254 ;;;; the effective-address (ea) structure
1255
1256 (defun reg-tn-encoding (tn)
1257   (declare (type tn tn))
1258   ;; ea only has space for three bits of register number: regs r8
1259   ;; and up are selected by a REX prefix byte which caller is responsible
1260   ;; for having emitted where necessary already
1261   (ecase (sb-name (sc-sb (tn-sc tn)))
1262     (registers
1263      (let ((offset (mod (tn-offset tn) 16)))
1264        (logior (ash (logand offset 1) 2)
1265                (ash offset -1))))
1266     (float-registers
1267      (mod (tn-offset tn) 8))))
1268
1269 (defstruct (ea (:constructor make-ea (size &key base index scale disp))
1270                (:copier nil))
1271   ;; note that we can represent an EA with a QWORD size, but EMIT-EA
1272   ;; can't actually emit it on its own: caller also needs to emit REX
1273   ;; prefix
1274   (size nil :type (member :byte :word :dword :qword))
1275   (base nil :type (or tn null))
1276   (index nil :type (or tn null))
1277   (scale 1 :type (member 1 2 4 8))
1278   (disp 0 :type (or (unsigned-byte 32) (signed-byte 32) fixup)))
1279 (def!method print-object ((ea ea) stream)
1280   (cond ((or *print-escape* *print-readably*)
1281          (print-unreadable-object (ea stream :type t)
1282            (format stream
1283                    "~S~@[ base=~S~]~@[ index=~S~]~@[ scale=~S~]~@[ disp=~S~]"
1284                    (ea-size ea)
1285                    (ea-base ea)
1286                    (ea-index ea)
1287                    (let ((scale (ea-scale ea)))
1288                      (if (= scale 1) nil scale))
1289                    (ea-disp ea))))
1290         (t
1291          (format stream "~A PTR [" (symbol-name (ea-size ea)))
1292          (when (ea-base ea)
1293            (write-string (sb!c::location-print-name (ea-base ea)) stream)
1294            (when (ea-index ea)
1295              (write-string "+" stream)))
1296          (when (ea-index ea)
1297            (write-string (sb!c::location-print-name (ea-index ea)) stream))
1298          (unless (= (ea-scale ea) 1)
1299            (format stream "*~A" (ea-scale ea)))
1300          (typecase (ea-disp ea)
1301            (null)
1302            (integer
1303             (format stream "~@D" (ea-disp ea)))
1304            (t
1305             (format stream "+~A" (ea-disp ea))))
1306          (write-char #\] stream))))
1307
1308 (defun emit-constant-tn-rip (segment constant-tn reg remaining-bytes)
1309   ;; AMD64 doesn't currently have a code object register to use as a
1310   ;; base register for constant access. Instead we use RIP-relative
1311   ;; addressing. The offset from the SIMPLE-FUN-HEADER to the instruction
1312   ;; is passed to the backpatch callback. In addition we need the offset
1313   ;; from the start of the function header to the slot in the CODE-HEADER
1314   ;; that stores the constant. Since we don't know where the code header
1315   ;; starts, instead count backwards from the function header.
1316   (let* ((2comp (component-info *component-being-compiled*))
1317          (constants (ir2-component-constants 2comp))
1318          (len (length constants))
1319          ;; Both CODE-HEADER and SIMPLE-FUN-HEADER are 16-byte aligned.
1320          ;; If there are an even amount of constants, there will be
1321          ;; an extra qword of padding before the function header, which
1322          ;; needs to be adjusted for. XXX: This will break if new slots
1323          ;; are added to the code header.
1324          (offset (* (- (+ len (if (evenp len)
1325                                   1
1326                                   2))
1327                        (tn-offset constant-tn))
1328                     n-word-bytes)))
1329     ;; RIP-relative addressing
1330     (emit-mod-reg-r/m-byte segment #b00 reg #b101)
1331     (emit-back-patch segment
1332                      4
1333                      (lambda (segment posn)
1334                        ;; The addressing is relative to end of instruction,
1335                        ;; i.e. the end of this dword. Hence the + 4.
1336                        (emit-signed-dword segment
1337                                           (+ 4 remaining-bytes
1338                                              (- (+ offset posn)))))))
1339   (values))
1340
1341 (defun emit-label-rip (segment fixup reg remaining-bytes)
1342   (let ((label (fixup-offset fixup)))
1343     ;; RIP-relative addressing
1344     (emit-mod-reg-r/m-byte segment #b00 reg #b101)
1345     (emit-back-patch segment
1346                      4
1347                      (lambda (segment posn)
1348                        (emit-signed-dword segment
1349                                           (- (label-position label)
1350                                              (+ posn 4 remaining-bytes))))))
1351   (values))
1352
1353 (defun emit-ea (segment thing reg &key allow-constants (remaining-bytes 0))
1354   (etypecase thing
1355     (tn
1356      ;; this would be eleganter if we had a function that would create
1357      ;; an ea given a tn
1358      (ecase (sb-name (sc-sb (tn-sc thing)))
1359        ((registers float-registers)
1360         (emit-mod-reg-r/m-byte segment #b11 reg (reg-tn-encoding thing)))
1361        (stack
1362         ;; Convert stack tns into an index off RBP.
1363         (let ((disp (frame-byte-offset (tn-offset thing))))
1364           (cond ((<= -128 disp 127)
1365                  (emit-mod-reg-r/m-byte segment #b01 reg #b101)
1366                  (emit-byte segment disp))
1367                 (t
1368                  (emit-mod-reg-r/m-byte segment #b10 reg #b101)
1369                  (emit-signed-dword segment disp)))))
1370        (constant
1371         (unless allow-constants
1372           ;; Why?
1373           (error
1374            "Constant TNs can only be directly used in MOV, PUSH, and CMP."))
1375         (emit-constant-tn-rip segment thing reg remaining-bytes))))
1376     (ea
1377      (let* ((base (ea-base thing))
1378             (index (ea-index thing))
1379             (scale (ea-scale thing))
1380             (disp (ea-disp thing))
1381             (mod (cond ((or (null base)
1382                             (and (eql disp 0)
1383                                  (not (= (reg-tn-encoding base) #b101))))
1384                         #b00)
1385                        ((and (fixnump disp) (<= -128 disp 127))
1386                         #b01)
1387                        (t
1388                         #b10)))
1389             (r/m (cond (index #b100)
1390                        ((null base) #b101)
1391                        (t (reg-tn-encoding base)))))
1392        (when (and (fixup-p disp)
1393                   (label-p (fixup-offset disp)))
1394          (aver (null base))
1395          (aver (null index))
1396          (return-from emit-ea (emit-ea segment disp reg
1397                                        :allow-constants allow-constants
1398                                        :remaining-bytes remaining-bytes)))
1399        (when (and (= mod 0) (= r/m #b101))
1400          ;; this is rip-relative in amd64, so we'll use a sib instead
1401          (setf r/m #b100 scale 1))
1402        (emit-mod-reg-r/m-byte segment mod reg r/m)
1403        (when (= r/m #b100)
1404          (let ((ss (1- (integer-length scale)))
1405                (index (if (null index)
1406                           #b100
1407                           (let ((index (reg-tn-encoding index)))
1408                             (if (= index #b100)
1409                                 (error "can't index off of ESP")
1410                                 index))))
1411                (base (if (null base)
1412                          #b101
1413                          (reg-tn-encoding base))))
1414            (emit-sib-byte segment ss index base)))
1415        (cond ((= mod #b01)
1416               (emit-byte segment disp))
1417              ((or (= mod #b10) (null base))
1418               (if (fixup-p disp)
1419                   (emit-absolute-fixup segment disp)
1420                   (emit-signed-dword segment disp))))))
1421     (fixup
1422      (typecase (fixup-offset thing)
1423        (label
1424         (emit-label-rip segment thing reg remaining-bytes))
1425        (t
1426         (emit-mod-reg-r/m-byte segment #b00 reg #b100)
1427         (emit-sib-byte segment 0 #b100 #b101)
1428         (emit-absolute-fixup segment thing))))))
1429
1430 (defun byte-reg-p (thing)
1431   (and (tn-p thing)
1432        (eq (sb-name (sc-sb (tn-sc thing))) 'registers)
1433        (member (sc-name (tn-sc thing)) *byte-sc-names*)
1434        t))
1435
1436 (defun byte-ea-p (thing)
1437   (typecase thing
1438     (ea (eq (ea-size thing) :byte))
1439     (tn
1440      (and (member (sc-name (tn-sc thing)) *byte-sc-names*) t))
1441     (t nil)))
1442
1443 (defun word-reg-p (thing)
1444   (and (tn-p thing)
1445        (eq (sb-name (sc-sb (tn-sc thing))) 'registers)
1446        (member (sc-name (tn-sc thing)) *word-sc-names*)
1447        t))
1448
1449 (defun word-ea-p (thing)
1450   (typecase thing
1451     (ea (eq (ea-size thing) :word))
1452     (tn (and (member (sc-name (tn-sc thing)) *word-sc-names*) t))
1453     (t nil)))
1454
1455 (defun dword-reg-p (thing)
1456   (and (tn-p thing)
1457        (eq (sb-name (sc-sb (tn-sc thing))) 'registers)
1458        (member (sc-name (tn-sc thing)) *dword-sc-names*)
1459        t))
1460
1461 (defun dword-ea-p (thing)
1462   (typecase thing
1463     (ea (eq (ea-size thing) :dword))
1464     (tn
1465      (and (member (sc-name (tn-sc thing)) *dword-sc-names*) t))
1466     (t nil)))
1467
1468 (defun qword-reg-p (thing)
1469   (and (tn-p thing)
1470        (eq (sb-name (sc-sb (tn-sc thing))) 'registers)
1471        (member (sc-name (tn-sc thing)) *qword-sc-names*)
1472        t))
1473
1474 (defun qword-ea-p (thing)
1475   (typecase thing
1476     (ea (eq (ea-size thing) :qword))
1477     (tn
1478      (and (member (sc-name (tn-sc thing)) *qword-sc-names*) t))
1479     (t nil)))
1480
1481 ;;; Return true if THING is a general-purpose register TN.
1482 (defun register-p (thing)
1483   (and (tn-p thing)
1484        (eq (sb-name (sc-sb (tn-sc thing))) 'registers)))
1485
1486 (defun accumulator-p (thing)
1487   (and (register-p thing)
1488        (= (tn-offset thing) 0)))
1489
1490 ;;; Return true if THING is an XMM register TN.
1491 (defun xmm-register-p (thing)
1492   (and (tn-p thing)
1493        (eq (sb-name (sc-sb (tn-sc thing))) 'float-registers)))
1494
1495 \f
1496 ;;;; utilities
1497
1498 (def!constant +operand-size-prefix-byte+ #b01100110)
1499
1500 (defun maybe-emit-operand-size-prefix (segment size)
1501   (unless (or (eq size :byte)
1502               (eq size :qword)          ; REX prefix handles this
1503               (eq size +default-operand-size+))
1504     (emit-byte segment +operand-size-prefix-byte+)))
1505
1506 ;;; A REX prefix must be emitted if at least one of the following
1507 ;;; conditions is true:
1508 ;;  1. The operand size is :QWORD and the default operand size of the
1509 ;;     instruction is not :QWORD.
1510 ;;; 2. The instruction references an extended register.
1511 ;;; 3. The instruction references one of the byte registers SIL, DIL,
1512 ;;;    SPL or BPL.
1513
1514 ;;; Emit a REX prefix if necessary. OPERAND-SIZE is used to determine
1515 ;;; whether to set REX.W. Callers pass it explicitly as :DO-NOT-SET if
1516 ;;; this should not happen, for example because the instruction's
1517 ;;; default operand size is qword. R, X and B are NIL or TNs specifying
1518 ;;; registers the encodings of which are extended with the REX.R, REX.X
1519 ;;; and REX.B bit, respectively. To determine whether one of the byte
1520 ;;; registers is used that can only be accessed using a REX prefix, we
1521 ;;; need only to test R and B, because X is only used for the index
1522 ;;; register of an effective address and therefore never byte-sized.
1523 ;;; For R we can avoid to calculate the size of the TN because it is
1524 ;;; always OPERAND-SIZE. The size of B must be calculated here because
1525 ;;; B can be address-sized (if it is the base register of an effective
1526 ;;; address), of OPERAND-SIZE (if the instruction operates on two
1527 ;;; registers) or of some different size (in the instructions that
1528 ;;; combine arguments of different sizes: MOVZX, MOVSX, MOVSXD and
1529 ;;; several SSE instructions, e.g. CVTSD2SI). We don't distinguish
1530 ;;; between general-purpose and floating point registers for this cause
1531 ;;; because only general-purpose registers can be byte-sized at all.
1532 (defun maybe-emit-rex-prefix (segment operand-size r x b)
1533   (declare (type (member nil :byte :word :dword :qword :do-not-set)
1534                  operand-size)
1535            (type (or null tn) r x b))
1536   (labels ((if-hi (r)
1537              (if (and r (> (tn-offset r)
1538                            ;; offset of r8 is 16, offset of xmm8 is 8
1539                            (if (eq (sb-name (sc-sb (tn-sc r)))
1540                                    'float-registers)
1541                                7
1542                                15)))
1543                  1
1544                  0))
1545            (reg-4-7-p (r)
1546              ;; Assuming R is a TN describing a general-purpose
1547              ;; register, return true if it references register
1548              ;; 4 upto 7.
1549              (<= 8 (tn-offset r) 15)))
1550     (let ((rex-w (if (eq operand-size :qword) 1 0))
1551           (rex-r (if-hi r))
1552           (rex-x (if-hi x))
1553           (rex-b (if-hi b)))
1554       (when (or (not (zerop (logior rex-w rex-r rex-x rex-b)))
1555                 (and r
1556                      (eq operand-size :byte)
1557                      (reg-4-7-p r))
1558                 (and b
1559                      (eq (operand-size b) :byte)
1560                      (reg-4-7-p b)))
1561         (emit-rex-byte segment #b0100 rex-w rex-r rex-x rex-b)))))
1562
1563 ;;; Emit a REX prefix if necessary. The operand size is determined from
1564 ;;; THING or can be overwritten by OPERAND-SIZE. This and REG are always
1565 ;;; passed to MAYBE-EMIT-REX-PREFIX. Additionally, if THING is an EA we
1566 ;;; pass its index and base registers, if it is a register TN, we pass
1567 ;;; only itself.
1568 ;;; In contrast to EMIT-EA above, neither stack TNs nor fixups need to
1569 ;;; be treated specially here: If THING is a stack TN, neither it nor
1570 ;;; any of its components are passed to MAYBE-EMIT-REX-PREFIX which
1571 ;;; works correctly because stack references always use RBP as the base
1572 ;;; register and never use an index register so no extended registers
1573 ;;; need to be accessed. Fixups are assembled using an addressing mode
1574 ;;; of displacement-only or RIP-plus-displacement (see EMIT-EA), so may
1575 ;;; not reference an extended register. The displacement-only addressing
1576 ;;; mode requires that REX.X is 0, which is ensured here.
1577 (defun maybe-emit-rex-for-ea (segment thing reg &key operand-size)
1578   (declare (type (or ea tn fixup) thing)
1579            (type (or null tn) reg)
1580            (type (member nil :byte :word :dword :qword :do-not-set)
1581                  operand-size))
1582   (let ((ea-p (ea-p thing)))
1583     (maybe-emit-rex-prefix segment
1584                            (or operand-size (operand-size thing))
1585                            reg
1586                            (and ea-p (ea-index thing))
1587                            (cond (ea-p (ea-base thing))
1588                                  ((and (tn-p thing)
1589                                        (member (sb-name (sc-sb (tn-sc thing)))
1590                                                '(float-registers registers)))
1591                                   thing)
1592                                  (t nil)))))
1593
1594 (defun operand-size (thing)
1595   (typecase thing
1596     (tn
1597      ;; FIXME: might as well be COND instead of having to use #. readmacro
1598      ;; to hack up the code
1599      (case (sc-name (tn-sc thing))
1600        (#.*qword-sc-names*
1601         :qword)
1602        (#.*dword-sc-names*
1603         :dword)
1604        (#.*word-sc-names*
1605         :word)
1606        (#.*byte-sc-names*
1607         :byte)
1608        ;; added by jrd: float-registers is a separate size (?)
1609        ;; The only place in the code where we are called with THING
1610        ;; being a float-register is in MAYBE-EMIT-REX-PREFIX when it
1611        ;; checks whether THING is a byte register. Thus our result in
1612        ;; these cases could as well be :dword and :qword. I leave it as
1613        ;; :float and :double which is more likely to trigger an aver
1614        ;; instead of silently doing the wrong thing in case this
1615        ;; situation should change. Lutz Euler, 2005-10-23.
1616        (#.*float-sc-names*
1617         :float)
1618        (#.*double-sc-names*
1619         :double)
1620        (#.*complex-sc-names*
1621         :complex)
1622        (t
1623         (error "can't tell the size of ~S ~S" thing (sc-name (tn-sc thing))))))
1624     (ea
1625      (ea-size thing))
1626     (fixup
1627      ;; GNA.  Guess who spelt "flavor" correctly first time round?
1628      ;; There's a strong argument in my mind to change all uses of
1629      ;; "flavor" to "kind": and similarly with some misguided uses of
1630      ;; "type" here and there.  -- CSR, 2005-01-06.
1631      (case (fixup-flavor thing)
1632        ((:foreign-dataref) :qword)))
1633     (t
1634      nil)))
1635
1636 (defun matching-operand-size (dst src)
1637   (let ((dst-size (operand-size dst))
1638         (src-size (operand-size src)))
1639     (if dst-size
1640         (if src-size
1641             (if (eq dst-size src-size)
1642                 dst-size
1643                 (error "size mismatch: ~S is a ~S and ~S is a ~S."
1644                        dst dst-size src src-size))
1645             dst-size)
1646         (if src-size
1647             src-size
1648             (error "can't tell the size of either ~S or ~S" dst src)))))
1649
1650 ;;; Except in a very few cases (MOV instructions A1, A3 and B8 - BF)
1651 ;;; we expect dword data bytes even when 64 bit work is being done.
1652 ;;; But A1 and A3 are currently unused and B8 - BF use EMIT-QWORD
1653 ;;; directly, so we emit all quad constants as dwords, additionally
1654 ;;; making sure that they survive the sign-extension to 64 bits
1655 ;;; unchanged.
1656 (defun emit-sized-immediate (segment size value)
1657   (ecase size
1658     (:byte
1659      (emit-byte segment value))
1660     (:word
1661      (emit-word segment value))
1662     (:dword
1663      (emit-dword segment value))
1664     (:qword
1665      (emit-signed-dword segment value))))
1666 \f
1667 ;;;; general data transfer
1668
1669 ;;; This is the part of the MOV instruction emitter that does moving
1670 ;;; of an immediate value into a qword register. We go to some length
1671 ;;; to achieve the shortest possible encoding.
1672 (defun emit-immediate-move-to-qword-register (segment dst src)
1673   (declare (type integer src))
1674   (cond ((typep src '(unsigned-byte 32))
1675          ;; We use the B8 - BF encoding with an operand size of 32 bits
1676          ;; here and let the implicit zero-extension fill the upper half
1677          ;; of the 64-bit destination register. Instruction size: five
1678          ;; or six bytes. (A REX prefix will be emitted only if the
1679          ;; destination is an extended register.)
1680          (maybe-emit-rex-prefix segment :dword nil nil dst)
1681          (emit-byte-with-reg segment #b10111 (reg-tn-encoding dst))
1682          (emit-dword segment src))
1683         (t
1684          (maybe-emit-rex-prefix segment :qword nil nil dst)
1685          (cond ((typep src '(signed-byte 32))
1686                 ;; Use the C7 encoding that takes a 32-bit immediate and
1687                 ;; sign-extends it to 64 bits. Instruction size: seven
1688                 ;; bytes.
1689                 (emit-byte segment #b11000111)
1690                 (emit-mod-reg-r/m-byte segment #b11 #b000
1691                                        (reg-tn-encoding dst))
1692                 (emit-signed-dword segment src))
1693                ((<= (- (expt 2 64) (expt 2 31))
1694                     src
1695                     (1- (expt 2 64)))
1696                 ;; This triggers on positive integers of 64 bits length
1697                 ;; with the most significant 33 bits being 1. We use the
1698                 ;; same encoding as in the previous clause.
1699                 (emit-byte segment #b11000111)
1700                 (emit-mod-reg-r/m-byte segment #b11 #b000
1701                                        (reg-tn-encoding dst))
1702                 (emit-signed-dword segment (- src (expt 2 64))))
1703                (t
1704                 ;; We need a full 64-bit immediate. Instruction size:
1705                 ;; ten bytes.
1706                 (emit-byte-with-reg segment #b10111 (reg-tn-encoding dst))
1707                 (emit-qword segment src))))))
1708
1709 (define-instruction mov (segment dst src)
1710   ;; immediate to register
1711   (:printer reg ((op #b1011) (imm nil :type 'signed-imm-data))
1712             '(:name :tab reg ", " imm))
1713   (:printer rex-reg ((op #b1011) (imm nil :type 'signed-imm-data-upto-qword))
1714             '(:name :tab reg ", " imm))
1715   ;; absolute mem to/from accumulator
1716   (:printer simple-dir ((op #b101000) (imm nil :type 'imm-addr))
1717             `(:name :tab ,(swap-if 'dir 'accum ", " '("[" imm "]"))))
1718   ;; register to/from register/memory
1719   (:printer reg-reg/mem-dir ((op #b100010)))
1720   (:printer rex-reg-reg/mem-dir ((op #b100010)))
1721   (:printer x66-reg-reg/mem-dir ((op #b100010)))
1722   (:printer x66-rex-reg-reg/mem-dir ((op #b100010)))
1723   ;; immediate to register/memory
1724   (:printer reg/mem-imm ((op '(#b1100011 #b000))))
1725   (:printer rex-reg/mem-imm ((op '(#b1100011 #b000))))
1726
1727   (:emitter
1728    (let ((size (matching-operand-size dst src)))
1729      (maybe-emit-operand-size-prefix segment size)
1730      (cond ((register-p dst)
1731             (cond ((integerp src)
1732                    (cond ((eq size :qword)
1733                           (emit-immediate-move-to-qword-register segment
1734                                                                  dst src))
1735                          (t
1736                           (maybe-emit-rex-prefix segment size nil nil dst)
1737                           (emit-byte-with-reg segment
1738                                               (if (eq size :byte)
1739                                                   #b10110
1740                                                   #b10111)
1741                                               (reg-tn-encoding dst))
1742                           (emit-sized-immediate segment size src))))
1743                   (t
1744                    (maybe-emit-rex-for-ea segment src dst)
1745                    (emit-byte segment
1746                               (if (eq size :byte)
1747                                   #b10001010
1748                                   #b10001011))
1749                    (emit-ea segment src (reg-tn-encoding dst) :allow-constants t))))
1750            ((integerp src)
1751             ;; C7 only deals with 32 bit immediates even if the
1752             ;; destination is a 64-bit location. The value is
1753             ;; sign-extended in this case.
1754             (maybe-emit-rex-for-ea segment dst nil)
1755             (emit-byte segment (if (eq size :byte) #b11000110 #b11000111))
1756             (emit-ea segment dst #b000)
1757             (emit-sized-immediate segment size src))
1758            ((register-p src)
1759             (maybe-emit-rex-for-ea segment dst src)
1760             (emit-byte segment (if (eq size :byte) #b10001000 #b10001001))
1761             (emit-ea segment dst (reg-tn-encoding src)))
1762            ((fixup-p src)
1763             ;; Generally we can't MOV a fixupped value into an EA, since
1764             ;; MOV on non-registers can only take a 32-bit immediate arg.
1765             ;; Make an exception for :FOREIGN fixups (pretty much just
1766             ;; the runtime asm, since other foreign calls go through the
1767             ;; the linkage table) and for linkage table references, since
1768             ;; these should always end up in low memory.
1769             (aver (or (eq (fixup-flavor src) :foreign)
1770                       (eq (fixup-flavor src) :foreign-dataref)
1771                       (eq (ea-size dst) :dword)))
1772             (maybe-emit-rex-for-ea segment dst nil)
1773             (emit-byte segment #b11000111)
1774             (emit-ea segment dst #b000)
1775             (emit-absolute-fixup segment src))
1776            (t
1777             (error "bogus arguments to MOV: ~S ~S" dst src))))))
1778
1779 (defun emit-move-with-extension (segment dst src signed-p)
1780   (aver (register-p dst))
1781   (let ((dst-size (operand-size dst))
1782         (src-size (operand-size src))
1783         (opcode (if signed-p  #b10111110 #b10110110)))
1784     (ecase dst-size
1785       (:word
1786        (aver (eq src-size :byte))
1787        (maybe-emit-operand-size-prefix segment :word)
1788        ;; REX prefix is needed if SRC is SIL, DIL, SPL or BPL.
1789        (maybe-emit-rex-for-ea segment src dst :operand-size :word)
1790        (emit-byte segment #b00001111)
1791        (emit-byte segment opcode)
1792        (emit-ea segment src (reg-tn-encoding dst)))
1793       ((:dword :qword)
1794        (ecase src-size
1795          (:byte
1796           (maybe-emit-rex-for-ea segment src dst :operand-size dst-size)
1797           (emit-byte segment #b00001111)
1798           (emit-byte segment opcode)
1799           (emit-ea segment src (reg-tn-encoding dst)))
1800          (:word
1801           (maybe-emit-rex-for-ea segment src dst :operand-size dst-size)
1802           (emit-byte segment #b00001111)
1803           (emit-byte segment (logior opcode 1))
1804           (emit-ea segment src (reg-tn-encoding dst)))
1805          (:dword
1806           (aver (eq dst-size :qword))
1807           ;; dst is in reg, src is in modrm
1808           (let ((ea-p (ea-p src)))
1809             (maybe-emit-rex-prefix segment (if signed-p :qword :dword) dst
1810                                    (and ea-p (ea-index src))
1811                                    (cond (ea-p (ea-base src))
1812                                          ((tn-p src) src)
1813                                          (t nil)))
1814             (emit-byte segment (if signed-p #x63 #x8b)) ;movsxd or straight mov
1815             ;;(emit-byte segment opcode)
1816             (emit-ea segment src (reg-tn-encoding dst)))))))))
1817
1818 (define-instruction movsx (segment dst src)
1819   (:printer ext-reg-reg/mem-no-width
1820             ((op #b10111110) (reg/mem nil :type 'sized-byte-reg/mem)))
1821   (:printer rex-ext-reg-reg/mem-no-width
1822             ((op #b10111110) (reg/mem nil :type 'sized-byte-reg/mem)))
1823   (:printer ext-reg-reg/mem-no-width
1824             ((op #b10111111) (reg/mem nil :type 'sized-word-reg/mem)))
1825   (:printer rex-ext-reg-reg/mem-no-width
1826             ((op #b10111111) (reg/mem nil :type 'sized-word-reg/mem)))
1827   (:emitter (emit-move-with-extension segment dst src :signed)))
1828
1829 (define-instruction movzx (segment dst src)
1830   (:printer ext-reg-reg/mem-no-width
1831             ((op #b10110110) (reg/mem nil :type 'sized-byte-reg/mem)))
1832   (:printer rex-ext-reg-reg/mem-no-width
1833             ((op #b10110110) (reg/mem nil :type 'sized-byte-reg/mem)))
1834   (:printer ext-reg-reg/mem-no-width
1835             ((op #b10110111) (reg/mem nil :type 'sized-word-reg/mem)))
1836   (:printer rex-ext-reg-reg/mem-no-width
1837             ((op #b10110111) (reg/mem nil :type 'sized-word-reg/mem)))
1838   (:emitter (emit-move-with-extension segment dst src nil)))
1839
1840 ;;; The regular use of MOVSXD is with an operand size of :qword. This
1841 ;;; sign-extends the dword source into the qword destination register.
1842 ;;; If the operand size is :dword the instruction zero-extends the dword
1843 ;;; source into the qword destination register, i.e. it does the same as
1844 ;;; a dword MOV into a register.
1845 (define-instruction movsxd (segment dst src)
1846   (:printer reg-reg/mem ((op #b0110001) (width 1)
1847                          (reg/mem nil :type 'sized-dword-reg/mem)))
1848   (:printer rex-reg-reg/mem ((op #b0110001) (width 1)
1849                              (reg/mem nil :type 'sized-dword-reg/mem)))
1850   (:emitter (emit-move-with-extension segment dst src :signed)))
1851
1852 ;;; this is not a real amd64 instruction, of course
1853 (define-instruction movzxd (segment dst src)
1854   ; (:printer reg-reg/mem ((op #x63) (reg nil :type 'reg)))
1855   (:emitter (emit-move-with-extension segment dst src nil)))
1856
1857 (define-instruction push (segment src)
1858   ;; register
1859   (:printer reg-no-width-default-qword ((op #b01010)))
1860   (:printer rex-reg-no-width-default-qword ((op #b01010)))
1861   ;; register/memory
1862   (:printer reg/mem-default-qword ((op '(#b11111111 #b110))))
1863   (:printer rex-reg/mem-default-qword ((op '(#b11111111 #b110))))
1864   ;; immediate
1865   (:printer byte ((op #b01101010) (imm nil :type 'signed-imm-byte))
1866             '(:name :tab imm))
1867   (:printer byte ((op #b01101000)
1868                   (imm nil :type 'signed-imm-data-default-qword))
1869             '(:name :tab imm))
1870   ;; ### segment registers?
1871
1872   (:emitter
1873    (cond ((integerp src)
1874           (cond ((<= -128 src 127)
1875                  (emit-byte segment #b01101010)
1876                  (emit-byte segment src))
1877                 (t
1878                  ;; A REX-prefix is not needed because the operand size
1879                  ;; defaults to 64 bits. The size of the immediate is 32
1880                  ;; bits and it is sign-extended.
1881                  (emit-byte segment #b01101000)
1882                  (emit-signed-dword segment src))))
1883          (t
1884           (let ((size (operand-size src)))
1885             (aver (or (eq size :qword) (eq size :word)))
1886             (maybe-emit-operand-size-prefix segment size)
1887             (maybe-emit-rex-for-ea segment src nil :operand-size :do-not-set)
1888             (cond ((register-p src)
1889                    (emit-byte-with-reg segment #b01010 (reg-tn-encoding src)))
1890                   (t
1891                    (emit-byte segment #b11111111)
1892                    (emit-ea segment src #b110 :allow-constants t))))))))
1893
1894 (define-instruction pop (segment dst)
1895   (:printer reg-no-width-default-qword ((op #b01011)))
1896   (:printer rex-reg-no-width-default-qword ((op #b01011)))
1897   (:printer reg/mem-default-qword ((op '(#b10001111 #b000))))
1898   (:printer rex-reg/mem-default-qword ((op '(#b10001111 #b000))))
1899   (:emitter
1900    (let ((size (operand-size dst)))
1901      (aver (or (eq size :qword) (eq size :word)))
1902      (maybe-emit-operand-size-prefix segment size)
1903      (maybe-emit-rex-for-ea segment dst nil :operand-size :do-not-set)
1904      (cond ((register-p dst)
1905             (emit-byte-with-reg segment #b01011 (reg-tn-encoding dst)))
1906            (t
1907             (emit-byte segment #b10001111)
1908             (emit-ea segment dst #b000))))))
1909
1910 (define-instruction xchg (segment operand1 operand2)
1911   ;; Register with accumulator.
1912   (:printer reg-no-width ((op #b10010)) '(:name :tab accum ", " reg))
1913   ;; Register/Memory with Register.
1914   (:printer reg-reg/mem ((op #b1000011)))
1915   (:printer rex-reg-reg/mem ((op #b1000011)))
1916   (:emitter
1917    (let ((size (matching-operand-size operand1 operand2)))
1918      (maybe-emit-operand-size-prefix segment size)
1919      (labels ((xchg-acc-with-something (acc something)
1920                 (if (and (not (eq size :byte)) (register-p something))
1921                     (progn
1922                       (maybe-emit-rex-for-ea segment acc something)
1923                       (emit-byte-with-reg segment
1924                                           #b10010
1925                                           (reg-tn-encoding something)))
1926                     (xchg-reg-with-something acc something)))
1927               (xchg-reg-with-something (reg something)
1928                 (maybe-emit-rex-for-ea segment something reg)
1929                 (emit-byte segment (if (eq size :byte) #b10000110 #b10000111))
1930                 (emit-ea segment something (reg-tn-encoding reg))))
1931        (cond ((accumulator-p operand1)
1932               (xchg-acc-with-something operand1 operand2))
1933              ((accumulator-p operand2)
1934               (xchg-acc-with-something operand2 operand1))
1935              ((register-p operand1)
1936               (xchg-reg-with-something operand1 operand2))
1937              ((register-p operand2)
1938               (xchg-reg-with-something operand2 operand1))
1939              (t
1940               (error "bogus args to XCHG: ~S ~S" operand1 operand2)))))))
1941
1942 (define-instruction lea (segment dst src)
1943   (:printer rex-reg-reg/mem ((op #b1000110)))
1944   (:printer reg-reg/mem ((op #b1000110) (width 1)))
1945   (:emitter
1946    (aver (or (dword-reg-p dst) (qword-reg-p dst)))
1947    (maybe-emit-rex-for-ea segment src dst
1948                           :operand-size :qword)
1949    (emit-byte segment #b10001101)
1950    (emit-ea segment src (reg-tn-encoding dst))))
1951
1952 (define-instruction cmpxchg (segment dst src &optional prefix)
1953   ;; Register/Memory with Register.
1954   (:printer ext-reg-reg/mem ((op #b1011000)) '(:name :tab reg/mem ", " reg))
1955   (:emitter
1956    (aver (register-p src))
1957    (emit-prefix segment prefix)
1958    (let ((size (matching-operand-size src dst)))
1959      (maybe-emit-operand-size-prefix segment size)
1960      (maybe-emit-rex-for-ea segment dst src)
1961      (emit-byte segment #b00001111)
1962      (emit-byte segment (if (eq size :byte) #b10110000 #b10110001))
1963      (emit-ea segment dst (reg-tn-encoding src)))))
1964
1965 \f
1966 ;;;; flag control instructions
1967
1968 ;;; CLC -- Clear Carry Flag.
1969 (define-instruction clc (segment)
1970   (:printer byte ((op #b11111000)))
1971   (:emitter
1972    (emit-byte segment #b11111000)))
1973
1974 ;;; CLD -- Clear Direction Flag.
1975 (define-instruction cld (segment)
1976   (:printer byte ((op #b11111100)))
1977   (:emitter
1978    (emit-byte segment #b11111100)))
1979
1980 ;;; CLI -- Clear Iterrupt Enable Flag.
1981 (define-instruction cli (segment)
1982   (:printer byte ((op #b11111010)))
1983   (:emitter
1984    (emit-byte segment #b11111010)))
1985
1986 ;;; CMC -- Complement Carry Flag.
1987 (define-instruction cmc (segment)
1988   (:printer byte ((op #b11110101)))
1989   (:emitter
1990    (emit-byte segment #b11110101)))
1991
1992 ;;; LAHF -- Load AH into flags.
1993 (define-instruction lahf (segment)
1994   (:printer byte ((op #b10011111)))
1995   (:emitter
1996    (emit-byte segment #b10011111)))
1997
1998 ;;; POPF -- Pop flags.
1999 (define-instruction popf (segment)
2000   (:printer byte ((op #b10011101)))
2001   (:emitter
2002    (emit-byte segment #b10011101)))
2003
2004 ;;; PUSHF -- push flags.
2005 (define-instruction pushf (segment)
2006   (:printer byte ((op #b10011100)))
2007   (:emitter
2008    (emit-byte segment #b10011100)))
2009
2010 ;;; SAHF -- Store AH into flags.
2011 (define-instruction sahf (segment)
2012   (:printer byte ((op #b10011110)))
2013   (:emitter
2014    (emit-byte segment #b10011110)))
2015
2016 ;;; STC -- Set Carry Flag.
2017 (define-instruction stc (segment)
2018   (:printer byte ((op #b11111001)))
2019   (:emitter
2020    (emit-byte segment #b11111001)))
2021
2022 ;;; STD -- Set Direction Flag.
2023 (define-instruction std (segment)
2024   (:printer byte ((op #b11111101)))
2025   (:emitter
2026    (emit-byte segment #b11111101)))
2027
2028 ;;; STI -- Set Interrupt Enable Flag.
2029 (define-instruction sti (segment)
2030   (:printer byte ((op #b11111011)))
2031   (:emitter
2032    (emit-byte segment #b11111011)))
2033 \f
2034 ;;;; arithmetic
2035
2036 (defun emit-random-arith-inst (name segment dst src opcode
2037                                     &optional allow-constants)
2038   (let ((size (matching-operand-size dst src)))
2039     (maybe-emit-operand-size-prefix segment size)
2040     (cond
2041      ((integerp src)
2042       (cond ((and (not (eq size :byte)) (<= -128 src 127))
2043              (maybe-emit-rex-for-ea segment dst nil)
2044              (emit-byte segment #b10000011)
2045              (emit-ea segment dst opcode :allow-constants allow-constants)
2046              (emit-byte segment src))
2047             ((accumulator-p dst)
2048              (maybe-emit-rex-for-ea segment dst nil)
2049              (emit-byte segment
2050                         (dpb opcode
2051                              (byte 3 3)
2052                              (if (eq size :byte)
2053                                  #b00000100
2054                                  #b00000101)))
2055              (emit-sized-immediate segment size src))
2056             (t
2057              (maybe-emit-rex-for-ea segment dst nil)
2058              (emit-byte segment (if (eq size :byte) #b10000000 #b10000001))
2059              (emit-ea segment dst opcode :allow-constants allow-constants)
2060              (emit-sized-immediate segment size src))))
2061      ((register-p src)
2062       (maybe-emit-rex-for-ea segment dst src)
2063       (emit-byte segment
2064                  (dpb opcode
2065                       (byte 3 3)
2066                       (if (eq size :byte) #b00000000 #b00000001)))
2067       (emit-ea segment dst (reg-tn-encoding src) :allow-constants allow-constants))
2068      ((register-p dst)
2069       (maybe-emit-rex-for-ea segment src dst)
2070       (emit-byte segment
2071                  (dpb opcode
2072                       (byte 3 3)
2073                       (if (eq size :byte) #b00000010 #b00000011)))
2074       (emit-ea segment src (reg-tn-encoding dst) :allow-constants allow-constants))
2075      (t
2076       (error "bogus operands to ~A" name)))))
2077
2078 (eval-when (:compile-toplevel :execute)
2079   (defun arith-inst-printer-list (subop)
2080     `((accum-imm ((op ,(dpb subop (byte 3 2) #b0000010))))
2081       (rex-accum-imm ((op ,(dpb subop (byte 3 2) #b0000010))))
2082       (reg/mem-imm ((op (#b1000000 ,subop))))
2083       (rex-reg/mem-imm ((op (#b1000000 ,subop))))
2084       ;; The redundant encoding #x82 is invalid in 64-bit mode,
2085       ;; therefore we force WIDTH to 1.
2086       (reg/mem-imm ((op (#b1000001 ,subop)) (width 1)
2087                     (imm nil :type signed-imm-byte)))
2088       (rex-reg/mem-imm ((op (#b1000001 ,subop)) (width 1)
2089                         (imm nil :type signed-imm-byte)))
2090       (reg-reg/mem-dir ((op ,(dpb subop (byte 3 1) #b000000))))
2091       (rex-reg-reg/mem-dir ((op ,(dpb subop (byte 3 1) #b000000))))))
2092   )
2093
2094 (define-instruction add (segment dst src &optional prefix)
2095   (:printer-list (arith-inst-printer-list #b000))
2096   (:emitter
2097    (emit-prefix segment prefix)
2098    (emit-random-arith-inst "ADD" segment dst src #b000)))
2099
2100 (define-instruction adc (segment dst src)
2101   (:printer-list (arith-inst-printer-list #b010))
2102   (:emitter (emit-random-arith-inst "ADC" segment dst src #b010)))
2103
2104 (define-instruction sub (segment dst src)
2105   (:printer-list (arith-inst-printer-list #b101))
2106   (:emitter (emit-random-arith-inst "SUB" segment dst src #b101)))
2107
2108 (define-instruction sbb (segment dst src)
2109   (:printer-list (arith-inst-printer-list #b011))
2110   (:emitter (emit-random-arith-inst "SBB" segment dst src #b011)))
2111
2112 (define-instruction cmp (segment dst src)
2113   (:printer-list (arith-inst-printer-list #b111))
2114   (:emitter (emit-random-arith-inst "CMP" segment dst src #b111 t)))
2115
2116 ;;; The one-byte encodings for INC and DEC are used as REX prefixes
2117 ;;; in 64-bit mode so we always use the two-byte form.
2118 (define-instruction inc (segment dst)
2119   (:printer reg/mem ((op '(#b1111111 #b000))))
2120   (:printer rex-reg/mem ((op '(#b1111111 #b000))))
2121   (:emitter
2122    (let ((size (operand-size dst)))
2123      (maybe-emit-operand-size-prefix segment size)
2124      (maybe-emit-rex-for-ea segment dst nil)
2125      (emit-byte segment (if (eq size :byte) #b11111110 #b11111111))
2126      (emit-ea segment dst #b000))))
2127
2128 (define-instruction dec (segment dst)
2129   (:printer reg/mem ((op '(#b1111111 #b001))))
2130   (:printer rex-reg/mem ((op '(#b1111111 #b001))))
2131   (:emitter
2132    (let ((size (operand-size dst)))
2133      (maybe-emit-operand-size-prefix segment size)
2134      (maybe-emit-rex-for-ea segment dst nil)
2135      (emit-byte segment (if (eq size :byte) #b11111110 #b11111111))
2136      (emit-ea segment dst #b001))))
2137
2138 (define-instruction neg (segment dst)
2139   (:printer reg/mem ((op '(#b1111011 #b011))))
2140   (:printer rex-reg/mem ((op '(#b1111011 #b011))))
2141   (:emitter
2142    (let ((size (operand-size dst)))
2143      (maybe-emit-operand-size-prefix segment size)
2144      (maybe-emit-rex-for-ea segment dst nil)
2145      (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2146      (emit-ea segment dst #b011))))
2147
2148 (define-instruction mul (segment dst src)
2149   (:printer accum-reg/mem ((op '(#b1111011 #b100))))
2150   (:printer rex-accum-reg/mem ((op '(#b1111011 #b100))))
2151   (:emitter
2152    (let ((size (matching-operand-size dst src)))
2153      (aver (accumulator-p dst))
2154      (maybe-emit-operand-size-prefix segment size)
2155      (maybe-emit-rex-for-ea segment src nil)
2156      (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2157      (emit-ea segment src #b100))))
2158
2159 (define-instruction imul (segment dst &optional src1 src2)
2160   (:printer accum-reg/mem ((op '(#b1111011 #b101))))
2161   (:printer rex-accum-reg/mem ((op '(#b1111011 #b101))))
2162   (:printer ext-reg-reg/mem-no-width ((op #b10101111)))
2163   (:printer rex-ext-reg-reg/mem-no-width ((op #b10101111)))
2164   (:printer reg-reg/mem ((op #b0110100) (width 1)
2165                          (imm nil :type 'signed-imm-data))
2166             '(:name :tab reg ", " reg/mem ", " imm))
2167   (:printer rex-reg-reg/mem ((op #b0110100) (width 1)
2168                              (imm nil :type 'signed-imm-data))
2169             '(:name :tab reg ", " reg/mem ", " imm))
2170   (:printer reg-reg/mem ((op #b0110101) (width 1)
2171                          (imm nil :type 'signed-imm-byte))
2172             '(:name :tab reg ", " reg/mem ", " imm))
2173   (:printer rex-reg-reg/mem ((op #b0110101) (width 1)
2174                              (imm nil :type 'signed-imm-byte))
2175             '(:name :tab reg ", " reg/mem ", " imm))
2176   (:emitter
2177    (flet ((r/m-with-immed-to-reg (reg r/m immed)
2178             (let* ((size (matching-operand-size reg r/m))
2179                    (sx (and (not (eq size :byte)) (<= -128 immed 127))))
2180               (maybe-emit-operand-size-prefix segment size)
2181               (maybe-emit-rex-for-ea segment r/m reg)
2182               (emit-byte segment (if sx #b01101011 #b01101001))
2183               (emit-ea segment r/m (reg-tn-encoding reg))
2184               (if sx
2185                   (emit-byte segment immed)
2186                   (emit-sized-immediate segment size immed)))))
2187      (cond (src2
2188             (r/m-with-immed-to-reg dst src1 src2))
2189            (src1
2190             (if (integerp src1)
2191                 (r/m-with-immed-to-reg dst dst src1)
2192                 (let ((size (matching-operand-size dst src1)))
2193                   (maybe-emit-operand-size-prefix segment size)
2194                   (maybe-emit-rex-for-ea segment src1 dst)
2195                   (emit-byte segment #b00001111)
2196                   (emit-byte segment #b10101111)
2197                   (emit-ea segment src1 (reg-tn-encoding dst)))))
2198            (t
2199             (let ((size (operand-size dst)))
2200               (maybe-emit-operand-size-prefix segment size)
2201               (maybe-emit-rex-for-ea segment dst nil)
2202               (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2203               (emit-ea segment dst #b101)))))))
2204
2205 (define-instruction div (segment dst src)
2206   (:printer accum-reg/mem ((op '(#b1111011 #b110))))
2207   (:printer rex-accum-reg/mem ((op '(#b1111011 #b110))))
2208   (:emitter
2209    (let ((size (matching-operand-size dst src)))
2210      (aver (accumulator-p dst))
2211      (maybe-emit-operand-size-prefix segment size)
2212      (maybe-emit-rex-for-ea segment src nil)
2213      (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2214      (emit-ea segment src #b110))))
2215
2216 (define-instruction idiv (segment dst src)
2217   (:printer accum-reg/mem ((op '(#b1111011 #b111))))
2218   (:printer rex-accum-reg/mem ((op '(#b1111011 #b111))))
2219   (:emitter
2220    (let ((size (matching-operand-size dst src)))
2221      (aver (accumulator-p dst))
2222      (maybe-emit-operand-size-prefix segment size)
2223      (maybe-emit-rex-for-ea segment src nil)
2224      (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2225      (emit-ea segment src #b111))))
2226
2227 (define-instruction bswap (segment dst)
2228   (:printer ext-reg-no-width ((op #b11001)))
2229   (:emitter
2230    (let ((size (operand-size dst)))
2231      (maybe-emit-rex-prefix segment size nil nil dst)
2232      (emit-byte segment #x0f)
2233      (emit-byte-with-reg segment #b11001 (reg-tn-encoding dst)))))
2234
2235 ;;; CBW -- Convert Byte to Word. AX <- sign_xtnd(AL)
2236 (define-instruction cbw (segment)
2237   (:printer x66-byte ((op #b10011000)))
2238   (:emitter
2239    (maybe-emit-operand-size-prefix segment :word)
2240    (emit-byte segment #b10011000)))
2241
2242 ;;; CWDE -- Convert Word To Double Word Extended. EAX <- sign_xtnd(AX)
2243 (define-instruction cwde (segment)
2244   (:printer byte ((op #b10011000)))
2245   (:emitter
2246    (maybe-emit-operand-size-prefix segment :dword)
2247    (emit-byte segment #b10011000)))
2248
2249 ;;; CDQE -- Convert Double Word To Quad Word Extended. RAX <- sign_xtnd(EAX)
2250 (define-instruction cdqe (segment)
2251   (:printer rex-byte ((op #b10011000)))
2252   (:emitter
2253    (maybe-emit-rex-prefix segment :qword nil nil nil)
2254    (emit-byte segment #b10011000)))
2255
2256 ;;; CWD -- Convert Word to Double Word. DX:AX <- sign_xtnd(AX)
2257 (define-instruction cwd (segment)
2258   (:printer x66-byte ((op #b10011001)))
2259   (:emitter
2260    (maybe-emit-operand-size-prefix segment :word)
2261    (emit-byte segment #b10011001)))
2262
2263 ;;; CDQ -- Convert Double Word to Quad Word. EDX:EAX <- sign_xtnd(EAX)
2264 (define-instruction cdq (segment)
2265   (:printer byte ((op #b10011001)))
2266   (:emitter
2267    (maybe-emit-operand-size-prefix segment :dword)
2268    (emit-byte segment #b10011001)))
2269
2270 ;;; CQO -- Convert Quad Word to Octaword. RDX:RAX <- sign_xtnd(RAX)
2271 (define-instruction cqo (segment)
2272   (:printer rex-byte ((op #b10011001)))
2273   (:emitter
2274    (maybe-emit-rex-prefix segment :qword nil nil nil)
2275    (emit-byte segment #b10011001)))
2276
2277 (define-instruction xadd (segment dst src &optional prefix)
2278   ;; Register/Memory with Register.
2279   (:printer ext-reg-reg/mem ((op #b1100000)) '(:name :tab reg/mem ", " reg))
2280   (:emitter
2281    (aver (register-p src))
2282    (emit-prefix segment prefix)
2283    (let ((size (matching-operand-size src dst)))
2284      (maybe-emit-operand-size-prefix segment size)
2285      (maybe-emit-rex-for-ea segment dst src)
2286      (emit-byte segment #b00001111)
2287      (emit-byte segment (if (eq size :byte) #b11000000 #b11000001))
2288      (emit-ea segment dst (reg-tn-encoding src)))))
2289
2290 \f
2291 ;;;; logic
2292
2293 (defun emit-shift-inst (segment dst amount opcode)
2294   (let ((size (operand-size dst)))
2295     (maybe-emit-operand-size-prefix segment size)
2296     (multiple-value-bind (major-opcode immed)
2297         (case amount
2298           (:cl (values #b11010010 nil))
2299           (1 (values #b11010000 nil))
2300           (t (values #b11000000 t)))
2301       (maybe-emit-rex-for-ea segment dst nil)
2302       (emit-byte segment
2303                  (if (eq size :byte) major-opcode (logior major-opcode 1)))
2304       (emit-ea segment dst opcode)
2305       (when immed
2306         (emit-byte segment amount)))))
2307
2308 (eval-when (:compile-toplevel :execute)
2309   (defun shift-inst-printer-list (subop)
2310     `((reg/mem ((op (#b1101000 ,subop)))
2311                (:name :tab reg/mem ", 1"))
2312       (rex-reg/mem ((op (#b1101000 ,subop)))
2313                    (:name :tab reg/mem ", 1"))
2314       (reg/mem ((op (#b1101001 ,subop)))
2315                (:name :tab reg/mem ", " 'cl))
2316       (rex-reg/mem ((op (#b1101001 ,subop)))
2317                (:name :tab reg/mem ", " 'cl))
2318       (reg/mem-imm ((op (#b1100000 ,subop))
2319                     (imm nil :type imm-byte)))
2320       (rex-reg/mem-imm ((op (#b1100000 ,subop))
2321                     (imm nil :type imm-byte))))))
2322
2323 (define-instruction rol (segment dst amount)
2324   (:printer-list
2325    (shift-inst-printer-list #b000))
2326   (:emitter
2327    (emit-shift-inst segment dst amount #b000)))
2328
2329 (define-instruction ror (segment dst amount)
2330   (:printer-list
2331    (shift-inst-printer-list #b001))
2332   (:emitter
2333    (emit-shift-inst segment dst amount #b001)))
2334
2335 (define-instruction rcl (segment dst amount)
2336   (:printer-list
2337    (shift-inst-printer-list #b010))
2338   (:emitter
2339    (emit-shift-inst segment dst amount #b010)))
2340
2341 (define-instruction rcr (segment dst amount)
2342   (:printer-list
2343    (shift-inst-printer-list #b011))
2344   (:emitter
2345    (emit-shift-inst segment dst amount #b011)))
2346
2347 (define-instruction shl (segment dst amount)
2348   (:printer-list
2349    (shift-inst-printer-list #b100))
2350   (:emitter
2351    (emit-shift-inst segment dst amount #b100)))
2352
2353 (define-instruction shr (segment dst amount)
2354   (:printer-list
2355    (shift-inst-printer-list #b101))
2356   (:emitter
2357    (emit-shift-inst segment dst amount #b101)))
2358
2359 (define-instruction sar (segment dst amount)
2360   (:printer-list
2361    (shift-inst-printer-list #b111))
2362   (:emitter
2363    (emit-shift-inst segment dst amount #b111)))
2364
2365 (defun emit-double-shift (segment opcode dst src amt)
2366   (let ((size (matching-operand-size dst src)))
2367     (when (eq size :byte)
2368       (error "Double shifts can only be used with words."))
2369     (maybe-emit-operand-size-prefix segment size)
2370     (maybe-emit-rex-for-ea segment dst src)
2371     (emit-byte segment #b00001111)
2372     (emit-byte segment (dpb opcode (byte 1 3)
2373                             (if (eq amt :cl) #b10100101 #b10100100)))
2374     (emit-ea segment dst (reg-tn-encoding src))
2375     (unless (eq amt :cl)
2376       (emit-byte segment amt))))
2377
2378 (eval-when (:compile-toplevel :execute)
2379   (defun double-shift-inst-printer-list (op)
2380     `(#+nil
2381       (ext-reg-reg/mem-imm ((op ,(logior op #b100))
2382                             (imm nil :type signed-imm-byte)))
2383       (ext-reg-reg/mem ((op ,(logior op #b101)))
2384          (:name :tab reg/mem ", " 'cl)))))
2385
2386 (define-instruction shld (segment dst src amt)
2387   (:declare (type (or (member :cl) (mod 32)) amt))
2388   (:printer-list (double-shift-inst-printer-list #b10100000))
2389   (:emitter
2390    (emit-double-shift segment #b0 dst src amt)))
2391
2392 (define-instruction shrd (segment dst src amt)
2393   (:declare (type (or (member :cl) (mod 32)) amt))
2394   (:printer-list (double-shift-inst-printer-list #b10101000))
2395   (:emitter
2396    (emit-double-shift segment #b1 dst src amt)))
2397
2398 (define-instruction and (segment dst src)
2399   (:printer-list
2400    (arith-inst-printer-list #b100))
2401   (:emitter
2402    (emit-random-arith-inst "AND" segment dst src #b100)))
2403
2404 (define-instruction test (segment this that)
2405   (:printer accum-imm ((op #b1010100)))
2406   (:printer rex-accum-imm ((op #b1010100)))
2407   (:printer reg/mem-imm ((op '(#b1111011 #b000))))
2408   (:printer rex-reg/mem-imm ((op '(#b1111011 #b000))))
2409   (:printer reg-reg/mem ((op #b1000010)))
2410   (:printer rex-reg-reg/mem ((op #b1000010)))
2411   (:emitter
2412    (let ((size (matching-operand-size this that)))
2413      (maybe-emit-operand-size-prefix segment size)
2414      (flet ((test-immed-and-something (immed something)
2415               (cond ((accumulator-p something)
2416                      (maybe-emit-rex-for-ea segment something nil)
2417                      (emit-byte segment
2418                                 (if (eq size :byte) #b10101000 #b10101001))
2419                      (emit-sized-immediate segment size immed))
2420                     (t
2421                      (maybe-emit-rex-for-ea segment something nil)
2422                      (emit-byte segment
2423                                 (if (eq size :byte) #b11110110 #b11110111))
2424                      (emit-ea segment something #b000)
2425                      (emit-sized-immediate segment size immed))))
2426             (test-reg-and-something (reg something)
2427               (maybe-emit-rex-for-ea segment something reg)
2428               (emit-byte segment (if (eq size :byte) #b10000100 #b10000101))
2429               (emit-ea segment something (reg-tn-encoding reg))))
2430        (cond ((integerp that)
2431               (test-immed-and-something that this))
2432              ((integerp this)
2433               (test-immed-and-something this that))
2434              ((register-p this)
2435               (test-reg-and-something this that))
2436              ((register-p that)
2437               (test-reg-and-something that this))
2438              (t
2439               (error "bogus operands for TEST: ~S and ~S" this that)))))))
2440
2441 (define-instruction or (segment dst src)
2442   (:printer-list
2443    (arith-inst-printer-list #b001))
2444   (:emitter
2445    (emit-random-arith-inst "OR" segment dst src #b001)))
2446
2447 (define-instruction xor (segment dst src)
2448   (:printer-list
2449    (arith-inst-printer-list #b110))
2450   (:emitter
2451    (emit-random-arith-inst "XOR" segment dst src #b110)))
2452
2453 (define-instruction not (segment dst)
2454   (:printer reg/mem ((op '(#b1111011 #b010))))
2455   (:printer rex-reg/mem ((op '(#b1111011 #b010))))
2456   (:emitter
2457    (let ((size (operand-size dst)))
2458      (maybe-emit-operand-size-prefix segment size)
2459      (maybe-emit-rex-for-ea segment dst nil)
2460      (emit-byte segment (if (eq size :byte) #b11110110 #b11110111))
2461      (emit-ea segment dst #b010))))
2462 \f
2463 ;;;; string manipulation
2464
2465 (define-instruction cmps (segment size)
2466   (:printer string-op ((op #b1010011)))
2467   (:printer rex-string-op ((op #b1010011)))
2468   (:emitter
2469    (maybe-emit-operand-size-prefix segment size)
2470    (maybe-emit-rex-prefix segment size nil nil nil)
2471    (emit-byte segment (if (eq size :byte) #b10100110 #b10100111))))
2472
2473 (define-instruction ins (segment acc)
2474   (:printer string-op ((op #b0110110)))
2475   (:printer rex-string-op ((op #b0110110)))
2476   (:emitter
2477    (let ((size (operand-size acc)))
2478      (aver (accumulator-p acc))
2479      (maybe-emit-operand-size-prefix segment size)
2480      (maybe-emit-rex-prefix segment size nil nil nil)
2481      (emit-byte segment (if (eq size :byte) #b01101100 #b01101101)))))
2482
2483 (define-instruction lods (segment acc)
2484   (:printer string-op ((op #b1010110)))
2485   (:printer rex-string-op ((op #b1010110)))
2486   (:emitter
2487    (let ((size (operand-size acc)))
2488      (aver (accumulator-p acc))
2489      (maybe-emit-operand-size-prefix segment size)
2490      (maybe-emit-rex-prefix segment size nil nil nil)
2491      (emit-byte segment (if (eq size :byte) #b10101100 #b10101101)))))
2492
2493 (define-instruction movs (segment size)
2494   (:printer string-op ((op #b1010010)))
2495   (:printer rex-string-op ((op #b1010010)))
2496   (:emitter
2497    (maybe-emit-operand-size-prefix segment size)
2498    (maybe-emit-rex-prefix segment size nil nil nil)
2499    (emit-byte segment (if (eq size :byte) #b10100100 #b10100101))))
2500
2501 (define-instruction outs (segment acc)
2502   (:printer string-op ((op #b0110111)))
2503   (:printer rex-string-op ((op #b0110111)))
2504   (:emitter
2505    (let ((size (operand-size acc)))
2506      (aver (accumulator-p acc))
2507      (maybe-emit-operand-size-prefix segment size)
2508      (maybe-emit-rex-prefix segment size nil nil nil)
2509      (emit-byte segment (if (eq size :byte) #b01101110 #b01101111)))))
2510
2511 (define-instruction scas (segment acc)
2512   (:printer string-op ((op #b1010111)))
2513   (:printer rex-string-op ((op #b1010111)))
2514   (:emitter
2515    (let ((size (operand-size acc)))
2516      (aver (accumulator-p acc))
2517      (maybe-emit-operand-size-prefix segment size)
2518      (maybe-emit-rex-prefix segment size nil nil nil)
2519      (emit-byte segment (if (eq size :byte) #b10101110 #b10101111)))))
2520
2521 (define-instruction stos (segment acc)
2522   (:printer string-op ((op #b1010101)))
2523   (:printer rex-string-op ((op #b1010101)))
2524   (:emitter
2525    (let ((size (operand-size acc)))
2526      (aver (accumulator-p acc))
2527      (maybe-emit-operand-size-prefix segment size)
2528      (maybe-emit-rex-prefix segment size nil nil nil)
2529      (emit-byte segment (if (eq size :byte) #b10101010 #b10101011)))))
2530
2531 (define-instruction xlat (segment)
2532   (:printer byte ((op #b11010111)))
2533   (:emitter
2534    (emit-byte segment #b11010111)))
2535
2536 (define-instruction rep (segment)
2537   (:emitter
2538    (emit-byte segment #b11110011)))
2539
2540 (define-instruction repe (segment)
2541   (:printer byte ((op #b11110011)))
2542   (:emitter
2543    (emit-byte segment #b11110011)))
2544
2545 (define-instruction repne (segment)
2546   (:printer byte ((op #b11110010)))
2547   (:emitter
2548    (emit-byte segment #b11110010)))
2549
2550 \f
2551 ;;;; bit manipulation
2552
2553 (define-instruction bsf (segment dst src)
2554   (:printer ext-reg-reg/mem-no-width ((op #b10111100)))
2555   (:printer rex-ext-reg-reg/mem-no-width ((op #b10111100)))
2556   (:emitter
2557    (let ((size (matching-operand-size dst src)))
2558      (when (eq size :byte)
2559        (error "can't scan bytes: ~S" src))
2560      (maybe-emit-operand-size-prefix segment size)
2561      (maybe-emit-rex-for-ea segment src dst)
2562      (emit-byte segment #b00001111)
2563      (emit-byte segment #b10111100)
2564      (emit-ea segment src (reg-tn-encoding dst)))))
2565
2566 (define-instruction bsr (segment dst src)
2567   (:printer ext-reg-reg/mem-no-width ((op #b10111101)))
2568   (:printer rex-ext-reg-reg/mem-no-width ((op #b10111101)))
2569   (:emitter
2570    (let ((size (matching-operand-size dst src)))
2571      (when (eq size :byte)
2572        (error "can't scan bytes: ~S" src))
2573      (maybe-emit-operand-size-prefix segment size)
2574      (maybe-emit-rex-for-ea segment src dst)
2575      (emit-byte segment #b00001111)
2576      (emit-byte segment #b10111101)
2577      (emit-ea segment src (reg-tn-encoding dst)))))
2578
2579 (defun emit-bit-test-and-mumble (segment src index opcode)
2580   (let ((size (operand-size src)))
2581     (when (eq size :byte)
2582       (error "can't scan bytes: ~S" src))
2583     (maybe-emit-operand-size-prefix segment size)
2584     (cond ((integerp index)
2585            (maybe-emit-rex-for-ea segment src nil)
2586            (emit-byte segment #b00001111)
2587            (emit-byte segment #b10111010)
2588            (emit-ea segment src opcode)
2589            (emit-byte segment index))
2590           (t
2591            (maybe-emit-rex-for-ea segment src index)
2592            (emit-byte segment #b00001111)
2593            (emit-byte segment (dpb opcode (byte 3 3) #b10000011))
2594            (emit-ea segment src (reg-tn-encoding index))))))
2595
2596 (eval-when (:compile-toplevel :execute)
2597   (defun bit-test-inst-printer-list (subop)
2598     `((ext-reg/mem-imm ((op (#b1011101 ,subop))
2599                         (reg/mem nil :type reg/mem)
2600                         (imm nil :type imm-byte)
2601                         (width 0)))
2602       (ext-reg-reg/mem ((op ,(dpb subop (byte 3 2) #b1000001))
2603                         (width 1))
2604                        (:name :tab reg/mem ", " reg)))))
2605
2606 (define-instruction bt (segment src index)
2607   (:printer-list (bit-test-inst-printer-list #b100))
2608   (:emitter
2609    (emit-bit-test-and-mumble segment src index #b100)))
2610
2611 (define-instruction btc (segment src index)
2612   (:printer-list (bit-test-inst-printer-list #b111))
2613   (:emitter
2614    (emit-bit-test-and-mumble segment src index #b111)))
2615
2616 (define-instruction btr (segment src index)
2617   (:printer-list (bit-test-inst-printer-list #b110))
2618   (:emitter
2619    (emit-bit-test-and-mumble segment src index #b110)))
2620
2621 (define-instruction bts (segment src index)
2622   (:printer-list (bit-test-inst-printer-list #b101))
2623   (:emitter
2624    (emit-bit-test-and-mumble segment src index #b101)))
2625
2626 \f
2627 ;;;; control transfer
2628
2629 (define-instruction call (segment where)
2630   (:printer near-jump ((op #b11101000)))
2631   (:printer reg/mem-default-qword ((op '(#b11111111 #b010))))
2632   (:printer rex-reg/mem-default-qword ((op '(#b11111111 #b010))))
2633   (:emitter
2634    (typecase where
2635      (label
2636       (emit-byte segment #b11101000) ; 32 bit relative
2637       (emit-back-patch segment
2638                        4
2639                        (lambda (segment posn)
2640                          (emit-signed-dword segment
2641                                             (- (label-position where)
2642                                                (+ posn 4))))))
2643      (fixup
2644       ;; There is no CALL rel64...
2645       (error "Cannot CALL a fixup: ~S" where))
2646      (t
2647       (maybe-emit-rex-for-ea segment where nil :operand-size :do-not-set)
2648       (emit-byte segment #b11111111)
2649       (emit-ea segment where #b010)))))
2650
2651 (defun emit-byte-displacement-backpatch (segment target)
2652   (emit-back-patch segment
2653                    1
2654                    (lambda (segment posn)
2655                      (let ((disp (- (label-position target) (1+ posn))))
2656                        (aver (<= -128 disp 127))
2657                        (emit-byte segment disp)))))
2658
2659 (define-instruction jmp (segment cond &optional where)
2660   ;; conditional jumps
2661   (:printer short-cond-jump ((op #b0111)) '('j cc :tab label))
2662   (:printer near-cond-jump () '('j cc :tab label))
2663   ;; unconditional jumps
2664   (:printer short-jump ((op #b1011)))
2665   (:printer near-jump ((op #b11101001)))
2666   (:printer reg/mem-default-qword ((op '(#b11111111 #b100))))
2667   (:printer rex-reg/mem-default-qword ((op '(#b11111111 #b100))))
2668   (:emitter
2669    (cond (where
2670           (emit-chooser
2671            segment 6 2
2672            (lambda (segment posn delta-if-after)
2673              (let ((disp (- (label-position where posn delta-if-after)
2674                             (+ posn 2))))
2675                (when (<= -128 disp 127)
2676                  (emit-byte segment
2677                             (dpb (conditional-opcode cond)
2678                                  (byte 4 0)
2679                                  #b01110000))
2680                  (emit-byte-displacement-backpatch segment where)
2681                  t)))
2682            (lambda (segment posn)
2683              (let ((disp (- (label-position where) (+ posn 6))))
2684                (emit-byte segment #b00001111)
2685                (emit-byte segment
2686                           (dpb (conditional-opcode cond)
2687                                (byte 4 0)
2688                                #b10000000))
2689                (emit-signed-dword segment disp)))))
2690          ((label-p (setq where cond))
2691           (emit-chooser
2692            segment 5 0
2693            (lambda (segment posn delta-if-after)
2694              (let ((disp (- (label-position where posn delta-if-after)
2695                             (+ posn 2))))
2696                (when (<= -128 disp 127)
2697                  (emit-byte segment #b11101011)
2698                  (emit-byte-displacement-backpatch segment where)
2699                  t)))
2700            (lambda (segment posn)
2701              (let ((disp (- (label-position where) (+ posn 5))))
2702                (emit-byte segment #b11101001)
2703                (emit-signed-dword segment disp)))))
2704          ((fixup-p where)
2705           (emit-byte segment #b11101001)
2706           (emit-relative-fixup segment where))
2707          (t
2708           (unless (or (ea-p where) (tn-p where))
2709             (error "don't know what to do with ~A" where))
2710           ;; near jump defaults to 64 bit
2711           ;; w-bit in rex prefix is unnecessary
2712           (maybe-emit-rex-for-ea segment where nil :operand-size :do-not-set)
2713           (emit-byte segment #b11111111)
2714           (emit-ea segment where #b100)))))
2715
2716 (define-instruction ret (segment &optional stack-delta)
2717   (:printer byte ((op #b11000011)))
2718   (:printer byte ((op #b11000010) (imm nil :type 'imm-word-16))
2719             '(:name :tab imm))
2720   (:emitter
2721    (cond ((and stack-delta (not (zerop stack-delta)))
2722           (emit-byte segment #b11000010)
2723           (emit-word segment stack-delta))
2724          (t
2725           (emit-byte segment #b11000011)))))
2726
2727 (define-instruction jrcxz (segment target)
2728   (:printer short-jump ((op #b0011)))
2729   (:emitter
2730    (emit-byte segment #b11100011)
2731    (emit-byte-displacement-backpatch segment target)))
2732
2733 (define-instruction loop (segment target)
2734   (:printer short-jump ((op #b0010)))
2735   (:emitter
2736    (emit-byte segment #b11100010)       ; pfw this was 11100011, or jecxz!!!!
2737    (emit-byte-displacement-backpatch segment target)))
2738
2739 (define-instruction loopz (segment target)
2740   (:printer short-jump ((op #b0001)))
2741   (:emitter
2742    (emit-byte segment #b11100001)
2743    (emit-byte-displacement-backpatch segment target)))
2744
2745 (define-instruction loopnz (segment target)
2746   (:printer short-jump ((op #b0000)))
2747   (:emitter
2748    (emit-byte segment #b11100000)
2749    (emit-byte-displacement-backpatch segment target)))
2750 \f
2751 ;;;; conditional move
2752 (define-instruction cmov (segment cond dst src)
2753   (:printer cond-move ())
2754   (:printer rex-cond-move ())
2755   (:emitter
2756    (aver (register-p dst))
2757    (let ((size (matching-operand-size dst src)))
2758      (aver (or (eq size :word) (eq size :dword) (eq size :qword)))
2759      (maybe-emit-operand-size-prefix segment size))
2760    (maybe-emit-rex-for-ea segment src dst)
2761    (emit-byte segment #b00001111)
2762    (emit-byte segment (dpb (conditional-opcode cond) (byte 4 0) #b01000000))
2763    (emit-ea segment src (reg-tn-encoding dst))))
2764
2765 ;;;; conditional byte set
2766
2767 (define-instruction set (segment dst cond)
2768   (:printer cond-set ())
2769   (:emitter
2770    (maybe-emit-rex-for-ea segment dst nil)
2771    (emit-byte segment #b00001111)
2772    (emit-byte segment (dpb (conditional-opcode cond) (byte 4 0) #b10010000))
2773    (emit-ea segment dst #b000)))
2774 \f
2775 ;;;; enter/leave
2776
2777 (define-instruction enter (segment disp &optional (level 0))
2778   (:declare (type (unsigned-byte 16) disp)
2779             (type (unsigned-byte 8) level))
2780   (:printer enter-format ((op #b11001000)))
2781   (:emitter
2782    (emit-byte segment #b11001000)
2783    (emit-word segment disp)
2784    (emit-byte segment level)))
2785
2786 (define-instruction leave (segment)
2787   (:printer byte ((op #b11001001)))
2788   (:emitter
2789    (emit-byte segment #b11001001)))
2790 \f
2791 ;;;; interrupt instructions
2792
2793 (defun snarf-error-junk (sap offset &optional length-only)
2794   (let* ((length (sb!sys:sap-ref-8 sap offset))
2795          (vector (make-array length :element-type '(unsigned-byte 8))))
2796     (declare (type sb!sys:system-area-pointer sap)
2797              (type (unsigned-byte 8) length)
2798              (type (simple-array (unsigned-byte 8) (*)) vector))
2799     (cond (length-only
2800            (values 0 (1+ length) nil nil))
2801           (t
2802            (sb!kernel:copy-ub8-from-system-area sap (1+ offset)
2803                                                 vector 0 length)
2804            (collect ((sc-offsets)
2805                      (lengths))
2806              (lengths 1)                ; the length byte
2807              (let* ((index 0)
2808                     (error-number (sb!c:read-var-integer vector index)))
2809                (lengths index)
2810                (loop
2811                  (when (>= index length)
2812                    (return))
2813                  (let ((old-index index))
2814                    (sc-offsets (sb!c:read-var-integer vector index))
2815                    (lengths (- index old-index))))
2816                (values error-number
2817                        (1+ length)
2818                        (sc-offsets)
2819                        (lengths))))))))
2820
2821 #|
2822 (defmacro break-cases (breaknum &body cases)
2823   (let ((bn-temp (gensym)))
2824     (collect ((clauses))
2825       (dolist (case cases)
2826         (clauses `((= ,bn-temp ,(car case)) ,@(cdr case))))
2827       `(let ((,bn-temp ,breaknum))
2828          (cond ,@(clauses))))))
2829 |#
2830
2831 (defun break-control (chunk inst stream dstate)
2832   (declare (ignore inst))
2833   (flet ((nt (x) (if stream (sb!disassem:note x dstate))))
2834     ;; XXX: {BYTE,WORD}-IMM-CODE below is a macro defined by the
2835     ;; DEFINE-INSTRUCTION-FORMAT for {BYTE,WORD}-IMM above.  Due to
2836     ;; the spectacular design for DEFINE-INSTRUCTION-FORMAT (involving
2837     ;; a call to EVAL in order to define the macros at compile-time
2838     ;; only) they do not even show up as symbols in the target core.
2839     (case #!-ud2-breakpoints (byte-imm-code chunk dstate)
2840           #!+ud2-breakpoints (word-imm-code chunk dstate)
2841       (#.error-trap
2842        (nt "error trap")
2843        (sb!disassem:handle-break-args #'snarf-error-junk stream dstate))
2844       (#.cerror-trap
2845        (nt "cerror trap")
2846        (sb!disassem:handle-break-args #'snarf-error-junk stream dstate))
2847       (#.breakpoint-trap
2848        (nt "breakpoint trap"))
2849       (#.pending-interrupt-trap
2850        (nt "pending interrupt trap"))
2851       (#.halt-trap
2852        (nt "halt trap"))
2853       (#.fun-end-breakpoint-trap
2854        (nt "function end breakpoint trap"))
2855       (#.single-step-around-trap
2856        (nt "single-step trap (around)"))
2857       (#.single-step-before-trap
2858        (nt "single-step trap (before)")))))
2859
2860 (define-instruction break (segment code)
2861   (:declare (type (unsigned-byte 8) code))
2862   #!-ud2-breakpoints (:printer byte-imm ((op #b11001100)) '(:name :tab code)
2863                                :control #'break-control)
2864   #!+ud2-breakpoints (:printer word-imm ((op #b0000101100001111)) '(:name :tab code)
2865                                :control #'break-control)
2866   (:emitter
2867    #!-ud2-breakpoints (emit-byte segment #b11001100)
2868    ;; On darwin, trap handling via SIGTRAP is unreliable, therefore we
2869    ;; throw a sigill with 0x0b0f instead and check for this in the
2870    ;; SIGILL handler and pass it on to the sigtrap handler if
2871    ;; appropriate
2872    #!+ud2-breakpoints (emit-word segment #b0000101100001111)
2873    (emit-byte segment code)))
2874
2875 (define-instruction int (segment number)
2876   (:declare (type (unsigned-byte 8) number))
2877   (:printer byte-imm ((op #b11001101)))
2878   (:emitter
2879    (etypecase number
2880      ((member 3)
2881       (emit-byte segment #b11001100))
2882      ((unsigned-byte 8)
2883       (emit-byte segment #b11001101)
2884       (emit-byte segment number)))))
2885
2886 (define-instruction iret (segment)
2887   (:printer byte ((op #b11001111)))
2888   (:emitter
2889    (emit-byte segment #b11001111)))
2890 \f
2891 ;;;; processor control
2892
2893 (define-instruction hlt (segment)
2894   (:printer byte ((op #b11110100)))
2895   (:emitter
2896    (emit-byte segment #b11110100)))
2897
2898 (define-instruction nop (segment)
2899   (:printer byte ((op #b10010000)))
2900   (:emitter
2901    (emit-byte segment #b10010000)))
2902
2903 (define-instruction wait (segment)
2904   (:printer byte ((op #b10011011)))
2905   (:emitter
2906    (emit-byte segment #b10011011)))
2907
2908 (defun emit-prefix (segment name)
2909   (declare (ignorable segment))
2910   (ecase name
2911     ((nil))
2912     (:lock
2913      #!+sb-thread
2914      (emit-byte segment #xf0))))
2915
2916 ;;; FIXME: It would be better to make the disassembler understand the prefix as part
2917 ;;; of the instructions...
2918 (define-instruction lock (segment)
2919   (:printer byte ((op #b11110000)))
2920   (:emitter
2921    (bug "LOCK prefix used as a standalone instruction")))
2922 \f
2923 ;;;; miscellaneous hackery
2924
2925 (define-instruction byte (segment byte)
2926   (:emitter
2927    (emit-byte segment byte)))
2928
2929 (define-instruction word (segment word)
2930   (:emitter
2931    (emit-word segment word)))
2932
2933 (define-instruction dword (segment dword)
2934   (:emitter
2935    (emit-dword segment dword)))
2936
2937 (defun emit-header-data (segment type)
2938   (emit-back-patch segment
2939                    n-word-bytes
2940                    (lambda (segment posn)
2941                      (emit-qword segment
2942                                  (logior type
2943                                          (ash (+ posn
2944                                                  (component-header-length))
2945                                               (- n-widetag-bits
2946                                                  word-shift)))))))
2947
2948 (define-instruction simple-fun-header-word (segment)
2949   (:emitter
2950    (emit-header-data segment simple-fun-header-widetag)))
2951
2952 (define-instruction lra-header-word (segment)
2953   (:emitter
2954    (emit-header-data segment return-pc-header-widetag)))
2955 \f
2956 ;;;; Instructions required to do floating point operations using SSE
2957
2958 ;; Return a two-element list of printers for SSE instructions. One
2959 ;; printer is for the format without a REX prefix, the other one for the
2960 ;; one with.
2961 (eval-when (:compile-toplevel :execute)
2962   (defun sse-inst-printer-list (inst-format-stem prefix opcode
2963                                 &key more-fields printer)
2964     (let ((fields `(,@(when prefix
2965                         `((prefix ,prefix)))
2966                     (op ,opcode)
2967                     ,@more-fields))
2968           (inst-formats (if prefix
2969                             (list (symbolicate "EXT-" inst-format-stem)
2970                                   (symbolicate "EXT-REX-" inst-format-stem))
2971                             (list inst-format-stem
2972                                   (symbolicate "REX-" inst-format-stem)))))
2973       (mapcar (lambda (inst-format)
2974                 `(,inst-format ,fields ,@(when printer
2975                                            (list printer))))
2976               inst-formats))))
2977
2978 (defun emit-sse-inst (segment dst src prefix opcode
2979                       &key operand-size (remaining-bytes 0))
2980   (when prefix
2981     (emit-byte segment prefix))
2982   (if operand-size
2983       (maybe-emit-rex-for-ea segment src dst :operand-size operand-size)
2984       (maybe-emit-rex-for-ea segment src dst))
2985   (emit-byte segment #x0f)
2986   (emit-byte segment opcode)
2987   (emit-ea segment src (reg-tn-encoding dst) :remaining-bytes remaining-bytes))
2988
2989 ;; 0110 0110:0000 1111:0111 00gg: 11 010 xmmreg:imm8
2990
2991 (defun emit-sse-inst-with-imm (segment dst/src imm
2992                                prefix opcode /i
2993                                &key operand-size)
2994   (aver (<= 0 /i 7))
2995   (when prefix
2996     (emit-byte segment prefix))
2997   (maybe-emit-rex-prefix segment operand-size dst/src nil nil)
2998   (emit-byte segment #x0F)
2999   (emit-byte segment opcode)
3000   (emit-byte segment (logior (ash (logior #b11000 /i) 3)
3001                              (reg-tn-encoding dst/src)))
3002   (emit-byte segment imm))
3003
3004 (macrolet
3005     ((define-imm-sse-instruction (name opcode /i)
3006          `(define-instruction ,name (segment dst/src imm)
3007             (:printer-list
3008              ',(sse-inst-printer-list 'xmm-imm #x66 opcode
3009                                       :more-fields `((/i ,/i))))
3010             (:emitter
3011              (emit-sse-inst-with-imm segment dst/src imm
3012                                      #x66 ,opcode ,/i
3013                                      :operand-size :do-not-set)))))
3014   (define-imm-sse-instruction pslldq #x73 7)
3015   (define-imm-sse-instruction psllw-imm #x71 6)
3016   (define-imm-sse-instruction pslld-imm #x72 6)
3017   (define-imm-sse-instruction psllq-imm #x73 6)
3018
3019   (define-imm-sse-instruction psraw-imm #x71 4)
3020   (define-imm-sse-instruction psrad-imm #x72 4)
3021
3022   (define-imm-sse-instruction psrldq #x73 3)
3023   (define-imm-sse-instruction psrlw-imm #x71 2)
3024   (define-imm-sse-instruction psrld-imm #x72 2)
3025   (define-imm-sse-instruction psrlq-imm #x73 2))
3026
3027 ;;; Emit an SSE instruction that has an XMM register as the destination
3028 ;;; operand and for which the size of the operands is implicitly given
3029 ;;; by the instruction.
3030 (defun emit-regular-sse-inst (segment dst src prefix opcode
3031                               &key (remaining-bytes 0))
3032   (aver (xmm-register-p dst))
3033   (emit-sse-inst segment dst src prefix opcode
3034                  :operand-size :do-not-set
3035                  :remaining-bytes remaining-bytes))
3036
3037 ;;; Instructions having an XMM register as the destination operand
3038 ;;; and an XMM register or a memory location as the source operand.
3039 ;;; The operand size is implicitly given by the instruction.
3040
3041 (macrolet ((define-regular-sse-inst (name prefix opcode)
3042              `(define-instruction ,name (segment dst src)
3043                 (:printer-list
3044                  ',(sse-inst-printer-list 'xmm-xmm/mem prefix opcode))
3045                 (:emitter
3046                  (emit-regular-sse-inst segment dst src ,prefix ,opcode)))))
3047   ;; logical
3048   (define-regular-sse-inst andpd    #x66 #x54)
3049   (define-regular-sse-inst andps    nil  #x54)
3050   (define-regular-sse-inst andnpd   #x66 #x55)
3051   (define-regular-sse-inst andnps   nil  #x55)
3052   (define-regular-sse-inst orpd     #x66 #x56)
3053   (define-regular-sse-inst orps     nil  #x56)
3054   (define-regular-sse-inst pand     #x66 #xdb)
3055   (define-regular-sse-inst pandn    #x66 #xdf)
3056   (define-regular-sse-inst por      #x66 #xeb)
3057   (define-regular-sse-inst pxor     #x66 #xef)
3058   (define-regular-sse-inst xorpd    #x66 #x57)
3059   (define-regular-sse-inst xorps    nil  #x57)
3060   ;; comparison
3061   (define-regular-sse-inst comisd   #x66 #x2f)
3062   (define-regular-sse-inst comiss   nil  #x2f)
3063   (define-regular-sse-inst ucomisd  #x66 #x2e)
3064   (define-regular-sse-inst ucomiss  nil  #x2e)
3065   ;; integer comparison
3066   (define-regular-sse-inst pcmpeqb  #x66 #x74)
3067   (define-regular-sse-inst pcmpeqw  #x66 #x75)
3068   (define-regular-sse-inst pcmpeqd  #x66 #x76)
3069   (define-regular-sse-inst pcmpgtb  #x66 #x64)
3070   (define-regular-sse-inst pcmpgtw  #x66 #x65)
3071   (define-regular-sse-inst pcmpgtd  #x66 #x66)
3072   ;; max/min
3073   (define-regular-sse-inst maxpd    #x66 #x5f)
3074   (define-regular-sse-inst maxps    nil  #x5f)
3075   (define-regular-sse-inst maxsd    #xf2 #x5f)
3076   (define-regular-sse-inst maxss    #xf3 #x5f)
3077   (define-regular-sse-inst minpd    #x66 #x5d)
3078   (define-regular-sse-inst minps    nil  #x5d)
3079   (define-regular-sse-inst minsd    #xf2 #x5d)
3080   (define-regular-sse-inst minss    #xf3 #x5d)
3081   ;; integer max/min
3082   (define-regular-sse-inst pmaxsw   #x66 #xee)
3083   (define-regular-sse-inst pmaxub   #x66 #xde)
3084   (define-regular-sse-inst pminsw   #x66 #xea)
3085   (define-regular-sse-inst pminub   #x66 #xda)
3086   ;; arithmetic
3087   (define-regular-sse-inst addpd    #x66 #x58)
3088   (define-regular-sse-inst addps    nil  #x58)
3089   (define-regular-sse-inst addsd    #xf2 #x58)
3090   (define-regular-sse-inst addss    #xf3 #x58)
3091   (define-regular-sse-inst divpd    #x66 #x5e)
3092   (define-regular-sse-inst divps    nil  #x5e)
3093   (define-regular-sse-inst divsd    #xf2 #x5e)
3094   (define-regular-sse-inst divss    #xf3 #x5e)
3095   (define-regular-sse-inst mulpd    #x66 #x59)
3096   (define-regular-sse-inst mulps    nil  #x59)
3097   (define-regular-sse-inst mulsd    #xf2 #x59)
3098   (define-regular-sse-inst mulss    #xf3 #x59)
3099   (define-regular-sse-inst rcpps    nil  #x53)
3100   (define-regular-sse-inst rcpss    #xf3 #x53)
3101   (define-regular-sse-inst rsqrtps  nil  #x52)
3102   (define-regular-sse-inst rsqrtss  #xf3 #x52)
3103   (define-regular-sse-inst sqrtpd   #x66 #x51)
3104   (define-regular-sse-inst sqrtps   nil  #x51)
3105   (define-regular-sse-inst sqrtsd   #xf2 #x51)
3106   (define-regular-sse-inst sqrtss   #xf3 #x51)
3107   (define-regular-sse-inst subpd    #x66 #x5c)
3108   (define-regular-sse-inst subps    nil  #x5c)
3109   (define-regular-sse-inst subsd    #xf2 #x5c)
3110   (define-regular-sse-inst subss    #xf3 #x5c)
3111   (define-regular-sse-inst unpckhpd #x66 #x15)
3112   (define-regular-sse-inst unpckhps nil  #x15)
3113   (define-regular-sse-inst unpcklpd #x66 #x14)
3114   (define-regular-sse-inst unpcklps nil  #x14)
3115   ;; integer arithmetic
3116   (define-regular-sse-inst paddb    #x66 #xfc)
3117   (define-regular-sse-inst paddw    #x66 #xfd)
3118   (define-regular-sse-inst paddd    #x66 #xfe)
3119   (define-regular-sse-inst paddq    #x66 #xd4)
3120   (define-regular-sse-inst paddsb   #x66 #xec)
3121   (define-regular-sse-inst paddsw   #x66 #xed)
3122   (define-regular-sse-inst paddusb  #x66 #xdc)
3123   (define-regular-sse-inst paddusw  #x66 #xdd)
3124   (define-regular-sse-inst pavgb    #x66 #xe0)
3125   (define-regular-sse-inst pavgw    #x66 #xe3)
3126   (define-regular-sse-inst pmaddwd  #x66 #xf5)
3127   (define-regular-sse-inst pmulhuw  #x66 #xe4)
3128   (define-regular-sse-inst pmulhw   #x66 #xe5)
3129   (define-regular-sse-inst pmullw   #x66 #xd5)
3130   (define-regular-sse-inst pmuludq  #x66 #xf4)
3131   (define-regular-sse-inst psadbw   #x66 #xf6)
3132   (define-regular-sse-inst psllw    #x66 #xf1)
3133   (define-regular-sse-inst pslld    #x66 #xf2)
3134   (define-regular-sse-inst psllq    #x66 #xf3)
3135   (define-regular-sse-inst psraw    #x66 #xe1)
3136   (define-regular-sse-inst psrad    #x66 #xe2)
3137   (define-regular-sse-inst psrlw    #x66 #xd1)
3138   (define-regular-sse-inst psrld    #x66 #xd2)
3139   (define-regular-sse-inst psrlq    #x66 #xd3)
3140   (define-regular-sse-inst psubb    #x66 #xf8)
3141   (define-regular-sse-inst psubw    #x66 #xf9)
3142   (define-regular-sse-inst psubd    #x66 #xfa)
3143   (define-regular-sse-inst psubq    #x66 #xfb)
3144   (define-regular-sse-inst psubsb   #x66 #xe8)
3145   (define-regular-sse-inst psubsw   #x66 #xe9)
3146   (define-regular-sse-inst psubusb  #x66 #xd8)
3147   (define-regular-sse-inst psubusw  #x66 #xd9)
3148   ;; conversion
3149   (define-regular-sse-inst cvtdq2pd #xf3 #xe6)
3150   (define-regular-sse-inst cvtdq2ps nil  #x5b)
3151   (define-regular-sse-inst cvtpd2dq #xf2 #xe6)
3152   (define-regular-sse-inst cvtpd2ps #x66 #x5a)
3153   (define-regular-sse-inst cvtps2dq #x66 #x5b)
3154   (define-regular-sse-inst cvtps2pd nil  #x5a)
3155   (define-regular-sse-inst cvtsd2ss #xf2 #x5a)
3156   (define-regular-sse-inst cvtss2sd #xf3 #x5a)
3157   (define-regular-sse-inst cvttpd2dq #x66 #xe6)
3158   (define-regular-sse-inst cvttps2dq #xf3 #x5b)
3159   ;; integer
3160   (define-regular-sse-inst packsswb  #x66 #x63)
3161   (define-regular-sse-inst packssdw  #x66 #x6b)
3162   (define-regular-sse-inst packuswb  #x66 #x67)
3163   (define-regular-sse-inst punpckhbw #x66 #x68)
3164   (define-regular-sse-inst punpckhwd #x66 #x69)
3165   (define-regular-sse-inst punpckhdq #x66 #x6a)
3166   (define-regular-sse-inst punpckhqdq #x66 #x6d)
3167   (define-regular-sse-inst punpcklbw #x66 #x60)
3168   (define-regular-sse-inst punpcklwd #x66 #x61)
3169   (define-regular-sse-inst punpckldq #x66 #x62)
3170   (define-regular-sse-inst punpcklqdq #x66 #x6c))
3171
3172 (macrolet ((define-xmm-shuffle-sse-inst (name prefix opcode n-bits radix)
3173                (let ((shuffle-pattern
3174                       (intern (format nil "SSE-SHUFFLE-PATTERN-~D-~D"
3175                                       n-bits radix))))
3176                  `(define-instruction ,name (segment dst src pattern)
3177                     (:printer-list
3178                      ',(sse-inst-printer-list
3179                         'xmm-xmm/mem prefix opcode
3180                         :more-fields `((imm nil :type ,shuffle-pattern))
3181                         :printer '(:name :tab reg ", " reg/mem ", " imm)))
3182
3183                     (:emitter
3184                      (aver (typep pattern '(unsigned-byte ,n-bits)))
3185                      (emit-regular-sse-inst segment dst src ,prefix ,opcode
3186                                             :remaining-bytes 1)
3187                      (emit-byte segment pattern))))))
3188   (define-xmm-shuffle-sse-inst pshufd  #x66 #x70 8 4)
3189   (define-xmm-shuffle-sse-inst pshufhw #xf3 #x70 8 4)
3190   (define-xmm-shuffle-sse-inst pshuflw #xf2 #x70 8 4)
3191   (define-xmm-shuffle-sse-inst shufpd  #x66 #xc6 2 2)
3192   (define-xmm-shuffle-sse-inst shufps  nil  #xc6 8 4))
3193
3194 ;; MASKMOVDQU (dst is DS:RDI)
3195 (define-instruction maskmovdqu (segment src mask)
3196   (:printer-list
3197    (sse-inst-printer-list 'xmm-xmm/mem #x66 #xf7))
3198   (:emitter
3199    (aver (xmm-register-p src))
3200    (aver (xmm-register-p mask))
3201    (emit-regular-sse-inst segment src mask #x66 #xf7)))
3202
3203 (macrolet ((define-comparison-sse-inst (name prefix opcode
3204                                         name-prefix name-suffix)
3205                `(define-instruction ,name (segment op x y)
3206                   (:printer-list
3207                    ',(sse-inst-printer-list
3208                       'xmm-xmm/mem prefix opcode
3209                       :more-fields '((imm nil :type sse-condition-code))
3210                       :printer `(,name-prefix imm ,name-suffix
3211                                  :tab reg ", " reg/mem)))
3212                   (:emitter
3213                    (let ((code (position op *sse-conditions*)))
3214                      (aver code)
3215                      (emit-regular-sse-inst segment x y ,prefix ,opcode
3216                                             :remaining-bytes 1)
3217                      (emit-byte segment code))))))
3218   (define-comparison-sse-inst cmppd #x66 #xc2 "CMP" "PD")
3219   (define-comparison-sse-inst cmpps nil  #xc2 "CMP" "PS")
3220   (define-comparison-sse-inst cmpsd #xf2 #xc2 "CMP" "SD")
3221   (define-comparison-sse-inst cmpss #xf3 #xc2 "CMP" "SS"))
3222
3223 ;;; MOVSD, MOVSS
3224 (macrolet ((define-movsd/ss-sse-inst (name prefix)
3225              `(define-instruction ,name (segment dst src)
3226                 (:printer-list
3227                  ',(sse-inst-printer-list 'xmm-xmm/mem-dir
3228                                           prefix #b0001000))
3229                 (:emitter
3230                  (cond ((xmm-register-p dst)
3231                         (emit-sse-inst segment dst src ,prefix #x10
3232                                        :operand-size :do-not-set))
3233                        (t
3234                         (aver (xmm-register-p src))
3235                         (emit-sse-inst segment src dst ,prefix #x11
3236                                        :operand-size :do-not-set)))))))
3237   (define-movsd/ss-sse-inst movsd #xf2)
3238   (define-movsd/ss-sse-inst movss #xf3))
3239
3240 ;;; Packed MOVs
3241 (macrolet ((define-mov-sse-inst (name prefix opcode-from opcode-to
3242                                       &key force-to-mem reg-reg-name)
3243                `(progn
3244                   ,(when reg-reg-name
3245                      `(define-instruction ,reg-reg-name (segment dst src)
3246                         (:emitter
3247                          (aver (xmm-register-p dst))
3248                          (aver (xmm-register-p src))
3249                          (emit-regular-sse-inst segment dst src
3250                                                 ,prefix ,opcode-from))))
3251                   (define-instruction ,name (segment dst src)
3252                     (:printer-list
3253                      '(,@(when opcode-from
3254                            (sse-inst-printer-list
3255                             'xmm-xmm/mem prefix opcode-from))
3256                        ,@(sse-inst-printer-list
3257                           'xmm-xmm/mem prefix opcode-to
3258                           :printer '(:name :tab reg/mem ", " reg))))
3259                     (:emitter
3260                      (cond ,@(when opcode-from
3261                                `(((xmm-register-p dst)
3262                                   ,(when force-to-mem
3263                                      `(aver (not (or (register-p src)
3264                                                      (xmm-register-p src)))))
3265                                   (emit-regular-sse-inst
3266                                    segment dst src ,prefix ,opcode-from))))
3267                            (t
3268                             (aver (xmm-register-p src))
3269                             ,(when force-to-mem
3270                                `(aver (not (or (register-p dst)
3271                                                (xmm-register-p dst)))))
3272                             (emit-regular-sse-inst segment src dst
3273                                                    ,prefix ,opcode-to))))))))
3274   ;; direction bit?
3275   (define-mov-sse-inst movapd #x66 #x28 #x29)
3276   (define-mov-sse-inst movaps nil  #x28 #x29)
3277   (define-mov-sse-inst movdqa #x66 #x6f #x7f)
3278   (define-mov-sse-inst movdqu #xf3 #x6f #x7f)
3279
3280   ;; streaming
3281   (define-mov-sse-inst movntdq #x66 nil #xe7 :force-to-mem t)
3282   (define-mov-sse-inst movntpd #x66 nil #x2b :force-to-mem t)
3283   (define-mov-sse-inst movntps nil  nil #x2b :force-to-mem t)
3284
3285   ;; use movhps for movlhps and movlps for movhlps
3286   (define-mov-sse-inst movhpd #x66 #x16 #x17 :force-to-mem t)
3287   (define-mov-sse-inst movhps nil  #x16 #x17 :reg-reg-name movlhps)
3288   (define-mov-sse-inst movlpd #x66 #x12 #x13 :force-to-mem t)
3289   (define-mov-sse-inst movlps nil  #x12 #x13 :reg-reg-name movhlps)
3290   (define-mov-sse-inst movupd #x66 #x10 #x11)
3291   (define-mov-sse-inst movups nil  #x10 #x11))
3292
3293 ;;; MOVQ
3294 (define-instruction movq (segment dst src)
3295   (:printer-list
3296    (append
3297     (sse-inst-printer-list 'xmm-xmm/mem #xf3 #x7e)
3298     (sse-inst-printer-list 'xmm-xmm/mem #x66 #xd6
3299                            :printer '(:name :tab reg/mem ", " reg))))
3300   (:emitter
3301    (cond ((xmm-register-p dst)
3302           (emit-sse-inst segment dst src #xf3 #x7e
3303                          :operand-size :do-not-set))
3304          (t
3305           (aver (xmm-register-p src))
3306           (emit-sse-inst segment src dst #x66 #xd6
3307                          :operand-size :do-not-set)))))
3308
3309 ;;; Instructions having an XMM register as the destination operand
3310 ;;; and a general-purpose register or a memory location as the source
3311 ;;; operand. The operand size is calculated from the source operand.
3312
3313 ;;; MOVD - Move a 32- or 64-bit value from a general-purpose register or
3314 ;;; a memory location to the low order 32 or 64 bits of an XMM register
3315 ;;; with zero extension or vice versa.
3316 ;;; We do not support the MMX version of this instruction.
3317 (define-instruction movd (segment dst src)
3318   (:printer-list
3319    (append
3320     (sse-inst-printer-list 'xmm-reg/mem #x66 #x6e)
3321     (sse-inst-printer-list 'xmm-reg/mem #x66 #x7e
3322                            :printer '(:name :tab reg/mem ", " reg))))
3323   (:emitter
3324    (cond ((xmm-register-p dst)
3325           (emit-sse-inst segment dst src #x66 #x6e))
3326          (t
3327           (aver (xmm-register-p src))
3328           (emit-sse-inst segment src dst #x66 #x7e)))))
3329
3330 (define-instruction pinsrw (segment dst src imm)
3331   (:printer-list
3332    (sse-inst-printer-list
3333     'xmm-reg/mem #x66 #xc4
3334     :more-fields '((imm nil :type imm-byte))
3335     :printer '(:name :tab reg ", " reg/mem ", " imm)))
3336   (:emitter
3337    (aver (xmm-register-p dst))
3338    (let ((src-size (operand-size src)))
3339      (aver (or (not (register-p src))
3340                (eq src-size :qword) (eq src-size :dword)))
3341      (emit-sse-inst segment dst src #x66 #xc4
3342                     :operand-size (if (register-p src) src-size :do-not-set)
3343                     :remaining-bytes 1))
3344    (emit-byte segment imm)))
3345
3346 (define-instruction pextrw (segment dst src imm)
3347   (:printer-list
3348    (sse-inst-printer-list
3349     'reg-xmm/mem #x66 #xc5
3350     :more-fields '((imm nil :type imm-byte))
3351     :printer '(:name :tab reg ", " reg/mem ", " imm)))
3352   (:emitter
3353    (aver (xmm-register-p src))
3354    (aver (register-p dst))
3355    (let ((dst-size (operand-size dst)))
3356      (aver (or (eq dst-size :qword) (eq dst-size :dword)))
3357      (emit-sse-inst segment dst src #x66 #xc5
3358                     :operand-size dst-size
3359                     :remaining-bytes 1))
3360    (emit-byte segment imm)))
3361
3362 (macrolet ((define-integer-source-sse-inst (name prefix opcode &key mem-only)
3363              `(define-instruction ,name (segment dst src)
3364                 (:printer-list
3365                  ',(sse-inst-printer-list 'xmm-reg/mem prefix opcode))
3366                 (:emitter
3367                  (aver (xmm-register-p dst))
3368                  ,(when mem-only
3369                     `(aver (not (or (register-p src)
3370                                     (xmm-register-p src)))))
3371                  (let ((src-size (operand-size src)))
3372                    (aver (or (eq src-size :qword) (eq src-size :dword))))
3373                  (emit-sse-inst segment dst src ,prefix ,opcode)))))
3374   (define-integer-source-sse-inst cvtsi2sd #xf2 #x2a)
3375   (define-integer-source-sse-inst cvtsi2ss #xf3 #x2a)
3376   ;; FIXME: memory operand is always a QWORD
3377   (define-integer-source-sse-inst cvtpi2pd #x66 #x2a :mem-only t)
3378   (define-integer-source-sse-inst cvtpi2ps nil  #x2a :mem-only t))
3379
3380 ;;; Instructions having a general-purpose register as the destination
3381 ;;; operand and an XMM register or a memory location as the source
3382 ;;; operand. The operand size is calculated from the destination
3383 ;;; operand.
3384
3385 (macrolet ((define-gpr-destination-sse-inst (name prefix opcode &key reg-only)
3386              `(define-instruction ,name (segment dst src)
3387                 (:printer-list
3388                  ',(sse-inst-printer-list 'reg-xmm/mem prefix opcode))
3389                 (:emitter
3390                  (aver (register-p dst))
3391                  ,(when reg-only
3392                     `(aver (xmm-register-p src)))
3393                  (let ((dst-size (operand-size dst)))
3394                    (aver (or (eq dst-size :qword) (eq dst-size :dword)))
3395                    (emit-sse-inst segment dst src ,prefix ,opcode
3396                                   :operand-size dst-size))))))
3397   (define-gpr-destination-sse-inst cvtsd2si  #xf2 #x2d)
3398   (define-gpr-destination-sse-inst cvtss2si  #xf3 #x2d)
3399   (define-gpr-destination-sse-inst cvttsd2si #xf2 #x2c)
3400   (define-gpr-destination-sse-inst cvttss2si #xf3 #x2c)
3401   (define-gpr-destination-sse-inst movmskpd  #x66 #x50 :reg-only t)
3402   (define-gpr-destination-sse-inst movmskps  nil  #x50 :reg-only t)
3403   (define-gpr-destination-sse-inst pmovmskb  #x66 #xd7 :reg-only t))
3404
3405 ;;; Other SSE instructions
3406
3407 ;; FIXME: is that right!?
3408 (define-instruction movnti (segment dst src)
3409   (:printer ext-reg-reg/mem-no-width ((op #xc3)))
3410   (:printer rex-ext-reg-reg/mem-no-width ((op #xc3)))
3411   (:emitter
3412    (aver (not (or (register-p dst)
3413                   (xmm-register-p dst))))
3414    (aver (register-p src))
3415    (maybe-emit-rex-for-ea segment src dst)
3416    (emit-byte segment #x0f)
3417    (emit-byte segment #xc3)
3418    (emit-ea segment dst (reg-tn-encoding src))))
3419
3420 (define-instruction prefetch (segment type src)
3421   (:printer ext-reg/mem-no-width ((op '(#x18 0)))
3422             '("PREFETCHNTA" :tab reg/mem))
3423   (:printer ext-reg/mem-no-width ((op '(#x18 1)))
3424             '("PREFETCHT0" :tab reg/mem))
3425   (:printer ext-reg/mem-no-width ((op '(#x18 2)))
3426             '("PREFETCHT1" :tab reg/mem))
3427   (:printer ext-reg/mem-no-width ((op '(#x18 3)))
3428             '("PREFETCHT2" :tab reg/mem))
3429   (:printer rex-ext-reg/mem-no-width ((op '(#x18 0)))
3430             '("PREFETCHNTA" :tab reg/mem))
3431   (:printer rex-ext-reg/mem-no-width ((op '(#x18 1)))
3432             '("PREFETCHT0" :tab reg/mem))
3433   (:printer rex-ext-reg/mem-no-width ((op '(#x18 2)))
3434             '("PREFETCHT1" :tab reg/mem))
3435   (:printer rex-ext-reg/mem-no-width ((op '(#x18 3)))
3436             '("PREFETCHT2" :tab reg/mem))
3437   (:emitter
3438    (aver (not (or (register-p src)
3439                   (xmm-register-p src))))
3440    (aver (eq (operand-size src) :byte))
3441    (let ((type (position type #(:nta :t0 :t1 :t2))))
3442      (aver type)
3443      (maybe-emit-rex-for-ea segment src nil)
3444      (emit-byte segment #x0f)
3445      (emit-byte segment #x18)
3446      (emit-ea segment src type))))
3447
3448 (define-instruction clflush (segment src)
3449   (:printer ext-reg/mem-no-width ((op '(#xae 7))))
3450   (:printer rex-ext-reg/mem-no-width ((op '(#xae 7))))
3451   (:emitter
3452    (aver (not (or (register-p src)
3453                   (xmm-register-p src))))
3454    (aver (eq (operand-size src) :byte))
3455    (maybe-emit-rex-for-ea segment src nil)
3456    (emit-byte segment #x0f)
3457    (emit-byte segment #xae)
3458    (emit-ea segment src 7)))
3459
3460 (macrolet ((define-fence-instruction (name last-byte)
3461                `(define-instruction ,name (segment)
3462                   (:printer three-bytes ((op '(#x0f #xae ,last-byte))))
3463                   (:emitter
3464                    (emit-byte segment #x0f)
3465                    (emit-byte segment #xae)
3466                    (emit-byte segment ,last-byte)))))
3467   (define-fence-instruction lfence #b11101000)
3468   (define-fence-instruction mfence #b11110000)
3469   (define-fence-instruction sfence #b11111000))
3470
3471 (define-instruction pause (segment)
3472   (:printer two-bytes ((op '(#xf3 #x90))))
3473   (:emitter
3474    (emit-byte segment #xf3)
3475    (emit-byte segment #x90)))
3476
3477 (define-instruction ldmxcsr (segment src)
3478   (:printer ext-reg/mem-no-width ((op '(#xae 2))))
3479   (:printer rex-ext-reg/mem-no-width ((op '(#xae 2))))
3480   (:emitter
3481    (aver (not (or (register-p src)
3482                   (xmm-register-p src))))
3483    (aver (eq (operand-size src) :dword))
3484    (maybe-emit-rex-for-ea segment src nil)
3485    (emit-byte segment #x0f)
3486    (emit-byte segment #xae)
3487    (emit-ea segment src 2)))
3488
3489 (define-instruction stmxcsr (segment dst)
3490   (:printer ext-reg/mem-no-width ((op '(#xae 3))))
3491   (:printer rex-ext-reg/mem-no-width ((op '(#xae 3))))
3492   (:emitter
3493    (aver (not (or (register-p dst)
3494                   (xmm-register-p dst))))
3495    (aver (eq (operand-size dst) :dword))
3496    (maybe-emit-rex-for-ea segment dst nil)
3497    (emit-byte segment #x0f)
3498    (emit-byte segment #xae)
3499    (emit-ea segment dst 3)))
3500
3501 ;;;; Miscellany
3502
3503 (define-instruction cpuid (segment)
3504   (:printer two-bytes ((op '(#b00001111 #b10100010))))
3505   (:emitter
3506    (emit-byte segment #b00001111)
3507    (emit-byte segment #b10100010)))
3508
3509 (define-instruction rdtsc (segment)
3510   (:printer two-bytes ((op '(#b00001111 #b00110001))))
3511   (:emitter
3512    (emit-byte segment #b00001111)
3513    (emit-byte segment #b00110001)))
3514
3515 ;;;; Late VM definitions
3516
3517 (defun canonicalize-inline-constant (constant &aux (alignedp nil))
3518   (let ((first (car constant)))
3519     (when (eql first :aligned)
3520       (setf alignedp t)
3521       (pop constant)
3522       (setf first (car constant)))
3523     (typecase first
3524       (single-float (setf constant (list :single-float first)))
3525       (double-float (setf constant (list :double-float first)))
3526       ((complex single-float)
3527          (setf constant (list :complex-single-float first)))
3528       ((complex double-float)
3529          (setf constant (list :complex-double-float first)))))
3530   (destructuring-bind (type value) constant
3531     (ecase type
3532       ((:byte :word :dword :qword)
3533          (aver (integerp value))
3534          (cons type value))
3535       ((:base-char)
3536          (aver (base-char-p value))
3537          (cons :byte (char-code value)))
3538       ((:character)
3539          (aver (characterp value))
3540          (cons :dword (char-code value)))
3541       ((:single-float)
3542          (aver (typep value 'single-float))
3543          (cons (if alignedp :oword :dword)
3544                (ldb (byte 32 0) (single-float-bits value))))
3545       ((:double-float)
3546          (aver (typep value 'double-float))
3547          (cons (if alignedp :oword :qword)
3548                (ldb (byte 64 0) (logior (ash (double-float-high-bits value) 32)
3549                                         (double-float-low-bits value)))))
3550       ((:complex-single-float)
3551          (aver (typep value '(complex single-float)))
3552          (cons (if alignedp :oword :qword)
3553                (ldb (byte 64 0)
3554                     (logior (ash (single-float-bits (imagpart value)) 32)
3555                             (ldb (byte 32 0)
3556                                  (single-float-bits (realpart value)))))))
3557       ((:oword :sse)
3558          (aver (integerp value))
3559          (cons :oword value))
3560       ((:complex-double-float)
3561          (aver (typep value '(complex double-float)))
3562          (cons :oword
3563                (logior (ash (double-float-high-bits (imagpart value)) 96)
3564                        (ash (double-float-low-bits (imagpart value)) 64)
3565                        (ash (ldb (byte 32 0)
3566                                  (double-float-high-bits (realpart value)))
3567                             32)
3568                        (double-float-low-bits (realpart value))))))))
3569
3570 (defun inline-constant-value (constant)
3571   (let ((label (gen-label))
3572         (size  (ecase (car constant)
3573                  ((:byte :word :dword :qword) (car constant))
3574                  ((:oword) :qword))))
3575     (values label (make-ea size
3576                            :disp (make-fixup nil :code-object label)))))
3577
3578 (defun emit-constant-segment-header (constants optimize)
3579   (declare (ignore constants))
3580   (loop repeat (if optimize 64 16) do (inst byte #x90)))
3581
3582 (defun size-nbyte (size)
3583   (ecase size
3584     (:byte  1)
3585     (:word  2)
3586     (:dword 4)
3587     (:qword 8)
3588     (:oword 16)))
3589
3590 (defun sort-inline-constants (constants)
3591   (stable-sort constants #'> :key (lambda (constant)
3592                                     (size-nbyte (caar constant)))))
3593
3594 (defun emit-inline-constant (constant label)
3595   (let ((size (size-nbyte (car constant))))
3596     (emit-alignment (integer-length (1- size)))
3597     (emit-label label)
3598     (let ((val (cdr constant)))
3599       (loop repeat size
3600             do (inst byte (ldb (byte 8 0) val))
3601                (setf val (ash val -8))))))