1.0.25.47: OOAO restoring fp control word
[sbcl.git] / src / runtime / sparc-arch.c
1 /*
2  * This software is part of the SBCL system. See the README file for
3  * more information.
4  *
5  * This software is derived from the CMU CL system, which was
6  * written at Carnegie Mellon University and released into the
7  * public domain. The software is in the public domain and is
8  * provided with absolutely no warranty. See the COPYING and CREDITS
9  * files for more information.
10  */
11 #include <stdio.h>
12
13 #include "sbcl.h"
14 #include "runtime.h"
15 #include "arch.h"
16 #include "globals.h"
17 #include "validate.h"
18 #include "os.h"
19 #include "lispregs.h"
20 #include "signal.h"
21 #include "alloc.h"
22 #include "interrupt.h"
23 #include "interr.h"
24 #include "breakpoint.h"
25 #include "monitor.h"
26
27 #ifdef LISP_FEATURE_LINUX
28 extern int linux_sparc_siginfo_bug;
29 #endif
30
31 void arch_init(void)
32 {
33     return;
34 }
35
36 os_vm_address_t arch_get_bad_addr(int sig, siginfo_t *code, os_context_t *context)
37 {
38     unsigned int badinst;
39     unsigned int *pc;
40     int rs1;
41
42     pc = (unsigned int *)(*os_context_pc_addr(context));
43
44     /* On the sparc, we have to decode the instruction. */
45
46     /* Make sure it's not the pc thats bogus, and that it was lisp code */
47     /* that caused the fault. */
48     if ((unsigned long) pc & 3) {
49       /* Unaligned */
50       return NULL;
51     }
52     if ((pc < READ_ONLY_SPACE_START ||
53          pc >= READ_ONLY_SPACE_START+READ_ONLY_SPACE_SIZE) &&
54         (pc < current_dynamic_space ||
55          pc >= current_dynamic_space + dynamic_space_size)) {
56       return NULL;
57     }
58
59     badinst = *pc;
60
61     if ((badinst >> 30) != 3)
62         /* All load/store instructions have op = 11 (binary) */
63         return 0;
64
65     rs1 = (badinst>>14)&0x1f;
66
67     if (badinst & (1<<13)) {
68         /* r[rs1] + simm(13) */
69         int simm13 = badinst & 0x1fff;
70
71         if (simm13 & (1<<12))
72             simm13 |= -1<<13;
73
74         return (os_vm_address_t)
75             (*os_context_register_addr(context, rs1)+simm13);
76     }
77     else {
78         /* r[rs1] + r[rs2] */
79         int rs2 = badinst & 0x1f;
80
81         return (os_vm_address_t)
82             (*os_context_register_addr(context, rs1) +
83              *os_context_register_addr(context, rs2));
84     }
85 }
86
87 void arch_skip_instruction(os_context_t *context)
88 {
89     *os_context_pc_addr(context) = *os_context_npc_addr(context);
90     /* Note that we're doing integer arithmetic here, not pointer. So
91      * the value that the return value of os_context_npc_addr() points
92      * to will be incremented by 4, not 16.
93      */
94     *os_context_npc_addr(context) += 4;
95 }
96
97 unsigned char *arch_internal_error_arguments(os_context_t *context)
98 {
99     return (unsigned char *)(*os_context_pc_addr(context) + 4);
100 }
101
102 boolean arch_pseudo_atomic_atomic(os_context_t *context)
103 {
104     /* FIXME: this foreign_function_call_active test is dubious at
105      * best. If a foreign call is made in a pseudo atomic section
106      * (?) or more likely a pseudo atomic section is in a foreign
107      * call then an interrupt is executed immediately. Maybe it
108      * has to do with C code not maintaining pseudo atomic
109      * properly. MG - 2005-08-10
110      *
111      * The foreign_function_call_active used to live at each call-site
112      * to arch_pseudo_atomic_atomic, but this seems clearer.
113      * --NS 2007-05-15 */
114     return (!foreign_function_call_active)
115         && ((*os_context_register_addr(context,reg_ALLOC)) & 4);
116 }
117
118 void arch_set_pseudo_atomic_interrupted(os_context_t *context)
119 {
120     *os_context_register_addr(context,reg_ALLOC) |=  1;
121 }
122
123 void arch_clear_pseudo_atomic_interrupted(os_context_t *context)
124 {
125     *os_context_register_addr(context,reg_ALLOC) &= ~1;
126 }
127
128 unsigned int arch_install_breakpoint(void *pc)
129 {
130     unsigned int *ptr = (unsigned int *)pc;
131     unsigned int result = *ptr;
132     *ptr = trap_Breakpoint;
133
134     os_flush_icache((os_vm_address_t) pc, sizeof(unsigned int));
135
136     return result;
137 }
138
139 void arch_remove_breakpoint(void *pc, unsigned int orig_inst)
140 {
141     *(unsigned int *)pc = orig_inst;
142     os_flush_icache((os_vm_address_t) pc, sizeof(unsigned int));
143 }
144
145 /*
146  * Perform the instruction that we overwrote with a breakpoint.  As we
147  * don't have a single-step facility, this means we have to:
148  * - put the instruction back
149  * - put a second breakpoint at the following instruction,
150  *   set after_breakpoint and continue execution.
151  *
152  * When the second breakpoint is hit (very shortly thereafter, we hope)
153  * sigtrap_handler gets called again, but follows the AfterBreakpoint
154  * arm, which
155  * - puts a bpt back in the first breakpoint place (running across a
156  *   breakpoint shouldn't cause it to be uninstalled)
157  * - replaces the second bpt with the instruction it was meant to be
158  * - carries on
159  *
160  * Clear?
161  */
162 static unsigned int *skipped_break_addr, displaced_after_inst;
163 static sigset_t orig_sigmask;
164
165 void arch_do_displaced_inst(os_context_t *context, unsigned int orig_inst)
166 {
167     unsigned int *pc = (unsigned int *)(*os_context_pc_addr(context));
168     unsigned int *npc = (unsigned int *)(*os_context_npc_addr(context));
169
170   /*  orig_sigmask = context->sigmask;
171       sigemptyset(&context->sigmask); */
172   /* FIXME!!! */
173   /* FILLBLOCKSET(&context->uc_sigmask);*/
174
175     *pc = orig_inst;
176     os_flush_icache((os_vm_address_t) pc, sizeof(unsigned int));
177     skipped_break_addr = pc;
178     displaced_after_inst = *npc;
179     *npc = trap_AfterBreakpoint;
180     os_flush_icache((os_vm_address_t) npc, sizeof(unsigned int));
181
182 }
183
184 static int pseudo_atomic_trap_p(os_context_t *context)
185 {
186     unsigned int* pc;
187     unsigned int badinst;
188     int result;
189
190
191     pc = (unsigned int*) *os_context_pc_addr(context);
192     badinst = *pc;
193     result = 0;
194
195     /* Check to see if the current instruction is a pseudo-atomic-trap */
196     if (((badinst >> 30) == 2) && (((badinst >> 19) & 0x3f) == 0x3a)
197         && (((badinst >> 13) & 1) == 1) && ((badinst & 0x7f) == PSEUDO_ATOMIC_TRAP))
198         {
199             unsigned int previnst;
200             previnst = pc[-1];
201             /*
202              * Check to see if the previous instruction was an andcc alloc-tn,
203              * 3, zero-tn instruction.
204              */
205             if (((previnst >> 30) == 2) && (((previnst >> 19) & 0x3f) == 0x11)
206                 && (((previnst >> 14) & 0x1f) == reg_ALLOC)
207                 && (((previnst >> 25) & 0x1f) == reg_ZERO)
208                 && (((previnst >> 13) & 1) == 1)
209                 && ((previnst & 0x1fff) == 3))
210                 {
211                     result = 1;
212                 }
213             else
214                 {
215                     fprintf(stderr, "Oops!  Got a PSEUDO-ATOMIC-TRAP without a preceeding andcc!\n");
216                 }
217         }
218     return result;
219 }
220
221 void
222 arch_handle_breakpoint(os_context_t *context)
223 {
224     handle_breakpoint(context);
225 }
226
227 void
228 arch_handle_fun_end_breakpoint(os_context_t *context)
229 {
230     *os_context_pc_addr(context) = (int) handle_fun_end_breakpoint(context);
231     *os_context_npc_addr(context) = *os_context_pc_addr(context) + 4;
232 }
233
234 void
235 arch_handle_after_breakpoint(os_context_t *context)
236 {
237     *skipped_break_addr = trap_Breakpoint;
238     os_flush_icache(skipped_break_addr, sizeof(unsigned int));
239     skipped_break_addr = NULL;
240     *(unsigned long *) os_context_pc_addr(context) = displaced_after_inst;
241     /* context->sigmask = orig_sigmask; */
242     os_flush_icache((os_vm_address_t) os_context_pc_addr(context), sizeof(unsigned int));
243 }
244
245 void
246 arch_handle_single_step_trap(os_context_t *context, int trap)
247 {
248     unsigned int code = *((u32 *)(*os_context_pc_addr(context)));
249     int register_offset = code >> 5 & 0x1f;
250     handle_single_step_trap(context, trap, register_offset);
251     arch_skip_instruction(context);
252 }
253
254 static void sigill_handler(int signal, siginfo_t *siginfo, void *void_context)
255 {
256     os_context_t *context = arch_os_get_context(&void_context);
257
258     if ((siginfo->si_code) == ILL_ILLOPC
259 #ifdef LISP_FEATURE_LINUX
260         || (linux_sparc_siginfo_bug && (siginfo->si_code == 2))
261 #endif
262         ) {
263         int trap;
264         unsigned int inst;
265         unsigned int* pc = (unsigned int*) siginfo->si_addr;
266
267         inst = *pc;
268         trap = inst & 0x1f;
269         handle_trap(context,trap);
270     }
271     else if ((siginfo->si_code) == ILL_ILLTRP
272 #ifdef LISP_FEATURE_LINUX
273              || (linux_sparc_siginfo_bug && (siginfo->si_code) == 192)
274 #endif
275              ) {
276         if (pseudo_atomic_trap_p(context)) {
277             /* A trap instruction from a pseudo-atomic.  We just need
278                to fixup up alloc-tn to remove the interrupted flag,
279                skip over the trap instruction, and then handle the
280                pending interrupt(s). */
281             arch_clear_pseudo_atomic_interrupted(context);
282             arch_skip_instruction(context);
283             interrupt_handle_pending(context);
284         }
285         else {
286             interrupt_internal_error(context, 0);
287         }
288     }
289     else {
290         interrupt_handle_now(signal, siginfo, context);
291     }
292 }
293
294 static void sigemt_handler(int signal, siginfo_t *siginfo, void *void_context)
295 {
296     unsigned int badinst;
297     boolean subtract, immed;
298     int rd, rs1, op1, rs2, op2, result;
299     os_context_t *context = arch_os_get_context(&void_context);
300
301     badinst = *(unsigned int *)os_context_pc_addr(context);
302     if ((badinst >> 30) != 2 || ((badinst >> 20) & 0x1f) != 0x11) {
303         /* It wasn't a tagged add.  Pass the signal into lisp. */
304         interrupt_handle_now(signal, siginfo, context);
305         return;
306     }
307
308     fprintf(stderr, "SIGEMT trap handler with tagged op instruction!\n");
309
310     /* Extract the parts of the inst. */
311     subtract = badinst & (1<<19);
312     rs1 = (badinst>>14) & 0x1f;
313     op1 = *os_context_register_addr(context, rs1);
314
315     /* If the first arg is $ALLOC then it is really a signal-pending note */
316     /* for the pseudo-atomic noise. */
317     if (rs1 == reg_ALLOC) {
318         /* Perform the op anyway. */
319         op2 = badinst & 0x1fff;
320         if (op2 & (1<<12))
321             op2 |= -1<<13;
322         if (subtract)
323             result = op1 - op2;
324         else
325             result = op1 + op2;
326         /* KLUDGE: this & ~7 is a little bit magical but basically
327            clears pseudo_atomic bits if any */
328         *os_context_register_addr(context, reg_ALLOC) = result & ~7;
329         arch_skip_instruction(context);
330         interrupt_handle_pending(context);
331         return;
332     }
333
334     if ((op1 & 3) != 0) {
335         /* The first arg wan't a fixnum. */
336         interrupt_internal_error(context, 0);
337         return;
338     }
339
340     if (immed = badinst & (1<<13)) {
341         op2 = badinst & 0x1fff;
342         if (op2 & (1<<12))
343             op2 |= -1<<13;
344     }
345     else {
346         rs2 = badinst & 0x1f;
347         op2 = *os_context_register_addr(context, rs2);
348     }
349
350     if ((op2 & 3) != 0) {
351         /* The second arg wan't a fixnum. */
352         interrupt_internal_error(context, 0);
353         return;
354     }
355
356     rd = (badinst>>25) & 0x1f;
357     if (rd != 0) {
358         /* Don't bother computing the result unless we are going to use it. */
359         if (subtract)
360             result = (op1>>2) - (op2>>2);
361         else
362             result = (op1>>2) + (op2>>2);
363
364         dynamic_space_free_pointer =
365             (lispobj *) *os_context_register_addr(context, reg_ALLOC);
366
367         *os_context_register_addr(context, rd) = alloc_number(result);
368
369         *os_context_register_addr(context, reg_ALLOC) =
370             (unsigned long) dynamic_space_free_pointer;
371     }
372
373     arch_skip_instruction(context);
374 }
375
376 void arch_install_interrupt_handlers()
377 {
378     undoably_install_low_level_interrupt_handler(SIGILL , sigill_handler);
379     undoably_install_low_level_interrupt_handler(SIGEMT, sigemt_handler);
380 }
381
382 \f
383 #ifdef LISP_FEATURE_LINKAGE_TABLE
384
385 /* This a naive port from CMUCL/sparc, which was mostly stolen from the
386  * CMUCL/x86 version, with adjustments for sparc
387  *
388  * Linkage entry size is 16, because we need at least 3 instruction to
389  * implement a jump:
390  *
391  *      sethi %hi(addr), %g4
392  *      jmpl  [%g4 + %lo(addr)], %g5
393  *      nop
394  *
395  * The Sparc V9 ABI seems to use 8 words for its jump tables.  Maybe
396  * we should do the same?
397  */
398
399 /*
400  * Define the registers to use in the linkage jump table. Can be the
401  * same. Some care must be exercised when choosing these. It has to be
402  * a register that is not otherwise being used. reg_L0 is a good
403  * choice. call_into_c trashes reg_L0 without preserving it, so we can
404  * trash it in the linkage jump table.
405  */
406 #define LINKAGE_TEMP_REG        reg_L0
407 #define LINKAGE_ADDR_REG        reg_L0
408
409 /*
410  * Insert the necessary jump instructions at the given address.
411  */
412 void
413 arch_write_linkage_table_jmp(void* reloc_addr, void *target_addr)
414 {
415   /*
416    * Make JMP to function entry.
417    *
418    * The instruction sequence is:
419    *
420    *        sethi %hi(addr), temp_reg
421    *        jmp   %temp_reg + %lo(addr), %addr_reg
422    *        nop
423    *        nop
424    *
425    */
426   int* inst_ptr;
427   unsigned long hi;                   /* Top 22 bits of address */
428   unsigned long lo;                   /* Low 10 bits of address */
429   unsigned int inst;
430
431   inst_ptr = (int*) reloc_addr;
432
433   /*
434    * Split the target address into hi and lo parts for the sethi
435    * instruction.  hi is the top 22 bits.  lo is the low 10 bits.
436    */
437   hi = (unsigned long) target_addr;
438   lo = hi & 0x3ff;
439   hi >>= 10;
440
441   /*
442    * sethi %hi(addr), temp_reg
443    */
444
445   inst = (0 << 30) | (LINKAGE_TEMP_REG << 25) | (4 << 22) | hi;
446   *inst_ptr++ = inst;
447
448   /*
449    * jmpl [temp_reg + %lo(addr)], addr_reg
450    */
451
452   inst = (2U << 30) | (LINKAGE_ADDR_REG << 25) | (0x38 << 19)
453     | (LINKAGE_TEMP_REG << 14) | (1 << 13) | lo;
454   *inst_ptr++ = inst;
455
456   /* nop (really sethi 0, %g0) */
457
458   inst = (0 << 30) | (0 << 25) | (4 << 22) | 0;
459
460   *inst_ptr++ = inst;
461   *inst_ptr++ = inst;
462
463   os_flush_icache((os_vm_address_t) reloc_addr, (char*) inst_ptr - (char*) reloc_addr);
464 }
465
466 void
467 arch_write_linkage_table_ref(void * reloc_addr, void *target_addr)
468 {
469     *(unsigned long *)reloc_addr = (unsigned long)target_addr;
470 }
471
472 #endif