1.0.16.7: slightly faster LAST
[sbcl.git] / src / compiler / knownfun.lisp
1 ;;;; This file contains stuff for maintaining a database of special
2 ;;;; information about functions known to the compiler. This includes
3 ;;;; semantic information such as side effects and type inference
4 ;;;; functions as well as transforms and IR2 translators.
5
6 ;;;; This software is part of the SBCL system. See the README file for
7 ;;;; more information.
8 ;;;;
9 ;;;; This software is derived from the CMU CL system, which was
10 ;;;; written at Carnegie Mellon University and released into the
11 ;;;; public domain. The software is in the public domain and is
12 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
13 ;;;; files for more information.
14
15 (in-package "SB!C")
16
17 (/show0 "knownfun.lisp 17")
18
19 ;;; IR1 boolean function attributes
20 ;;;
21 ;;; There are a number of boolean attributes of known functions which
22 ;;; we like to have in IR1. This information is mostly side effect
23 ;;; information of a sort, but it is different from the kind of
24 ;;; information we want in IR2. We aren't interested in a fine
25 ;;; breakdown of side effects, since we do very little code motion on
26 ;;; IR1. We are interested in some deeper semantic properties such as
27 ;;; whether it is safe to pass stack closures to.
28 (!def-boolean-attribute ir1
29   ;; may call functions that are passed as arguments. In order to
30   ;; determine what other effects are present, we must find the
31   ;; effects of all arguments that may be functions.
32   call
33   ;; may incorporate function or number arguments into the result or
34   ;; somehow pass them upward. Note that this applies to any argument
35   ;; that *might* be a function or number, not just the arguments that
36   ;; always are.
37   unsafe
38   ;; may fail to return during correct execution. Errors are O.K.
39   unwind
40   ;; the (default) worst case. Includes all the other bad things, plus
41   ;; any other possible bad thing. If this is present, the above bad
42   ;; attributes will be explicitly present as well.
43   any
44   ;; may be constant-folded. The function has no side effects, but may
45   ;; be affected by side effects on the arguments. e.g. SVREF, MAPC.
46   ;; Functions that side-effect their arguments are not considered to
47   ;; be foldable. Although it would be "legal" to constant fold them
48   ;; (since it "is an error" to modify a constant), we choose not to
49   ;; mark these functions as foldable in this database.
50   foldable
51   ;; may be eliminated if value is unused. The function has no side
52   ;; effects except possibly cons. If a function might signal errors,
53   ;; then it is not flushable even if it is movable, foldable or
54   ;; unsafely-flushable. Implies UNSAFELY-FLUSHABLE. (In safe code
55   ;; type checking of arguments is always performed by the caller, so
56   ;; a function which SHOULD signal an error if arguments are not of
57   ;; declared types may be FLUSHABLE.)
58   flushable
59   ;; unsafe call may be eliminated if value is unused. The function
60   ;; has no side effects except possibly cons and signalling an error
61   ;; in the safe code. If a function MUST signal errors, then it is
62   ;; not unsafely-flushable even if it is movable or foldable.
63   unsafely-flushable
64   ;; return value is important, and ignoring it is probably a mistake.
65   ;; Unlike the other attributes, this is used only for style
66   ;; warnings and has no effect on optimization.
67   important-result
68   ;; may be moved with impunity. Has no side effects except possibly
69   ;; consing, and is affected only by its arguments.
70   ;;
71   ;; Since it is not used now, its distribution in fndb.lisp is
72   ;; mere random; use with caution.
73   movable
74   ;; The function is a true predicate likely to be open-coded. Convert
75   ;; any non-conditional uses into (IF <pred> T NIL). Not usually
76   ;; specified to DEFKNOWN, since this is implementation dependent,
77   ;; and is usually automatically set by the DEFINE-VOP :CONDITIONAL
78   ;; option.
79   predicate
80   ;; Inhibit any warning for compiling a recursive definition.
81   ;; (Normally the compiler warns when compiling a recursive
82   ;; definition for a known function, since it might be a botched
83   ;; interpreter stub.)
84   recursive
85   ;; The function does explicit argument type checking, so the
86   ;; declared type should not be asserted when a definition is
87   ;; compiled.
88   explicit-check
89   ;; The function should always be translated by a VOP (i.e. it should
90   ;; should never be converted into a full call).  This is used strictly
91   ;; as a consistency checking mechanism inside the compiler during IR2
92   ;; transformation.
93   always-translatable)
94
95 (defstruct (fun-info #-sb-xc-host (:pure t))
96   ;; boolean attributes of this function.
97   (attributes (missing-arg) :type attributes)
98   ;; TRANSFORM structures describing transforms for this function
99   (transforms () :type list)
100   ;; a function which computes the derived type for a call to this
101   ;; function by examining the arguments. This is null when there is
102   ;; no special method for this function.
103   (derive-type nil :type (or function null))
104   ;; a function that does various unspecified code transformations by
105   ;; directly hacking the IR. Returns true if further optimizations of
106   ;; the call shouldn't be attempted.
107   ;;
108   ;; KLUDGE: This return convention (non-NIL if you shouldn't do
109   ;; further optimiz'ns) is backwards from the return convention for
110   ;; transforms. -- WHN 19990917
111   (optimizer nil :type (or function null))
112   ;; a function computing the constant or literal arguments which are
113   ;; destructively modified by the call.
114   (destroyed-constant-args nil :type (or function null))
115   ;; If true, a special-case LTN annotation method that is used in
116   ;; place of the standard type/policy template selection. It may use
117   ;; arbitrary code to choose a template, decide to do a full call, or
118   ;; conspire with the IR2-CONVERT method to do almost anything. The
119   ;; COMBINATION node is passed as the argument.
120   (ltn-annotate nil :type (or function null))
121   ;; If true, the special-case IR2 conversion method for this
122   ;; function. This deals with funny functions, and anything else that
123   ;; can't be handled using the template mechanism. The COMBINATION
124   ;; node and the IR2-BLOCK are passed as arguments.
125   (ir2-convert nil :type (or function null))
126   ;; If true, the function can stack-allocate the result. The
127   ;; COMBINATION node is passed as an argument.
128   (stack-allocate-result nil :type (or function null))
129   ;; all the templates that could be used to translate this function
130   ;; into IR2, sorted by increasing cost.
131   (templates nil :type list)
132   ;; If non-null, then this function is a unary type predicate for
133   ;; this type.
134   (predicate-type nil :type (or ctype null)))
135
136 (defprinter (fun-info)
137   (attributes :test (not (zerop attributes))
138               :prin1 (decode-ir1-attributes attributes))
139   (transforms :test transforms)
140   (derive-type :test derive-type)
141   (optimizer :test optimizer)
142   (ltn-annotate :test ltn-annotate)
143   (ir2-convert :test ir2-convert)
144   (templates :test templates)
145   (predicate-type :test predicate-type))
146 \f
147 ;;;; interfaces to defining macros
148
149 ;;; an IR1 transform
150 (defstruct (transform (:copier nil))
151   ;; the function type which enables this transform.
152   ;;
153   ;; (Note that declaring this :TYPE FUN-TYPE probably wouldn't
154   ;; work because some function types, like (SPECIFIER-TYPE 'FUNCTION0
155   ;; itself, are represented as BUILT-IN-TYPE, and at least as of
156   ;; sbcl-0.pre7.54 or so, that's inconsistent with being a
157   ;; FUN-TYPE.)
158   (type (missing-arg) :type ctype)
159   ;; the transformation function. Takes the COMBINATION node and
160   ;; returns a lambda expression, or throws out.
161   (function (missing-arg) :type function)
162   ;; string used in efficiency notes
163   (note (missing-arg) :type string)
164   ;; T if we should emit a failure note even if SPEED=INHIBIT-WARNINGS.
165   (important nil :type (member t nil)))
166
167 (defprinter (transform) type note important)
168
169 ;;; Grab the FUN-INFO and enter the function, replacing any old
170 ;;; one with the same type and note.
171 (declaim (ftype (function (t list function &optional (or string null)
172                              (member t nil))
173                           *)
174                 %deftransform))
175 (defun %deftransform (name type fun &optional note important)
176   (let* ((ctype (specifier-type type))
177          (note (or note "optimize"))
178          (info (fun-info-or-lose name))
179          (old (find-if (lambda (x)
180                          (and (type= (transform-type x) ctype)
181                               (string-equal (transform-note x) note)
182                               (eq (transform-important x) important)))
183                        (fun-info-transforms info))))
184     (cond (old
185            (style-warn "Overwriting ~S" old)
186            (setf (transform-function old) fun
187                  (transform-note old) note))
188           (t
189            (push (make-transform :type ctype :function fun :note note
190                                  :important important)
191                  (fun-info-transforms info))))
192     name))
193
194 ;;; Make a FUN-INFO structure with the specified type, attributes
195 ;;; and optimizers.
196 (declaim (ftype (function (list list attributes &key
197                                 (:derive-type (or function null))
198                                 (:optimizer (or function null))
199                                 (:destroyed-constant-args (or function null)))
200                           *)
201                 %defknown))
202 (defun %defknown (names type attributes &key derive-type optimizer destroyed-constant-args)
203   (let ((ctype (specifier-type type))
204         (info (make-fun-info :attributes attributes
205                              :derive-type derive-type
206                              :optimizer optimizer
207                              :destroyed-constant-args destroyed-constant-args))
208         (target-env *info-environment*))
209     (dolist (name names)
210       (let ((old-fun-info (info :function :info name)))
211         (when old-fun-info
212           ;; This is handled as an error because it's generally a bad
213           ;; thing to blow away all the old optimization stuff. It's
214           ;; also a potential source of sneaky bugs:
215           ;;    DEFKNOWN FOO
216           ;;    DEFTRANSFORM FOO
217           ;;    DEFKNOWN FOO ; possibly hidden inside some macroexpansion
218           ;;    ; Now the DEFTRANSFORM doesn't exist in the target Lisp.
219           ;; However, it's continuable because it might be useful to do
220           ;; it when testing new optimization stuff interactively.
221           (cerror "Go ahead, overwrite it."
222                   "~@<overwriting old FUN-INFO ~2I~_~S ~I~_for ~S~:>"
223                   old-fun-info name)))
224       (setf (info :function :type name target-env) ctype)
225       (setf (info :function :where-from name target-env) :declared)
226       (setf (info :function :kind name target-env) :function)
227       (setf (info :function :info name target-env) info)))
228   names)
229
230 ;;; Return the FUN-INFO for NAME or die trying. Since this is
231 ;;; used by callers who want to modify the info, and the info may be
232 ;;; shared, we copy it. We don't have to copy the lists, since each
233 ;;; function that has generators or transforms has already been
234 ;;; through here.
235 (declaim (ftype (sfunction (t) fun-info) fun-info-or-lose))
236 (defun fun-info-or-lose (name)
237   (let (;; FIXME: Do we need this rebinding here? It's a literal
238         ;; translation of the old CMU CL rebinding to
239         ;; (OR *BACKEND-INFO-ENVIRONMENT* *INFO-ENVIRONMENT*),
240         ;; and it's not obvious whether the rebinding to itself is
241         ;; needed that SBCL doesn't need *BACKEND-INFO-ENVIRONMENT*.
242         (*info-environment* *info-environment*))
243     (let ((old (info :function :info name)))
244       (unless old (error "~S is not a known function." name))
245       (setf (info :function :info name) (copy-fun-info old)))))
246 \f
247 ;;;; generic type inference methods
248
249 ;;; Derive the type to be the type of the xxx'th arg. This can normally
250 ;;; only be done when the result value is that argument.
251 (defun result-type-first-arg (call)
252   (declare (type combination call))
253   (let ((lvar (first (combination-args call))))
254     (when lvar (lvar-type lvar))))
255 (defun result-type-last-arg (call)
256   (declare (type combination call))
257   (let ((lvar (car (last (combination-args call)))))
258     (when lvar (lvar-type lvar))))
259
260 ;;; Derive the result type according to the float contagion rules, but
261 ;;; always return a float. This is used for irrational functions that
262 ;;; preserve realness of their arguments.
263 (defun result-type-float-contagion (call)
264   (declare (type combination call))
265   (reduce #'numeric-contagion (combination-args call)
266           :key #'lvar-type
267           :initial-value (specifier-type 'single-float)))
268
269 ;;; Return a closure usable as a derive-type method for accessing the
270 ;;; N'th argument. If arg is a list, result is a list. If arg is a
271 ;;; vector, result is a vector with the same element type.
272 (defun sequence-result-nth-arg (n)
273   (lambda (call)
274     (declare (type combination call))
275     (let ((lvar (nth (1- n) (combination-args call))))
276       (when lvar
277         (let ((type (lvar-type lvar)))
278           (if (array-type-p type)
279               (specifier-type
280                `(vector ,(type-specifier (array-type-element-type type))))
281               (let ((ltype (specifier-type 'list)))
282                 (when (csubtypep type ltype)
283                   ltype))))))))
284
285 ;;; Derive the type to be the type specifier which is the Nth arg.
286 (defun result-type-specifier-nth-arg (n)
287   (lambda (call)
288     (declare (type combination call))
289     (let ((lvar (nth (1- n) (combination-args call))))
290       (when (and lvar (constant-lvar-p lvar))
291         (careful-specifier-type (lvar-value lvar))))))
292
293 ;;; Derive the type to be the type specifier which is the Nth arg,
294 ;;; with the additional restriptions noted in the CLHS for STRING and
295 ;;; SIMPLE-STRING, defined to specialize on CHARACTER, and for VECTOR
296 ;;; (under the page for MAKE-SEQUENCE).
297 (defun creation-result-type-specifier-nth-arg (n)
298   (lambda (call)
299     (declare (type combination call))
300     (let ((lvar (nth (1- n) (combination-args call))))
301       (when (and lvar (constant-lvar-p lvar))
302         (let* ((specifier (lvar-value lvar))
303                (lspecifier (if (atom specifier) (list specifier) specifier)))
304           (cond
305             ((eq (car lspecifier) 'string)
306              (destructuring-bind (string &rest size)
307                  lspecifier
308                (declare (ignore string))
309                (careful-specifier-type
310                 `(vector character ,@(when size size)))))
311             ((eq (car lspecifier) 'simple-string)
312              (destructuring-bind (simple-string &rest size)
313                  lspecifier
314                (declare (ignore simple-string))
315                (careful-specifier-type
316                 `(simple-array character ,@(if size (list size) '((*)))))))
317             (t
318              (let ((ctype (careful-specifier-type specifier)))
319                (if (and (array-type-p ctype)
320                         (eq (array-type-specialized-element-type ctype)
321                             *wild-type*))
322                    ;; I don't think I'm allowed to modify what I get
323                    ;; back from SPECIFIER-TYPE; it is, after all,
324                    ;; cached.  Better copy it, then.
325                    (let ((real-ctype (copy-structure ctype)))
326                      (setf (array-type-element-type real-ctype)
327                            *universal-type*
328                            (array-type-specialized-element-type real-ctype)
329                            *universal-type*)
330                      real-ctype)
331                    ctype)))))))))
332
333 (defun remove-non-constants-and-nils (fun)
334   (lambda (list)
335     (remove-if-not #'lvar-value
336                    (remove-if-not #'constant-lvar-p (funcall fun list)))))
337
338 ;;; FIXME: bad name (first because it uses 1-based indexing; second
339 ;;; because it doesn't get the nth constant arguments)
340 (defun nth-constant-args (&rest indices)
341   (lambda (list)
342     (let (result)
343       (do ((i 1 (1+ i))
344            (list list (cdr list))
345            (indices indices))
346           ((null indices) (nreverse result))
347         (when (= i (car indices))
348           (when (constant-lvar-p (car list))
349             (push (car list) result))
350           (setf indices (cdr indices)))))))
351
352 ;;; FIXME: a number of the sequence functions not only do not destroy
353 ;;; their argument if it is empty, but also leave it alone if :start
354 ;;; and :end bound a null sequence, or if :count is 0.  This test is a
355 ;;; bit complicated to implement, verging on the impossible, but for
356 ;;; extra points (fill #\1 "abc" :start 0 :end 0) should not cause a
357 ;;; warning.
358 (defun nth-constant-nonempty-sequence-args (&rest indices)
359   (lambda (list)
360     (let (result)
361       (do ((i 1 (1+ i))
362            (list list (cdr list))
363            (indices indices))
364           ((null indices) (nreverse result))
365         (when (= i (car indices))
366           (when (constant-lvar-p (car list))
367             (let ((value (lvar-value (car list))))
368               (unless (or (typep value 'null)
369                           (typep value '(vector * 0)))
370                 (push (car list) result))))
371           (setf indices (cdr indices)))))))
372
373 (/show0 "knownfun.lisp end of file")