1.0.33.15: preparation for UTF external formats
[sbcl.git] / src / code / fd-stream.lisp
1 ;;;; streams for UNIX file descriptors
2
3 ;;;; This software is part of the SBCL system. See the README file for
4 ;;;; more information.
5 ;;;;
6 ;;;; This software is derived from the CMU CL system, which was
7 ;;;; written at Carnegie Mellon University and released into the
8 ;;;; public domain. The software is in the public domain and is
9 ;;;; provided with absolutely no warranty. See the COPYING and CREDITS
10 ;;;; files for more information.
11
12 (in-package "SB!IMPL")
13
14 ;;;; BUFFER
15 ;;;;
16 ;;;; Streams hold BUFFER objects, which contain a SAP, size of the
17 ;;;; memory area the SAP stands for (LENGTH bytes), and HEAD and TAIL
18 ;;;; indexes which delimit the "valid", or "active" area of the
19 ;;;; memory. HEAD is inclusive, TAIL is exclusive.
20 ;;;;
21 ;;;; Buffers get allocated lazily, and are recycled by returning them
22 ;;;; to the *AVAILABLE-BUFFERS* list. Every buffer has it's own
23 ;;;; finalizer, to take care of releasing the SAP memory when a stream
24 ;;;; is not properly closed.
25 ;;;;
26 ;;;; The code aims to provide a limited form of thread and interrupt
27 ;;;; safety: parallel writes and reads may lose output or input, cause
28 ;;;; interleaved IO, etc -- but they should not corrupt memory. The
29 ;;;; key to doing this is to read buffer state once, and update the
30 ;;;; state based on the read state:
31 ;;;;
32 ;;;; (let ((tail (buffer-tail buffer)))
33 ;;;;   ...
34 ;;;;   (setf (buffer-tail buffer) (+ tail n)))
35 ;;;;
36 ;;;; NOT
37 ;;;;
38 ;;;; (let ((tail (buffer-tail buffer)))
39 ;;;;   ...
40 ;;;;  (incf (buffer-tail buffer) n))
41 ;;;;
42
43 (declaim (inline buffer-sap buffer-length buffer-head buffer-tail
44                  (setf buffer-head) (setf buffer-tail)))
45 (defstruct (buffer (:constructor %make-buffer (sap length)))
46   (sap (missing-arg) :type system-area-pointer :read-only t)
47   (length (missing-arg) :type index :read-only t)
48   (head 0 :type index)
49   (tail 0 :type index))
50
51 (defvar *available-buffers* ()
52   #!+sb-doc
53   "List of available buffers.")
54
55 (defvar *available-buffers-spinlock* (sb!thread::make-spinlock
56                                       :name "lock for *AVAILABLE-BUFFERS*")
57   #!+sb-doc
58   "Mutex for access to *AVAILABLE-BUFFERS*.")
59
60 (defmacro with-available-buffers-lock ((&optional) &body body)
61   ;; CALL-WITH-SYSTEM-SPINLOCK because
62   ;;
63   ;; 1. streams are low-level enough to be async signal safe, and in
64   ;;    particular a C-c that brings up the debugger while holding the
65   ;;    mutex would lose badly
66   ;;
67   ;; 2. this can potentially be a fairly busy (but also probably
68   ;;    uncontended) lock, so we don't want to pay the syscall per
69   ;;    release -- hence a spinlock.
70   ;;
71   ;; ...again, once we have smarted locks the spinlock here can become
72   ;; a mutex.
73   `(sb!thread::with-system-spinlock (*available-buffers-spinlock*)
74      ,@body))
75
76 (defconstant +bytes-per-buffer+ (* 4 1024)
77   #!+sb-doc
78   "Default number of bytes per buffer.")
79
80 (defun alloc-buffer (&optional (size +bytes-per-buffer+))
81   ;; Don't want to allocate & unwind before the finalizer is in place.
82   (without-interrupts
83     (let* ((sap (allocate-system-memory size))
84            (buffer (%make-buffer sap size)))
85       (when (zerop (sap-int sap))
86         (error "Could not allocate ~D bytes for buffer." size))
87       (finalize buffer (lambda ()
88                          (deallocate-system-memory sap size))
89                 :dont-save t)
90       buffer)))
91
92 (defun get-buffer ()
93   ;; Don't go for the lock if there is nothing to be had -- sure,
94   ;; another thread might just release one before we get it, but that
95   ;; is not worth the cost of locking. Also release the lock before
96   ;; allocation, since it's going to take a while.
97   (if *available-buffers*
98       (or (with-available-buffers-lock ()
99             (pop *available-buffers*))
100           (alloc-buffer))
101       (alloc-buffer)))
102
103 (declaim (inline reset-buffer))
104 (defun reset-buffer (buffer)
105   (setf (buffer-head buffer) 0
106         (buffer-tail buffer) 0)
107   buffer)
108
109 (defun release-buffer (buffer)
110   (reset-buffer buffer)
111   (with-available-buffers-lock ()
112     (push buffer *available-buffers*)))
113
114 ;;; This is a separate buffer management function, as it wants to be
115 ;;; clever about locking -- grabbing the lock just once.
116 (defun release-fd-stream-buffers (fd-stream)
117   (let ((ibuf (fd-stream-ibuf fd-stream))
118         (obuf (fd-stream-obuf fd-stream))
119         (queue (loop for item in (fd-stream-output-queue fd-stream)
120                        when (buffer-p item)
121                        collect (reset-buffer item))))
122     (when ibuf
123       (push (reset-buffer ibuf) queue))
124     (when obuf
125       (push (reset-buffer obuf) queue))
126     ;; ...so, anything found?
127     (when queue
128       ;; detach from stream
129       (setf (fd-stream-ibuf fd-stream) nil
130             (fd-stream-obuf fd-stream) nil
131             (fd-stream-output-queue fd-stream) nil)
132       ;; splice to *available-buffers*
133       (with-available-buffers-lock ()
134         (setf *available-buffers* (nconc queue *available-buffers*))))))
135 \f
136 ;;;; the FD-STREAM structure
137
138 (defstruct (fd-stream
139             (:constructor %make-fd-stream)
140             (:conc-name fd-stream-)
141             (:predicate fd-stream-p)
142             (:include ansi-stream
143                       (misc #'fd-stream-misc-routine))
144             (:copier nil))
145
146   ;; the name of this stream
147   (name nil)
148   ;; the file this stream is for
149   (file nil)
150   ;; the backup file namestring for the old file, for :IF-EXISTS
151   ;; :RENAME or :RENAME-AND-DELETE.
152   (original nil :type (or simple-string null))
153   (delete-original nil)       ; for :if-exists :rename-and-delete
154   ;;; the number of bytes per element
155   (element-size 1 :type index)
156   ;; the type of element being transfered
157   (element-type 'base-char)
158   ;; the Unix file descriptor
159   (fd -1 :type fixnum)
160   ;; controls when the output buffer is flushed
161   (buffering :full :type (member :full :line :none))
162   ;; controls whether the input buffer must be cleared before output
163   ;; (must be done for files, not for sockets, pipes and other data
164   ;; sources where input and output aren't related).  non-NIL means
165   ;; don't clear input buffer.
166   (dual-channel-p nil)
167   ;; character position if known -- this may run into bignums, but
168   ;; we probably should flip it into null then for efficiency's sake...
169   (char-pos nil :type (or unsigned-byte null))
170   ;; T if input is waiting on FD. :EOF if we hit EOF.
171   (listen nil :type (member nil t :eof))
172
173   ;; the input buffer
174   (instead (make-array 0 :element-type 'character :adjustable t :fill-pointer t) :type (array character (*)))
175   (ibuf nil :type (or buffer null))
176   (eof-forced-p nil :type (member t nil))
177
178   ;; the output buffer
179   (obuf nil :type (or buffer null))
180
181   ;; output flushed, but not written due to non-blocking io?
182   (output-queue nil)
183   (handler nil)
184   ;; timeout specified for this stream as seconds or NIL if none
185   (timeout nil :type (or single-float null))
186   ;; pathname of the file this stream is opened to (returned by PATHNAME)
187   (pathname nil :type (or pathname null))
188   (external-format :default)
189   ;; fixed width, or function to call with a character
190   (char-size 1 :type (or fixnum function))
191   (output-bytes #'ill-out :type function)
192   ;; a boolean indicating whether the stream is bivalent.  For
193   ;; internal use only.
194   (bivalent-p nil :type boolean))
195 (def!method print-object ((fd-stream fd-stream) stream)
196   (declare (type stream stream))
197   (print-unreadable-object (fd-stream stream :type t :identity t)
198     (format stream "for ~S" (fd-stream-name fd-stream))))
199 \f
200 ;;;; CORE OUTPUT FUNCTIONS
201
202 ;;; Buffer the section of THING delimited by START and END by copying
203 ;;; to output buffer(s) of stream.
204 (defun buffer-output (stream thing start end)
205   (declare (index start end))
206   (when (< end start)
207     (error ":END before :START!"))
208   (when (> end start)
209     ;; Copy bytes from THING to buffers.
210     (flet ((copy-to-buffer (buffer tail count)
211              (declare (buffer buffer) (index tail count))
212              (aver (plusp count))
213              (let ((sap (buffer-sap buffer)))
214                (etypecase thing
215                  (system-area-pointer
216                   (system-area-ub8-copy thing start sap tail count))
217                  ((simple-unboxed-array (*))
218                   (copy-ub8-to-system-area thing start sap tail count))))
219              ;; Not INCF! If another thread has moved tail from under
220              ;; us, we don't want to accidentally increment tail
221              ;; beyond buffer-length.
222              (setf (buffer-tail buffer) (+ count tail))
223              (incf start count)))
224       (tagbody
225          ;; First copy is special: the buffer may already contain
226          ;; something, or be even full.
227          (let* ((obuf (fd-stream-obuf stream))
228                 (tail (buffer-tail obuf))
229                 (space (- (buffer-length obuf) tail)))
230            (when (plusp space)
231              (copy-to-buffer obuf tail (min space (- end start)))
232              (go :more-output-p)))
233        :flush-and-fill
234          ;; Later copies should always have an empty buffer, since
235          ;; they are freshly flushed, but if another thread is
236          ;; stomping on the same buffer that might not be the case.
237          (let* ((obuf (flush-output-buffer stream))
238                 (tail (buffer-tail obuf))
239                 (space (- (buffer-length obuf) tail)))
240            (copy-to-buffer obuf tail (min space (- end start))))
241        :more-output-p
242          (when (> end start)
243            (go :flush-and-fill))))))
244
245 ;;; Flush the current output buffer of the stream, ensuring that the
246 ;;; new buffer is empty. Returns (for convenience) the new output
247 ;;; buffer -- which may or may not be EQ to the old one. If the is no
248 ;;; queued output we try to write the buffer immediately -- otherwise
249 ;;; we queue it for later.
250 (defun flush-output-buffer (stream)
251   (let ((obuf (fd-stream-obuf stream)))
252     (when obuf
253       (let ((head (buffer-head obuf))
254             (tail (buffer-tail obuf)))
255         (cond ((eql head tail)
256                ;; Buffer is already empty -- just ensure that is is
257                ;; set to zero as well.
258                (reset-buffer obuf))
259               ((fd-stream-output-queue stream)
260                ;; There is already stuff on the queue -- go directly
261                ;; there.
262                (aver (< head tail))
263                (%queue-and-replace-output-buffer stream))
264               (t
265                ;; Try a non-blocking write, queue whatever is left over.
266                (aver (< head tail))
267                (synchronize-stream-output stream)
268                (let ((length (- tail head)))
269                  (multiple-value-bind (count errno)
270                      (sb!unix:unix-write (fd-stream-fd stream) (buffer-sap obuf)
271                                          head length)
272                    (cond ((eql count length)
273                           ;; Complete write -- we can use the same buffer.
274                           (reset-buffer obuf))
275                          (count
276                           ;; Partial write -- update buffer status and queue.
277                           ;; Do not use INCF! Another thread might have moved
278                           ;; head...
279                           (setf (buffer-head obuf) (+ count head))
280                           (%queue-and-replace-output-buffer stream))
281                          #!-win32
282                          ((eql errno sb!unix:ewouldblock)
283                           ;; Blocking, queue.
284                           (%queue-and-replace-output-buffer stream))
285                          (t
286                           (simple-stream-perror "Couldn't write to ~s"
287                                                 stream errno)))))))))))
288
289 ;;; Helper for FLUSH-OUTPUT-BUFFER -- returns the new buffer.
290 (defun %queue-and-replace-output-buffer (stream)
291   (let ((queue (fd-stream-output-queue stream))
292         (later (list (or (fd-stream-obuf stream) (bug "Missing obuf."))))
293         (new (get-buffer)))
294     ;; Important: before putting the buffer on queue, give the stream
295     ;; a new one. If we get an interrupt and unwind losing the buffer
296     ;; is relatively OK, but having the same buffer in two places
297     ;; would be bad.
298     (setf (fd-stream-obuf stream) new)
299     (cond (queue
300            (nconc queue later))
301           (t
302            (setf (fd-stream-output-queue stream) later)))
303     (unless (fd-stream-handler stream)
304       (setf (fd-stream-handler stream)
305             (add-fd-handler (fd-stream-fd stream)
306                             :output
307                             (lambda (fd)
308                               (declare (ignore fd))
309                               (write-output-from-queue stream)))))
310     new))
311
312 ;;; This is called by the FD-HANDLER for the stream when output is
313 ;;; possible.
314 (defun write-output-from-queue (stream)
315   (synchronize-stream-output stream)
316   (let (not-first-p)
317     (tagbody
318      :pop-buffer
319        (let* ((buffer (pop (fd-stream-output-queue stream)))
320               (head (buffer-head buffer))
321               (length (- (buffer-tail buffer) head)))
322          (declare (index head length))
323          (aver (>= length 0))
324          (multiple-value-bind (count errno)
325              (sb!unix:unix-write (fd-stream-fd stream) (buffer-sap buffer)
326                                  head length)
327            (cond ((eql count length)
328                   ;; Complete write, see if we can do another right
329                   ;; away, or remove the handler if we're done.
330                   (release-buffer buffer)
331                   (cond ((fd-stream-output-queue stream)
332                          (setf not-first-p t)
333                          (go :pop-buffer))
334                         (t
335                          (let ((handler (fd-stream-handler stream)))
336                            (aver handler)
337                            (setf (fd-stream-handler stream) nil)
338                            (remove-fd-handler handler)))))
339                  (count
340                   ;; Partial write. Update buffer status and requeue.
341                   (aver (< count length))
342                   ;; Do not use INCF! Another thread might have moved head.
343                   (setf (buffer-head buffer) (+ head count))
344                   (push buffer (fd-stream-output-queue stream)))
345                  (not-first-p
346                   ;; We tried to do multiple writes, and finally our
347                   ;; luck ran out. Requeue.
348                   (push buffer (fd-stream-output-queue stream)))
349                  (t
350                   ;; Could not write on the first try at all!
351                   #!+win32
352                   (simple-stream-perror "Couldn't write to ~S." stream errno)
353                   #!-win32
354                   (if (= errno sb!unix:ewouldblock)
355                       (bug "Unexpected blocking in WRITE-OUTPUT-FROM-QUEUE.")
356                       (simple-stream-perror "Couldn't write to ~S"
357                                             stream errno))))))))
358   nil)
359
360 ;;; Try to write THING directly to STREAM without buffering, if
361 ;;; possible. If direct write doesn't happen, buffer.
362 (defun write-or-buffer-output (stream thing start end)
363   (declare (index start end))
364   (cond ((fd-stream-output-queue stream)
365          (buffer-output stream thing start end))
366         ((< end start)
367          (error ":END before :START!"))
368         ((> end start)
369          (let ((length (- end start)))
370            (synchronize-stream-output stream)
371            (multiple-value-bind (count errno)
372                (sb!unix:unix-write (fd-stream-fd stream) thing start length)
373              (cond ((eql count length)
374                     ;; Complete write -- done!
375                     )
376                    (count
377                     (aver (< count length))
378                     ;; Partial write -- buffer the rest.
379                     (buffer-output stream thing (+ start count) end))
380                    (t
381                     ;; Could not write -- buffer or error.
382                     #!+win32
383                     (simple-stream-perror "couldn't write to ~s" stream errno)
384                     #!-win32
385                     (if (= errno sb!unix:ewouldblock)
386                         (buffer-output stream thing start end)
387                         (simple-stream-perror "couldn't write to ~s" stream errno)))))))))
388
389 ;;; Deprecated -- can go away after 1.1 or so. Deprecated because
390 ;;; this is not something we want to export. Nikodemus thinks the
391 ;;; right thing is to support a low-level non-stream like IO layer,
392 ;;; akin to java.nio.
393 (defun output-raw-bytes (stream thing &optional start end)
394   (write-or-buffer-output stream thing (or start 0) (or end (length thing))))
395
396 (define-compiler-macro output-raw-bytes (stream thing &optional start end)
397   (deprecation-warning 'output-raw-bytes)
398   (let ((x (gensym "THING")))
399     `(let ((,x ,thing))
400        (write-or-buffer-output ,stream ,x (or ,start 0) (or ,end (length ,x))))))
401 \f
402 ;;;; output routines and related noise
403
404 (defvar *output-routines* ()
405   #!+sb-doc
406   "List of all available output routines. Each element is a list of the
407   element-type output, the kind of buffering, the function name, and the number
408   of bytes per element.")
409
410 ;;; common idioms for reporting low-level stream and file problems
411 (defun simple-stream-perror (note-format stream errno)
412   (error 'simple-stream-error
413          :stream stream
414          :format-control "~@<~?: ~2I~_~A~:>"
415          :format-arguments (list note-format (list stream) (strerror errno))))
416 (defun simple-file-perror (note-format pathname errno)
417   (error 'simple-file-error
418          :pathname pathname
419          :format-control "~@<~?: ~2I~_~A~:>"
420          :format-arguments
421          (list note-format (list pathname) (strerror errno))))
422
423 (defun stream-decoding-error (stream octets)
424   (error 'stream-decoding-error
425          :external-format (stream-external-format stream)
426          :stream stream
427          ;; FIXME: dunno how to get at OCTETS currently, or even if
428          ;; that's the right thing to report.
429          :octets octets))
430 (defun stream-encoding-error (stream code)
431   (error 'stream-encoding-error
432          :external-format (stream-external-format stream)
433          :stream stream
434          :code code))
435
436 (defun c-string-encoding-error (external-format code)
437   (error 'c-string-encoding-error
438          :external-format external-format
439          :code code))
440
441 (defun c-string-decoding-error (external-format octets)
442   (error 'c-string-decoding-error
443          :external-format external-format
444          :octets octets))
445
446 ;;; Returning true goes into end of file handling, false will enter another
447 ;;; round of input buffer filling followed by re-entering character decode.
448 (defun stream-decoding-error-and-handle (stream octet-count)
449   (restart-case
450       (stream-decoding-error stream
451                              (let* ((buffer (fd-stream-ibuf stream))
452                                     (sap (buffer-sap buffer))
453                                     (head (buffer-head buffer)))
454                                (loop for i from 0 below octet-count
455                                      collect (sap-ref-8 sap (+ head i)))))
456     (attempt-resync ()
457       :report (lambda (stream)
458                 (format stream
459                         "~@<Attempt to resync the stream at a ~
460                         character boundary and continue.~@:>"))
461       (fd-stream-resync stream)
462       nil)
463     (force-end-of-file ()
464       :report (lambda (stream)
465                 (format stream "~@<Force an end of file.~@:>"))
466       (setf (fd-stream-eof-forced-p stream) t))
467     (input-replacement (string)
468       :report (lambda (stream)
469                 (format stream "~@<Use string as replacement input, ~
470                                attempt to resync at a character ~
471                                boundary and continue.~@:>"))
472       :interactive (lambda ()
473                      (format *query-io* "~@<Enter a string: ~@:>")
474                      (finish-output *query-io*)
475                      (list (read *query-io*)))
476       (let ((string (reverse (string string)))
477             (instead (fd-stream-instead stream)))
478         (dotimes (i (length string))
479           (vector-push-extend (char string i) instead))
480         (fd-stream-resync stream)
481         (when (> (length string) 0)
482           (setf (fd-stream-listen stream) t)))
483       nil)))
484
485 (defun stream-encoding-error-and-handle (stream code)
486   (restart-case
487       (stream-encoding-error stream code)
488     (output-nothing ()
489       :report (lambda (stream)
490                 (format stream "~@<Skip output of this character.~@:>"))
491       (throw 'output-nothing nil))
492     (output-replacement (string)
493       :report (lambda (stream)
494                 (format stream "~@<Output replacement string.~@:>"))
495       :interactive (lambda ()
496                      (format *query-io* "~@<Enter a string: ~@:>")
497                      (finish-output *query-io*)
498                      (list (read *query-io*)))
499       (let ((string (string string)))
500         (fd-sout stream (string string) 0 (length string)))
501       (throw 'output-nothing nil))))
502
503 (defun external-format-encoding-error (stream code)
504   (if (streamp stream)
505       (stream-encoding-error-and-handle stream code)
506       (c-string-encoding-error stream code)))
507
508 (defun synchronize-stream-output (stream)
509   ;; If we're reading and writing on the same file, flush buffered
510   ;; input and rewind file position accordingly.
511   (unless (fd-stream-dual-channel-p stream)
512     (let ((adjust (nth-value 1 (flush-input-buffer stream))))
513       (unless (eql 0 adjust)
514         (sb!unix:unix-lseek (fd-stream-fd stream) (- adjust) sb!unix:l_incr)))))
515
516 (defun fd-stream-output-finished-p (stream)
517   (let ((obuf (fd-stream-obuf stream)))
518     (or (not obuf)
519         (and (zerop (buffer-tail obuf))
520              (not (fd-stream-output-queue stream))))))
521
522 (defmacro output-wrapper/variable-width ((stream size buffering restart)
523                                          &body body)
524   (let ((stream-var (gensym "STREAM")))
525     `(let* ((,stream-var ,stream)
526             (obuf (fd-stream-obuf ,stream-var))
527             (tail (buffer-tail obuf))
528             (size ,size))
529       ,(unless (eq (car buffering) :none)
530          `(when (<= (buffer-length obuf) (+ tail size))
531             (setf obuf (flush-output-buffer ,stream-var)
532                   tail (buffer-tail obuf))))
533       ,(unless (eq (car buffering) :none)
534          ;; FIXME: Why this here? Doesn't seem necessary.
535          `(synchronize-stream-output ,stream-var))
536       ,(if restart
537            `(catch 'output-nothing
538               ,@body
539               (setf (buffer-tail obuf) (+ tail size)))
540            `(progn
541              ,@body
542              (setf (buffer-tail obuf) (+ tail size))))
543       ,(ecase (car buffering)
544          (:none
545           `(flush-output-buffer ,stream-var))
546          (:line
547           `(when (eql byte #\Newline)
548              (flush-output-buffer ,stream-var)))
549          (:full))
550     (values))))
551
552 (defmacro output-wrapper ((stream size buffering restart) &body body)
553   (let ((stream-var (gensym "STREAM")))
554     `(let* ((,stream-var ,stream)
555             (obuf (fd-stream-obuf ,stream-var))
556             (tail (buffer-tail obuf)))
557       ,(unless (eq (car buffering) :none)
558          `(when (<= (buffer-length obuf) (+ tail ,size))
559             (setf obuf (flush-output-buffer ,stream-var)
560                   tail (buffer-tail obuf))))
561       ;; FIXME: Why this here? Doesn't seem necessary.
562       ,(unless (eq (car buffering) :none)
563          `(synchronize-stream-output ,stream-var))
564       ,(if restart
565            `(catch 'output-nothing
566               ,@body
567               (setf (buffer-tail obuf) (+ tail ,size)))
568            `(progn
569              ,@body
570              (setf (buffer-tail obuf) (+ tail ,size))))
571       ,(ecase (car buffering)
572          (:none
573           `(flush-output-buffer ,stream-var))
574          (:line
575           `(when (eql byte #\Newline)
576              (flush-output-buffer ,stream-var)))
577          (:full))
578     (values))))
579
580 (defmacro def-output-routines/variable-width
581     ((name-fmt size restart external-format &rest bufferings)
582      &body body)
583   (declare (optimize (speed 1)))
584   (cons 'progn
585         (mapcar
586             (lambda (buffering)
587               (let ((function
588                      (intern (format nil name-fmt (string (car buffering))))))
589                 `(progn
590                    (defun ,function (stream byte)
591                      (declare (ignorable byte))
592                      (output-wrapper/variable-width (stream ,size ,buffering ,restart)
593                        ,@body))
594                    (setf *output-routines*
595                          (nconc *output-routines*
596                                 ',(mapcar
597                                    (lambda (type)
598                                      (list type
599                                            (car buffering)
600                                            function
601                                            1
602                                            external-format))
603                                    (cdr buffering)))))))
604             bufferings)))
605
606 ;;; Define output routines that output numbers SIZE bytes long for the
607 ;;; given bufferings. Use BODY to do the actual output.
608 (defmacro def-output-routines ((name-fmt size restart &rest bufferings)
609                                &body body)
610   (declare (optimize (speed 1)))
611   (cons 'progn
612         (mapcar
613             (lambda (buffering)
614               (let ((function
615                      (intern (format nil name-fmt (string (car buffering))))))
616                 `(progn
617                    (defun ,function (stream byte)
618                      (output-wrapper (stream ,size ,buffering ,restart)
619                        ,@body))
620                    (setf *output-routines*
621                          (nconc *output-routines*
622                                 ',(mapcar
623                                    (lambda (type)
624                                      (list type
625                                            (car buffering)
626                                            function
627                                            size
628                                            nil))
629                                    (cdr buffering)))))))
630             bufferings)))
631
632 ;;; FIXME: is this used anywhere any more?
633 (def-output-routines ("OUTPUT-CHAR-~A-BUFFERED"
634                       1
635                       t
636                       (:none character)
637                       (:line character)
638                       (:full character))
639   (if (eql byte #\Newline)
640       (setf (fd-stream-char-pos stream) 0)
641       (incf (fd-stream-char-pos stream)))
642   (setf (sap-ref-8 (buffer-sap obuf) tail)
643         (char-code byte)))
644
645 (def-output-routines ("OUTPUT-UNSIGNED-BYTE-~A-BUFFERED"
646                       1
647                       nil
648                       (:none (unsigned-byte 8))
649                       (:full (unsigned-byte 8)))
650   (setf (sap-ref-8 (buffer-sap obuf) tail)
651         byte))
652
653 (def-output-routines ("OUTPUT-SIGNED-BYTE-~A-BUFFERED"
654                       1
655                       nil
656                       (:none (signed-byte 8))
657                       (:full (signed-byte 8)))
658   (setf (signed-sap-ref-8 (buffer-sap obuf) tail)
659         byte))
660
661 (def-output-routines ("OUTPUT-UNSIGNED-SHORT-~A-BUFFERED"
662                       2
663                       nil
664                       (:none (unsigned-byte 16))
665                       (:full (unsigned-byte 16)))
666   (setf (sap-ref-16 (buffer-sap obuf) tail)
667         byte))
668
669 (def-output-routines ("OUTPUT-SIGNED-SHORT-~A-BUFFERED"
670                       2
671                       nil
672                       (:none (signed-byte 16))
673                       (:full (signed-byte 16)))
674   (setf (signed-sap-ref-16 (buffer-sap obuf) tail)
675         byte))
676
677 (def-output-routines ("OUTPUT-UNSIGNED-LONG-~A-BUFFERED"
678                       4
679                       nil
680                       (:none (unsigned-byte 32))
681                       (:full (unsigned-byte 32)))
682   (setf (sap-ref-32 (buffer-sap obuf) tail)
683         byte))
684
685 (def-output-routines ("OUTPUT-SIGNED-LONG-~A-BUFFERED"
686                       4
687                       nil
688                       (:none (signed-byte 32))
689                       (:full (signed-byte 32)))
690   (setf (signed-sap-ref-32 (buffer-sap obuf) tail)
691         byte))
692
693 #+#.(cl:if (cl:= sb!vm:n-word-bits 64) '(and) '(or))
694 (progn
695   (def-output-routines ("OUTPUT-UNSIGNED-LONG-LONG-~A-BUFFERED"
696                         8
697                         nil
698                         (:none (unsigned-byte 64))
699                         (:full (unsigned-byte 64)))
700     (setf (sap-ref-64 (buffer-sap obuf) tail)
701           byte))
702   (def-output-routines ("OUTPUT-SIGNED-LONG-LONG-~A-BUFFERED"
703                         8
704                         nil
705                         (:none (signed-byte 64))
706                         (:full (signed-byte 64)))
707     (setf (signed-sap-ref-64 (buffer-sap obuf) tail)
708           byte)))
709
710 ;;; the routine to use to output a string. If the stream is
711 ;;; unbuffered, slam the string down the file descriptor, otherwise
712 ;;; use OUTPUT-RAW-BYTES to buffer the string. Update charpos by
713 ;;; checking to see where the last newline was.
714 (defun fd-sout (stream thing start end)
715   (declare (type fd-stream stream) (type string thing))
716   (let ((start (or start 0))
717         (end (or end (length (the vector thing)))))
718     (declare (fixnum start end))
719     (let ((last-newline
720            (string-dispatch (simple-base-string
721                              #!+sb-unicode
722                              (simple-array character (*))
723                              string)
724                thing
725              (position #\newline thing :from-end t
726                        :start start :end end))))
727       (if (and (typep thing 'base-string)
728                (eq (fd-stream-external-format-keyword stream) :latin-1))
729           (ecase (fd-stream-buffering stream)
730             (:full
731              (buffer-output stream thing start end))
732             (:line
733              (buffer-output stream thing start end)
734              (when last-newline
735                (flush-output-buffer stream)))
736             (:none
737              (write-or-buffer-output stream thing start end)))
738           (ecase (fd-stream-buffering stream)
739             (:full (funcall (fd-stream-output-bytes stream)
740                             stream thing nil start end))
741             (:line (funcall (fd-stream-output-bytes stream)
742                             stream thing last-newline start end))
743             (:none (funcall (fd-stream-output-bytes stream)
744                             stream thing t start end))))
745       (if last-newline
746           (setf (fd-stream-char-pos stream) (- end last-newline 1))
747           (incf (fd-stream-char-pos stream) (- end start))))))
748
749 (defstruct (external-format
750              (:constructor %make-external-format)
751              (:conc-name ef-)
752              (:predicate external-format-p)
753              (:copier %copy-external-format))
754   ;; All the names that can refer to this external format.  The first
755   ;; one is the canonical name.
756   (names (missing-arg) :type list :read-only t)
757   (default-replacement-character (missing-arg) :type character)
758   (read-n-chars-fun (missing-arg) :type function)
759   (read-char-fun (missing-arg) :type function)
760   (write-n-bytes-fun (missing-arg) :type function)
761   (write-char-none-buffered-fun (missing-arg) :type function)
762   (write-char-line-buffered-fun (missing-arg) :type function)
763   (write-char-full-buffered-fun (missing-arg) :type function)
764   ;; Can be nil for fixed-width formats.
765   (resync-fun nil :type (or function null))
766   (bytes-for-char-fun (missing-arg) :type function)
767   (read-c-string-fun (missing-arg) :type function)
768   (write-c-string-fun (missing-arg) :type function)
769   ;; We indirect through symbols in these functions so that a
770   ;; developer working on the octets code can easily redefine things
771   ;; and use the new function definition without redefining the
772   ;; external format as well.  The slots above don't do any
773   ;; indirection because a developer working with those slots would be
774   ;; redefining the external format anyway.
775   (octets-to-string-fun (missing-arg) :type function)
776   (string-to-octets-fun (missing-arg) :type function))
777
778 (defun wrap-external-format-functions (external-format fun)
779   (let ((result (%copy-external-format external-format)))
780     (macrolet ((frob (accessor)
781                  `(setf (,accessor result) (funcall fun (,accessor result)))))
782       (frob ef-read-n-chars-fun)
783       (frob ef-read-char-fun)
784       (frob ef-write-n-bytes-fun)
785       (frob ef-write-char-none-buffered-fun)
786       (frob ef-write-char-line-buffered-fun)
787       (frob ef-write-char-full-buffered-fun)
788       (frob ef-resync-fun)
789       (frob ef-bytes-for-char-fun)
790       (frob ef-read-c-string-fun)
791       (frob ef-write-c-string-fun)
792       (frob ef-octets-to-string-fun)
793       (frob ef-string-to-octets-fun))
794     result))
795
796 (defvar *external-formats* (make-hash-table)
797   #!+sb-doc
798   "Hashtable of all available external formats. The table maps from
799   external-format names to EXTERNAL-FORMAT structures.")
800
801 (defun get-external-format (external-format)
802   (flet ((keyword-external-format (keyword)
803            (declare (type keyword keyword))
804            (gethash keyword *external-formats*))
805          (replacement-handlerify (entry replacement)
806            (when entry
807              (wrap-external-format-functions
808               entry
809               (lambda (fun)
810                 (and fun
811                      (lambda (&rest rest)
812                        (declare (dynamic-extent rest))
813                        (handler-bind
814                            ((stream-decoding-error
815                              (lambda (c)
816                                (declare (ignore c))
817                                (invoke-restart 'input-replacement replacement)))
818                             (stream-encoding-error
819                              (lambda (c)
820                                (declare (ignore c))
821                                (invoke-restart 'output-replacement replacement)))
822                             (octets-encoding-error
823                              (lambda (c) (use-value replacement c)))
824                             (octet-decoding-error
825                              (lambda (c) (use-value replacement c))))
826                          (apply fun rest)))))))))
827     (typecase external-format
828       (keyword (keyword-external-format external-format))
829       ((cons keyword)
830        (let ((entry (keyword-external-format (car external-format)))
831              (replacement (getf (cdr external-format) :replacement)))
832          (if replacement
833              (replacement-handlerify entry replacement)
834              entry))))))
835
836 (defun get-external-format-or-lose (external-format)
837   (or (get-external-format external-format)
838       (error "Undefined external-format ~A" external-format)))
839
840 (defun external-format-keyword (external-format)
841   (typecase external-format
842     (keyword external-format)
843     ((cons keyword) (car external-format))))
844
845 (defun fd-stream-external-format-keyword (stream)
846   (external-format-keyword (fd-stream-external-format stream)))
847
848 (defun canonize-external-format (external-format entry)
849   (typecase external-format
850     (keyword (first (ef-names entry)))
851     ((cons keyword) (cons (first (ef-names entry)) (rest external-format)))))
852
853 ;;; Find an output routine to use given the type and buffering. Return
854 ;;; as multiple values the routine, the real type transfered, and the
855 ;;; number of bytes per element.
856 (defun pick-output-routine (type buffering &optional external-format)
857   (when (subtypep type 'character)
858     (let ((entry (get-external-format external-format)))
859       (when entry
860         (return-from pick-output-routine
861           (values (ecase buffering
862                     (:none (ef-write-char-none-buffered-fun entry))
863                     (:line (ef-write-char-line-buffered-fun entry))
864                     (:full (ef-write-char-full-buffered-fun entry)))
865                   'character
866                   1
867                   (ef-write-n-bytes-fun entry)
868                   (canonize-external-format external-format entry))))))
869   (dolist (entry *output-routines*)
870     (when (and (subtypep type (first entry))
871                (eq buffering (second entry))
872                (or (not (fifth entry))
873                    (eq external-format (fifth entry))))
874       (return-from pick-output-routine
875         (values (symbol-function (third entry))
876                 (first entry)
877                 (fourth entry)))))
878   ;; KLUDGE: dealing with the buffering here leads to excessive code
879   ;; explosion.
880   ;;
881   ;; KLUDGE: also see comments in PICK-INPUT-ROUTINE
882   (loop for i from 40 by 8 to 1024 ; ARB (KLUDGE)
883         if (subtypep type `(unsigned-byte ,i))
884         do (return-from pick-output-routine
885              (values
886               (ecase buffering
887                 (:none
888                  (lambda (stream byte)
889                    (output-wrapper (stream (/ i 8) (:none) nil)
890                      (loop for j from 0 below (/ i 8)
891                            do (setf (sap-ref-8 (buffer-sap obuf)
892                                                (+ j tail))
893                                     (ldb (byte 8 (- i 8 (* j 8))) byte))))))
894                 (:full
895                  (lambda (stream byte)
896                    (output-wrapper (stream (/ i 8) (:full) nil)
897                      (loop for j from 0 below (/ i 8)
898                            do (setf (sap-ref-8 (buffer-sap obuf)
899                                                (+ j tail))
900                                     (ldb (byte 8 (- i 8 (* j 8))) byte)))))))
901               `(unsigned-byte ,i)
902               (/ i 8))))
903   (loop for i from 40 by 8 to 1024 ; ARB (KLUDGE)
904         if (subtypep type `(signed-byte ,i))
905         do (return-from pick-output-routine
906              (values
907               (ecase buffering
908                 (:none
909                  (lambda (stream byte)
910                    (output-wrapper (stream (/ i 8) (:none) nil)
911                      (loop for j from 0 below (/ i 8)
912                            do (setf (sap-ref-8 (buffer-sap obuf)
913                                                (+ j tail))
914                                     (ldb (byte 8 (- i 8 (* j 8))) byte))))))
915                 (:full
916                  (lambda (stream byte)
917                    (output-wrapper (stream (/ i 8) (:full) nil)
918                      (loop for j from 0 below (/ i 8)
919                            do (setf (sap-ref-8 (buffer-sap obuf)
920                                                (+ j tail))
921                                     (ldb (byte 8 (- i 8 (* j 8))) byte)))))))
922               `(signed-byte ,i)
923               (/ i 8)))))
924 \f
925 ;;;; input routines and related noise
926
927 ;;; a list of all available input routines. Each element is a list of
928 ;;; the element-type input, the function name, and the number of bytes
929 ;;; per element.
930 (defvar *input-routines* ())
931
932 ;;; Return whether a primitive partial read operation on STREAM's FD
933 ;;; would (probably) block.  Signal a `simple-stream-error' if the
934 ;;; system call implementing this operation fails.
935 ;;;
936 ;;; It is "may" instead of "would" because "would" is not quite
937 ;;; correct on win32.  However, none of the places that use it require
938 ;;; further assurance than "may" versus "will definitely not".
939 (defun sysread-may-block-p (stream)
940   #!+win32
941   ;; This answers T at EOF on win32, I think.
942   (not (sb!win32:fd-listen (fd-stream-fd stream)))
943   #!-win32
944   (sb!unix:with-restarted-syscall (count errno)
945     (sb!alien:with-alien ((read-fds (sb!alien:struct sb!unix:fd-set)))
946       (sb!unix:fd-zero read-fds)
947       (sb!unix:fd-set (fd-stream-fd stream) read-fds)
948       (sb!unix:unix-fast-select (1+ (fd-stream-fd stream))
949                                 (sb!alien:addr read-fds)
950                                 nil nil 0 0))
951     (case count
952       ((1) nil)
953       ((0) t)
954       (otherwise
955        (simple-stream-perror "couldn't check whether ~S is readable"
956                              stream
957                              errno)))))
958
959 ;;; If the read would block wait (using SERVE-EVENT) till input is available,
960 ;;; then fill the input buffer, and return the number of bytes read. Throws
961 ;;; to EOF-INPUT-CATCHER if the eof was reached.
962 (defun refill-input-buffer (stream)
963   (dx-let ((fd (fd-stream-fd stream))
964            (errno 0)
965            (count 0))
966     (tagbody
967        ;; Check for blocking input before touching the stream, as if
968        ;; we happen to wait we are liable to be interrupted, and the
969        ;; interrupt handler may use the same stream.
970        (if (sysread-may-block-p stream)
971            (go :wait-for-input)
972            (go :main))
973        ;; These (:CLOSED-FLAME and :READ-ERROR) tags are here so what
974        ;; we can signal errors outside the WITHOUT-INTERRUPTS.
975      :closed-flame
976        (closed-flame stream)
977      :read-error
978        (simple-stream-perror "couldn't read from ~S" stream errno)
979      :wait-for-input
980        ;; This tag is here so we can unwind outside the WITHOUT-INTERRUPTS
981        ;; to wait for input if read tells us EWOULDBLOCK.
982        (unless (wait-until-fd-usable fd :input (fd-stream-timeout stream))
983          (signal-timeout 'io-timeout :stream stream :direction :read
984                          :seconds (fd-stream-timeout stream)))
985      :main
986        ;; Since the read should not block, we'll disable the
987        ;; interrupts here, so that we don't accidentally unwind and
988        ;; leave the stream in an inconsistent state.
989
990        ;; Execute the nlx outside without-interrupts to ensure the
991        ;; resulting thunk is stack-allocatable.
992        ((lambda (return-reason)
993           (ecase return-reason
994             ((nil))             ; fast path normal cases
995             ((:wait-for-input) (go :wait-for-input))
996             ((:closed-flame)   (go :closed-flame))
997             ((:read-error)     (go :read-error))))
998         (without-interrupts
999           ;; Check the buffer: if it is null, then someone has closed
1000           ;; the stream from underneath us. This is not ment to fix
1001           ;; multithreaded races, but to deal with interrupt handlers
1002           ;; closing the stream.
1003           (block nil
1004             (prog1 nil
1005               (let* ((ibuf (or (fd-stream-ibuf stream) (return :closed-flame)))
1006                      (sap (buffer-sap ibuf))
1007                      (length (buffer-length ibuf))
1008                      (head (buffer-head ibuf))
1009                      (tail (buffer-tail ibuf)))
1010                 (declare (index length head tail)
1011                          (inline sb!unix:unix-read))
1012                 (unless (zerop head)
1013                   (cond ((eql head tail)
1014                          ;; Buffer is empty, but not at yet reset -- make it so.
1015                          (setf head 0
1016                                tail 0)
1017                          (reset-buffer ibuf))
1018                         (t
1019                          ;; Buffer has things in it, but they are not at the
1020                          ;; head -- move them there.
1021                          (let ((n (- tail head)))
1022                            (system-area-ub8-copy sap head sap 0 n)
1023                            (setf head 0
1024                                  (buffer-head ibuf) head
1025                                  tail n
1026                                  (buffer-tail ibuf) tail)))))
1027                 (setf (fd-stream-listen stream) nil)
1028                 (setf (values count errno)
1029                       (sb!unix:unix-read fd (sap+ sap tail) (- length tail)))
1030                 (cond ((null count)
1031                        #!+win32
1032                        (return :read-error)
1033                        #!-win32
1034                        (if (eql errno sb!unix:ewouldblock)
1035                            (return :wait-for-input)
1036                            (return :read-error)))
1037                       ((zerop count)
1038                        (setf (fd-stream-listen stream) :eof)
1039                        (/show0 "THROWing EOF-INPUT-CATCHER")
1040                        (throw 'eof-input-catcher nil))
1041                       (t
1042                        ;; Success! (Do not use INCF, for sake of other threads.)
1043                        (setf (buffer-tail ibuf) (+ count tail))))))))))
1044     count))
1045
1046 ;;; Make sure there are at least BYTES number of bytes in the input
1047 ;;; buffer. Keep calling REFILL-INPUT-BUFFER until that condition is met.
1048 (defmacro input-at-least (stream bytes)
1049   (let ((stream-var (gensym "STREAM"))
1050         (bytes-var (gensym "BYTES"))
1051         (buffer-var (gensym "IBUF")))
1052     `(let* ((,stream-var ,stream)
1053             (,bytes-var ,bytes)
1054             (,buffer-var (fd-stream-ibuf ,stream-var)))
1055        (loop
1056          (when (>= (- (buffer-tail ,buffer-var)
1057                       (buffer-head ,buffer-var))
1058                    ,bytes-var)
1059            (return))
1060          (refill-input-buffer ,stream-var)))))
1061
1062 (defmacro input-wrapper/variable-width ((stream bytes eof-error eof-value)
1063                                         &body read-forms)
1064   (let ((stream-var (gensym "STREAM"))
1065         (retry-var (gensym "RETRY"))
1066         (element-var (gensym "ELT")))
1067     `(let* ((,stream-var ,stream)
1068             (ibuf (fd-stream-ibuf ,stream-var))
1069             (size nil))
1070        (block use-instead
1071          (when (fd-stream-eof-forced-p ,stream-var)
1072            (setf (fd-stream-eof-forced-p ,stream-var) nil)
1073            (return-from use-instead
1074              (eof-or-lose ,stream-var ,eof-error ,eof-value)))
1075          (let ((,element-var nil)
1076                (decode-break-reason nil))
1077            (do ((,retry-var t))
1078                ((not ,retry-var))
1079              (if (> (length (fd-stream-instead ,stream-var)) 0)
1080                  (let* ((instead (fd-stream-instead ,stream-var))
1081                         (result (vector-pop instead))
1082                         (pointer (fill-pointer instead)))
1083                    (when (= pointer 0)
1084                      (setf (fd-stream-listen ,stream-var) nil))
1085                    (return-from use-instead result))
1086                  (unless
1087                      (catch 'eof-input-catcher
1088                        (setf decode-break-reason
1089                              (block decode-break-reason
1090                                (input-at-least ,stream-var ,(if (consp bytes) (car bytes) `(setq size ,bytes)))
1091                                (let* ((byte (sap-ref-8 (buffer-sap ibuf) (buffer-head ibuf))))
1092                                  (declare (ignorable byte))
1093                                  ,@(when (consp bytes)
1094                                      `((let ((sap (buffer-sap ibuf))
1095                                              (head (buffer-head ibuf)))
1096                                          (declare (ignorable sap head))
1097                                          (setq size ,(cadr bytes))
1098                                          (input-at-least ,stream-var size))))
1099                                  (setq ,element-var (locally ,@read-forms))
1100                                  (setq ,retry-var nil))
1101                                nil))
1102                        (when decode-break-reason
1103                          (when (stream-decoding-error-and-handle
1104                                 stream decode-break-reason)
1105                            (setq ,retry-var nil)
1106                            (throw 'eof-input-catcher nil)))
1107                        t)
1108                    (let ((octet-count (- (buffer-tail ibuf)
1109                                          (buffer-head ibuf))))
1110                      (when (or (zerop octet-count)
1111                                (and (not ,element-var)
1112                                     (not decode-break-reason)
1113                                     (stream-decoding-error-and-handle
1114                                      stream octet-count)))
1115                        (setq ,retry-var nil))))))
1116            (cond (,element-var
1117                   (incf (buffer-head ibuf) size)
1118                   ,element-var)
1119                  (t
1120                   (eof-or-lose ,stream-var ,eof-error ,eof-value))))))))
1121
1122 ;;; a macro to wrap around all input routines to handle EOF-ERROR noise
1123 (defmacro input-wrapper ((stream bytes eof-error eof-value) &body read-forms)
1124   (let ((stream-var (gensym "STREAM"))
1125         (element-var (gensym "ELT")))
1126     `(let* ((,stream-var ,stream)
1127             (ibuf (fd-stream-ibuf ,stream-var)))
1128        (if (> (length (fd-stream-instead ,stream-var)) 0)
1129            (bug "INSTEAD not empty in INPUT-WRAPPER for ~S" ,stream-var)
1130            (let ((,element-var
1131                   (catch 'eof-input-catcher
1132                     (input-at-least ,stream-var ,bytes)
1133                     (locally ,@read-forms))))
1134              (cond (,element-var
1135                     (incf (buffer-head (fd-stream-ibuf ,stream-var)) ,bytes)
1136                     ,element-var)
1137                    (t
1138                     (eof-or-lose ,stream-var ,eof-error ,eof-value))))))))
1139
1140 (defmacro def-input-routine/variable-width (name
1141                                             (type external-format size sap head)
1142                                             &rest body)
1143   `(progn
1144      (defun ,name (stream eof-error eof-value)
1145        (input-wrapper/variable-width (stream ,size eof-error eof-value)
1146          (let ((,sap (buffer-sap ibuf))
1147                (,head (buffer-head ibuf)))
1148            ,@body)))
1149      (setf *input-routines*
1150            (nconc *input-routines*
1151                   (list (list ',type ',name 1 ',external-format))))))
1152
1153 (defmacro def-input-routine (name
1154                              (type size sap head)
1155                              &rest body)
1156   `(progn
1157      (defun ,name (stream eof-error eof-value)
1158        (input-wrapper (stream ,size eof-error eof-value)
1159          (let ((,sap (buffer-sap ibuf))
1160                (,head (buffer-head ibuf)))
1161            ,@body)))
1162      (setf *input-routines*
1163            (nconc *input-routines*
1164                   (list (list ',type ',name ',size nil))))))
1165
1166 ;;; STREAM-IN routine for reading a string char
1167 (def-input-routine input-character
1168                    (character 1 sap head)
1169   (code-char (sap-ref-8 sap head)))
1170
1171 ;;; STREAM-IN routine for reading an unsigned 8 bit number
1172 (def-input-routine input-unsigned-8bit-byte
1173                    ((unsigned-byte 8) 1 sap head)
1174   (sap-ref-8 sap head))
1175
1176 ;;; STREAM-IN routine for reading a signed 8 bit number
1177 (def-input-routine input-signed-8bit-number
1178                    ((signed-byte 8) 1 sap head)
1179   (signed-sap-ref-8 sap head))
1180
1181 ;;; STREAM-IN routine for reading an unsigned 16 bit number
1182 (def-input-routine input-unsigned-16bit-byte
1183                    ((unsigned-byte 16) 2 sap head)
1184   (sap-ref-16 sap head))
1185
1186 ;;; STREAM-IN routine for reading a signed 16 bit number
1187 (def-input-routine input-signed-16bit-byte
1188                    ((signed-byte 16) 2 sap head)
1189   (signed-sap-ref-16 sap head))
1190
1191 ;;; STREAM-IN routine for reading a unsigned 32 bit number
1192 (def-input-routine input-unsigned-32bit-byte
1193                    ((unsigned-byte 32) 4 sap head)
1194   (sap-ref-32 sap head))
1195
1196 ;;; STREAM-IN routine for reading a signed 32 bit number
1197 (def-input-routine input-signed-32bit-byte
1198                    ((signed-byte 32) 4 sap head)
1199   (signed-sap-ref-32 sap head))
1200
1201 #+#.(cl:if (cl:= sb!vm:n-word-bits 64) '(and) '(or))
1202 (progn
1203   (def-input-routine input-unsigned-64bit-byte
1204       ((unsigned-byte 64) 8 sap head)
1205     (sap-ref-64 sap head))
1206   (def-input-routine input-signed-64bit-byte
1207       ((signed-byte 64) 8 sap head)
1208     (signed-sap-ref-64 sap head)))
1209
1210 ;;; Find an input routine to use given the type. Return as multiple
1211 ;;; values the routine, the real type transfered, and the number of
1212 ;;; bytes per element (and for character types string input routine).
1213 (defun pick-input-routine (type &optional external-format)
1214   (when (subtypep type 'character)
1215     (let ((entry (get-external-format external-format)))
1216       (when entry
1217         (return-from pick-input-routine
1218           (values (ef-read-char-fun entry)
1219                   'character
1220                   1
1221                   (ef-read-n-chars-fun entry)
1222                   (canonize-external-format external-format entry))))))
1223   (dolist (entry *input-routines*)
1224     (when (and (subtypep type (first entry))
1225                (or (not (fourth entry))
1226                    (eq external-format (fourth entry))))
1227       (return-from pick-input-routine
1228         (values (symbol-function (second entry))
1229                 (first entry)
1230                 (third entry)))))
1231   ;; FIXME: let's do it the hard way, then (but ignore things like
1232   ;; endianness, efficiency, and the necessary coupling between these
1233   ;; and the output routines).  -- CSR, 2004-02-09
1234   (loop for i from 40 by 8 to 1024 ; ARB (well, KLUDGE really)
1235         if (subtypep type `(unsigned-byte ,i))
1236         do (return-from pick-input-routine
1237              (values
1238               (lambda (stream eof-error eof-value)
1239                 (input-wrapper (stream (/ i 8) eof-error eof-value)
1240                   (let ((sap (buffer-sap ibuf))
1241                         (head (buffer-head ibuf)))
1242                     (loop for j from 0 below (/ i 8)
1243                           with result = 0
1244                           do (setf result
1245                                    (+ (* 256 result)
1246                                       (sap-ref-8 sap (+ head j))))
1247                           finally (return result)))))
1248               `(unsigned-byte ,i)
1249               (/ i 8))))
1250   (loop for i from 40 by 8 to 1024 ; ARB (well, KLUDGE really)
1251         if (subtypep type `(signed-byte ,i))
1252         do (return-from pick-input-routine
1253              (values
1254               (lambda (stream eof-error eof-value)
1255                 (input-wrapper (stream (/ i 8) eof-error eof-value)
1256                   (let ((sap (buffer-sap ibuf))
1257                         (head (buffer-head ibuf)))
1258                     (loop for j from 0 below (/ i 8)
1259                           with result = 0
1260                           do (setf result
1261                                    (+ (* 256 result)
1262                                       (sap-ref-8 sap (+ head j))))
1263                           finally (return (if (logbitp (1- i) result)
1264                                               (dpb result (byte i 0) -1)
1265                                               result))))))
1266               `(signed-byte ,i)
1267               (/ i 8)))))
1268
1269 ;;; the N-BIN method for FD-STREAMs
1270 ;;;
1271 ;;; Note that this blocks in UNIX-READ. It is generally used where
1272 ;;; there is a definite amount of reading to be done, so blocking
1273 ;;; isn't too problematical.
1274 (defun fd-stream-read-n-bytes (stream buffer start requested eof-error-p
1275                                &aux (total-copied 0))
1276   (declare (type fd-stream stream))
1277   (declare (type index start requested total-copied))
1278   (aver (= (length (fd-stream-instead stream)) 0))
1279   (do ()
1280       (nil)
1281     (let* ((remaining-request (- requested total-copied))
1282            (ibuf (fd-stream-ibuf stream))
1283            (head (buffer-head ibuf))
1284            (tail (buffer-tail ibuf))
1285            (available (- tail head))
1286            (n-this-copy (min remaining-request available))
1287            (this-start (+ start total-copied))
1288            (this-end (+ this-start n-this-copy))
1289            (sap (buffer-sap ibuf)))
1290       (declare (type index remaining-request head tail available))
1291       (declare (type index n-this-copy))
1292       ;; Copy data from stream buffer into user's buffer.
1293       (%byte-blt sap head buffer this-start this-end)
1294       (incf (buffer-head ibuf) n-this-copy)
1295       (incf total-copied n-this-copy)
1296       ;; Maybe we need to refill the stream buffer.
1297       (cond (;; If there were enough data in the stream buffer, we're done.
1298              (eql total-copied requested)
1299              (return total-copied))
1300             (;; If EOF, we're done in another way.
1301              (null (catch 'eof-input-catcher (refill-input-buffer stream)))
1302              (if eof-error-p
1303                  (error 'end-of-file :stream stream)
1304                  (return total-copied)))
1305             ;; Otherwise we refilled the stream buffer, so fall
1306             ;; through into another pass of the loop.
1307             ))))
1308
1309 (defun fd-stream-resync (stream)
1310   (let ((entry (get-external-format (fd-stream-external-format stream))))
1311     (when entry
1312       (funcall (ef-resync-fun entry) stream))))
1313
1314 (defun get-fd-stream-character-sizer (stream)
1315   (let ((entry (get-external-format (fd-stream-external-format stream))))
1316     (when entry
1317       (ef-bytes-for-char-fun entry))))
1318
1319 (defun fd-stream-character-size (stream char)
1320   (let ((sizer (get-fd-stream-character-sizer stream)))
1321     (when sizer (funcall sizer char))))
1322
1323 (defun fd-stream-string-size (stream string)
1324   (let ((sizer (get-fd-stream-character-sizer stream)))
1325     (when sizer
1326       (loop for char across string summing (funcall sizer char)))))
1327
1328 (defun find-external-format (external-format)
1329   (when external-format
1330     (get-external-format external-format)))
1331
1332 (defun variable-width-external-format-p (ef-entry)
1333   (and ef-entry (not (null (ef-resync-fun ef-entry)))))
1334
1335 (defun bytes-for-char-fun (ef-entry)
1336   (if ef-entry (ef-bytes-for-char-fun ef-entry) (constantly 1)))
1337
1338 (defmacro define-unibyte-mapping-external-format
1339     (canonical-name (&rest other-names) &body exceptions)
1340   (let ((->code-name (symbolicate canonical-name '->code-mapper))
1341         (code->-name (symbolicate 'code-> canonical-name '-mapper))
1342         (get-bytes-name (symbolicate 'get- canonical-name '-bytes))
1343         (string->-name (symbolicate 'string-> canonical-name))
1344         (define-string*-name (symbolicate 'define- canonical-name '->string*))
1345         (string*-name (symbolicate canonical-name '->string*))
1346         (define-string-name (symbolicate 'define- canonical-name '->string))
1347         (string-name (symbolicate canonical-name '->string))
1348         (->string-aref-name (symbolicate canonical-name '->string-aref)))
1349     `(progn
1350        (define-unibyte-mapper ,->code-name ,code->-name
1351          ,@exceptions)
1352        (declaim (inline ,get-bytes-name))
1353        (defun ,get-bytes-name (string pos)
1354          (declare (optimize speed (safety 0))
1355                   (type simple-string string)
1356                   (type array-range pos))
1357          (get-latin-bytes #',code->-name ,canonical-name string pos))
1358        (defun ,string->-name (string sstart send null-padding)
1359          (declare (optimize speed (safety 0))
1360                   (type simple-string string)
1361                   (type array-range sstart send))
1362          (values (string->latin% string sstart send #',get-bytes-name null-padding)))
1363        (defmacro ,define-string*-name (accessor type)
1364          (declare (ignore type))
1365          (let ((name (make-od-name ',string*-name accessor)))
1366            `(progn
1367               (defun ,name (string sstart send array astart aend)
1368                 (,(make-od-name 'latin->string* accessor)
1369                   string sstart send array astart aend #',',->code-name)))))
1370        (instantiate-octets-definition ,define-string*-name)
1371        (defmacro ,define-string-name (accessor type)
1372          (declare (ignore type))
1373          (let ((name (make-od-name ',string-name accessor)))
1374            `(progn
1375               (defun ,name (array astart aend)
1376                 (,(make-od-name 'latin->string accessor)
1377                   array astart aend #',',->code-name)))))
1378        (instantiate-octets-definition ,define-string-name)
1379        (define-unibyte-external-format ,canonical-name ,other-names
1380          (let ((octet (,code->-name bits)))
1381            (if octet
1382                (setf (sap-ref-8 sap tail) octet)
1383                (external-format-encoding-error stream bits)))
1384          (let ((code (,->code-name byte)))
1385            (if code
1386                (code-char code)
1387                (return-from decode-break-reason 1)))
1388          ,->string-aref-name
1389          ,string->-name))))
1390
1391 (defmacro define-unibyte-external-format
1392     (canonical-name (&rest other-names)
1393      out-form in-form octets-to-string-symbol string-to-octets-symbol)
1394   `(define-external-format/variable-width (,canonical-name ,@other-names)
1395      t #\? 1
1396      ,out-form
1397      1
1398      ,in-form
1399      ,octets-to-string-symbol
1400      ,string-to-octets-symbol))
1401
1402 (defmacro define-external-format/variable-width
1403     (external-format output-restart replacement-character
1404      out-size-expr out-expr in-size-expr in-expr
1405      octets-to-string-sym string-to-octets-sym)
1406   (let* ((name (first external-format))
1407          (out-function (symbolicate "OUTPUT-BYTES/" name))
1408          (format (format nil "OUTPUT-CHAR-~A-~~A-BUFFERED" (string name)))
1409          (in-function (symbolicate "FD-STREAM-READ-N-CHARACTERS/" name))
1410          (in-char-function (symbolicate "INPUT-CHAR/" name))
1411          (resync-function (symbolicate "RESYNC/" name))
1412          (size-function (symbolicate "BYTES-FOR-CHAR/" name))
1413          (read-c-string-function (symbolicate "READ-FROM-C-STRING/" name))
1414          (output-c-string-function (symbolicate "OUTPUT-TO-C-STRING/" name))
1415          (n-buffer (gensym "BUFFER")))
1416     `(progn
1417       (defun ,size-function (byte)
1418         (declare (ignorable byte))
1419         ,out-size-expr)
1420       (defun ,out-function (stream string flush-p start end)
1421         (let ((start (or start 0))
1422               (end (or end (length string))))
1423           (declare (type index start end))
1424           (synchronize-stream-output stream)
1425           (unless (<= 0 start end (length string))
1426             (sequence-bounding-indices-bad-error string start end))
1427           (do ()
1428               ((= end start))
1429             (let ((obuf (fd-stream-obuf stream)))
1430               (string-dispatch (simple-base-string
1431                                 #!+sb-unicode (simple-array character (*))
1432                                 string)
1433                   string
1434                 (let ((len (buffer-length obuf))
1435                       (sap (buffer-sap obuf))
1436                       ;; FIXME: Rename
1437                       (tail (buffer-tail obuf)))
1438                   (declare (type index tail)
1439                            ;; STRING bounds have already been checked.
1440                            (optimize (safety 0)))
1441                   (,@(if output-restart
1442                          `(catch 'output-nothing)
1443                          `(progn))
1444                      (do* ()
1445                           ((or (= start end) (< (- len tail) 4)))
1446                        (let* ((byte (aref string start))
1447                               (bits (char-code byte))
1448                               (size ,out-size-expr))
1449                          ,out-expr
1450                          (incf tail size)
1451                          (setf (buffer-tail obuf) tail)
1452                          (incf start)))
1453                      (go flush))
1454                   ;; Exited via CATCH: skip the current character.
1455                   (incf start))))
1456            flush
1457             (when (< start end)
1458               (flush-output-buffer stream)))
1459           (when flush-p
1460             (flush-output-buffer stream))))
1461       (def-output-routines/variable-width (,format
1462                                            ,out-size-expr
1463                                            ,output-restart
1464                                            ,external-format
1465                                            (:none character)
1466                                            (:line character)
1467                                            (:full character))
1468           (if (eql byte #\Newline)
1469               (setf (fd-stream-char-pos stream) 0)
1470               (incf (fd-stream-char-pos stream)))
1471         (let ((bits (char-code byte))
1472               (sap (buffer-sap obuf))
1473               (tail (buffer-tail obuf)))
1474           ,out-expr))
1475       (defun ,in-function (stream buffer start requested eof-error-p
1476                            &aux (total-copied 0))
1477         (declare (type fd-stream stream)
1478                  (type index start requested total-copied)
1479                  (type
1480                   (simple-array character (#.+ansi-stream-in-buffer-length+))
1481                   buffer))
1482         (when (fd-stream-eof-forced-p stream)
1483           (setf (fd-stream-eof-forced-p stream) nil)
1484           (return-from ,in-function 0))
1485         (do ((instead (fd-stream-instead stream)))
1486             ((= (fill-pointer instead) 0)
1487              (setf (fd-stream-listen stream) nil))
1488           (setf (aref buffer (+ start total-copied)) (vector-pop instead))
1489           (incf total-copied)
1490           (when (= requested total-copied)
1491             (when (= (fill-pointer instead) 0)
1492               (setf (fd-stream-listen stream) nil))
1493             (return-from ,in-function total-copied)))
1494         (do ()
1495             (nil)
1496           (let* ((ibuf (fd-stream-ibuf stream))
1497                  (head (buffer-head ibuf))
1498                  (tail (buffer-tail ibuf))
1499                  (sap (buffer-sap ibuf))
1500                  (decode-break-reason nil))
1501             (declare (type index head tail))
1502             ;; Copy data from stream buffer into user's buffer.
1503             (do ((size nil nil))
1504                 ((or (= tail head) (= requested total-copied)))
1505               (setf decode-break-reason
1506                     (block decode-break-reason
1507                       ,@(when (consp in-size-expr)
1508                           `((when (> ,(car in-size-expr) (- tail head))
1509                               (return))))
1510                       (let ((byte (sap-ref-8 sap head)))
1511                         (declare (ignorable byte))
1512                         (setq size ,(if (consp in-size-expr) (cadr in-size-expr) in-size-expr))
1513                         (when (> size (- tail head))
1514                           (return))
1515                         (setf (aref buffer (+ start total-copied)) ,in-expr)
1516                         (incf total-copied)
1517                         (incf head size))
1518                       nil))
1519               (setf (buffer-head ibuf) head)
1520               (when decode-break-reason
1521                 ;; If we've already read some characters on when the invalid
1522                 ;; code sequence is detected, we return immediately. The
1523                 ;; handling of the error is deferred until the next call
1524                 ;; (where this check will be false). This allows establishing
1525                 ;; high-level handlers for decode errors (for example
1526                 ;; automatically resyncing in Lisp comments).
1527                 (when (plusp total-copied)
1528                   (return-from ,in-function total-copied))
1529                 (when (stream-decoding-error-and-handle
1530                        stream decode-break-reason)
1531                   (if eof-error-p
1532                       (error 'end-of-file :stream stream)
1533                       (return-from ,in-function total-copied)))
1534                 ;; we might have been given stuff to use instead, so
1535                 ;; we have to return (and trust our caller to know
1536                 ;; what to do about TOTAL-COPIED being 0).
1537                 (return-from ,in-function total-copied)))
1538             (setf (buffer-head ibuf) head)
1539             ;; Maybe we need to refill the stream buffer.
1540             (cond ( ;; If there were enough data in the stream buffer, we're done.
1541                    (= total-copied requested)
1542                    (return total-copied))
1543                   ( ;; If EOF, we're done in another way.
1544                    (or (eq decode-break-reason 'eof)
1545                        (null (catch 'eof-input-catcher
1546                                (refill-input-buffer stream))))
1547                    (if eof-error-p
1548                        (error 'end-of-file :stream stream)
1549                        (return total-copied)))
1550                   ;; Otherwise we refilled the stream buffer, so fall
1551                   ;; through into another pass of the loop.
1552                   ))))
1553       (def-input-routine/variable-width ,in-char-function (character
1554                                                            ,external-format
1555                                                            ,in-size-expr
1556                                                            sap head)
1557         (let ((byte (sap-ref-8 sap head)))
1558           (declare (ignorable byte))
1559           ,in-expr))
1560       (defun ,resync-function (stream)
1561         (let ((ibuf (fd-stream-ibuf stream))
1562               size)
1563           (catch 'eof-input-catcher
1564             (loop
1565                (incf (buffer-head ibuf))
1566                (input-at-least stream ,(if (consp in-size-expr) (car in-size-expr) `(setq size ,in-size-expr)))
1567                (unless (block decode-break-reason
1568                          (let* ((sap (buffer-sap ibuf))
1569                                 (head (buffer-head ibuf))
1570                                 (byte (sap-ref-8 sap head)))
1571                            (declare (ignorable byte))
1572                            ,@(when (consp in-size-expr)
1573                                `((setq size ,(cadr in-size-expr))
1574                                  (input-at-least stream size)))
1575                            (setf head (buffer-head ibuf))
1576                            ,in-expr)
1577                          nil)
1578                  (return))))))
1579       (defun ,read-c-string-function (sap element-type)
1580         (declare (type system-area-pointer sap))
1581         (locally
1582             (declare (optimize (speed 3) (safety 0)))
1583           (let* ((stream ,name)
1584                  (size 0) (head 0) (byte 0) (char nil)
1585                  (decode-break-reason nil)
1586                  (length (dotimes (count (1- ARRAY-DIMENSION-LIMIT) count)
1587                            (setf decode-break-reason
1588                                  (block decode-break-reason
1589                                    (setf byte (sap-ref-8 sap head)
1590                                          size ,(if (consp in-size-expr) (cadr in-size-expr) in-size-expr)
1591                                          char ,in-expr)
1592                                    (incf head size)
1593                                    nil))
1594                            (when decode-break-reason
1595                              (c-string-decoding-error ,name decode-break-reason))
1596                            (when (zerop (char-code char))
1597                              (return count))))
1598                  (string (make-string length :element-type element-type)))
1599             (declare (ignorable stream)
1600                      (type index head length) ;; size
1601                      (type (unsigned-byte 8) byte)
1602                      (type (or null character) char)
1603                      (type string string))
1604             (setf head 0)
1605             (dotimes (index length string)
1606               (setf decode-break-reason
1607                     (block decode-break-reason
1608                       (setf byte (sap-ref-8 sap head)
1609                             size ,(if (consp in-size-expr) (cadr in-size-expr) in-size-expr)
1610                             char ,in-expr)
1611                       (incf head size)
1612                       nil))
1613               (when decode-break-reason
1614                 (c-string-decoding-error ,name decode-break-reason))
1615               (setf (aref string index) char)))))
1616
1617       (defun ,output-c-string-function (string)
1618         (declare (type simple-string string))
1619         (locally
1620             (declare (optimize (speed 3) (safety 0)))
1621           (let* ((length (length string))
1622                  (char-length (make-array (1+ length) :element-type 'index))
1623                  (buffer-length
1624                   (+ (loop for i of-type index below length
1625                         for byte of-type character = (aref string i)
1626                         for bits = (char-code byte)
1627                         sum (setf (aref char-length i)
1628                                   (the index ,out-size-expr)))
1629                      (let* ((byte (code-char 0))
1630                             (bits (char-code byte)))
1631                        (declare (ignorable byte bits))
1632                        (setf (aref char-length length)
1633                              (the index ,out-size-expr)))))
1634                  (tail 0)
1635                  (,n-buffer (make-array buffer-length
1636                                         :element-type '(unsigned-byte 8)))
1637                  stream)
1638             (declare (type index length buffer-length tail)
1639                      (type null stream)
1640                      (ignorable stream))
1641             (with-pinned-objects (,n-buffer)
1642               (let ((sap (vector-sap ,n-buffer)))
1643                 (declare (system-area-pointer sap))
1644                 (loop for i of-type index below length
1645                       for byte of-type character = (aref string i)
1646                       for bits = (char-code byte)
1647                       for size of-type index = (aref char-length i)
1648                       do (prog1
1649                              ,out-expr
1650                            (incf tail size)))
1651                 (let* ((bits 0)
1652                        (byte (code-char bits))
1653                        (size (aref char-length length)))
1654                   (declare (ignorable bits byte size))
1655                   ,out-expr)))
1656             ,n-buffer)))
1657
1658       (let ((entry (%make-external-format
1659                     :names ',external-format
1660                     :default-replacement-character ,replacement-character
1661                     :read-n-chars-fun #',in-function
1662                     :read-char-fun #',in-char-function
1663                     :write-n-bytes-fun #',out-function
1664                     ,@(mapcan #'(lambda (buffering)
1665                                   (list (intern (format nil "WRITE-CHAR-~A-BUFFERED-FUN" buffering) :keyword)
1666                                         `#',(intern (format nil format (string buffering)))))
1667                               '(:none :line :full))
1668                     :resync-fun #',resync-function
1669                     :bytes-for-char-fun #',size-function
1670                     :read-c-string-fun #',read-c-string-function
1671                     :write-c-string-fun #',output-c-string-function
1672                     :octets-to-string-fun (lambda (&rest rest)
1673                                             (declare (dynamic-extent rest))
1674                                             (apply ',octets-to-string-sym rest))
1675                     :string-to-octets-fun (lambda (&rest rest)
1676                                             (declare (dynamic-extent rest))
1677                                             (apply ',string-to-octets-sym rest)))))
1678         (dolist (ef ',external-format)
1679           (setf (gethash ef *external-formats*) entry))))))
1680 \f
1681 ;;;; utility functions (misc routines, etc)
1682
1683 ;;; Fill in the various routine slots for the given type. INPUT-P and
1684 ;;; OUTPUT-P indicate what slots to fill. The buffering slot must be
1685 ;;; set prior to calling this routine.
1686 (defun set-fd-stream-routines (fd-stream element-type external-format
1687                                input-p output-p buffer-p)
1688   (let* ((target-type (case element-type
1689                         (unsigned-byte '(unsigned-byte 8))
1690                         (signed-byte '(signed-byte 8))
1691                         (:default 'character)
1692                         (t element-type)))
1693          (character-stream-p (subtypep target-type 'character))
1694          (bivalent-stream-p (eq element-type :default))
1695          normalized-external-format
1696          (bin-routine #'ill-bin)
1697          (bin-type nil)
1698          (bin-size nil)
1699          (cin-routine #'ill-in)
1700          (cin-type nil)
1701          (cin-size nil)
1702          (input-type nil)           ;calculated from bin-type/cin-type
1703          (input-size nil)           ;calculated from bin-size/cin-size
1704          (read-n-characters #'ill-in)
1705          (bout-routine #'ill-bout)
1706          (bout-type nil)
1707          (bout-size nil)
1708          (cout-routine #'ill-out)
1709          (cout-type nil)
1710          (cout-size nil)
1711          (output-type nil)
1712          (output-size nil)
1713          (output-bytes #'ill-bout))
1714
1715     ;; Ensure that we have buffers in the desired direction(s) only,
1716     ;; getting new ones and dropping/resetting old ones as necessary.
1717     (let ((obuf (fd-stream-obuf fd-stream)))
1718       (if output-p
1719           (if obuf
1720               (reset-buffer obuf)
1721               (setf (fd-stream-obuf fd-stream) (get-buffer)))
1722           (when obuf
1723             (setf (fd-stream-obuf fd-stream) nil)
1724             (release-buffer obuf))))
1725
1726     (let ((ibuf (fd-stream-ibuf fd-stream)))
1727       (if input-p
1728           (if ibuf
1729               (reset-buffer ibuf)
1730               (setf (fd-stream-ibuf fd-stream) (get-buffer)))
1731           (when ibuf
1732             (setf (fd-stream-ibuf fd-stream) nil)
1733             (release-buffer ibuf))))
1734
1735     ;; FIXME: Why only for output? Why unconditionally?
1736     (when output-p
1737       (setf (fd-stream-char-pos fd-stream) 0))
1738
1739     (when (and character-stream-p
1740                (eq external-format :default))
1741       (/show0 "/getting default external format")
1742       (setf external-format (default-external-format)))
1743
1744     (when input-p
1745       (when (or (not character-stream-p) bivalent-stream-p)
1746         (multiple-value-setq (bin-routine bin-type bin-size read-n-characters
1747                                           normalized-external-format)
1748           (pick-input-routine (if bivalent-stream-p '(unsigned-byte 8)
1749                                   target-type)
1750                               external-format))
1751         (unless bin-routine
1752           (error "could not find any input routine for ~S" target-type)))
1753       (when character-stream-p
1754         (multiple-value-setq (cin-routine cin-type cin-size read-n-characters
1755                                           normalized-external-format)
1756           (pick-input-routine target-type external-format))
1757         (unless cin-routine
1758           (error "could not find any input routine for ~S" target-type)))
1759       (setf (fd-stream-in fd-stream) cin-routine
1760             (fd-stream-bin fd-stream) bin-routine)
1761       ;; character type gets preferential treatment
1762       (setf input-size (or cin-size bin-size))
1763       (setf input-type (or cin-type bin-type))
1764       (when normalized-external-format
1765         (setf (fd-stream-external-format fd-stream)
1766               normalized-external-format))
1767       (when (= (or cin-size 1) (or bin-size 1) 1)
1768         (setf (fd-stream-n-bin fd-stream) ;XXX
1769               (if (and character-stream-p (not bivalent-stream-p))
1770                   read-n-characters
1771                   #'fd-stream-read-n-bytes))
1772         ;; Sometimes turn on fast-read-char/fast-read-byte.  Switch on
1773         ;; for character and (unsigned-byte 8) streams.  In these
1774         ;; cases, fast-read-* will read from the
1775         ;; ansi-stream-(c)in-buffer, saving function calls.
1776         ;; Otherwise, the various data-reading functions in the stream
1777         ;; structure will be called.
1778         (when (and buffer-p
1779                    (not bivalent-stream-p)
1780                    ;; temporary disable on :io streams
1781                    (not output-p))
1782           (cond (character-stream-p
1783                  (setf (ansi-stream-cin-buffer fd-stream)
1784                        (make-array +ansi-stream-in-buffer-length+
1785                                    :element-type 'character)))
1786                 ((equal target-type '(unsigned-byte 8))
1787                  (setf (ansi-stream-in-buffer fd-stream)
1788                        (make-array +ansi-stream-in-buffer-length+
1789                                    :element-type '(unsigned-byte 8))))))))
1790
1791     (when output-p
1792       (when (or (not character-stream-p) bivalent-stream-p)
1793         (multiple-value-setq (bout-routine bout-type bout-size output-bytes
1794                                            normalized-external-format)
1795           (pick-output-routine (if bivalent-stream-p
1796                                    '(unsigned-byte 8)
1797                                    target-type)
1798                                (fd-stream-buffering fd-stream)
1799                                external-format))
1800         (unless bout-routine
1801           (error "could not find any output routine for ~S buffered ~S"
1802                  (fd-stream-buffering fd-stream)
1803                  target-type)))
1804       (when character-stream-p
1805         (multiple-value-setq (cout-routine cout-type cout-size output-bytes
1806                                            normalized-external-format)
1807           (pick-output-routine target-type
1808                                (fd-stream-buffering fd-stream)
1809                                external-format))
1810         (unless cout-routine
1811           (error "could not find any output routine for ~S buffered ~S"
1812                  (fd-stream-buffering fd-stream)
1813                  target-type)))
1814       (when normalized-external-format
1815         (setf (fd-stream-external-format fd-stream)
1816               normalized-external-format))
1817       (when character-stream-p
1818         (setf (fd-stream-output-bytes fd-stream) output-bytes))
1819       (setf (fd-stream-out fd-stream) cout-routine
1820             (fd-stream-bout fd-stream) bout-routine
1821             (fd-stream-sout fd-stream) (if (eql cout-size 1)
1822                                            #'fd-sout #'ill-out))
1823       (setf output-size (or cout-size bout-size))
1824       (setf output-type (or cout-type bout-type)))
1825
1826     (when (and input-size output-size
1827                (not (eq input-size output-size)))
1828       (error "Element sizes for input (~S:~S) and output (~S:~S) differ?"
1829              input-type input-size
1830              output-type output-size))
1831     (setf (fd-stream-element-size fd-stream)
1832           (or input-size output-size))
1833
1834     (setf (fd-stream-element-type fd-stream)
1835           (cond ((equal input-type output-type)
1836                  input-type)
1837                 ((null output-type)
1838                  input-type)
1839                 ((null input-type)
1840                  output-type)
1841                 ((subtypep input-type output-type)
1842                  input-type)
1843                 ((subtypep output-type input-type)
1844                  output-type)
1845                 (t
1846                  (error "Input type (~S) and output type (~S) are unrelated?"
1847                         input-type
1848                         output-type))))))
1849
1850 ;;; Handles the resource-release aspects of stream closing, and marks
1851 ;;; it as closed.
1852 (defun release-fd-stream-resources (fd-stream)
1853   (handler-case
1854       (without-interrupts
1855         ;; Drop handlers first.
1856         (when (fd-stream-handler fd-stream)
1857           (remove-fd-handler (fd-stream-handler fd-stream))
1858           (setf (fd-stream-handler fd-stream) nil))
1859         ;; Disable interrupts so that a asynch unwind will not leave
1860         ;; us with a dangling finalizer (that would close the same
1861         ;; --possibly reassigned-- FD again), or a stream with a closed
1862         ;; FD that appears open.
1863         (sb!unix:unix-close (fd-stream-fd fd-stream))
1864         (set-closed-flame fd-stream)
1865         (when (fboundp 'cancel-finalization)
1866           (cancel-finalization fd-stream)))
1867     ;; On error unwind from WITHOUT-INTERRUPTS.
1868     (serious-condition (e)
1869       (error e)))
1870   ;; Release all buffers. If this is undone, or interrupted,
1871   ;; we're still safe: buffers have finalizers of their own.
1872   (release-fd-stream-buffers fd-stream))
1873
1874 ;;; Flushes the current input buffer and any supplied replacements,
1875 ;;; and returns the input buffer, and the amount of of flushed input
1876 ;;; in bytes.
1877 (defun flush-input-buffer (stream)
1878   (let ((unread (length (fd-stream-instead stream))))
1879     (setf (fill-pointer (fd-stream-instead stream)) 0)
1880     (let ((ibuf (fd-stream-ibuf stream)))
1881       (if ibuf
1882           (let ((head (buffer-head ibuf))
1883                 (tail (buffer-tail ibuf)))
1884             (values (reset-buffer ibuf) (- (+ unread tail) head)))
1885           (values nil unread)))))
1886
1887 (defun fd-stream-clear-input (stream)
1888   (flush-input-buffer stream)
1889   #!+win32
1890   (progn
1891     (sb!win32:fd-clear-input (fd-stream-fd stream))
1892     (setf (fd-stream-listen stream) nil))
1893   #!-win32
1894   (catch 'eof-input-catcher
1895     (loop until (sysread-may-block-p stream)
1896           do
1897           (refill-input-buffer stream)
1898           (reset-buffer (fd-stream-ibuf stream)))
1899     t))
1900
1901 ;;; Handle miscellaneous operations on FD-STREAM.
1902 (defun fd-stream-misc-routine (fd-stream operation &optional arg1 arg2)
1903   (declare (ignore arg2))
1904   (case operation
1905     (:listen
1906      (labels ((do-listen ()
1907                 (let ((ibuf (fd-stream-ibuf fd-stream)))
1908                   (or (not (eql (buffer-head ibuf) (buffer-tail ibuf)))
1909                       (fd-stream-listen fd-stream)
1910                       #!+win32
1911                       (sb!win32:fd-listen (fd-stream-fd fd-stream))
1912                       #!-win32
1913                       ;; If the read can block, LISTEN will certainly return NIL.
1914                       (if (sysread-may-block-p fd-stream)
1915                           nil
1916                           ;; Otherwise select(2) and CL:LISTEN have slightly
1917                           ;; different semantics.  The former returns that an FD
1918                           ;; is readable when a read operation wouldn't block.
1919                           ;; That includes EOF.  However, LISTEN must return NIL
1920                           ;; at EOF.
1921                           (progn (catch 'eof-input-catcher
1922                                    ;; r-b/f too calls select, but it shouldn't
1923                                    ;; block as long as read can return once w/o
1924                                    ;; blocking
1925                                    (refill-input-buffer fd-stream))
1926                                  ;; At this point either IBUF-HEAD != IBUF-TAIL
1927                                  ;; and FD-STREAM-LISTEN is NIL, in which case
1928                                  ;; we should return T, or IBUF-HEAD ==
1929                                  ;; IBUF-TAIL and FD-STREAM-LISTEN is :EOF, in
1930                                  ;; which case we should return :EOF for this
1931                                  ;; call and all future LISTEN call on this stream.
1932                                  ;; Call ourselves again to determine which case
1933                                  ;; applies.
1934                                  (do-listen)))))))
1935        (do-listen)))
1936     (:unread
1937      (decf (buffer-head (fd-stream-ibuf fd-stream))
1938            (fd-stream-character-size fd-stream arg1)))
1939     (:close
1940      ;; Drop input buffers
1941      (setf (ansi-stream-in-index fd-stream) +ansi-stream-in-buffer-length+
1942            (ansi-stream-cin-buffer fd-stream) nil
1943            (ansi-stream-in-buffer fd-stream) nil)
1944      (cond (arg1
1945             ;; We got us an abort on our hands.
1946             (let ((outputp (fd-stream-obuf fd-stream))
1947                   (file (fd-stream-file fd-stream))
1948                   (orig (fd-stream-original fd-stream)))
1949               ;; This takes care of the important stuff -- everything
1950               ;; rest is cleaning up the file-system, which we cannot
1951               ;; do on some platforms as long as the file is open.
1952               (release-fd-stream-resources fd-stream)
1953               ;; We can't do anything unless we know what file were
1954               ;; dealing with, and we don't want to do anything
1955               ;; strange unless we were writing to the file.
1956               (when (and outputp file)
1957                 (if orig
1958                     ;; If the original is EQ to file we are appending to
1959                     ;; and can just close the file without renaming.
1960                     (unless (eq orig file)
1961                       ;; We have a handle on the original, just revert.
1962                       (multiple-value-bind (okay err)
1963                           (sb!unix:unix-rename orig file)
1964                         ;; FIXME: Why is this a SIMPLE-STREAM-ERROR, and the
1965                         ;; others are SIMPLE-FILE-ERRORS? Surely they should
1966                         ;; all be the same?
1967                         (unless okay
1968                           (error 'simple-stream-error
1969                                  :format-control
1970                                  "~@<Couldn't restore ~S to its original contents ~
1971                                   from ~S while closing ~S: ~2I~_~A~:>"
1972                                  :format-arguments
1973                                  (list file orig fd-stream (strerror err))
1974                                  :stream fd-stream))))
1975                     ;; We can't restore the original, and aren't
1976                     ;; appending, so nuke that puppy.
1977                     ;;
1978                     ;; FIXME: This is currently the fate of superseded
1979                     ;; files, and according to the CLOSE spec this is
1980                     ;; wrong. However, there seems to be no clean way to
1981                     ;; do that that doesn't involve either copying the
1982                     ;; data (bad if the :abort resulted from a full
1983                     ;; disk), or renaming the old file temporarily
1984                     ;; (probably bad because stream opening becomes more
1985                     ;; racy).
1986                     (multiple-value-bind (okay err)
1987                         (sb!unix:unix-unlink file)
1988                       (unless okay
1989                         (error 'simple-file-error
1990                                :pathname file
1991                                :format-control
1992                                "~@<Couldn't remove ~S while closing ~S: ~2I~_~A~:>"
1993                                :format-arguments
1994                                (list file fd-stream (strerror err)))))))))
1995            (t
1996             (finish-fd-stream-output fd-stream)
1997             (let ((orig (fd-stream-original fd-stream)))
1998               (when (and orig (fd-stream-delete-original fd-stream))
1999                 (multiple-value-bind (okay err) (sb!unix:unix-unlink orig)
2000                   (unless okay
2001                     (error 'simple-file-error
2002                            :pathname orig
2003                            :format-control
2004                            "~@<couldn't delete ~S while closing ~S: ~2I~_~A~:>"
2005                            :format-arguments
2006                            (list orig fd-stream (strerror err)))))))
2007             ;; In case of no-abort close, don't *really* close the
2008             ;; stream until the last moment -- the cleaning up of the
2009             ;; original can be done first.
2010             (release-fd-stream-resources fd-stream))))
2011     (:clear-input
2012      (fd-stream-clear-input fd-stream))
2013     (:force-output
2014      (flush-output-buffer fd-stream))
2015     (:finish-output
2016      (finish-fd-stream-output fd-stream))
2017     (:element-type
2018      (fd-stream-element-type fd-stream))
2019     (:external-format
2020      (fd-stream-external-format fd-stream))
2021     (:interactive-p
2022      (= 1 (the (member 0 1)
2023             (sb!unix:unix-isatty (fd-stream-fd fd-stream)))))
2024     (:line-length
2025      80)
2026     (:charpos
2027      (fd-stream-char-pos fd-stream))
2028     (:file-length
2029      (unless (fd-stream-file fd-stream)
2030        ;; This is a TYPE-ERROR because ANSI's species FILE-LENGTH
2031        ;; "should signal an error of type TYPE-ERROR if stream is not
2032        ;; a stream associated with a file". Too bad there's no very
2033        ;; appropriate value for the EXPECTED-TYPE slot..
2034        (error 'simple-type-error
2035               :datum fd-stream
2036               :expected-type 'fd-stream
2037               :format-control "~S is not a stream associated with a file."
2038               :format-arguments (list fd-stream)))
2039      (multiple-value-bind (okay dev ino mode nlink uid gid rdev size
2040                                 atime mtime ctime blksize blocks)
2041          (sb!unix:unix-fstat (fd-stream-fd fd-stream))
2042        (declare (ignore ino nlink uid gid rdev
2043                         atime mtime ctime blksize blocks))
2044        (unless okay
2045          (simple-stream-perror "failed Unix fstat(2) on ~S" fd-stream dev))
2046        (if (zerop mode)
2047            nil
2048            (truncate size (fd-stream-element-size fd-stream)))))
2049     (:file-string-length
2050      (etypecase arg1
2051        (character (fd-stream-character-size fd-stream arg1))
2052        (string (fd-stream-string-size fd-stream arg1))))
2053     (:file-position
2054      (if arg1
2055          (fd-stream-set-file-position fd-stream arg1)
2056          (fd-stream-get-file-position fd-stream)))))
2057
2058 ;; FIXME: Think about this.
2059 ;;
2060 ;; (defun finish-fd-stream-output (fd-stream)
2061 ;;   (let ((timeout (fd-stream-timeout fd-stream)))
2062 ;;     (loop while (fd-stream-output-queue fd-stream)
2063 ;;        ;; FIXME: SIGINT while waiting for a timeout will
2064 ;;        ;; cause a timeout here.
2065 ;;        do (when (and (not (serve-event timeout)) timeout)
2066 ;;             (signal-timeout 'io-timeout
2067 ;;                             :stream fd-stream
2068 ;;                             :direction :write
2069 ;;                             :seconds timeout)))))
2070
2071 (defun finish-fd-stream-output (stream)
2072   (flush-output-buffer stream)
2073   (do ()
2074       ((null (fd-stream-output-queue stream)))
2075     (serve-all-events)))
2076
2077 (defun fd-stream-get-file-position (stream)
2078   (declare (fd-stream stream))
2079   (without-interrupts
2080     (let ((posn (sb!unix:unix-lseek (fd-stream-fd stream) 0 sb!unix:l_incr)))
2081       (declare (type (or (alien sb!unix:off-t) null) posn))
2082       ;; We used to return NIL for errno==ESPIPE, and signal an error
2083       ;; in other failure cases. However, CLHS says to return NIL if
2084       ;; the position cannot be determined -- so that's what we do.
2085       (when (integerp posn)
2086         ;; Adjust for buffered output: If there is any output
2087         ;; buffered, the *real* file position will be larger
2088         ;; than reported by lseek() because lseek() obviously
2089         ;; cannot take into account output we have not sent
2090         ;; yet.
2091         (dolist (buffer (fd-stream-output-queue stream))
2092           (incf posn (- (buffer-tail buffer) (buffer-head buffer))))
2093         (let ((obuf (fd-stream-obuf stream)))
2094           (when obuf
2095             (incf posn (buffer-tail obuf))))
2096         ;; Adjust for unread input: If there is any input
2097         ;; read from UNIX but not supplied to the user of the
2098         ;; stream, the *real* file position will smaller than
2099         ;; reported, because we want to look like the unread
2100         ;; stuff is still available.
2101         (let ((ibuf (fd-stream-ibuf stream)))
2102           (when ibuf
2103             (decf posn (- (buffer-tail ibuf) (buffer-head ibuf)))))
2104         ;; Divide bytes by element size.
2105         (truncate posn (fd-stream-element-size stream))))))
2106
2107 (defun fd-stream-set-file-position (stream position-spec)
2108   (declare (fd-stream stream))
2109   (check-type position-spec
2110               (or (alien sb!unix:off-t) (member nil :start :end))
2111               "valid file position designator")
2112   (tagbody
2113    :again
2114      ;; Make sure we don't have any output pending, because if we
2115      ;; move the file pointer before writing this stuff, it will be
2116      ;; written in the wrong location.
2117      (finish-fd-stream-output stream)
2118      ;; Disable interrupts so that interrupt handlers doing output
2119      ;; won't screw us.
2120      (without-interrupts
2121        (unless (fd-stream-output-finished-p stream)
2122          ;; We got interrupted and more output came our way during
2123          ;; the interrupt. Wrapping the FINISH-FD-STREAM-OUTPUT in
2124          ;; WITHOUT-INTERRUPTS gets nasty as it can signal errors,
2125          ;; so we prefer to do things like this...
2126          (go :again))
2127        ;; Clear out any pending input to force the next read to go to
2128        ;; the disk.
2129        (flush-input-buffer stream)
2130        ;; Trash cached value for listen, so that we check next time.
2131        (setf (fd-stream-listen stream) nil)
2132          ;; Now move it.
2133          (multiple-value-bind (offset origin)
2134              (case position-spec
2135                (:start
2136                 (values 0 sb!unix:l_set))
2137                (:end
2138                 (values 0 sb!unix:l_xtnd))
2139                (t
2140                 (values (* position-spec (fd-stream-element-size stream))
2141                         sb!unix:l_set)))
2142            (declare (type (alien sb!unix:off-t) offset))
2143            (let ((posn (sb!unix:unix-lseek (fd-stream-fd stream)
2144                                            offset origin)))
2145              ;; CLHS says to return true if the file-position was set
2146              ;; succesfully, and NIL otherwise. We are to signal an error
2147              ;; only if the given position was out of bounds, and that is
2148              ;; dealt with above. In times past we used to return NIL for
2149              ;; errno==ESPIPE, and signal an error in other cases.
2150              ;;
2151              ;; FIXME: We are still liable to signal an error if flushing
2152              ;; output fails.
2153              (return-from fd-stream-set-file-position
2154                (typep posn '(alien sb!unix:off-t))))))))
2155
2156 \f
2157 ;;;; creation routines (MAKE-FD-STREAM and OPEN)
2158
2159 ;;; Create a stream for the given Unix file descriptor.
2160 ;;;
2161 ;;; If INPUT is non-NIL, allow input operations. If OUTPUT is non-nil,
2162 ;;; allow output operations. If neither INPUT nor OUTPUT is specified,
2163 ;;; default to allowing input.
2164 ;;;
2165 ;;; ELEMENT-TYPE indicates the element type to use (as for OPEN).
2166 ;;;
2167 ;;; BUFFERING indicates the kind of buffering to use.
2168 ;;;
2169 ;;; TIMEOUT (if true) is the number of seconds to wait for input. If
2170 ;;; NIL (the default), then wait forever. When we time out, we signal
2171 ;;; IO-TIMEOUT.
2172 ;;;
2173 ;;; FILE is the name of the file (will be returned by PATHNAME).
2174 ;;;
2175 ;;; NAME is used to identify the stream when printed.
2176 (defun make-fd-stream (fd
2177                        &key
2178                        (input nil input-p)
2179                        (output nil output-p)
2180                        (element-type 'base-char)
2181                        (buffering :full)
2182                        (external-format :default)
2183                        timeout
2184                        file
2185                        original
2186                        delete-original
2187                        pathname
2188                        input-buffer-p
2189                        dual-channel-p
2190                        (name (if file
2191                                  (format nil "file ~A" file)
2192                                  (format nil "descriptor ~W" fd)))
2193                        auto-close)
2194   (declare (type index fd) (type (or real null) timeout)
2195            (type (member :none :line :full) buffering))
2196   (cond ((not (or input-p output-p))
2197          (setf input t))
2198         ((not (or input output))
2199          (error "File descriptor must be opened either for input or output.")))
2200   (let ((stream (%make-fd-stream :fd fd
2201                                  :name name
2202                                  :file file
2203                                  :original original
2204                                  :delete-original delete-original
2205                                  :pathname pathname
2206                                  :buffering buffering
2207                                  :dual-channel-p dual-channel-p
2208                                  :external-format external-format
2209                                  :bivalent-p (eq element-type :default)
2210                                  :char-size (external-format-char-size external-format)
2211                                  :timeout
2212                                  (if timeout
2213                                      (coerce timeout 'single-float)
2214                                      nil))))
2215     (set-fd-stream-routines stream element-type external-format
2216                             input output input-buffer-p)
2217     (when (and auto-close (fboundp 'finalize))
2218       (finalize stream
2219                 (lambda ()
2220                   (sb!unix:unix-close fd)
2221                   #!+sb-show
2222                   (format *terminal-io* "** closed file descriptor ~W **~%"
2223                           fd))
2224                 :dont-save t))
2225     stream))
2226
2227 ;;; Pick a name to use for the backup file for the :IF-EXISTS
2228 ;;; :RENAME-AND-DELETE and :RENAME options.
2229 (defun pick-backup-name (name)
2230   (declare (type simple-string name))
2231   (concatenate 'simple-string name ".bak"))
2232
2233 ;;; Ensure that the given arg is one of the given list of valid
2234 ;;; things. Allow the user to fix any problems.
2235 (defun ensure-one-of (item list what)
2236   (unless (member item list)
2237     (error 'simple-type-error
2238            :datum item
2239            :expected-type `(member ,@list)
2240            :format-control "~@<~S is ~_invalid for ~S; ~_need one of~{ ~S~}~:>"
2241            :format-arguments (list item what list))))
2242
2243 ;;; Rename NAMESTRING to ORIGINAL. First, check whether we have write
2244 ;;; access, since we don't want to trash unwritable files even if we
2245 ;;; technically can. We return true if we succeed in renaming.
2246 (defun rename-the-old-one (namestring original)
2247   (unless (sb!unix:unix-access namestring sb!unix:w_ok)
2248     (error "~@<The file ~2I~_~S ~I~_is not writable.~:>" namestring))
2249   (multiple-value-bind (okay err) (sb!unix:unix-rename namestring original)
2250     (if okay
2251         t
2252         (error 'simple-file-error
2253                :pathname namestring
2254                :format-control
2255                "~@<couldn't rename ~2I~_~S ~I~_to ~2I~_~S: ~4I~_~A~:>"
2256                :format-arguments (list namestring original (strerror err))))))
2257
2258 (defun open (filename
2259              &key
2260              (direction :input)
2261              (element-type 'base-char)
2262              (if-exists nil if-exists-given)
2263              (if-does-not-exist nil if-does-not-exist-given)
2264              (external-format :default)
2265              &aux ; Squelch assignment warning.
2266              (direction direction)
2267              (if-does-not-exist if-does-not-exist)
2268              (if-exists if-exists))
2269   #!+sb-doc
2270   "Return a stream which reads from or writes to FILENAME.
2271   Defined keywords:
2272    :DIRECTION - one of :INPUT, :OUTPUT, :IO, or :PROBE
2273    :ELEMENT-TYPE - the type of object to read or write, default BASE-CHAR
2274    :IF-EXISTS - one of :ERROR, :NEW-VERSION, :RENAME, :RENAME-AND-DELETE,
2275                        :OVERWRITE, :APPEND, :SUPERSEDE or NIL
2276    :IF-DOES-NOT-EXIST - one of :ERROR, :CREATE or NIL
2277   See the manual for details."
2278
2279   ;; Calculate useful stuff.
2280   (multiple-value-bind (input output mask)
2281       (ecase direction
2282         (:input  (values   t nil sb!unix:o_rdonly))
2283         (:output (values nil   t sb!unix:o_wronly))
2284         (:io     (values   t   t sb!unix:o_rdwr))
2285         (:probe  (values   t nil sb!unix:o_rdonly)))
2286     (declare (type index mask))
2287     (let* (;; PATHNAME is the pathname we associate with the stream.
2288            (pathname (merge-pathnames filename))
2289            (physical (physicalize-pathname pathname))
2290            (truename (probe-file physical))
2291            ;; NAMESTRING is the native namestring we open the file with.
2292            (namestring (cond (truename
2293                               (native-namestring truename :as-file t))
2294                              ((or (not input)
2295                                   (and input (eq if-does-not-exist :create))
2296                                   (and (eq direction :io) (not if-does-not-exist-given)))
2297                               (native-namestring physical :as-file t)))))
2298       ;; Process if-exists argument if we are doing any output.
2299       (cond (output
2300              (unless if-exists-given
2301                (setf if-exists
2302                      (if (eq (pathname-version pathname) :newest)
2303                          :new-version
2304                          :error)))
2305              (ensure-one-of if-exists
2306                             '(:error :new-version :rename
2307                                      :rename-and-delete :overwrite
2308                                      :append :supersede nil)
2309                             :if-exists)
2310              (case if-exists
2311                ((:new-version :error nil)
2312                 (setf mask (logior mask sb!unix:o_excl)))
2313                ((:rename :rename-and-delete)
2314                 (setf mask (logior mask sb!unix:o_creat)))
2315                ((:supersede)
2316                 (setf mask (logior mask sb!unix:o_trunc)))
2317                (:append
2318                 (setf mask (logior mask sb!unix:o_append)))))
2319             (t
2320              (setf if-exists :ignore-this-arg)))
2321
2322       (unless if-does-not-exist-given
2323         (setf if-does-not-exist
2324               (cond ((eq direction :input) :error)
2325                     ((and output
2326                           (member if-exists '(:overwrite :append)))
2327                      :error)
2328                     ((eq direction :probe)
2329                      nil)
2330                     (t
2331                      :create))))
2332       (ensure-one-of if-does-not-exist
2333                      '(:error :create nil)
2334                      :if-does-not-exist)
2335       (if (eq if-does-not-exist :create)
2336         (setf mask (logior mask sb!unix:o_creat)))
2337
2338       (let ((original (case if-exists
2339                         ((:rename :rename-and-delete)
2340                          (pick-backup-name namestring))
2341                         ((:append :overwrite)
2342                          ;; KLUDGE: Provent CLOSE from deleting
2343                          ;; appending streams when called with :ABORT T
2344                          namestring)))
2345             (delete-original (eq if-exists :rename-and-delete))
2346             (mode #o666))
2347         (when (and original (not (eq original namestring)))
2348           ;; We are doing a :RENAME or :RENAME-AND-DELETE. Determine
2349           ;; whether the file already exists, make sure the original
2350           ;; file is not a directory, and keep the mode.
2351           (let ((exists
2352                  (and namestring
2353                       (multiple-value-bind (okay err/dev inode orig-mode)
2354                           (sb!unix:unix-stat namestring)
2355                         (declare (ignore inode)
2356                                  (type (or index null) orig-mode))
2357                         (cond
2358                          (okay
2359                           (when (and output (= (logand orig-mode #o170000)
2360                                                #o40000))
2361                             (error 'simple-file-error
2362                                    :pathname pathname
2363                                    :format-control
2364                                    "can't open ~S for output: is a directory"
2365                                    :format-arguments (list namestring)))
2366                           (setf mode (logand orig-mode #o777))
2367                           t)
2368                          ((eql err/dev sb!unix:enoent)
2369                           nil)
2370                          (t
2371                           (simple-file-perror "can't find ~S"
2372                                               namestring
2373                                               err/dev)))))))
2374             (unless (and exists
2375                          (rename-the-old-one namestring original))
2376               (setf original nil)
2377               (setf delete-original nil)
2378               ;; In order to use :SUPERSEDE instead, we have to make
2379               ;; sure SB!UNIX:O_CREAT corresponds to
2380               ;; IF-DOES-NOT-EXIST. SB!UNIX:O_CREAT was set before
2381               ;; because of IF-EXISTS being :RENAME.
2382               (unless (eq if-does-not-exist :create)
2383                 (setf mask
2384                       (logior (logandc2 mask sb!unix:o_creat)
2385                               sb!unix:o_trunc)))
2386               (setf if-exists :supersede))))
2387
2388         ;; Now we can try the actual Unix open(2).
2389         (multiple-value-bind (fd errno)
2390             (if namestring
2391                 (sb!unix:unix-open namestring mask mode)
2392                 (values nil sb!unix:enoent))
2393           (labels ((open-error (format-control &rest format-arguments)
2394                      (error 'simple-file-error
2395                             :pathname pathname
2396                             :format-control format-control
2397                             :format-arguments format-arguments))
2398                    (vanilla-open-error ()
2399                      (simple-file-perror "error opening ~S" pathname errno)))
2400             (cond ((numberp fd)
2401                    (case direction
2402                      ((:input :output :io)
2403                       (make-fd-stream fd
2404                                       :input input
2405                                       :output output
2406                                       :element-type element-type
2407                                       :external-format external-format
2408                                       :file namestring
2409                                       :original original
2410                                       :delete-original delete-original
2411                                       :pathname pathname
2412                                       :dual-channel-p nil
2413                                       :input-buffer-p t
2414                                       :auto-close t))
2415                      (:probe
2416                       (let ((stream
2417                              (%make-fd-stream :name namestring
2418                                               :fd fd
2419                                               :pathname pathname
2420                                               :element-type element-type)))
2421                         (close stream)
2422                         stream))))
2423                   ((eql errno sb!unix:enoent)
2424                    (case if-does-not-exist
2425                      (:error (vanilla-open-error))
2426                      (:create
2427                       (open-error "~@<The path ~2I~_~S ~I~_does not exist.~:>"
2428                                   pathname))
2429                      (t nil)))
2430                   ((and (eql errno sb!unix:eexist) (null if-exists))
2431                    nil)
2432                   (t
2433                    (vanilla-open-error)))))))))
2434 \f
2435 ;;;; initialization
2436
2437 ;;; the stream connected to the controlling terminal, or NIL if there is none
2438 (defvar *tty*)
2439
2440 ;;; the stream connected to the standard input (file descriptor 0)
2441 (defvar *stdin*)
2442
2443 ;;; the stream connected to the standard output (file descriptor 1)
2444 (defvar *stdout*)
2445
2446 ;;; the stream connected to the standard error output (file descriptor 2)
2447 (defvar *stderr*)
2448
2449 ;;; This is called when the cold load is first started up, and may also
2450 ;;; be called in an attempt to recover from nested errors.
2451 (defun stream-cold-init-or-reset ()
2452   (stream-reinit)
2453   (setf *terminal-io* (make-synonym-stream '*tty*))
2454   (setf *standard-output* (make-synonym-stream '*stdout*))
2455   (setf *standard-input* (make-synonym-stream '*stdin*))
2456   (setf *error-output* (make-synonym-stream '*stderr*))
2457   (setf *query-io* (make-synonym-stream '*terminal-io*))
2458   (setf *debug-io* *query-io*)
2459   (setf *trace-output* *standard-output*)
2460   (values))
2461
2462 (defun stream-deinit ()
2463   ;; Unbind to make sure we're not accidently dealing with it
2464   ;; before we're ready (or after we think it's been deinitialized).
2465   (with-available-buffers-lock ()
2466     (without-package-locks
2467         (makunbound '*available-buffers*))))
2468
2469 (defun stdstream-external-format (outputp)
2470   (declare (ignorable outputp))
2471   (let* ((keyword #!+win32 (if outputp (sb!win32::console-output-codepage) (sb!win32::console-input-codepage))
2472                   #!-win32 (default-external-format))
2473          (ef (get-external-format keyword))
2474          (replacement (ef-default-replacement-character ef)))
2475     `(,keyword :replacement ,replacement)))
2476
2477 ;;; This is called whenever a saved core is restarted.
2478 (defun stream-reinit (&optional init-buffers-p)
2479   (when init-buffers-p
2480     (with-available-buffers-lock ()
2481       (aver (not (boundp '*available-buffers*)))
2482       (setf *available-buffers* nil)))
2483   (with-output-to-string (*error-output*)
2484     (setf *stdin*
2485           (make-fd-stream 0 :name "standard input" :input t :buffering :line
2486                             :external-format (stdstream-external-format nil)))
2487     (setf *stdout*
2488           (make-fd-stream 1 :name "standard output" :output t :buffering :line
2489                             :external-format (stdstream-external-format t)))
2490     (setf *stderr*
2491           (make-fd-stream 2 :name "standard error" :output t :buffering :line
2492                             :external-format (stdstream-external-format t)))
2493     (let* ((ttyname #.(coerce "/dev/tty" 'simple-base-string))
2494            (tty (sb!unix:unix-open ttyname sb!unix:o_rdwr #o666)))
2495       (if tty
2496           (setf *tty*
2497                 (make-fd-stream tty :name "the terminal"
2498                                 :input t :output t :buffering :line
2499                                 :external-format (stdstream-external-format t)
2500                                 :auto-close t))
2501           (setf *tty* (make-two-way-stream *stdin* *stdout*))))
2502     (princ (get-output-stream-string *error-output*) *stderr*))
2503   (values))
2504 \f
2505 ;;;; miscellany
2506
2507 ;;; the Unix way to beep
2508 (defun beep (stream)
2509   (write-char (code-char bell-char-code) stream)
2510   (finish-output stream))
2511
2512 ;;; This is kind of like FILE-POSITION, but is an internal hack used
2513 ;;; by the filesys stuff to get and set the file name.
2514 ;;;
2515 ;;; FIXME: misleading name, screwy interface
2516 (defun file-name (stream &optional new-name)
2517   (when (typep stream 'fd-stream)
2518       (cond (new-name
2519              (setf (fd-stream-pathname stream) new-name)
2520              (setf (fd-stream-file stream)
2521                    (native-namestring (physicalize-pathname new-name)
2522                                       :as-file t))
2523              t)
2524             (t
2525              (fd-stream-pathname stream)))))