1.0.30.41: Octets support for ebcdic-us
authorChristophe Rhodes <csr21@cantab.net>
Fri, 7 Aug 2009 11:21:21 +0000 (11:21 +0000)
committerChristophe Rhodes <csr21@cantab.net>
Fri, 7 Aug 2009 11:21:21 +0000 (11:21 +0000)
Continuing the theme of extensions no-one has ever asked for.

(There's a lot of duplicated code everywhere in
src/code/external-formats that could be replaced with a
sufficiently complicated macro-defining-macro...)

NEWS
build-order.lisp-expr
src/code/external-formats/enc-ebcdic.lisp [new file with mode: 0644]
src/code/fd-stream.lisp
version.lisp-expr

diff --git a/NEWS b/NEWS
index 5eff26d..f368e7e 100644 (file)
--- a/NEWS
+++ b/NEWS
@@ -3,12 +3,15 @@ changes relative to sbcl-1.0.30:
   * improvement: stack allocation is should now be possible in all nested
     inlining cases: failure to stack allocate when equivalent code is manually
     open coded is now considered a bug.
-  * improvement: the Unicode character database has been upgraded to the
-    Unicode 5.1 standard, giving names and properties to a number of new
-    characters, and providing a few extra characters with case
-    transformations.
-  * improvement: the system now recognizes and produces names for Unicode
-    Hangul syllable characters.
+  * improvements related to Unicode: 
+    ** the Unicode character database has been upgraded to the
+       Unicode 5.1 standard, giving names and properties to a number of new
+       characters, and providing a few extra characters with case
+       transformations.
+    ** the system now recognizes and produces names for Unicode Hangul 
+       syllable characters.
+    ** the EBCDIC-US external-format is now supported for octet operations
+       (as well as for stream operations).
   * new feature: experimental :EMIT-CFASL parameter to COMPILE-FILE can
     be used to output toplevel compile-time effects into a separate .CFASL
     file.
index 55fa294..cf68857 100644 (file)
  ("src/code/debug" :not-host)
 
  ("src/code/octets" :not-host)
+ ("src/code/external-formats/enc-ebcdic" :not-host)
  #!+sb-unicode
  ("src/code/external-formats/enc-cyr" :not-host)
  #!+sb-unicode
diff --git a/src/code/external-formats/enc-ebcdic.lisp b/src/code/external-formats/enc-ebcdic.lisp
new file mode 100644 (file)
index 0000000..f3d1144
--- /dev/null
@@ -0,0 +1,73 @@
+(in-package "SB!IMPL")
+
+(defmacro define-unibyte-permutation-mapper (byte-code-name code-byte-name table)
+  `(let ((byte-to-code-table ',(coerce table '(simple-array (unsigned-byte 8) (256))))
+         (code-to-byte-table (make-array 256 :element-type '(unsigned-byte 8))))
+     (dotimes (i 256)
+       (setf (aref code-to-byte-table (aref byte-to-code-table i)) i))
+     (defun ,byte-code-name (byte)
+       (declare (optimize speed (safety 0))
+                (type (unsigned-byte 8) byte))
+       (aref byte-to-code-table byte))
+     (defun ,code-byte-name (code)
+       (declare (optimize speed (safety 0))
+                (type char-code code))
+       (if (> code 255)
+           nil
+           (aref code-to-byte-table code)))))
+
+(define-unibyte-permutation-mapper ebcdic-us->code-mapper code->ebcdic-us-mapper
+  (#x00 #x01 #x02 #x03 #x9c #x09 #x86 #x7f #x97 #x8d #x8e #x0b #x0c #x0d #x0e #x0f
+   #x10 #x11 #x12 #x13 #x9d #x85 #x08 #x87 #x18 #x19 #x92 #x8f #x1c #x1d #x1e #x1f
+   #x80 #x81 #x82 #x83 #x84 #x0a #x17 #x1b #x88 #x89 #x8a #x8b #x8c #x05 #x06 #x07
+   #x90 #x91 #x16 #x93 #x94 #x95 #x96 #x04 #x98 #x99 #x9a #x9b #x14 #x15 #x9e #x1a
+   #x20 #xa0 #xe2 #xe4 #xe0 #xe1 #xe3 #xe5 #xe7 #xf1 #xa2 #x2e #x3c #x28 #x2b #x7c
+   #x26 #xe9 #xea #xeb #xe8 #xed #xee #xef #xec #xdf #x21 #x24 #x2a #x29 #x3b #xac
+   #x2d #x2f #xc2 #xc4 #xc0 #xc1 #xc3 #xc5 #xc7 #xd1 #xa6 #x2c #x25 #x5f #x3e #x3f
+   #xf8 #xc9 #xca #xcb #xc8 #xcd #xce #xcf #xcc #x60 #x3a #x23 #x40 #x27 #x3d #x22
+   #xd8 #x61 #x62 #x63 #x64 #x65 #x66 #x67 #x68 #x69 #xab #xbb #xf0 #xfd #xfe #xb1
+   #xb0 #x6a #x6b #x6c #x6d #x6e #x6f #x70 #x71 #x72 #xaa #xba #xe6 #xb8 #xc6 #xa4
+   #xb5 #x7e #x73 #x74 #x75 #x76 #x77 #x78 #x79 #x7a #xa1 #xbf #xd0 #xdd #xde #xae
+   #x5e #xa3 #xa5 #xb7 #xa9 #xa7 #xb6 #xbc #xbd #xbe #x5b #x5d #xaf #xa8 #xb4 #xd7
+   #x7b #x41 #x42 #x43 #x44 #x45 #x46 #x47 #x48 #x49 #xad #xf4 #xf6 #xf2 #xf3 #xf5
+   #x7d #x4a #x4b #x4c #x4d #x4e #x4f #x50 #x51 #x52 #xb9 #xfb #xfc #xf9 #xfa #xff
+   #x5c #xf7 #x53 #x54 #x55 #x56 #x57 #x58 #x59 #x5a #xb2 #xd4 #xd6 #xd2 #xd3 #xd5
+   #x30 #x31 #x32 #x33 #x34 #x35 #x36 #x37 #x38 #x39 #xb3 #xdb #xdc #xd9 #xda #x9f))
+
+(declaim (inline get-ebcdic-us-bytes))
+(defun get-ebcdic-us-bytes (string pos)
+  (declare (optimize speed (safety 0))
+           (type simple-string string)
+           (type array-range pos))
+  (get-latin-bytes #'code->ebcdic-us-mapper :ebcdic-us string pos))
+
+(defun string->ebcdic-us (string sstart send null-padding)
+    (declare (optimize speed (safety 0))
+             (type simple-string string)
+             (type array-range sstart send))
+  (values (string->latin% string sstart send #'get-ebcdic-us-bytes null-padding)))
+
+(defmacro define-ebcdic-us->string* (accessor type)
+  (declare (ignore type))
+  (let ((name (make-od-name 'ebcdic-us->string* accessor)))
+    `(progn
+       (defun ,name (string sstart send array astart aend)
+         (,(make-od-name 'latin->string* accessor) string sstart send array astart aend #'ebcdic-us->code-mapper)))))
+(instantiate-octets-definition define-ebcdic-us->string*)
+
+(defmacro define-ebcdic-us->string (accessor type)
+  (declare (ignore type))
+  `(defun ,(make-od-name 'ebcdic-us->string accessor) (array astart aend)
+     (,(make-od-name 'latin->string accessor) array astart aend #'ebcdic-us->code-mapper)))
+(instantiate-octets-definition define-ebcdic-us->string)
+
+(add-external-format-funs '(:ebcdic-us :cp037 :|cp037| :ibm-037 :ibm037)
+                          '(ebcdic-us->string-aref string->ebcdic-us))
+
+(define-external-format (:ebcdic-us :cp037 :|cp037| :ibm-037 :ibm037)
+    1 t
+    (let ((ebcdic-us-byte (code->ebcdic-us-mapper bits)))
+      (if ebcdic-us-byte
+          (setf (sap-ref-8 sap tail) ebcdic-us-byte)
+          (external-format-encoding-error stream bits)))
+    (code-char (ebcdic-us->code-mapper byte)))
index 9c8ac6b..4c978bc 100644 (file)
       (setf (sap-ref-8 sap tail) bits))
   (code-char byte))
 
-(let* ((table (let ((s (make-string 256)))
-                (map-into s #'code-char
-                          '(#x00 #x01 #x02 #x03 #x9c #x09 #x86 #x7f #x97 #x8d #x8e #x0b #x0c #x0d #x0e #x0f
-                            #x10 #x11 #x12 #x13 #x9d #x85 #x08 #x87 #x18 #x19 #x92 #x8f #x1c #x1d #x1e #x1f
-                            #x80 #x81 #x82 #x83 #x84 #x0a #x17 #x1b #x88 #x89 #x8a #x8b #x8c #x05 #x06 #x07
-                            #x90 #x91 #x16 #x93 #x94 #x95 #x96 #x04 #x98 #x99 #x9a #x9b #x14 #x15 #x9e #x1a
-                            #x20 #xa0 #xe2 #xe4 #xe0 #xe1 #xe3 #xe5 #xe7 #xf1 #xa2 #x2e #x3c #x28 #x2b #x7c
-                            #x26 #xe9 #xea #xeb #xe8 #xed #xee #xef #xec #xdf #x21 #x24 #x2a #x29 #x3b #xac
-                            #x2d #x2f #xc2 #xc4 #xc0 #xc1 #xc3 #xc5 #xc7 #xd1 #xa6 #x2c #x25 #x5f #x3e #x3f
-                            #xf8 #xc9 #xca #xcb #xc8 #xcd #xce #xcf #xcc #x60 #x3a #x23 #x40 #x27 #x3d #x22
-                            #xd8 #x61 #x62 #x63 #x64 #x65 #x66 #x67 #x68 #x69 #xab #xbb #xf0 #xfd #xfe #xb1
-                            #xb0 #x6a #x6b #x6c #x6d #x6e #x6f #x70 #x71 #x72 #xaa #xba #xe6 #xb8 #xc6 #xa4
-                            #xb5 #x7e #x73 #x74 #x75 #x76 #x77 #x78 #x79 #x7a #xa1 #xbf #xd0 #xdd #xde #xae
-                            #x5e #xa3 #xa5 #xb7 #xa9 #xa7 #xb6 #xbc #xbd #xbe #x5b #x5d #xaf #xa8 #xb4 #xd7
-                            #x7b #x41 #x42 #x43 #x44 #x45 #x46 #x47 #x48 #x49 #xad #xf4 #xf6 #xf2 #xf3 #xf5
-                            #x7d #x4a #x4b #x4c #x4d #x4e #x4f #x50 #x51 #x52 #xb9 #xfb #xfc #xf9 #xfa #xff
-                            #x5c #xf7 #x53 #x54 #x55 #x56 #x57 #x58 #x59 #x5a #xb2 #xd4 #xd6 #xd2 #xd3 #xd5
-                            #x30 #x31 #x32 #x33 #x34 #x35 #x36 #x37 #x38 #x39 #xb3 #xdb #xdc #xd9 #xda #x9f))
-                s))
-       (reverse-table (let ((rt (make-array 256 :element-type '(unsigned-byte 8) :initial-element 0)))
-                          (loop for char across table for i from 0
-                               do (aver (= 0 (aref rt (char-code char))))
-                               do (setf (aref rt (char-code char)) i))
-                          rt)))
-  (define-external-format (:ebcdic-us :ibm-037 :ibm037)
-      1 t
-    (if (>= bits 256)
-        (external-format-encoding-error stream bits)
-        (setf (sap-ref-8 sap tail) (aref reverse-table bits)))
-    (aref table byte)))
-
-
 #!+sb-unicode
 (let ((latin-9-table (let ((table (make-string 256)))
                        (do ((i 0 (1+ i)))
index ada1c4c..edf1472 100644 (file)
@@ -17,4 +17,4 @@
 ;;; checkins which aren't released. (And occasionally for internal
 ;;; versions, especially for internal versions off the main CVS
 ;;; branch, it gets hairier, e.g. "0.pre7.14.flaky4.13".)
-"1.0.30.40"
+"1.0.30.41"