Extended Binary Coded Decimal Interchange Code
Der Extended Binary Coded Decimal Interchange Code (EBCDIC, sinngemäß „erweiterter Austauschcode für binär kodierte Dezimalziffern“) ist eine von IBM entwickelte 8-Bit-Zeichenkodierung, bei der jedoch nicht alle Codewörter verwendet werden. Der EBCDIC ist aus dem älteren Binary Coded Decimal Interchange Code (BCDIC) entstanden, der wiederum auf dem 4-Bit-Code BCD (Binary Coded Decimal) basiert.
EBCDIC wird fast ausschließlich auf Großrechnern verwendet. Trotz seines Alters wird die Kodierung auch noch in heutigen Systemen genutzt, beispielsweise im 2001 veröffentlichten z/OS[1].
Ähnlich wie das Unicode Transformation Format UTF-8 eine Kodierung von Unicode unter Beibehaltung der Kodierung des ASCII-Zeichensatzes darstellt, gibt es eine Unicode-Kodierung, die auf EBCDIC aufbaut. Dieses Format heißt UTF-EBCDIC.
Aufbau der Codepage
Die EBCDIC-Codepage besteht aus 8 Bits, also 28 = 256 möglichen Kombinationen. Diese Zahl reicht nicht aus, um für Sprachen mit lateinischem Alphabet die Sonderzeichen darzustellen, darum gibt es – ähnlich wie beim ASCII-Zeichensatz / ISO 8859 verschiedene Varianten.
Grundstruktur
Wie bei ISO 8859 gibt es ein Grundgerüst von Zeichen, die in allen Codepages gleich sind . Dies sind insbesondere die Buchstaben a–z und A–Z sowie die Ziffern. Hinzu kommen die ersten 64 Zeichen (00hex – 3Fhex), die Steuerzeichen sind.
Erkennbar ist der historische Zusammenhang mit der 80-Zeichen-Lochkartenkodierung von IBM, bei der die Buchstaben A–I, J–R und S–Z die Positionen 1 bis 9 bzw. 2 bis 9 in der numerischen Zone benutzen.
Aus dieser historisch gewachsenen Struktur ergeben sich einige Schwierigkeiten:
- Die Buchstaben A–Z und a–z folgen nicht lückenlos aufeinander. Dies erschwert in der Programmierung die Identifikation von Zeichen (um zu prüfen, ob ein Zeichen c ein Großbuchstabe ist, reicht nicht die Prüfung "A" ≤ c ≤ "Z") sowie deren Sortierung.
- Im Gegensatz zu ASCII stehen in EBCDIC die Kleinbuchstaben vor den Großbuchstaben.
- Wichtige Zeichen, die in modernen Programmiersprachen benötigt werden, fehlen. Zum Beispiel "{" und "}".
- Während in den ASCII-Codepages der Bereich der ersten 7 Bits (00hex – 7Fhex) und nur dieser für alle Varianten gleich ist, ist für EBCDIC der gemeinsame Bereich unregelmäßig über die 256 Zeichen verstreut.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | SP | . | < | ( | + | 4… (4hex = 0100bin) | |||||||||||
5… | & | * | ) | ; | 5… (5hex = 0101bin) | ||||||||||||
6… | - | / | , | % | _ | > | ? | 6… (6hex = 0110bin) | |||||||||
7… | : | ' | = | " | 7… (7hex = 0111bin) | ||||||||||||
8… | a | b | c | d | e | f | g | h | i | 8… (8hex = 1000bin) | |||||||
9… | j | k | l | m | n | o | p | q | r | 9… (9hex = 1001bin) | |||||||
A… | s | t | u | v | w | x | y | z | A… (Ahex = 1010bin) | ||||||||
B… | B… (Bhex = 1011bin) | ||||||||||||||||
C… | A | B | C | D | E | F | G | H | I | C… (Chex = 1100bin) | |||||||
D… | J | K | L | M | N | O | P | Q | R | D… (Dhex = 1101bin) | |||||||
E… | S | T | U | V | W | X | Y | Z | E… (Ehex = 1110bin) | ||||||||
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EO | F… (Fhex = 1111bin) | |||||
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- SP (40hex): Leerzeichen
- EO (FFhex): spezielles Steuerzeichen
Steuerzeichen
Die ersten 64 Zeichen von 00hex bis 3Fhex definieren Steuerzeichen und sind für alle EBCDIC-Codepages identisch.[2]
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | NUL | SOH | STX | ETX | SEL | HT | RNL | DEL | GE | SPS | RPT | VT | FF | CR | SO | SI | 0… (0hex = 00002) |
1… | DLE | DC1 | DC2 | DC3 | RES ENP | NL | BS | POC | CAN | EM | UBS | CU1 | IFS | IGS | IRS | IUS ITB | 1… (1hex = 00012) |
2… | DS | SOS | FS | WUS | BYP INP | LF | ETB | ESC | SA | SFE | SM SW | CSP | MFA | ENQ | ACK | BEL | 2… (2hex = 00102) |
3… | SYN | IR | PP | TRN | NBS | EOT | SBS | IT | RFF | CU3 | DC4 | NAK | SUB | 3… (3hex = 00112) | |||
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
Einige Steuerzeichen haben ihre Bedeutung seit den frühen Versionen von EBCDIC geändert.
- 04hex war in der ersten EBCDIC-Version von 1964 mit einem Zeichen namens
PF
(Punch Off, „Lochung aus“) belegt.,[3] später wurde darausST
(String Terminator, „Ende der Zeichenkette“)[3], und heute (2007) ist es mitSEL
(Select, „auswählen“) belegt[2], für das im ASCII-Code keine Entsprechung existiert. - 06hex ist heute (2007) mit
RNL
(Required New Line, „benötigt neue Zeile“) belegt. Ursprünglich war es mitLC
(Lower Case, „Kleinbuchstaben“) belegt und zwischenzeitlich auch mitSSA
(System Status Available, „Systemstatus verfügbar“). - 08hex ist heute mit
GE
(Graphic Escape, „Umschalten in den Grafikmodus“) belegt. Ursprünglich war es mitEPA
(End of Protected Area, „Ende des geschützten Bereichs“) belegt. - 09hex ist heute mit
SPS
(Superscript, „Hochstellung“) belegt. Ursprünglich war es mitRLF
(Reverse Line Feed, „umgekehrter Zeilenvorschub“) belegt. - 0Ahex ist heute mit
RPT
(Repeat, „Wiederholen“) belegt. Ursprünglich war es mitSMM
(Start of Manual Message, „Beginn einer händischen Mitteilung“) belegt. - 13hex ist heute mit
DC3
(Device Control 3, „Gerätekontrollkode 3“) belegt. Ursprünglich war es mitTM
(Top Margin, „oberer Rand“) belegt. - 14hex ist heute mit „RES/ENP“ (Restore/Enable Presentation, „Darstellung wiederherstellen/aktivieren“) belegt. Zwischenzeitlich war es auch
OSC
für Operating System Command („Betriebssystembefehl“) belegt. - 17hex ist heute mit
POC
(Program-Operator Communication, „Kommunikation mit Programmbediener“) belegt. Ursprünglich war esIL
(Idle, „Leerlauf“) und zwischenzeitlich auch mitESA
(End Selected Area, „Ende des ausgewählten Bereichs“) belegt. - 1Ahex ist heute mit
UBS
(Unit backspace, „eine Einheit zurück“) belegt. Ursprünglich war es mitCC
(Cursor Control, „Steuerung der Schreibmarke“) belegt.
Die Abkürzung CU1
steht für „Customer Use“, also ein frei nutzbares Steuerzeichen.
Die Steuerzeichen IFS
(Interchange File Separator), IGS
(Interchange Group Separator), IRS
(Interchange Record Separator) und IUS
(Interchange Unit Separator) sind Trennzeichen, die den ASCII-Steuerzeichen FS
, GS
, RS
und US
entsprechen. ITB
(Intermediate Transmission Block, „dazwischen liegender Sendeblock“) ist ein anderer Name für IUS.
Varianten
Übersicht der EBCDIC-Codepages mit Latin-1-Zeichensatz
Codepage | Codepage mit €-Zeichen | Länder |
---|---|---|
037 | 1140 | Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA |
273 | 1141 | Deutschland, Österreich |
277 | 1142 | Dänemark, Norwegen |
278 | 1143 | Finnland, Schweden |
280 | 1144 | Italien |
284 | 1145 | Lateinamerika, Spanien |
285 | 1146 | Großbritannien und Nordirland, Irland |
297 | 1147 | Frankreich |
500 | 1148 | Belgien, Kanada, Schweiz, International |
871 | 1149 | Island |
1047 | Offene Systeme (MVS C-Compiler) | |
EDF03DRV | Deutschland (BS2000/OSD) |
EBCDIC 037
EBCDIC 037 ist eine Variante des EBCDIC-Codes. Er wird (praktisch ausschließlich auf IBM-Großrechnern) zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | ä | à | á | ã | å | ç | ñ | ¢ | . | < | ( | + | | | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ß | ! | $ | * | ) | ; | ¬ | 5… (5hex = 0101bin) |
6… | - | / | Â | Ä | À | Á | Ã | Å | Ç | Ñ | ¦ | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | @ | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | ¤ | 9… (9hex = 1001bin) |
A… | µ | ~ | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ^ | £ | ¥ | · | © | § | ¶ | ¼ | ½ | ¾ | [ | ] | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | { | A | B | C | D | E | F | G | H | I | ô | ö | ò | ó | õ | C… (Chex = 1100bin) | |
D… | } | J | K | L | M | N | O | P | Q | R | ¹ | û | ü | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | \ | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | Ö | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | Ü | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC 273
EBCDIC 273 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet, praktisch ausschließlich auf IBM-Großrechnern.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | { | à | á | ã | å | ç | ñ | Ä | . | < | ( | + | ! | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ~ | Ü | $ | * | ) | ; | ^ | 5… (5hex = 0101bin) |
6… | - | / | Â | [ | À | Á | Ã | Å | Ç | Ñ | ö | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | § | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | ¤ | 9… (9hex = 1001bin) |
A… | µ | ß | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ¢ | £ | ¥ | · | © | @ | ¶ | ¼ | ½ | ¾ | ¬ | | | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | ä | A | B | C | D | E | F | G | H | I | ô | ¦ | ò | ó | õ | C… (Chex = 1100bin) | |
D… | ü | J | K | L | M | N | O | P | Q | R | ¹ | û | } | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | Ö | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | \ | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | ] | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC 500
EBCDIC 500 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des internationalen Zeichensatzes verwendet, praktisch ausschließlich auf IBM-Großrechnern.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | ä | à | á | ã | å | ç | ñ | [ | . | < | ( | + | ! | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ß | ] | $ | * | ) | ; | ^ | 5… (5hex = 0101bin) |
6… | - | / | Â | Ä | À | Á | Ã | Å | Ç | Ñ | ¦ | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | @ | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | ¤ | 9… (9hex = 1001bin) |
A… | µ | ~ | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ¢ | £ | ¥ | · | © | § | ¶ | ¼ | ½ | ¾ | ¬ | | | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | { | A | B | C | D | E | F | G | H | I | ô | ö | ò | ó | õ | C… (Chex = 1100bin) | |
D… | } | J | K | L | M | N | O | P | Q | R | ¹ | û | ü | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | \ | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | Ö | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | Ü | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC 1140
EBCDIC 1140 ist eine Variante des EBCDIC-Codes. Er wird (praktisch ausschließlich auf IBM-Großrechnern) zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet. Sie entspricht der Codepage 037 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | ä | à | á | ã | å | ç | ñ | ¢ | . | < | ( | + | | | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ß | ! | $ | * | ) | ; | ¬ | 5… (5hex = 0101bin) |
6… | - | / | Â | Ä | À | Á | Ã | Å | Ç | Ñ | ¦ | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | @ | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | € | 9… (9hex = 1001bin) |
A… | µ | ~ | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ^ | £ | ¥ | · | © | § | ¶ | ¼ | ½ | ¾ | [ | ] | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | { | A | B | C | D | E | F | G | H | I | ô | ö | ò | ó | õ | C… (Chex = 1100bin) | |
D… | } | J | K | L | M | N | O | P | Q | R | ¹ | û | ü | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | \ | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | Ö | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | Ü | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC 1141
EBCDIC 1141 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet, praktisch ausschließlich auf IBM-Großrechnern. Sie entspricht der Codepage 273 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | { | à | á | ã | å | ç | ñ | Ä | . | < | ( | + | ! | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ~ | Ü | $ | * | ) | ; | ^ | 5… (5hex = 0101bin) |
6… | - | / | Â | [ | À | Á | Ã | Å | Ç | Ñ | ö | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | § | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | € | 9… (9hex = 1001bin) |
A… | µ | ß | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ¢ | £ | ¥ | · | © | @ | ¶ | ¼ | ½ | ¾ | ¬ | | | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | ä | A | B | C | D | E | F | G | H | I | ô | ¦ | ò | ó | õ | C… (Chex = 1100bin) | |
D… | ü | J | K | L | M | N | O | P | Q | R | ¹ | û | } | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | Ö | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | \ | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | ] | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC 1148
EBCDIC 1148 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des internationalen Zeichensatzes verwendet, praktisch ausschließlich auf IBM-Großrechnern. Sie entspricht der Codepage 500 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | â | ä | à | á | ã | å | ç | ñ | [ | . | < | ( | + | ! | 4… (4hex = 0100bin) | ||
5… | & | é | ê | ë | è | í | î | ï | ì | ß | ] | $ | * | ) | ; | ^ | 5… (5hex = 0101bin) |
6… | - | / | Â | Ä | À | Á | Ã | Å | Ç | Ñ | ¦ | , | % | _ | > | ? | 6… (6hex = 0110bin) |
7… | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | @ | ' | = | " | 7… (7hex = 0111bin) |
8… | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | 8… (8hex = 1000bin) |
9… | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | € | 9… (9hex = 1001bin) |
A… | µ | ~ | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | A… (Ahex = 1010bin) |
B… | ¢ | £ | ¥ | · | © | § | ¶ | ¼ | ½ | ¾ | ¬ | | | ¯ | ¨ | ´ | × | B… (Bhex = 1011bin) |
C… | { | A | B | C | D | E | F | G | H | I | ô | ö | ò | ó | õ | C… (Chex = 1100bin) | |
D… | } | J | K | L | M | N | O | P | Q | R | ¹ | û | ü | ù | ú | ÿ | D… (Dhex = 1101bin) |
E… | \ | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | Ö | Ò | Ó | Õ | E… (Ehex = 1110bin) |
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | Ü | Ù | Ú | F… (Fhex = 1111bin) | |
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
- 41hex: geschütztes Leerzeichen
- CAhex: weicher/kurzer Trennstrich
- FFhex: Steuerzeichen (EBCDIC)
EBCDIC-Variante EBCDIC.DF.03-DRV (CCSN:EDF03DRV)
EBCDIC.DF.03-DRV oder CCSN:EDF03DRV ist eine Variante des EBCDIC-Codes, die auf Fujitsu-Großrechnern unter dem Betriebssystem BS2000/OSD zur Darstellung des deutschen Zeichensatzes verwendet wird. Diese Variante weicht speziell bei der Definition der deutschen Umlaute von anderen EBCDIC-Varianten ab.
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4… | ` | . | < | ( | + | |ö | 4… (4hex = 0100bin) | ||||||||||
5… | & | ! | $ | * | ) | ; | 5… (5hex = 0101bin) | ||||||||||
6… | - | / | ^ | , | % | _ | > | ? | 6… (6hex = 0110bin) | ||||||||
7… | : | # | @§ | ' | = | " | 7… (7hex = 0111bin) | ||||||||||
8… | a | b | c | d | e | f | g | h | i | 8… (8hex = 1000bin) | |||||||
9… | j | k | l | m | n | o | p | q | r | 9… (9hex = 1001bin) | |||||||
A… | s | t | u | v | w | x | y | z | A… (Ahex = 1010bin) | ||||||||
B… | [Ä | \Ö | ]Ü | B… (Bhex = 1011bin) | |||||||||||||
C… | A | B | C | D | E | F | G | H | I | C… (Chex = 1100bin) | |||||||
D… | J | K | L | M | N | O | P | Q | R | D… (Dhex = 1101bin) | |||||||
E… | S | T | U | V | W | X | Y | Z | E… (Ehex = 1110bin) | ||||||||
F… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | {ä | }ü | ~ß | F… (Fhex = 1111bin) | |||
…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
- 40hex: Leerzeichen
Eine weitere Besonderheit in diesem Zeichensatz ist die Doppelbelegung der Zeichen an den Positionen:
- 4Fhex:
|
oderö
- 7Chex:
@
oder§
- BBhex:
[
oderÄ
- BChex:
\
oderÖ
- BDhex:
]
oderÜ
- FBhex:
{
oderä
- FDhex:
}
oderü
- FFhex:
~
oderß
Die Darstellung wird am BS2000/OSD ausschließlich durch die verwendete Hardware bzw. durch die verwendeten Schriften unterschieden.
Anekdotisches
2021 bestand ein Bankkunde auf der korrekten Schreibweise seines Nachnamens inkl. Akutzeichen "é". Das Gericht gab der Klage statt, auf Basis der Europäischen Datenschutzgrundverordnung, Artikel 16 "Recht auf Berichtigung". Die belgische Bank argumentierte vergeblich, dass ihr 1995 eingeführtes System zur Verwaltung der Kundendaten die Zeichenkodierung EBCDIC verwende, die dieses Zeichen nicht unterstütze.[4]
Weblinks
- EBCDIC-Codepages mit Latin-1-Zeichensatz
- Code page identifiers (Ausführliche IBM-Übersicht der verschiedenen EBCDIC-codepages) (Memento vom 9. Mai 2018 im Internet Archive)
- Definition von UTF-EBCDIC
Einzelnachweise
- ↑ The EBCDIC character set. ibm.com, abgerufen am 26. Oktober 2021
- ↑ a b Appendix G: Control Character Mappings. In: Character Data Representation Architecture Reference. IBM (ibm.com PDF, S. 311).
- ↑ a b Dik T. Winter: Standards on Codes. Archiviert vom (nicht mehr online verfügbar) am 16. Juni 2007; abgerufen am 13. August 2007.
- ↑ https://www.gegevensbeschermingsautoriteit.be/publications/arrest-van-9-oktober-2019-van-het-marktenhof.pdf
Auf dieser Seite verwendete Medien
An IBM 5081-style punched card showing the encoding of the 1964 EBCDIC Latin character set, including numerals 0-9, upper-case letters A-Z, and special characters. The contrast of the human-readable strip at the top of the card has been artificially enhanced.