|
Eckarts Lehrstunde aus Funk 08/1998
Thema: Umlaute bei Datenübertragung
Häufig taucht bei Datenübertragung im Amateurfunk bei Packet Radio oder bei Pactor
ein Problem auf, dass die Umlaute (ÄÖÜäöü) und ß nicht richtig dargestellt werden,
wie dies im Bild 1 zum Beispiel bei einer Pactor-Übertragung der Fall war. Mit manchen
Stationen hat man keine Probleme, bei anderen sind die Umlaute falsch. Wechselt man das
Programm, kann es genau umgekehrt sein. Woran liegt das?
Bild 1: Falsche Umlautdarstellung bei
Datenübertragung
Bei Packet Radio wird der 7-Bit-ASCII-Code meistens verwendet. ASCII heißt "American
Standard Code for Information Interchange". Im Englischen
gibt es aber keine Umlaute. Als man den Code festgelegt hatte, hatte man an
internationalen Datenaustausch noch nicht gedacht. Man hat 128 verschieden Zeichen
festgelegt, wie sie im oberen Teil der Tabelle 1 zu sehen sind. Die oberen zwei Zeilen
enthalten Steuerzeichen, die hier nicht wiedergegeben sind.
Mit diesen 128 Möglichkeiten kann man alle Buchstaben in Groß- und Kleinschrift sowie
alle Ziffern und Satzzeichen sowie ein paar Sonderzeichen (runde, eckige, geschweifte
Klammern usw.) darstellen. In Deutschland wollte man mit diesem 7-Bit-Code ebenfalls
auskommen und hat sich überlegt, die eckigen und geschweiften Klammern, den abfallenden
Schrägstrich (Backslash), den senkrechten Strich sowie das Zeichen ^ wegzulassen und dafür die Umlaute
und das ß einzusetzen. Dies wurde dann "Deutscher IBM-Zeichensatz" genannt. Die
Änderungen sind in den unteren drei Zeilen in der Tabelle 1 zu sehen. Vergleichen Sie
einmal die Felder 5B, 5C, 5D, 5E, 7B, 7C, 7D in den entsprechenden Zeilen!
ASCII |
0
0000 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
A |
B |
C |
D |
E |
F
1111 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
SPC |
! |
" |
# |
$ |
% |
& |
´ |
( |
) |
* |
+ |
, |
- |
. |
/ |
3 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
: |
; |
< |
= |
> |
? |
4 |
@ |
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O |
5 |
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
[ |
\ |
] |
^ |
_ |
6 |
` |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o |
7 |
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
{ |
| |
} |
~ |
DEL |
IMB deutsch:
5 |
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
Ä |
Ö |
Ü |
ß |
_ |
6 |
` |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o |
7 |
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
ä |
ö |
ü |
~ |
DEL |
Tabelle: ASCII-Code (oben) und IBM-Zeichensatz
deutsch (unten)
Viele von Ihnen werden diese Probleme noch kennen, als die Drucker von den
DOS-Programmen gesteuert wurden und manchmal den deutschen Zeichensatz nicht kannten.
Unter Windows hat man die Druckeransteuerung für alle Programme vereinheitlicht, indem
die Programme keinen Druckertreiber mehr haben, sondern die Ausgabe auf den Drucker
Windows überlassen. Dann braucht man nur einmal bei der Installation von Windows die
deutsche Sprache anzumelden.
Nun zurück zur Datenübertragung. Bei Packet verwendet man diesen 7-Bit-Code für die
normale Textübertragung. Stellt man das Programm auf deutschen Zeichensatz ein, fehlen
die Klammern und der Backslash, was manchmal sehr lästig ist. Manche OMs bleiben deshalb
beim amerikanischen Zeichensatz (ASCII) und schreiben keine Umlaute sondern nur AE, OE und
so weiter.
Wenn diese OMs aber Texte von Stationen bekommen, die den deutschen IBM-Zeichensatz
eingestellt haben, werden die Umlaute als Klammern dargestellt oder sehen bei Pactor ganz
seltsam aus, wie dies in Bild 1 zu sehen ist.
Bild 2: ANSI-Zeichensatz
Inzwischen hat man dieses Problem natürlich erkannt und in den USA den Zeichensatz auf
256 Zeichen (8 Bit) erweitert und erhält den ANSI-Zeichensatz (American National
Standard Institute). Man kann nun in den Feldern 128 bis 255 die anderen
internationalen Zeichen der einzelnen Länder unterbringen. Im Bild 2 ist der
ANSI-Zeichensatz dargestellt, wie man ihn bei Windows zu sehen bekommt, wenn man
Sonderzeichen einfügen möchte.
Bei Pactor gibt es nun ein neues Problem in diesem Zusammenhang. Pactor arbeitet
grundsätzlich mit 8 Bit. Also kann man hier den ANSI-Zeichensatz verwenden. Bei DOS wird
jedoch bei Texten das ASCII-Format verwendet, bei Windows normalerweise ANSI. Nun
verwenden manche Funkamateure das amerikanische ASCII-Format, manche den deutschen
IBM-Zeichensatz (ASCII deutsch) und manche ANSI. In den Pactorprogrammen lassen sich
diese Zeichensätze entsprechend einstellen.
Man kann dieses Format nun nicht vereinheitlichen, weil manche eben ASCII unter DOS
für die weitere Textverarbeitung benötigen und andere unter Windows 95 im ANSI-Format
arbeiten möchten. Es bleibt dann dem geplagten Funkamateur nichts anderes übrig, als die
Dateien, die weiter verarbeitet werden sollen, in das entsprechende Format zu
konvertieren. Jedes bessere Textverarbeitungsprogramm kann entsprechende Konvertierungen
durchführen. Man muss nur etwas probieren, bis man das richtige Format gefunden hat. So
habe ich beispielsweise den oberen Text von Bild 1 unter Word im MS-DOS-Format umwandeln
lassen und nun sind alle Umlaute und das ß richtig dargestellt, wie man im Bild 3 sieht.
Mit dem Ausdrucken unter Windows hat man dann keine Schwierigkeiten mehr.
Bild 3: Nach der Konvertierung sind die Umlaute
wieder in Ordnung
Die häufig falsche Darstellung der Zeichen liegt also
nicht an den Programmen, sondern an der jeweiligen Einstellung des gewählten Text-Codes.
Da die Funkamateure aber verschiedene Einstellungen verwenden, muss man bei Empfang auf
den gleichen Code umstellen können. Manche Programme können dies per
"Knopfdruck" nachträglich machen, wie beispielsweise Graphic Packet. Bei
anderen Programmen muss man nachträglich umständlich konvertieren.
© 1999 Eckart K. W. Moltrecht, DJ4UF

weitersagen:
www.amateurfunklehrgang.de
|