HOWTO zu den Boolschen Wahrheitswerten in Perl

(C) 2006-2013 T.Birnthaler/H.Gottschalk <howtos(at)ostc.de>
              OSTC Open Source Training and Consulting GmbH
              www.ostc.de

$Id: perl-true-false-HOWTO.txt,v 1.11 2013/11/14 14:45:25 tsbirn Exp $

Dieses Dokument beschreibt die Logik der Booleschen Werte TRUE/FALSE in Perl.

Inhaltsverzeichnis

1) Boolsche Werte
2) Logische Operatoren
3) Short cut/circuit evaluation
4) "undef" versus definierte Werte
5) Spezielle Operatoren

1) Boolsche Werte   (Toc)

Perl kennt keinen Boolschen Datentyp mit den Werten "TRUE" und "FALSE", sondern
interpretiert JEDEN Wert (undef, Skalar, Array, Hash, Referenz) als logischen
Wert. Dabei ist exakt definiert, welche Werte als logisch FALSE und welche als
logisch TRUE interpretiert werden. Logisch FALSE sind GENAU die folgenden 5
Werte:

  +-------+-----------------------------------------------------------------+
  | Wert  | Beschreibung                                                    |
  +-------+-----------------------------------------------------------------+
  | undef | Undefinierter Wert                                              |
  | ""    | Leere Zeichenkette (natürlich auch '', q//, qq//)               |
  | 0     | Zahl Null (auch -0 und 0.0)                                     |
  | "0"   | Zeichenkette bestehend aus Zeichen Null (auch '0', Sonderfall!) |
  | ()    | Leere Liste (natürlich auch qw//)                               |
  +-------+-----------------------------------------------------------------+

Sonderfall: Die Zeichenkette "0" wird auch als logisch FALSE interpretiert,
weil sie nicht von der Zahl 0 unterscheidbar ist, wenn Perl automatisch
zwischen Strings und Zahlen hin- und herkonvertiert.

ALLE ANDEREN Werte werden als logisch TRUE interpretiert, insbesondere die
folgenden:

  +-------+--------------------------------------------------+
  | Wert  | Bedeutung                                        |
  +-------+--------------------------------------------------+
  |  " "  | Zeichenkette bestehend aus einem Leerzeichen     |
  | "\n"  | Zeichenkette bestehend aus einem Newline         |
  | "\r"  | Zeichenkette bestehend aus einem Carriage Return |
  | "+0"  | Zeichenkette bestehend aus zwei Zeichen          |
  | "-0"  | Zeichenkette bestehend aus zwei Zeichen          |
  | "00"  | Zeichenkette bestehend aus zwei Null-Zeichen     |
  | "0.0" | Zeichenkette bestehend aus drei Zeichen          |
  |  -1   | Negative Zahl                                    |
  |  {}   | Referenz auf leeren Hash                         |
  |  []   | Referenz auf leeres Array                        |
  +-------+--------------------------------------------------+

2) Logische Operatoren   (Toc)

Die logischen Operatoren &&, and, ||, or, !, not und xor liefern angewendet auf
Wahrheitswerte (oder andere Werte, die dann als Wahrheitswerte interpretiert
werden) folgende Resultate:

  +--------+------------+------------------------------------------------------+
  |Operator| Alternativ | Bedeutung                                            |
  +--------+------------+------------------------------------------------------+
  | A && B | A and B    | Resultat TRUE wenn beide Operanden TRUE              |
  | A || B | A or B     | Resultat TRUE wenn einer der beiden Operanden TRUE   |
  | ! A    | not A      | Resultat TRUE wenn Operand FALSE (negieren)         |
  |        | A xor B    | Resultat TRUE wenn ein Operand TRUE und einer FALSE |
  +--------+------------+------------------------------------------------------+

TRUE wird meist als "1" und FALSE wird meist als "" (leere Zeichenkette)
dargestellt. Letztlich liefern die logischen Operatoren aber immer den LETZTEN
ausgewerteten Wert als Ergebnis zurück:

  0 or "abc"                       # --> "abc" = TRUE
  1 and 234                        # --> 234   = TRUE
  9 and undef                      # --> undef = FALSE
  0 or ()                          # --> ()    = FALSE

Der Vorrang von && und || liegt nach den Zuweisungoperatoren (d.h. Klammern
sind notwendig, wenn das Ergebnis zugewiesen werden soll). Der Vorrang von
"and", "or", "not" und "xor" liegt NACH allen anderen Operatoren (auch nach
","), d.h. ist der geringst mögliche. Einfaches Austauschen von && und "and"
bzw. || und "or" bzw. ! und "not" führt daher oft zu einer falschen
Auswertungsreihenfolge!

3) Short cut/circuit evaluation   (Toc)

Logische Operatoren werden von links nach rechts ausgewertet (unter
Berücksichtigung des Vorrangs). Ergibt sich dabei ein Zwischenergebnis,
bei dem das Endergebnis des gesamten logischen Ausdrucks sofort feststeht,
wird die Auswertung an dieser Stelle abgebrochen und der Rest des logischen
Ausdrucks nicht mehr ausgewertet (sogenannte "Short cut evaluation",
"Short circuit evaluation", verkürzte Auswertung ). Dieses Verhalten ist
keine Perl-Besonderheit, sondern ist in vielen Programmiersprachen (z.B. C,
C++, Java, JavaScript, PHP, Python, Ruby, Awk) zu beobachten.

Insbesondere wird eine Folge von UND-Verknüpfungen ("and", "&&") mit dem
Gesamtergebnis FALSE abgebrochen, sobald 1x FALSE als Zwischenergebnis
vorkommt. Eine Folge von ODER-Verknüpfungen ("or", "||") wird mit dem
Gesamtergebnis TRUE abgebrochen, sobald 1x TRUE als Zwischenergebnis vorkommt.

Beispiel:

  0 and print "Nicht ausgegeben";         # --> 0 und nichts ausgegeben
  1 or  print "Auch nicht ausgegeben";    # --> 1 und nichts ausgegeben
  0 or "abc" or 3.14                      # --> "abc"
  1 and "" and 3.14                       # --> ""

4) "undef" versus definierte Werte   (Toc)

Nicht initialisierte Variablen haben in Perl den Wert "undef" und sind somit
UNDEFINIERT (analog SQL-Wert "NULL"). ALLE anderen Werte sind DEFINIERT, diese
können mit dem Operator "defined" vom Wert "undef" unterschieden werden.

  +-------+------+--------+---------+----------+
  | Wert  | TRUE | FALSE  | defined | !defined |
  +-------+------+--------+---------+----------+
  | undef | Nein |   Ja   |  Nein   |    Ja    |
  +-------+------+--------+---------+----------+
  | ""    | Nein |   Ja   |   Ja    |   Nein   |
  | 0     | Nein |   Ja   |   Ja    |   Nein   |
  | "0"   | Nein |   Ja   |   Ja    |   Nein   |
  | ()    | Nein |   Ja   |   Ja    |   Nein   |
  +-------+------+--------+---------+----------+
  | " "   |  Ja  |  Nein  |   Ja    |   Nein   |
  | "\n"  |  Ja  |  Nein  |   Ja    |   Nein   |
  | "\r"  |  Ja  |  Nein  |   Ja    |   Nein   |
  | "+0"  |  Ja  |  Nein  |   Ja    |   Nein   |
  | "-0"  |  Ja  |  Nein  |   Ja    |   Nein   |
  | "00"  |  Ja  |  Nein  |   Ja    |   Nein   |
  | "0.0" |  Ja  |  Nein  |   Ja    |   Nein   |
  | -1    |  Ja  |  Nein  |   Ja    |   Nein   |
  | {}    |  Ja  |  Nein  |   Ja    |   Nein   |
  | []    |  Ja  |  Nein  |   Ja    |   Nein   |
  +-------+------+--------+---------+----------+

Folgende Tests prüfen, ob der Wert einer Variablen $var DEFINIERT bzw.
UNDEFINIERT ist:

  if (defined $var)     { ... }       # $var DEFINIERT?
  if (not defined $var) { ... }       # $var UNDEFINIERT?
  if (! defined $var)   { ... }       # $var UNDEFINIERT?
  unless (defined $var)   { ... }     # $var UNDEFINIERT?

Folgende Tests prüfen, ob der Wert einer Variablen $var TRUE bzw. FALSE ist:

  if ($var)     { ... }      # $var TRUE?
  if (not $var) { ... }      # $var FALSE?
  if (! $var)   { ... }      # $var FALSE?
  unless ($var)   { ... }    # $var FALSE?

5) Spezielle Operatoren   (Toc)

Der Operator "//" (defined-or) prüft, ob der linke Wert definiert ist: Wenn ja,
gibt er ihn zurück, sonst wird der rechte Wert zurückgegeben:

  $var = $ARGV[0] // "";

Der Operator "||" (or) prüft, ob der linke Wert TRUE ist: Wenn ja, gibt er ihn
zurück, sonst wird der rechte Wert zurückgegeben:

  $var = $ARGV[0] || "1";