Heim

Perl

Dieser Artikel beschäftigt sich mit der Programmiersprache Perl; zu weiteren Bedeutungen siehe Perl (Begriffsklärung).
Perl
Erscheinungsjahr: 1987
Entwickler: Larry Wall, Perl Porter
Aktuelle Version: 5.10.0  (18. Dezember 2007)
Typisierung: schwach, dynamisch, implizit
Einflüsse: Awk, BASIC-PLUS, C, C++, LISP, Pascal, Python, Sed, Unix-Shell
Beeinflusste: PHP, Ruby, Python, JavaScript
Betriebssystem: plattformunabhängig
Lizenz: GPL und Artistic License
Website: www.perl.org

Perl [pɛɹl] ist eine freie, plattformunabhängige und interpretierte Programmiersprache (Skriptsprache), die mehrere Programmierparadigmen unterstützt.

Der Linguist Larry Wall entwarf sie 1987 als Synthese aus C, awk, den UNIX-Befehlen und anderen Einflüssen. Ursprünglich als Werkzeug zur Verarbeitung und Manipulation von Textdateien insbesondere bei System- und Netzwerkadministration vorgesehen (z. B. Auswertung von Logdateien), hat Perl auch bei der Entwicklung von Webanwendungen und in der Bioinformatik weite Verbreitung gefunden. Hauptziele sind eine schnelle Problemlösung und größtmögliche Freiheit für Programmierer. Die Bearbeitung von Texten mit Hilfe regulärer Ausdrücke sowie viele frei verfügbare Module, die an einem zentralen Ort (CPAN) gesammelt werden, sind Stärken der Sprache.

Inhaltsverzeichnis

Geschichte

Entstehung

Larry Wall war als Administrator und Programmierer bei dem Unternehmen Unisys angestellt, wo er seit März 1987 daran beteiligt war, unter dem Namen blacker ein sicheres Netzwerk für die NSA zu entwickeln. Er erhielt mehrere Aufträge, Werkzeuge zur Überwachung und Fernwartung der entstehenden Software zu schaffen. Eine Hauptaufgabe war dabei, übersichtliche Berichte aus verstreuten Logdateien zu erzeugen. Da ihm die vorhandenen Sprachen und Werkzeuge dafür zu umständlich erschienen, entwickelte er mit Hilfe seines damaligen Teamkollegen Daniel Faigin und seines Schwagers Mark Biggar schrittweise eine eigene Sprache, um seine Aufgaben zu lösen.

Dabei griff er auch auf sein Wissen und seine Erfahrung als Linguist zurück und entwarf Perl nahe an den menschlichen Sprachgewohnheiten. Dies drückt sich in minimalen Voraussetzungen für Einsteiger, einer starken Kombinierbarkeit der Sprachelemente und einem reichen Wortschatz aus, der auch Befehle zulässt, deren Bedeutungen sich überschneiden. Wall sieht darin die Bedürfnisse eines Praktikers nach Freiheit und intuitivem Ausdruck verwirklicht.

Gemäß diesem praktischen Ansatz borgte sich Perl seinen Wortschatz und seine logischen Strukturen von den in den 1980er Jahren unter Unix verbreiteten Sprachen und Werkzeugen, was das Erlernen vereinfachte, aber auch die Unix-Philosophie umkehrte.

Unix und seine Systembefehle waren kompiliert und meist in C geschrieben. Diese Befehle waren logische Einheiten und sollten genau eine Aufgabe beherrschen: „Do one thing and do it well“ („Mach eine Sache und mach sie gut“). Interpretierte Shell-Skripte kombinierten schnell und einfach die Befehle, die untereinander ihre Ergebnisse durch Pipes weiterreichen konnten. Perl verletzt diese Philosophie, indem es diese Befehle zum Bestandteil der Programmiersprache macht, also C und Shell vereint und die vorhandenen Befehle und Werkzeuge übergeht.

Dies wurde notwendig, weil Shell-Skripte für komplexe Aufgaben ungeeignet waren. Ihr Ablauf ist sehr einfach, sie können Daten nur eingeschränkt zwischenspeichern und die Pipes sind Nadelöhre für den Datenaustausch. Andererseits erlauben sie einen wesentlich kompakteren Programmierstil, da die Benutzung eines UNIX-Werkzeugs viele Zeilen C-Quelltext ersetzen kann.

Um die Vorteile beider Programmierarten nutzen zu können, schuf Wall eine Kombination aus C und Werkzeugen wie sed, awk, grep und sort. Er fügte Eigenschaften der Bourne Shell, in geringem Maße auch Elemente aus Pascal und BASIC, sowie eigene Ideen dazu[1]. Diese Fusion ermöglichte kurze, mächtige Programme, die man schnell schreiben und jederzeit auch testen konnte, ohne sie kompilieren zu müssen, was die Entwicklung ebenfalls beschleunigte. Später wurden weitere Fähigkeiten von Sprachen wie LISP, Smalltalk, Python oder Ruby „importiert“.

Name

Der Name Perl bezieht sich auf ein Zitat aus dem Matthäus-Evangelium (13,46) EU, in dem Jesus das Himmelreich mit dem Bild eines Händlers beschreibt, der seinen gesamten Besitz verkaufen will, um eine kostbare Perle zu erwerben. Noch vor der Veröffentlichung wurde der Name von „Pearl“ in „Perl“ geändert, da es bereits eine Programmiersprache namens PEARL gab. Allgemein verbreitet und von Larry Wall akzeptiert sind auch die Backronyme Practical Extraction and Report Language (zweckmäßige Extraktions- und Berichtssprache) und Pathologically Eclectic Rubbish Lister (krankhaft stilmischender Blödsinnsauflister). Die Schreibweise „Perl“ bezeichnet die Sprache, „perl“ dagegen das Programm, das diese Sprache interpretiert. Ferner legt die Perl-Gemeinde Wert darauf, dass nicht die Schreibweise „PERL“ verwendet wird.[2]

Perl 1 bis 4

Am 18. Dezember 1987 publizierte Larry Wall sein Programm im Usenet als Perl 1.0, das damals noch eine mächtigere Shell war, die gut mit Texten und Dateien umgehen, andere Programme steuern und gut lesbare Berichte ausgeben konnte. Bereits am 5. Juni im Jahr darauf erschien die Version 2.0 mit grunderneuerter und erweiterter Regex-Engine und einigen weiteren Verbesserungen. Am 18. Oktober 1989 folgte Perl 3, das mit binären Daten umgehen konnte und auch Netzwerkprogrammierung ermöglichte. Als neue Lizenz wurde die GPL gewählt.

Fast unverändert war es ab dem 21. März 1991 als Perl 4 erhältlich, jedoch nun wahlweise unter der GPL oder der von Larry Wall entwickelten Artistic License. Der eigentliche Grund für die neue Version war aber das gleichzeitig erschienene Kamelbuch, das als Referenz für den aktuellen, als Version 4 markierten Stand, veröffentlicht wurde. Bis dahin waren die seit Perl 1 verfügbaren UNIX-man-pages die einzige verfügbare Perl-Dokumentation. Diese bieten zu jedem Thema eine fundierte und umfangreiche Abhandlung, aber keinen einfachen Einstieg für Perl-Anfänger.

Diese Lücke sollte das von Randal L. Schwartz, Larry Wall und Tom Christiansen verfasste Buch schließen. Es erschien im O’Reilly Verlag, der mit diesem und weiteren Titeln als renommierter Fachverlag für Programmierer bekannt wurde. Perl-Bücher von O’Reilly wurden die maßgeblichen Perl-Publikationen, was sich erst im neuen Jahrtausend etwas relativierte. Der Verlag betreibt auch unter der Internetadresse perl.com das meistbesuchte Online-Magazin für Perl-Programmierung und veranstaltet mit der TPC (The Perl Conference – heute OSCON) die größte Perl-Konferenz. O’Reilly profitierte von Perls wachsender Popularität, und im Gegenzug bezahlte Tim O’Reilly seinem Freund Larry Wall in den folgenden Jahren ein festes Gehalt, der sich so, ohne weitere Pflichten oder Vorgaben, der Weiterentwicklung der Sprache widmen konnte.

1993, als Perl die Version 4.036 erreichte, brach Larry Wall die Weiterentwicklung ab, um mit Perl 5 eine vollständige Neuentwicklung zu beginnen.

Perl 5

Perl 5.0 wurde am 18. Oktober 1994 veröffentlicht und war der bisher größte Fortschritt für die Sprache. Mit Plain Old Documentation konnte man nun formatierte Dokumentation in den Quelltext einfügen. Auch ließ sich die Sprache ab jetzt durch separate Module erweitern, was im folgenden Jahr zur Entstehung des CPAN führte. Dieses große Archiv frei erhältlicher Module ist heute selbst ein wichtiger Grund, Perl einzusetzen. Eine weitere wichtige Neuerung war die Einführung von Referenzen, die erstmals eine einfache Erstellung zusammengesetzter Datenstrukturen erlaubte.

Mit Version 5 wurde es auch möglich, objektorientiert in Perl zu programmieren. Dabei wählte Larry Wall einen ungewöhnlichen Weg und leitete die dafür verwendete Syntax fast ausschließlich aus vorhandenen Sprachelementen ab (Packages, Package-Funktionen und Package-Variablen sowie den neuen Referenzen). Lediglich die Funktion bless() zum Anlegen eines Objektes und der Pfeil-Operator (->) zum Aufruf von Methoden kamen hinzu. Es entstand auch XS, eine Schnittstellenbeschreibungssprache, die es ermöglicht, Perl-Programme mit anderen Sprachen zu erweitern oder mit Perl-Programmen beliebige Software oder Hardware anzusprechen.

Seit der Veröffentlichung von Perl 5 beteiligte sich Larry Wall kaum noch an der Entwicklung der Sprache. Dies übernahmen freiwillig Perl-begeisterte Programmierer, die sogenannten Perl 5 Porter, die über die im Mai 1994 gegründete p5p-Mailingliste kommunizieren, aber auch zunehmend über einen eigenen Bug- und Request-Tracker (RT) über Fehlerbehebungen und neue Funktionen der Sprache entscheiden. Dabei übernimmt je Version ein sogenannter Pumpking die Leitung. Der Begriff Perl Porter entstammt der ursprünglichen Aufgabe der p5p-Liste, die Portierung von Perl auf andere Betriebssysteme zu koordinieren.

In den Jahren nach Version 5.0 wurde nicht nur Perl auf Macintosh und Windows portiert, sondern es verschob sich auch die Nummerierung der Versionen. Da sich an der Syntax nichts Wesentliches änderte, beließ man die 5 und erhöhte bei größeren Meilensteinen die erste Nachkommastelle, verwendete aber zusätzliche Nummern um die Zwischenschritte zu zählen. Da Perl erst ab 5.6 mit Versionsnummern, die mehrere Kommata enthalten, umgehen konnte, wurden sie bis dahin z.B. Perl 5.001 oder Perl 5.001012 geschrieben. Ab 5.6 wurde auch das Versionsschema von Linux übernommen, bei dem gerade Nummern auf Fehlerfreiheit gepflegte Benutzerversionen hindeuten und ungerade auf Entwicklerversionen, in die neue Funktionen einfließen. Serien von Benutzerversionen (z.B. 5.8.x) werden untereinander binär kompatibel gehalten, was bedeutet, dass ein für Perl 5.8.7 kompiliertes Binärmodul auch mit 5.8.8, nicht jedoch mit 5.10 oder 5.6.1 funktioniert.

Perl 5.6

Diese Version brachte einige neue experimentelle Fähigkeiten, die erst später ausreiften, wie Unicode und UTF-8, Threads und cloning. Auch 64-Bit-Prozessoren konnten nun genutzt werden. Sprachlich fügte diese von Gurusamy Sarathy geleitete Reihe vor allem lexikalisch globale Variablen (mit our) und eine Vektorschreibweise, die den Vergleich mehrstelliger Versionsnummern erlaubt, sowie die Spezialvariablen @- und @+, ein.

Perl 5.8

Mit der von Nicholas Clark betreuten Reihe 5.8.x wurden vor allem die Probleme mit Unicode und den Threads behoben, aber auch die Ein-/Ausgabe (IO), Signale und die numerische Genauigkeit wurden entscheidend verbessert.

Perl 5.10

Neben verringertem Speicherverbrauch und einer erneuerten und nun auch austauschbaren Regex-Maschine brachte diese Version unter der Führung von Rafaël Garcia-Suarez vor allem Neuerungen, die dem Entwurf von Perl 6 entstammen und deren Gebrauch entweder einzeln oder kollektiv mit use feature ':5.10'; angemeldet werden muss. Hierzu zählen say, given und when (switch), der smartmatch-Operator(~~), der defined or-Operator(//) und state-Variablen, welche die Erzeugung von Closures vereinfachen. Weitere nennenswerte Neuheiten umfassen den verlagerbaren Installationpfad, stapelbare Dateitestoperatoren, definierbare lexikalische Pragmas, optionale C3-Serialisierung der Objektvererbung und field hashes (für "inside out"-Objekte). Die Regex-Engine arbeitet nun iterativ statt rekursiv, was nun rekursive Ausdrücke ermöglicht. Komplexe Suchanfragen können nun auch verständlicher und weniger fehleranfällig durch named captures formuliert werden. Die Spezialvariablen $# und $* sowie die Interpreterschnittstellen perlcc und JPL wurden entfernt.

Aktuelle Versionen

Auch wenn die neueste Benutzerversion 5.10.0 lautet, werden derzeit die Versionsreihen 5.8.x und 5.6.x weiterhin gepflegt, da sie von den meisten Programmen und Webservern verwendet werden. Deswegen gelten sowohl 5.8.8 und geringer auch 5.6.2 als aktuelle Versionen. 5.005 und 5.004 sind veraltet, wichtige Module funktionieren mit ihnen aber weiterhin, wobei 5.005 noch minimal weitergepflegt wird. Die nächste Perlversion wird 5.12 und nicht Perl 6 sein, welches ein Langzeitprojekt ist, die Sprache, den Interpreter und die umgebende Infrastruktur vollständig zu neu zu gestalten.

Perl 6

Am 19. Juli 2000 auf der TPC 4 [3] wurde Perl 6 als die Version der Perl-Gemeinschaft angekündigt. Nachdem Larry Wall mehrere hundert Vorschläge auswertete und thematisch sortierte, schrieb er je Thema einen Überblick seiner Vorstellungen (Apocalypse genannt), der nach Diskussionen in den Mailinglisten von Damian Conway zu einer detaillierten Exegese formuliert wird. Dabei wird die Sprache entrümpelt und mit neuen Fähigkeiten ausgestattet[4]. Unter anderem wurde die Objektorientierung komplett neu gestaltet und funktionale Programmierelemente wie Hyperoperatoren und Junctions eingeführt. Makros werden Sourcefilter ablösen und die neu systematisierten und erweiterten regulären Ausdrücke werden nun rules genannt, da sie sich zu ableitbaren Grammatiken zusammenfassen lassen, was eine lex-ähnliche Programmierweise erlaubt. Sie werden mit dem smart match-Operator ~~ angewendet der je nach Kontext verschiedene Arten von Daten, Datenstrukturen und auch Inhalte von Symboltabellen vergleichen kann.

Diese Neugestaltung der Syntax ist in großen Teilen abgeschlossen, einzelne Bereiche wie z.B. Threads wurden aber noch gar nicht abgedeckt. Da im Gegensatz zu den ersten Jahren die Weiterentwicklung meist in den Mailinglisten und kleineren Kreisen geschieht, sind die Apocalypsen und Exegesen teilweise veraltet und wurden durch wesentlich knapper gehaltene Synopsen ersetzt.

Als Interpreter für Perl 6 ist eine neue registerbasierte Virtuelle Maschine namens Parrot in Entwicklung, die neben Perl 6 noch viele andere Sprachen kompilieren (in Bytecode übersetzen) und ausführen können soll. Sie wurde von Dan Sugalski und Chip Salzenberg entworfen und wird derzeit von Allison Randal und Patrick Michaud betreut, wobei letzterer für die Parrot Compiler Tools zuständig ist, einem Satz für Parrot geschriebener Werkzeuge, der die Erstellung von Parsern beschleunigt.

Audrey Tang leitet seit Anfang Februar 2005 die Entwicklung des alternativen Perl-6-Compilers namens Pugs in der Sprache Haskell. Die Entwicklung geht wesentlich schneller als beim Parrot-Projekt voran, und bereits seit Anfang 2006 können damit Programme ausgeführt werden, die sowohl große Teile der Perl-6-Syntax als auch Perl-5-Module benutzen können. Pugs erfüllt bereits wichtige Aufgaben bei der Erprobung der neuen Syntax, dem Schreiben der Spezifikationen, Dokumentation, Beispielen und Softwaretests für Perl 6. Es wurde bereits begonnen, Teile von Pugs nach Perl 6 zu übertragen, um eher den geplanten Perl-6-Parser für Parrot zu erhalten, der in Perl 6 geschrieben sein soll.

Merkmale

Prinzipien

Perl wurde für den praktischen Einsatz entwickelt und konzentriert sich daher auf schnelle und einfache Programmierbarkeit, Vollständigkeit und Anpassbarkeit. Diese Philosophie drückt sich in den folgenden Schlagworten oder Phrasen aus, die meist von Larry Wall stammen.

Mehrere Wege

Das bekannteste und grundlegendste Perl-Motto ist „There is more than one way to do it“, kurz TIMTOWTDI oder (mit englischer Kontraktion) gesprochen „Tim Toady“. Zu deutsch: „Es gibt mehr als einen Weg, etwas zu tun“. Perl macht im Gegensatz zu Sprachen wie Python weniger Vorgaben und bietet absichtlich für jedes Problem mehrere Formulierungs- und Lösungsmöglichkeiten (Syntaktischer Zucker). Zum Beispiel kann man logische Operatoren als || und && (wie in C) oder (mit Bedeutungsnuancen) als or und and (wie in Pascal) schreiben; aber auch zahlreiche Befehle mit einem sich überschneidenden Funktionsumfang wie map und for erlauben verschiedene Formulierungen für den gleichen Sachverhalt. Einige Befehle wie der Diamant-Operator (<>) bieten verkürzte Schreibweisen für bereits vorhandene Funktionalität. Diese Vielfalt wird auch im CPAN sichtbar, wo oft mehrere Module einen sehr ähnlichen Zweck erfüllen.

Ein weiteres Schlagwort, das man auch als Erweiterung von TIMTOWTDI sehen kann, bezeichnet Perl als die erste postmoderne Programmiersprache. Damit ist gemeint, dass Perl verschiedene Paradigmen vereint und es dem Benutzer frei steht, strukturierte, objektorientierte, funktionale und imperative Sprachmerkmale zu kombinieren.

Einfach und möglich

Der andere wichtige Merksatz ist Perl makes easy jobs easy and hard jobs possible, was zu deutsch bedeutet Perl hält die einfachen Aufgaben einfach und macht (die Lösung) schwierige(r) Aufgaben möglich. Dies beinhaltet zum ersten das Ziel, gängige Aufgaben möglichst mit kurzen „fertigen Lösungen“ zu vereinfachen. Zum Beispiel prüft -e dateiname die Existenz einer Datei. Einfache Aufgaben einfach zu belassen, bedeutet für Perl aber auch, möglichst keine vorbereitenden Programmieranweisungen zu verlangen, wie das Anmelden von Variablen oder das Schreiben einer Klasse. Zweitens versucht Perl vollständig zu sein und für jedes Problem mindestens die Grundlagen bereitzustellen, die eine Lösung möglich machen. Das dritte Ziel, die beiden ersten Ziele nicht kollidieren zu lassen, gewinnt mit dem wachsendem Sprachumfang von Perl 6 immer mehr an Bedeutung, wo in Anlehnung an den Huffman-Code die Schreibweisen der am häufigsten verwendeten Befehle möglichst kurz gehalten sind, ohne mit der Logik der Schreibweise ähnlicher Befehle zu brechen.

Kontextsensitiv

In Perl gibt es Befehle, die verschiedene Bedeutungen haben, je nachdem in welchem Zusammenhang sie benutzt werden. Derart kontextsensitiv sind Datenstrukturen wie das Array. Wird es einem anderen Array zugewiesen, wird dessen Inhalt übergeben; ist der Empfänger ein einzelner Wert (Skalar), erhält dieser die Länge des Arrays.

Technische Merkmale

Der Perl-Interpreter selbst ist ein in C geschriebenes Programm, das auf annähernd jedem Betriebssystem kompilierbar ist. Vorkompilierte Versionen auf selten verwendeten Systemen wie zum Beispiel BeOS oder OS/2 sind jedoch nicht immer auf dem neuesten Stand. Der Quellcode umfasst circa 50 MB und enthält auch Perl-Skripte, die die Funktion von Makefiles, und der Test-Suite übernehmen. Aktuell ist das kompilierte Programm circa 850 KB groß, was aber je nach Betriebssystem, verwendetem Compiler und Bibliotheken variieren kann.

Perl-Skripte werden in Textdateien mit beliebigem Zeilentrennzeichen gespeichert. Beim Start eines Skripts wird es vom Perl-Interpreter eingelesen, in einen Parse Tree umgewandelt, dieser zu Bytecode, welcher dann ausgeführt wird. Der im Interpreter integrierte Parser ist eine angepasste Version von GNU Bison.

Strenggenommen ist Perl daher keine interpretierte Sprache, da ein Perl-Programm vor jeder Ausführung kompiliert wird. Das bedeutet etwa, dass anders als bei rein interpretierten Sprachen ein Programm mit Syntaxfehlern nicht startet.

Verbreitung

Zu Beginn war Perl ein UNIX-Werkzeug, das besonders auf die Verarbeitung von Textdateien, Steuerung anderer Programme sowie zur Ausgabe von Berichten ausgelegt war. Dafür wird es bis heute, nicht nur von Systemadministratoren, auf allen verbreiteten Betriebssystemen eingesetzt. Dabei bekam Perl auch den Ruf einer glue language ("Klebstoff-Sprache"), weil mit Hilfe von relativ schnell geschriebenen Perl-Skripten inkompatible Software verbunden werden kann.

Mit der Verbreitung des World Wide Web wurde Perl zunehmend benutzt, um Webserver, Datenbanken und weitere Programme und Daten zu verbinden und die Ergebnisse in Form von HTML-Seiten auszugeben. Der Perl-Interpreter wird dabei über CGI oder FastCGI vom Webserver angesprochen oder ist direkt im Server eingebettet. (mod_perl im Apache, ActiveState PerlEx im MS IIS). Auch wenn für diese serverseitige Skript-Programmierung PHP mittlerweile populärer wurde, wird Perl weiterhin von vielen großen und kleinen Seiten und Internetdiensten wie Amazon.com, IMDB.com, slashdot.org, MovableType und LiveJournal verwendet. Da Perl-Skripte oft kaum erkennbar an vielen wichtigen Stellen arbeiten, wurde Perl auch scherzhaft als das Klebeband bezeichnet, welches das Internet zusammenhält. In Perl entstanden auch Frameworks wie Mason, Embperl, Maypole, Catalyst und Jifty die eine sehr schnelle Entwicklung komplexer und leicht veränderbarer Internetseiten erlauben. Auch Wiki-Software ist häufig in Perl geschrieben wie z.B. Socialtext das auf Mason basiert, Kwiki, TWiki, ProWiki oder UseMod. Wichtige Perl-Programme im E-Mail-Bereich sind SpamAssassin (Spam-Filter), PopFile und open webmail. Auch verbreitete Ticket-Systeme mit Webschnittstelle wie Bugzilla oder RT sind in Perl geschrieben.

Weitere Hauptanwendungsfelder sind das Data-Munging und die Bioinformatik, wo Perl seit etwa 1995 die am häufigsten verwendete Sprache war und immer noch bedeutend ist. Gründe hierfür sind wieder die Fähigkeit, Informationen in Textform zu verarbeiten, und die Flexibilität und Offenheit der Sprache, die es der internationalen Forschergemeinde erlauben, trotz unterschiedlicher Standards der Institute zusammenzuarbeiten. BioPerl ist hier die wichtigste Sammlung frei erhältlicher Werkzeuge, die sich vor allem auf das Gebiet der Genomsequenzenanalyse konzentriert. Beim Human Genome Project spielte Perl eine wichtige Rolle.

Auch Desktop-Anwendungen und Spiele wie Frozen Bubble können sinnvollerweise in Perl geschrieben werden, weil die Personal Computer mittlerweile schnell genug sind, solche Anwendungen auszuführen, und diese schneller zu entwickeln sind als mit Hilfe kompilierter Sprachen.

Bereiche, in denen Skriptsprachen wie Perl nicht sinnvoll eingesetzt werden können, sind zum einen Anwendungen mit hohen Anforderungen an Hardware-Nähe oder Geschwindigkeit wie zum Beispiel Treiber oder Codecs. Zum anderen sollten sie nicht in stark sicherheitskritischen Bereichen (z. B. Flugzeugsteuerung) Verwendung finden, da aufgrund der laxen Syntaxprüfung (z. B. fehlendes/sehr schwaches Typsystem) viele Fehler erst zur Laufzeit auftreten und eine Verifizierung im allgemeinen nicht möglich ist.

Logos

Als Maskottchen von Perl dient ein Dromedar. Es zierte erstmals den Umschlag des auch als Kamelbuch bekannten Referenzwerkes Programming Perl. Sein Verleger (Tim O’Reilly) sagte in einem Interview scherzhaft als Begründung: Perl ist hässlich und kommt über lange Strecken ohne Wasser aus. Das Dromedar ist auf dem Programming Republic of Perl Emblem zu sehen, das oft als offizielles Perl-Logo angesehen wird und dessen nichtkommerziellen Gebrauch O’Reilly gestattet. Andere im Zusammenhang mit Perl benutzte Logos sind neben Perlen die aufgeschnittene Zwiebel (Erkennungszeichen der Perl Foundation) und der Komodowaran, der die weit verbreitete Perl-Distribution ActivePerl von ActiveState schmückt.

Kritik

Häufigster Kritikpunkt an Perl ist seine, besonders für Umsteiger, mangelnde Lesbarkeit. Kritiker nennen Perl auch scherzhaft eine „write-only“-Sprache, da der Quelltext selbst für den Autor nach einiger Zeit nicht mehr verständlich sein soll. Ein weiterer Gag besteht in der Aussage, Perl sei die einzige Programmiersprache, bei der man den Code UUencoden könne, ohne dass ein sichtbarer Unterschied entstünde. Tatsächlich bietet Perl überdurchschnittlich viele Freiheiten, die zu unleserlichem Code führen können (siehe Disziplinen). Andererseits ermöglicht es die gleiche Freiheit auch, nahe an der logischen Struktur des Problems oder dem menschlichen Verständnis zu programmieren. Die von Perl-Programmierern geschätzte Freiheit, persönlichen Vorlieben nachzugehen, muss bei Projekten, die von mehreren Programmierern oder über längere Zeiträume entwickelt werden, durch selbst auferlegte Regeln eingeschränkt werden, um spätere Probleme zu vermeiden. Dies erfordert zusätzlichen Kommunikationsaufwand oder die Verwendung von Software wie Perl::Critic.

Einige Teile der Syntax, wie die Objektorientierung und Signaturen, sind zwar einfach und sehr mächtig, werden aber häufig gegenüber vergleichbaren Sprachen wie Python oder Ruby als veraltet wahrgenommen und fordern bei standardisierten Herangehensweisen, besonders von Perl-Anfängern, zusätzliche Tipp- und Denkarbeit. Diese Probleme sollen mit Perl 6 behoben werden oder können mit zusätzlichen, für Perl 5 erhältlichen Modulen umgangen werden.

Weiterhin wird Perl vorgeworfen, es verletze die UNIX-Philosophie (siehe dazu den Abschnitt Entstehung).

Starke Kritik wird auch gegen Perl 6 erhoben, das zu hoch gesteckte Ziele habe und nach 7 Jahren angeblich immer noch keine sichtbaren Ergebnisse bringe und statt dessen die Zukunft von Perl (5) lähme. Perl 6 war von Anfang an als Langzeitprojekt ausgerufen, das ausschließlich auf nicht immer planbarer Freiwilligenarbeit und kaum auf finanzieller Unterstützung beruht. Seine konkreten Ziele zeichneten sich erst im Verlauf der Entwicklung ab, und es gab eindeutige Probleme bei der Kommunikation und der Außendarstellung. Allerdings enthält die aktuelle Perl-Version 5.10 bereits vielsprechende Neuerungen aus Perl 6, Pugs kann große Teile von Perl 6 ausführen und der Perl 6-rules-Compiler PGE beeindruckte auf Fachkonferenzen als Werkzeug für den Parserbau.

Syntax

Freies Format

Perl erlaubt bedingt formatfreien Quellcode. Das bedeutet, dass Einrückungen und zusätzliche Leerzeichen syntaktisch unerheblich sind und auch Zeilenumbrüche nach Belieben eingefügt werden können. Dafür müssen Befehle eines Blocks mit Semikolon getrennt werden. Einige Sprachelemente wie Formate, here-docs und gewöhnliche reguläre Ausdrücke sind nicht formatfrei.

Variablen

Charakteristisch für Perl ist, dass Variablen durch ein Prefix (auch Sigil genannt) gekennzeichnet werden, das ihren Datentyp anzeigt. Hier einige Beispiele:

Datei-Handles, Verzeichnis-Handles und Formate besitzen keinen Präfix, sind aber ebenfalls eigenständige Datentypen. Jeder Datentyp hat in Perl seinen eigenen Namensraum.

Basisdatentypen in Perl sind skalare Variablen, Arrays und Hashes (assoziative Arrays).

Hashes und Arrays lassen sich einander zuweisen, wobei Hashes als Listen von Key/Value-Paaren betrachtet werden. Daten verschiedenen Typs lassen sich mittels Referenzen beliebig zu neuen Datenstrukturen kombinieren, beispielsweise sind Hashes denkbar, die neben (Referenzen auf) Arrays auch einzelne Skalare enthalten.

Package-Variablen werden automatisch erstellt, sobald sie das erste Mal verwendet werden. Weitaus häufiger im modernen Sprachgebrauch kommen gültigkeitsbeschränkte Variablen zum Einsatz. Diese müssen mittels my deklariert werden. undef variable gibt die angegebene Variable wieder frei.

Kontrollstrukturen

Die grundlegenden Kontrollstrukturen unterscheiden sich kaum von denen in C, Java und JavaScript.

Bedingte Ausführung

if funktioniert wie aus C bekannt; unless, eine Besonderheit von Perl, ist eine Schreibweise für if (!(<Bedingung>)). Eine Case- oder Switch-Anweisung (given when) gibt es erst ab Perl 5.10, vorher musste man diese Struktur mit if … elsif … else nachbilden. Jedoch setzt given die Kontextvariable ($_) wie for und when wendet smartmatch (~~) darauf an, was dieses Konstrukt ungleich vielfältiger einsetzbar macht als traditionelle Case-Befehle. Das optionale default entspricht hier einem else. Die optimierten logischen Operatoren erlauben auch eine bedingte Ausführung. Bei or (bzw. ||) wird der zweite Ausdruck ausgeführt, wenn das Ergebnis des ersten kein wahrer Wert ist, and (bzw. &&) funktioniert analog.

 if     (<Bedingung>) {<Anweisungen>}
[elsif  (<Bedingung>) {<Anweisungen>}]
[else                 {<Anweisungen>}]

 unless (<Bedingung>) {<Anweisungen>}
[else                 {<Anweisungen>}]

 given (<variable>) {
     [when (<Wert>) {<Anweisungen>}]
     [default       {<Anweisungen>}]
 }
<Bedingung> ? <Anweisung 1> : <Anweisung 2>;

<Ausdruck 1> || <Ausdruck 2>;
<Ausdruck 1> && <Ausdruck 2>;

Schleifen

Wie in C iterieren while und for (in der an C angelehnten Variante), solange die Bedingung wahr ist, until, bis sie wahr ist, und foreach iteriert über eine Liste. In Perl 5 sind for und foreach austauschbar.

 [label:] while (<Bedingung>)
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] until (<Bedingung>)
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] for ([<Startanweisung>]; [<Bedingung>]; [<Updateanweisung>])
              {<Anweisungen>} [continue {<Anweisungen>}]

 [label:] for[each] [[my] $element] (<Liste>)
              {<Anweisungen>} [continue {<Anweisungen>}]

last verlässt sofort die Schleife, redo wiederholt die derzeitige Iteration, und next springt zum continue-Block, bevor es dann mit der nächsten Iteration fortfährt. Diese Befehle können von einem Label-Bezeichner gefolgt sein, der bei geschachtelten Strukturen bestimmt, auf welche Schleife sich der Befehl bezieht.

do {<Anweisungen>} while <Bedingung>; # Spezialfall: in dieser Form
do {<Anweisungen>} until <Bedingung>; # mindestens eine Ausführung

Nachgestellte Kontrollstrukturen

Die oberhalb aufgezählten Kontrollstrukturen beziehen sich auf einen Block mit mehreren Anweisungen. Bei einzelnen Anweisungen kann man auch die verkürzte, nachgestellte Schreibweise wählen, die auch den (englischsprachigen) Lesern das Verständnis durch natürlichsprachige Formulierung erleichtert.

<Anweisung> if      <Bedingung>;
<Anweisung> unless  <Bedingung>;

<Anweisung> for     <Liste>;
<Anweisung> while   <Bedingung>;
<Anweisung> until   <Bedingung>;

Reguläre Ausdrücke

Seit seinen Anfängen waren Reguläre Ausdrücke (Regex) ein besonderes Merkmal von Perl, da ähnliche Fähigkeiten bis dahin meist nur spezialisierte Sprachen wie Snobol und awk hatten. Durch die große Verbreitung setzte Perl einen inoffiziellen Standard, der durch die von Perl unabhängige und auch teilweise abweichende Bibliothek PCRE aufgegriffen wurde, die heute von mehreren bedeutenden Sprachen und Projekten verwendet wird.

Seit Version 5.0 hat Perl seine Regex-Fähigkeiten um viele Funktionen, wie z.B. Rückwärtsreferenzen, erweitert. Auch lassen sich Reguläre Ausdrücke in Perl wesentlich direkter - als z. B. in Java - mit dem =~-Operator verwenden, da sie Kernbestandteil der Sprache sind und nicht eine zuschaltbare Bibliothek. Der eigentliche Reguläre Ausdruck wird mit Schrägstrichen als Begrenzungszeichen notiert. Weil Schrägstriche häufig auch innerhalb Regulärer Ausdrücke vorkommen können, dürfen auch viele andere Zeichen zur Begrenzung verwendet werden. Das verbessert die Lesbarkeit, weil man so Zeichen wählen kann, die sich vom Inhalt des Regulären Ausdrucks abheben.

Perl kennt zwei Befehle für Reguläre Ausdrücke, deren Verhalten mit vielen nachgestellten Optionen verändert werden kann.

$var =~ [m]/<Suchausdruck>/[g[c]][i][m][o][s][x];
$var =~ s/<Suchausdruck>/<Ersatzausdruck>/[e][g][i][m][o][s][x];

Nach erfolgreicher Verwendung eines Regulären Ausdruckes stehen folgende Sondervariablen zur Verfügung:

Der oft in einem Atemzug mit m() und s() beschriebene Operator tr() hat mit ihnen nur die Schreibweise gemein. Er lehnt sich an den UNIX-Befehl tr an, der dem Ersetzen einzelner Zeichen dient. Synonym kann statt tr auch y geschrieben werden.

$var =~ tr/<Suchzeichen>/<Ersatzzeichen>/[c][d][s];

Neben diesen beiden kann auch der Befehl split erwähnt werden, der eine Zeichenfolge aufteilt anhand eines Trennzeichens, das auch ein Regulärer Ausdruck sein darf.

Quoting und Interpolation

Quoting-Operatoren:

Alternatives Quoting und Variableninterpolation führen zu besonders gut lesbarem Code. Ein Beispiel zur Verdeutlichung:

$text = 'He\'s my friend ' . $name . ' from ' . $town . '.'
       . ' ' . $name . ' has worked in company "' . $company . '" for ' . $years . ' years.';
$text = "He's my friend $name from $town. $name has worked in company \"$company\" for $years years.";
$text = qq{He's my friend $name from $town. $name has worked in company "$company" for $years years.};

Perl-Kultur und Spaß

Gemeinschaft

Wie auch bei anderen Projekten freier Software gibt es zwischen vielen Entwicklern und Benutzern der Sprache besondere soziale Bindungen, und es bildete sich eine eigene Kultur daraus. Die Perl-Kultur ist von Offenheit, Gastlichkeit und Hilfsbereitschaft, aber auch von Individualismus, Spieltrieb und Humor geprägt. Anfangs war sicher Larry Wall hierfür ein Vorbild, da er durch andere Projekte wie rn oder patch bereits bei der Veröffentlichung von Perl eine prominente Position in UNIX-Entwicklerkreisen hatte, doch mittlerweile zählen auch Randal L. Schwartz, Damian Conway, Audrey Tang, Brian Ingerson und Adam Kennedy zu den Leitfiguren, die durch ihre Arbeiten innerhalb der „Szene“ große Beachtung finden. Im Gegensatz zu kommerziellen Programmiersprachen lassen sich fast alle Aktivitäten auf persönliche Motivationen zurückführen. Dementsprechend ist die Perl Foundation eine reine Freiwilligen-Organisation, die sich als Angelpunkt einer sich selbst verwaltenden Gemeinschaft versteht und die gespendeten Gelder für einflussreiche Projekte und Personen, Organisation von Entwicklerkonferenzen und den Betrieb der wichtigsten Perl betreffenden Webseiten verwendet.

Treffen, Workshops und Konferenzen

Lokale Benutzergruppen, die meist ein oder zweimal im Monat zu zwanglosen Treffen einladen, bei denen auch Vorträge gehalten werden können, nennen sich Perl Mongers und sind in über 200 größeren Städten auf der ganzen Welt zu finden. Größer, wesentlich straffer organisiert und meist landesbezogen sind die jährlichen Workshops, von denen der gut etablierte Deutsche Perl-Workshop[5] einer der ersten war. Workshops wollen ambitionierte Entwickler in einem möglichst erschwinglichen Rahmen lokal zusammenzuführen. Ein ähnliches Ziel haben die größeren Yet Another Perl Conferences (YAPC), die für die Regionen Nordamerika, Europa, Asien und Israel abgehalten werden. Am größten, allerdings auch am teuersten ist die von O’Reilly in den USA ausgerichtete The Perl Conference (TPF), die mittlerweile Teil der OSCON ist.

Disziplinen

Viele Spracheigenschaften von Perl laden dazu ein, Programmcode kreativ zu gestalten. Dies hat zu verschiedenen intellektuellen, teils humorvollen, teils skurrilen Wettbewerben und Traditionen um die Programmiersprache Perl geführt.

Golf
Golf ist eine Sportart für Programmierer, bei der das kürzeste Programm (in ASCII-Zeichen), das eine gestellte Aufgabe vollständig erfüllt, gewinnt. Da Perl viele, teils trickreiche Kürzel und Abkürzungen gängiger Techniken kennt, ist dies eine besonders populäre Disziplin unter Perl-Programmierern.
Poesie
Da Perl viele Elemente der englischen Sprache beinhaltet, gibt es regelrechte Wettbewerbe, in welchen die besten Beispiele in Perl-Poesie prämiert werden. Neben der freien Form, die lediglich Perl zum Inhalt hat, wird hier versucht, Gedichte zu schreiben, die vom Interpreter ohne Warnungen und Fehlermeldungen ausgeführt werden[6]. Daneben gibt es auch noch einen Perl-Haiku-Wettbewerb, der dieser japanischen Gedichtform gewidmet ist.
Obfuscation
Sehr berühmt und berüchtigt ist auch die Disziplin obfuscation (Verschleierung), für die es auch einen jährlichen Wettbewerb (den „Obfuscated Perl Contest“) gibt, der am ehesten mit dem International Obfuscated C Code Contest vergleichbar ist, den Larry Wall selbst zweimal gewann. Hier wird danach gestrebt, auf ungewöhnliche und kreative Art und Weise die Funktion eines Programms zu verschleiern. Dies ist in Perl besonders leicht, da es für fast alles Kürzel gibt, die Sprache selbst sehr dynamisch ist und viele Dinge abhängig vom Kontext automatisch geschehen, was auch oft als „Perl-Magie“ bezeichnet wird. Ein Beispiel von Mark Jason Dominus, das 2000 beim 5. Annual Obfuscated Perl Contest den zweiten Preis gewann (dieses Programm gibt den Text "Just another Perl / Unix hacker" aus):
@P=split//,".URRUU\c8R";@d=split//,"\nrekcah xinU / lreP rehtona tsuJ";sub p{
@p{"r$p","u$p"}=(P,P);pipe"r$p","u$p";++$p;($q*=2)+=$f=!fork;map{$P=$P[$f^ord
($p{$_})&6];$p{$_}=/ ^$P/ix?$P:close$_}keys%p}p;p;p;p;p;map{$p{$_}=~/^[P.]/&&
close$_}%p;wait until$?;map{/^r/&&<$_>}%p;$_=$d[$q];sleep rand(2)if/\S/;print
JAPH
Eine Art Unterkategorie von obfuscation ist die von Randal L. Schwartz öffentlich begonnene Disziplin JAPH. Das sind Signaturen, die kleine Perl-Programme enthalten, welche meist nur den Namen des Autors oder eine Botschaft auf eine möglichst nicht nachvollziehbare Art ausgeben. Die Buchstaben JAPH sind die Anfangsbuchstaben von Schwartz' Signatur Just Another Perl Hacker.
Perligata
Das Perl-Modul Lingua::Romana::Perligata von Damian Conway ist wohl eines der skurrilsten Module schlechthin: Es ermöglicht dem Benutzer, Perl komplett in Latein zu schreiben. Wie in der lateinischen Sprache ist die Satzstellung (weitgehend) irrelevant für die Bedeutung eines Ausdrucks, stattdessen werden die Bezüge zwischen einzelnen Wörtern durch ihre Flexion hergestellt. Von Variablen bis Referenzen und mehrdimensionalen Arrays ist alles in dieser neuen Sprachdefinition vorhanden. Nahezu alle Sonderzeichen wurden aus der Sprache entfernt, Variablen gleichen Namens, aber unterschiedlicher Struktur (Beispielsweise $next und @next) werden dekliniert, um die entsprechende Variable zu adressieren. Etwas Beispielcode:
insertum stringo unum tum duo excerpemento da.
   # Entspricht: substr($string,1,2) = $insert;
clavis hashus nominamentum da.
   # Entspricht: @keys = keys %hash;
Aus ähnlichem Antrieb entstanden „Sprach-Module“ für Klingonisch, Borg oder Leetspeak. Solche Module sind ein gutes Beispiel für den Zeitaufwand, den viele Leute Perl widmen; Perl kann man in diesem Sinne durchaus als Hobby bezeichnen.
Acme
Brian Ingerson legte mit seinem bekannten Modul namens Acme, das unmittelbar nichts weiter tut, als dem Benutzer zu bescheinigen, sein Programm habe den Höchstgrad an Perfektion erreicht, einen Grundstein für eine CPAN-Kategorie von Modulen, die keinen produktiven Nutzen haben, sogar oft bewusst kontraproduktiv sind oder eine Funktion vorgeben, die unmöglich so erreicht werden kann und eher als Witz zu verstehen ist. Dieses Spiel mit skurrilen Ideen umfasst beeindruckende ASCII-Art, Module, die den Quellcode unsichtbar machen (Acme::Bleach) oder sonstig humorvoll manipulieren, indem sie ihn zum Beispiel mit typischen Sprachfehlern des Präsidenten Bush versehen oder Methoden zufällig löschen, was die Anwesenheit einer diebischen Elster simulieren soll.

Mottos und Zitate

Es gibt viele bekannte Mottos und Zitate, die sich mit Perl selbst oder den Möglichkeiten der Sprache beschäftigen; hier einige Kostproben:

Weitere Informationen

Wettbewerbe

Im Jahr 2004 erreichte Perl beim 7. Wettbewerb des International Conference on Functional Programming Contest eine Platzierung in der Lightning Division.

Literatur

Für Programmier-Anfänger
Für Perl-Einsteiger
Für Fortgeschrittene
 Wikibooks: Perl-Programmierung – Lern- und Lehrmaterialien
Allgemeine Informationen
Deutsche Hilfe zu Perl
Downloadmöglichkeiten
Zeitschriften

Quellen

  1. manpage von Perl 1.0 in der Perl-Timeline (englisch) auf perl.org
  2. Der erste Teil der offiziellen Perl-FAQ (englisch)
  3. Larry Walls Rede auf der OSCON 2000 als perl.com-Artikel (englisch)
  4. Perl6 Community Development Server: Perl6::Perl5::Differences -- Differences between Perl 5 and Perl 6 (englisch), Stand: 5. September 2006
  5. Deutscher Perl-Workshop
  6. zum Beispiel perlmonks.org - Perl-Poetry-Kategorie (engl.)
Dieser Artikel wurde in die Liste der lesenswerten Artikel aufgenommen.