Perl (programozási nyelv)

Perl

Paradigmafunkcionális, imperatív, objektumorientált (osztályalapú), reflektív, procedurális, generikus
Jellemző kiterjesztés.pl, .pm, .t
Megjelent1987
TervezőLarry Wall
FejlesztőLarry Wall
Utolsó kiadás5.32.0[1] (2020-06-20)
Típusosságdinamikus
Hatással volt ráAWK, Smalltalk 80, Lisp, C, C++, sed, Unix shell, Pascal
Befolyásolt nyelvekPython, PHP, Ruby, ECMAScript, LPC, Windows PowerShell, JavaScript, Falcon, Perl 6, Qore
Operációs rendszermultiplatform
LicencGNU General Public License vagy Artistic License[2]
Weboldal

A Perl egy általános célú, magas szintű, interpretált, dinamikus programozási nyelv, melynek első verzióját Larry Wall 1987. december 18-án tette közzé.

Stílusában és funkcionalitásában sokat merít a C, sed, awk és sh nyelvekből. A Perl egyik legfontosabb része a reguláris kifejezések széles körű támogatása, mely által kiválóan alkalmas nagy méretű szöveg- vagy adatfájlok egyszerű feldolgozására. Az 5-ös változat megjelenésével a 90-es években elterjedt a dinamikus, CGI alapú weboldalak nyelveként, de jellemzőbb felhasználási területei a már említetteken túl a rendszeradminisztráció, a hálózati programozás, a pénzügyi informatika és a bioinformatika.

A perl interpreter és az alap disztribúció a GNU GPL vagy az Artistic License figyelembevételével elérhető, felhasználható és módosítható szabad szoftver.

Történet

Korai változatok (1987–1993)

Larry Wall 1987-ben kezdte el fejleszteni a Perlt, amikor az Unisysnél dolgozott. Az 1.0-s kiadást a comp.sources.misc hírcsoportban tette közzé december 18-án. A Perl 2 (1988) egy jobb regex-motorral érkezett, a Perl 3 (1989) pedig már bináris adatfolyamokat is tudott kezelni.

Az eredeti dokumentáció egyetlen – egyre hosszabb – man oldal volt. 1991-ben jelent meg a Programming Perl, avagy a „tevés könyv”, és vált tulajdonképpen a nyelv referenciájává. Ezzel együtt a főverzió 4-re változott: így könnyebb volt hivatkozni a könyv által ismertetett változatra.

A Perl 4 egészen a 4.036-os verzióig húzta, melyet 1993-ban adtak ki. Eddigre Larry kilépett a fejlesztéséből, hogy az 5-ös változat kialakításával foglalkozhasson.

Perl 5 – korai évek (1994–2000)

1994 májusában hozták létre a perl5-porters levelezőlistát, elősegítendő az új változat különböző platformokra portolását. A levelezőlista azóta is a Perl 5 fejlesztésének elsődleges kommunikációs eszköze.

1994. október 17-én elkészült az 5.000. A kódértelmezőt szinte teljesen újraírták, a nyelv képes lett objektumok, referenciák, helyi változók, modulok kezelésére. A modularitás lehetővé tette a nyelv kiegészítését, így a Perl magjához kevesebbet kellett hozzányúlni.

A Perl életében talán legfontosabb esemény 1995. október 26-án történt meg, amikor létrehozták a CPAN-t, mely a Perlben írt modulok gyűjtőoldala. Ezzel egy központi helyről (illetve annak számos tükörszerveréről) lehetett letölteni kiegészítéseket, például a már említett CGI modult. Mára körülbelül 28 ezer csomagot („disztribúciót”) tartalmaz, közel 11 ezer felhasználótól, ezzel az egyik legnagyobb szabadszoftver-gyűjtőoldal a világon. Magát a Perlt is a CPAN-on teszik közzé.

1996-ban, az 5.002 kiadással bekerültek a nyelvbe a prototípusok, amivel lehetségessé vált olyan szubrutinok készítése, amelyek úgy működnek, mint a beépített függvények.

A ’97-ben kiadott 5.004-es változat bevezette a UNIVERSAL alapobjektumot, lehetőséget arra, hogy modulok betöltésekor megköveteljük modulverziót, valamint az alap disztribúció része lett a CGI modul. Szintén ekkor lett elérhető a Perl Microsoft Windows operációs rendszeren.

A hagyományos verziószámozás utolsó kiadása 1998 közepén jelent meg. Az 5.005 sokat javított a regex-motoron, bevezették a qr// operátort, és a p5p még több operációs rendszerre portolta a nyelvet, többek között BeOS-ra is.

Szintén ekkor jött létre a PerlMonks, egy olyan weboldal, ahol a felhasználók egymás Perllel kapcsolatos kérdéseire tudnak válaszolni.

Perl 6, stagnálás (2000–2008)

Fő verzió Legutolsó frissítés
5.5 2004-02-23[3]
5.6 2003-11-15 [3]
5.8 2008-12-14[3]
5.10 2009-08-23[3]
5.12 2012-11-10[3]
5.14 2013-03-10[3]
5.16 2013-03-11[3]
5.18 2014-10-02[3]
5.20 2015-02-14[3]
5.22 2015-06-01[3]
Jelentés
Piros Már nem támogatott kiadás
Zöld Még támogatott kiadás
Kék Elkövetkezendő kiadás

2000. március 22-én megjelent az 5.6, rengeteg újítással: 64 bites rendszerek támogatása, Unicode-támogatás, 2 GiB-nál nagyobb fájlok támogatása, our kulcsszó. Az új verziózásra való áttérés magával hozta a más szabad szoftvereknél is elterjedt szemantikát, miszerint a páros verziók a stabil, felhasználásra szánt kiadások, míg a páratlan verziók a fejlesztői változatok, amikben szinte minden megtörténhet.

Ugyanekkor Larry Wall egy új projektbe kezdett, az akkor még a Perl folytatásának szánt 6-os verzióba. 2000 során 361 RFC dokumentum gyűlt össze a Perl közösségből, a tervek szerint ezek mentén fejlesztették volna az új változatot. 2001-ben elkezdődött az Kinyilatkoztatások (Apocalypse) megírása – ezek a dokumentumok foglalták össze az új generációs Perllel szembeni felhasználói elvárásokat. Néhány évig a Perl 6 csak papíron létezett, és ott is meglehetősen absztraktan.

Az 5.8-at 2002-ben adták ki, javított a Unicode alrendszeren, beépítettek egy teljesen új IO réteget, javítottak a számolási pontosságon. Ez a változat további kilenc javítást kapott, a legfrissebbet 2008-ban. Jelenleg is a legelterjedtebb változat, a nagy céges környezet ritka szoftverfrissítéseinek köszönhetően.

2004-ben a Perl 6 fejlesztői megpróbálták összefoglalni a Kinyilatkoztatásokat, de ehelyett ezek az új dokumentumok (Synopsis) végeredményben specifikálták az új nyelvet, és a konkrét fejlesztés megkezdődhetett.

A Perl 5 pedig várta a folytatását, az új Perlt.

Modern Perl (2008-tól napjainkig)

2007 utolsó napjaiban – a Perl megjelenésének 20. évfordulójára időzítve – végre kiadták az 5.10-et, ezzel szakítva azzal a tévhittel, hogy a Perl következő verziója a 6-os lesz. Mivel a 6-os viszont sehogy sem akart elkészülni, néhány érdekes újdonságot beolvasztottak belőle az 5-ös széria új kiadásába: hasznos új funkciók a reguláris kifejezésekben, switch-szerű elágazások (given … when …), smart match operátor (~~), defined-or operátor (//), állapotváltozók (state).

Az 5.11-es fejlesztési fázisban új alapokra helyezték a Perl fejlesztését, a további időhúzást elkerülendő. A terv az volt, hogy minden hónapban kiadnak egy fejlesztői változatot, minden évben egy új nagy kiadást, valamint minden stabil kiadás után negyedévente ahhoz javító kiadásokat. Ezzel a Perl fejlesztése új életre kelt, 2010 óta minden évben sok újdonság látja meg a napvilágot az új stabil verziókkal.

Az 5.12 teljes Y2038-felkészültséget, Unicode 5.2-t, DTrace-támogatást hozott. 2011 májusában kiadták az 5.14-et, jobb IPv6-támogatással, majd 2012 májusában az 5.16-ot. Ez utóbbiban a feature-ök támogatása megváltozott, lehetővé vált megadni, hogy milyen verziójú Perlt szeretnénk a kódban emulálni (ez például a sokat változó smart match operátor esetén bizonyult hasznosnak, de más esetben is előfordulhat, hogy egy régebbi Perl működése szükséges egy adott program helyes futásához, de bizonyos okokból már újabb interpretert kell használnunk). 2013 májusában kiadták az 5.18-at.

Ez az éra hozta el a modern Perl mozgalmat is. Ez a kifejezés egy olyan fejlesztői kultúrát takar, ami él a CPAN adta lehetőségekkel, kihasználja a nyelv új képességeit, és nagyon komolyan veszi a helyesen működő, jó szoftver készítését. A nevet magán viseli chromatic könyve, az ingyenesen elérhető Modern Perl,[4] de olyan szervezetek is képviselik, mint az Enlightened Perl Organization.

2014-ben két fő változatát fejlesztik. Az elterjedtebb, támogatottabb változat az 5-ös, mely az 5.20.1 verziónál tart. A 6-os változat a Perl teljes újragondolása lesz, a nyelvtan szigorúbb, gépi módon könnyebben értelmezhetőbb felépítését és a régi nyelv csapdáinak megszüntetését célozva meg. A két változat egymással nem kompatibilis.[5]

A névről

A nyelvet eredetileg Pearl-nek hívták, ami angolul gyöngyöt jelent. Larry Wall rövid és pozitív hangvételű nevet keresett a nyelvnek, azonban a szótárban végignézve az összes három- és négybetűs szót, egyik sem tetszett neki igazán. Megfordult a fejében az is, hogy feleségéről, Gloriáról nevezze el az új nyelvet. Végül a Pearl szóra esett a választása (a Biblia szerint szerint: „egy nagy értékű gyöngy” / „one pearl of great value”[6]). A hivatalos kiadás előtt azonban rájött, hogy már létezik ilyen névvel programnyelv, így gyorsan megváltoztatta a név írásmódját, kihagyva az a betűt.

A nevet nagy kezdőbetűvel használjuk (Perl) ha magára a programozási nyelvre hivatkozunk, és kicsivel (perl), ha az interpreterre. Ahogy azt a Perl közösség is állítja: „Only perl can parse Perl” (csak a perl képes a Perlt értelmezni). A PERL írásmód helytelen. Magyarul jellemzően fonetikusan ejtjük, de előfordul az angolos (/pɜːl/, /pɝl/) kiejtés is.

Bár a Perl nem betűszó, néhány rövidítést társítanak a névhez. Ilyen például a Pathologically Eclectic Rubbish Lister (kb. betegesen túldíszített selejt-listázó). A leginkább elterjedt és szakkönyvekben, illetve a Perl saját oldalán is használt rövidítés-magyarázat a Practical Extraction and Report Language (gyakorlati (szöveg)kinyerő és jelentéskészítő nyelv). Ez a magyarázat ráadásul összecseng az eredeti Pearl névvel is, amennyiben az And szót is bevesszük a rövidítés betűi közé.

Szemlélet

Larry Wall nyelvészetet tanult, így a nyelv tervezésekor kifejezetten a természetes nyelvek irányából próbálta megközelíteni a problémát. Ezzel valamelyest összecseng az, hogy nincs a nyelvben – ahogy a természetes nyelvekben sem – egyetlen igaz út, a dolgokat többféleképpen meg lehet valósítani, és személy- és helyzetfüggő, hogy melyik út a legjobb (vö. a Python szemléletével, ami kifejezetten azt preferálja, hogy egy dologhoz lehetőleg csak egy út vezessen és az legyen minél nyilvánvalóbb[7]). Ezt a Perl közösség TIMTOWTDI-nak („Tim Toady”) hívja: There is more than one way to do it.

A másik elv az „easy things should be easy and hard things should be possible”: a könnyű dolgokat legyen könnyű megcsinálni, de a nehéz dolgokat is meg lehessen csinálni.

Fontos gondolat még, hogy a nyelv elsősorban nem arra van optimalizálva, hogy hatékonyan használja ki az egyre olcsóbb hardvert, hanem arra, hogy a dráguló munkaerőt használja ki a lehető leghatékonyabban. Ezt segíti, hogy a különböző dolgok jól elkülönülnek egymástól – a különböző változófajták más-más jellel kezdődnek, a tömbök és az asszociatív tömbök elemeit más karakterekkel érjük el (szögletes ill. kapcsos zárójel), a sztringek és a reguláris kifejezések alapértelmezett karaktere különbözik (sztringet aposztróf vagy idézőjel, regexet perjelek közé zárunk), stb.

Szintén a nyelvészeti tanulmányok hatásának tulajdonítható az, hogy a leggyakoribb utasítások lehetőleg rövidek, a legfontosabb paraméter jellemzően legelöl áll és nagy a nyelvi alapkifejezések száma. A Perl előnyben részesíti a tömör és a felhasználó számára természetes szerkezeteket, még annak árán is, ha az implementáció bonyolultabb lesz. Ide kapcsolható még a DWIM szemlélet is („Do what I mean” – tedd azt, amire gondolok), vagyis a legkevesebb meglepetés elve: a nyelv felületes ismeretével is könnyen rá lehet jönni egy ismeretlen kifejezés, szerkezet szándékára.

A Perlt áthatja a praktikusság – nem baj, ha nem szép valami, csak tegye a dolgát. Ez persze sok kritikára is okot ad, hiszen emiatt nagyon is jellemző a rendezetlen, trehány program; a programozó nem azért írta, hogy más majd karbantartsa azt, hanem azért, hogy egy feladatot elvégezzen vele. Maga a Perl se túl elegáns: lehet feszegetni a szabályait, a fordító meglehetősen megbocsátó. Emiatt – alapból legalábbis, ha az ember nem használja a strict pragmát – a hibákat nem mindig könnyű megtalálni. A beépített függvények számosság-kontextustól való függéséről maga a dokumentáció is azt állítja: „Általánosságban véve azt csinálják amit szeretnél, kivéve ha következetességet szeretnél.”[8]

A Perl előnyei és hátrányai

Előnyei:

  • Gép- és rendszerfüggetlen, szinte mindenütt megvan.
  • Gyors és hatékony, nagy könyvtára van.
  • Elsőrangú reguláriskifejezés-kezelője (regular expression) van, ragyogó leírással.
  • Szinte minden számítógépes problémára nyújt megoldást.
  • Összetett jelkészletének köszönhetően kis helyen nagy mennyiségű információ fogalmazható meg, így egy képernyőn nagyobb információtartalom fér el.

Hátrányai:

  • Eklektikus, azaz sokféle nyelvből vett át tulajdonságokat, emiatt tanulása nem triviális.
  • Gazdag jelrendszert használ a különféle változófajták jelölésére, amit előnynek is lehet tekinteni.
  • Könyvtárai sokrétűek, de gyakran külön töltendők le egy nagy archívumból (CPAN).

Perl humor

Ugyanúgy, mint a C nyelvben, a Perlben is népszerűek az elborult lelkivilágú programírási versenyek. Ezek győztesei olyan kódokat produkálnak, melyekről órákig tart megállapítani, hogy voltaképpen mit is csinálnak, azonban lefuttatva általában valamilyen egyszerű műveletet hajtanak végre – például kiírják, hogy „Helló világ!” (Hello world!).

Népszerű foglalatosság Perlben verset írni, tehát olyan programkódot, ami értelmezhető a perl fordító által, de olvasható angol nyelvű versként is. Ez a hobbi többé-kevésbé egyedi a programnyelvek között, nagyrészt annak köszönhetően, hogy a Perl legtöbb utasítása angol szó. A legújabb verseket rendszeresen közzéteszik a Perl Poetry oldalon.

Érdekes még a Perl golf. Ugyanúgy, mint a fizikai golfban, a lényeg itt is a cél elérése minél kevesebb ütéssel, az ütések azonban billentyű leütést jelentenek. Egy feladat lehet például a „leghosszabb anagramma megtalálása a beolvasott szövegben”. A versenyzők egymást túllicitálva írnak minél kevesebb billentyű leütéssel begépelhető programkódokat.

Az egyik legbizarrabb szórakozás a Lingua::Romana::Perligata CPAN modul, mely képes arra, hogy latin nyelven íródott szöveget értelmezzen és hajtsa végre azt, módot adva a latin nyelvű Perl programozásra.

Megemlítést érdemel továbbá a Perl Linux minimalista disztribúció, amely (ha nem minden, de) sok megszokott Linux parancsot tartalmaz, egytől egyig Perl-ben megírva! (pl. chmod, find, file, ls, touch ...). A rendszer mindössze a Linux kernelt, a uClibc -t (minimális alternatíva glibc helyett), a Perl értelmezőt és a Perl nyelven írott parancsokhoz tartozó programokat tartalmazza.

Alapok

A LAMP (szoftvercsomag) tartalmazhatja Perl-t is

A Perl szabad szoftver, amely az Artistic licence és a GPL alatt érhető el.

A Perl használatára jó példa, hogy a Wikipédia is egy Perlben írt CGI szkriptként működött 2002 januárjáig. (A lecserélésének oka sem a Perl bármilyen káros tulajdonsága volt – egyszerűen azok a programozók, akik újraírták, nem a Perlt ismerték jobban.) Egy másik nagyobb alkalmazóként a Slashdot.org említhető, amelyet a Perlben írt Slashcode működtet. Webes alkalmazások esetében a Perlt gyakran Apache web szerverrel és annak mod perl moduljával használják.

A nyelvet támogatói és becsmérlői is egyaránt tisztelik szintaxisa és sajátosságai miatt. A két tábor közötti különbség azonban abban rejlik, hogy ezt erényként vagy vétekként értékelik-e. Tulajdonságai miatt gyakran hasonlítják a természetes nyelvekhez (mint az angol), illetve az evolúcióhoz. Larry Wall így érvel:

… gyakran viccelődünk azzal, hogy a teve egy bizottság által tervezett ló, de ha jobban belegondolunk, láthatjuk, hogy a teve elég jól alkalmazkodott a sivatagi élethez. A teve önellátóvá vált. Másrészt a teve nem jutott el odáig, hogy kellemes szaga is legyen. Ugyanígy még a Perl sem.

Felismerve „csúnya, de hasznos” természetét, a tevét választották a Perl kabalafigurájává, és mivel az O’Reilly kiadó által megjelentetett Perl programozás (Programming Perl) című könyv borítójára is a teve került, ezt programozói körökben egyszerűen csak „teve-könyv”-nek (angolul „camel book”) hívják.

Implementáció

A Perl egyik bástyája a CPAN, amelyről hatalmas mennyiségű, ingyenesen használható modul tölthető le, melyek az elméleti matematikától az adatbázis kezelésen keresztül a hálózati implementációkig sok-sok mindent felölelnek. A CPAN moduljainak túlnyomó többsége az Artistic licence, a GPL, vagy esetleg mindkettő alatt használható. 2004-ben a CPAN több mint 4000 szerző által írt moduljainak száma meghaladta a 7000-et. A CPAN.pm is egy perl modul, amelynek segítségével további modulokat lehet letölteni és telepíteni a CPAN-ról vagy tüköroldalairól, tetszés szerint interaktívan, vagy akár teljesen automatikusan.

A jelenlegi verzió

A jelenleg elérhető az 5.12.3-es verzió, melyet 2011. január 21-én adtak ki. Ez a változat is (már az 5.10 óta egyébként elérhető) teljes Unicode támogatást nyújt.

A következő generációs Perl6 nyelv fejlesztése folyamatban van, ezt már a több programozási nyelvet is támogató, Parrot-nak elnevezett virtuális gép fogja futtatni.

A Perl működése

Bár a Perl hordozza az interpretált nyelvek minden előnyét, mégsem szigorúan sorról sorra értelmezi a forráskódot, hanem először egy átmeneti belső formátumra alakítja, amelyet futtatás előtt optimalizál. Ez a működés lehetővé teszi, hogy a szintaktikai hibák már fordításidőben észlelhetők legyenek, a szubrutinok hívásai pedig még a szubrutin definíciója előtt szerepelhetnek a forrásban. Az 5.005-ös verzió óta lehetővé vált az átmeneti bájtkód elmentése későbbi futtatásokhoz, amellyel megspórolható a kezdeti fordítási fázis.

Mindenképpen idekívánkozik, hogy a legtöbb linuxos (unixos) gépen a Perl értelmező a /usr/bin könyvtárban van, és hogy alapvető elv egy program elkészítésénél a hordozhatóság, ezért be kell írni a forrás legelső sorába:

#!/usr/bin/perl

ez a Perl-nek egy megjegyzés, viszont segít egyes programokat (főként parancsértelmezőket, mint például bash) abban, hogy rájöjjenek, mivel is lehet futtatni a programot.

A Windows rendszerek esetén célszerű a ".pl" fájlokhoz a perl.exe-t társítani, illetve a perl.exe-t tartalmazó könyvtárat hozzáadni a %PATH% környezeti változóhoz.

Adatszerkezetek

Három alapvető adatszerkezet van: skalár, lista (másik nevén tömb) és asszociatív tömb (hash).

  • A skalár bármilyen karakterlánc vagy szám lehet, nevük elé $-jelet kell tenni (megjegyzendő, hogy szemben a C-vel, a karakterláncok NULL karaktert is tartalmazhatnak, így bináris adatok feldolgozására is lehetőség van):
$skalar = "Ez egy szoveg"; # skalár változó
$szamskalar = 123.456; # skalár szám értékkel
  • A lista vagy tömb a C-hez hasonlóan 0-tól indexelt (ez átállítható) adatsor, a nevük elé @-t kell tenni, amikor viszont egy elemét szeretnénk elérni, akkor már skalárként kell kezelni ($):
@tomb1 = (1011,1012,1013,1014,1015,1016,); # egy tömb
@tomb2 = (2000,2100,2200,2300,2040,2045,); # egy tömb
@tomb8 = (8000,8100,8400,8245,); # egy tömb
$i = $tomb1[0]; # a tömb legelső eleme
  • Az asszociatív tömb gyakorlatilag naivan tekinthető egy sztring-indexű tömbnek, de „hivatalosan” név-érték párok halmaza, a név bármilyen sztring lehet, az érték pedig akár hivatkozás is (erről bővebben kicsit később). Az asszociatív tömbök nevét % jellel kezdjük, az egyes értékeket a listához hasonlóan a $ jel segítségével érhetjük el (látható az is, hogy a lekérdezendő elem neve {}-ek köz szerepel):
%asszoc = ('nev1','adat1','nev2','adat2'); # egy asszoc tömb, figyeljük meg, hogy páros számú
                                             elem van felsorolva
%asszoc = ( # az előző deklaráció más (könnyebben áttekinthető)
              'nev1' => 'adat1',           # stílusban írva
              'nev2' => 'adat2'
           );
$asszoc{'nev3'} = 'adat3'; # új elem hozzáadása az asszociatív tömbhöz
delete $asszoc{'nev2'}; # elem törlése az asszociatív tömbből

Kezdetben zavaró lehet, hogy egy tömb, asszociatív tömb elemének lekérdezésekor is $-jelet kell tenni a változó neve elé, azonban mindig gondoljunk arra, hogy a $, % és @ jelek használata attól függ, hogy mit is szeretnénk értékként visszakapni.

Vezérlő szerkezetek

A Perl vezérlő szerkezetei a C és Java nyelvekéire hasonlítanak.

Ciklusok

címke while ( kifejezés ) blokk
címke while ( kifejezés ) blokk continue blokk
címke for ( kifejezés1 ; utasítás2 ; utasítás3 ) blokk
címke foreach változó ( lista ) blokk
címke foreach változó ( lista ) blokk continue blokk

ahol a blokk egy vagy több Perl utasítás kapcsos zárójelek között:

{ utasítások }

A kettősponttal lezárt címkét a ciklusvezérlő utasításokban használhatjuk.

  • A next utasítás a ciklust a következő elemre lépteti
  • A last utasítás azonnal kilép a ciklusból
  • A redo utasítás a ciklust az aktuális elemmel indítja újra

Beágyazott ciklusokban címkével együtt használva az utasításokat, azok a címkének megfelelő cikluson értelmeződnek, lehetőséget adva például egy belső ciklusban egy külső megszakítására. A for szerkezet szemantikája megegyezik a C nyelvvel. A kifejezés1 még az első kör előtt kiértékelődik; a kifejezés2 minden iteráció előtt értékelődik ki és amennyiben hamisnak bizonyul, úgy a ciklus befejeződik; a kifejezés3 pedig minden egyes iteráció végén hajtódik végre.

A foreach szerkezetben a változó egy skaláris változót jelöl, aminek elhagyása esetén a beépített ciklusváltozó, a $_ veszi fel az értékeket.

Ráadásképpen bármely egyszerű kifejezés (ami nem képez blokkot) végrehajtható akár a következő formákban is:

while ( kifejezés }
until ( kifejezés )

Hasonlóképp készíthető hátultesztelő ciklus, ahol a blokk a kifejezés értékétől függetlenül először biztosan lefut. Ezt a do utasítással kell kezdeni:

do blokk while ( kifejezés );
do blokk until ( kifejezés );

Vigyázat! Ezeket az egyszerűsített kifejezéseket a Perl nem tekinti teljes értékű ciklusnak, így ezekben nem használhatóak a next, last és redo ciklusvezérlő utasítások!

Feltételes elágazások

if ( kifejezés ) blokk

Amennyiben a kifejezés igaz, úgy végrehajtódnak a blokkban szereplő utasítások.

unless ( kifejezés ) blokk1
else blokk2

Amennyiben a kifejezés hamis, úgy végrehajtódnak a blokkban szereplő utasítások.

if ( kifejezés ) blokk1
else blokk2

Ha igaz a kifejezés, akkor a blokk1 fut le, ellenkező esetben pedig a blokk2.

if ( kifejezés1 ) blokk1
elsif ( kifejezés2 ) blokk2
else blokk3

Ha a kifejezés1 igaz, akkor a blokk1 értelmeződik, ellenkező esetben megvizsgálja a kifejezés2-t, és ennek megfelelően vagy a blokk2 vagy pedig a blokk3 lesz értelmezve.

A Perl a kifejezéseket minden esetben igaz-hamis értékekként kezeli. Ha a kifejezés számnak tekinthető, akkor bármely nem nulla érték igazként értékelődik. Ha a kifejezés szöveges érték, akkor bármely nem nulla hosszúságú szöveg igaz, kivéve a "0"-t.

"0" hamis
"0.0" igaz
"00" igaz
"-0" igaz
-1 igaz

Ha listát vagy asszociatív tömböt írunk a kifejezés helyére, akkor annak elemszáma értékelődik ki, tehát az üres lista és asszociatív tömb hamis lesz.

Kifejezésmódosító szerkezetek

Egyszerű kifejezésekben, értékadásokban a while, until, if, unless és foreach direktívák használhatóak kifejezésmódosítóként is, ilyenkor a direktíva eredményétől függ a kifejezés végrehajtása.

utasítás while ( logikai kifejezés )
utasítás until ( logikai kifejezés )
utasítás if ( logikai kifejezés )
utasítás unless ( logikai kifejezés )
utasítás foreach ( logikai kifejezés )

A kifejezésmódosítók nem ágyazhatók egymásba, így a következő kódrészlet szintaktikailag hibás:

utasítás if ( logikai kifejezés ) for ( lista )

A for és a foreach kulcsszavak egymással tetszőlegesen felcserélhetők a nyelvben. Célszerű azonban, ha konzekvensen használjuk: pl. ha számsorról van szó, akkor for (legyen az akár 1..1e3) és a foreach, ha egy tömb elemeiről. A hátravetett kifejezések használatakor a zárójel elhagyható, ami növelheti az olvashatóságot. A legtöbb esetben azonban célszerű kerülni a ezt az írásmódot, mivel úgy olvasáskor, mint a végrehajtás során előbb azt vizsgáljuk, hogy teljesül-e a feltétel (illetve hányszor, milyen adatokkal stb.), és csak utána hajtódik végre a kódrészlet.

print $a if $a > 5; # az érték csak akkor jelenik meg, ha nagyobb, mint 5
print "$_\n" for 1 .. 10; # 1-től 10-ig kiírja a számokat egymás alá
print "$_: $h{ $_ }\n" foreach sort keys %h; # asszociatív tömb elemeinek kiírása (kulcsok szerint betűrendben)

Többágú feltételes elágazás (switch)

A Perl nyelv 5.8-as változatáig alapjában véve nem volt külön szerkezet a C nyelvben megszokott switch utasításra, azonban az alábbi programozási technikával ez megvalósítható volt:

SWITCH: {
        if ( logikai kifejezés ) { utasítások; last SWITCH; }
        if ( logikai kifejezés ) { utasítások; last SWITCH; }
# ...
        egyéb esetben végrehajtandó utasítások;
}

avagy

SWITCH:
        utasítás1, utasítás2, last SWITCH if ( logikai kifejezés );
        utasítás1, utasítás2, last SWITCH if ( logikai kifejezés );
# ...
        egyéb esetben végrehajtandó utasítások;
}

vagy elsif-et használva

if ( logikai kifejezés1 ) {
    utasítások;
} elsif( logikai kifejezés2 ) {
    utasítások;
} elsif( logikai kifejezés3 ) {
    utasítások;
} else {
    egyéb esetben végrehajtandó utasítások;
}

Jól példázza azonban a Perl nyelv bővíthetőségét, hogy kiegészítő modul segítségével akár "szabványos" switch szerkezet is használható a Switch CPAN modul használatával

use Switch;

switch ($val) {
    case 1          { utasítások }
    case "a"        { utasítások }
    case [1..10,42] { utasítások }
    case /\w+/      { utasítások }
    ''...''
    else            { utasítások }
}

Ezzel azonban bánjunk óvatosan, mivel a Switch modul voltaképp átírja a programkódot az első megoldásra, ezáltal egyes esetekben megnövekedhet a sorok száma. Ekkor egy későbbi hibajelzés olyan sorra mutathat, ahol valójában nem is szerepel a kérdéses hivatkozás.

Az 5.10-es változatban már van valódi beépített „switch” is given néven. (Annyi más újdonsághoz hasonlóan, ezt is a lassan készülő 6.0-s Perlből backportolták.)

use feature "switch";

given($_) {
    when (/^abc/) { $abc = 1; }
    when (/^def/) { $def = 1; }
    when (/^xyz/) { $xyz = 1; }
    default { $nothing = 1; }
}

Bonyolultabb adatszerkezetek

Hivatkozások segítségével az alaptípusoknál sokkal összetettebb adatszerkezetek is létrehozhatók, például olyan névsor készíthető, amiben egy névhez több adatot is lehet rendelni (születés helye, ideje, lakcím stb.), míg egyszerű (egydimenziós) asszociatív tömbök segítségével csak egy adatot lehet minden kulcshoz hozzárendelni.

Skaláris

%tomb1 = (
    nev1 => 'lakcím1',
    nev2 => 'lakcím2',
};
%tomb2 = {
    nev1 => {
         lakcim => 'lakcím1',
         telefonszamok => [ 'telefonszám1', 'telefonszám2' ],
         szuletes => {
             helye => 'szül.hely1',
             ideje => évszám1,
         },
     },
     nev2 => {
         lakcim => 'lakcím2',
         telefonszamok => [ 'telefonszám3', 'telefonszám4', 'telefonszám5' ],
         szuletes => {
             helye => 'szül.hely2',
             ideje => évszám2,
         },
     },
};
 
print $tomb1{nev2}; # lakcím2
print $tomb2->{nev1}->{szuletes}->{helye}; # szül.hely1
print $tomb2->{nev2}->{telefonszamok}->[0]; # telefonszám3

Függvények, szubrutinok

A Perlben a függvényeket a sub kulcsszóval lehet deklarálni. Az átadott paraméterek a @_ listában érhetők el. Ha három paraméterrel hívjuk meg a függvényt, akkor a @_ lista három elemet fog tartalmazni, ezekre $_[0], $_[1] és $_[2]-ként lehet hivatkozhatni, illetve a shift utasítást használva is felhasználhatjuk a lista elemeit. Ha a shift utasításnak nem adunk paramétert, akkor az a @_ listán hajtja végre a műveletet. A függvények a legutoljára végrehajtott utasítás értékével, avagy a return kulcsszó által beállított értékkel térnek vissza.

sub terfogat {
    my $oldalhossz = shift;
    return $oldalhossz ** 3;
}

my $oldal = 16;
print terfogat( $oldal );

A paraméterek nevesíthetőek is a függvénynek asszociatív tömböt adva át paraméterként:

sub udvozlet {
    my %szemely = @_;
    return "Szia $szemely{vezeteknev} $szemely{keresztnev}\n";
}
 
print udvozlet(
    vezeteknev => 'Szabo',
    keresztnev => 'Janos',
);

Reguláris kifejezések

A Perlben nagyon hatékony módon lehet mintaillesztést végezni szabályos kifejezések (angolul: regular expression) segítségével. A perl szabályos kifejezések eredetileg a Unix Version 8 szintaxisát követték, de azóta a perl más irányba fejlődött tovább, s mára fogalommá vált a perl-kompatibilis szabályos kifejezés.

Az m// (match) operátor azt vizsgálja meg, hogy egy string illeszkedik-e egy adott szabályos kifejezéshez. Például az alábbi kifejezés értéke pontosan akkor igaz, ha az $x string tartalmazza az abc részt:

$x =~ m/abc/

Az abc string helyén állhat összetettebb szabályos kifejezés is, például a . speciális karakter tetszőleges karaktert jelöl. Az alábbi kifejezés igaz értékű, ha két a betű között egy tetszőleges karakter áll valahol az $x stringben.

$x =~ m/a.a/

Ha a kifejezést i (angolul ignore case) kapcsolóval bővítjük, akkor a kis- és a nagybetűk azonosnak számítanak a mintaillesztésnél. A következő kifejezés igaz értékű, ha az $x string tartalmazza a Nemecsek szót, függetlenül attól, hogy az kis- vagy nagybetűkkel van-e írva.

$x =~ m/Nemecsek/i

Az s// (substitute) operátor adott szabályos kifejezést keres és lecseréli azt a megadott kifejezésre. A következő programsor lecseréli a szó első előfordulását tehén-re az $tej stringben.

$tej =~ s/ló/tehén/;

A g (global) kapcsolóval a csere globálissá tehető. Az alábbi programsor lecseréli a megszorítás szó összes előfordulását reformra a $cikk stringben.

$cikk =~ s/megszorítás/reform/g;


Egyszerű példaprogramok

A legegyszerűbb „Helló világ!” program a következőképp fest Perlben:

#!/usr/bin/perl -w

print "Helló világ!\n";

Jegyzetek

  1. Perl 5.32.0 is now available!. www.nntp.perl.org. (Hozzáférés: 2020. június 20.)
  2. Perl Licensing. dev.perl.org. (Hozzáférés: 2011. január 8.)
  3. a b c d e f g h i j Perl Source. www.cpan.org. (Hozzáférés: 2014. június 27.)
  4. Modern Perl 2011-2012. [2013. szeptember 21-i dátummal az eredetiből archiválva]. (Hozzáférés: 2013. szeptember 17.)
  5. What about Perl 6. perl-begin.org. [2015. január 26-i dátummal az eredetiből archiválva]. (Hozzáférés: 2014. december 30.)
  6. Máté 13,46
  7. PEP 20 – The Zen of Python, a filozófia 13. sora
  8. perlfunc dokumentáció: bevezető a Perl függvényeihez[halott link]

További információk

Kapcsolódó szócikkek

 

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia