PerlTimeline

Ken Thompson megalkotja a grep parancsot, melyben az ed szövegszerkesztő parancsai és beépített reguláris kifejezései egy külső programban valódulnak meg, a Global REgular expression Print-ben.

1977

Alfred V. Aho, Peter J. Weinberger, és Brian W. Kernighan megalkotja az awk számítógépes nyelvet. Az awk a Perl elődjének tekinthető.

1987

Dec. 18-án Larry Wall felteszi a hálózatra a Perl 1.000-át, és azonnal több ezer önkéntes hozzálát teszteléséhez és fejlesztéséhez. Larry Wall egy fájlarhíváló és hibajelentő rendszert szeretett volna megíni awk-ban, de az kevésnek bizonyult a problémához. Lusta programozó révén azonnal írt egy megfelelőbb programzási nyelvet.

Mivel kicsit rendetlen a formátuma, szokás a Perl-t még Patologikusan Eklektikus Rendetlenség Listázónak is nevezni. A szerző ezt is hivatalosnak tekinti.

1988

1989

Okt. 18-án megjelenik a Perl 3.000, és első ízben a GNU Nyilvános Licensz alapján

1990

1991

Márc. 21-én megjelenik a Perl 4.000, mind a GNU Nyilvános Licensz mind az Artistic licensz alapján.

1992

Decemberben felvetődik egy, a TeX mintájára szerveződő (Comprehensive TeX Archive Network -- CTAN) arhíváló rendszer létrehozásának gondolata: CPAN -- Comprehensive Perl Archive Network.

1994

1995

Rasmus Lerdorf megalkotja a Perl CGI szkriptet, mely egy HTML dokumentumban információt gyűjtött a látogatókról, és azt beleírta a HTML dokumentumba.

1996

Doug MacEachern megalkotja a mod_perl-t, mely beépíti a perl értelmezőt az Apache web kiszolgálóba.

1997

2001

Open Cola 1.0 is the first open source consumer product and sports the following Perl code on the can: (24 April)

Egyéb Linkek

Támogatott Operációs rendszerek

Perl főbb tulajdonságai

Perl és a Web

A Perl célja

A Perlt programozóknak tervezték, általános feladatokhoz, melyek túl nehezek vagy túl hordozhatóságérzékenyek a shell számára, és túl bonyolult azokat C-ben vagy más UNIX ragasztónyelven kódolni.

A Perl működése

A Perl a futtatandó programot először teljes egészében beolvassa és értelmezi, majd ha azt hibátlannak találta, akkor kezd neki a futtatásnak. Ezáltal előfeldolgozza a scriptet, és jelentősen gyorsítja a futását egy egyszerű értelmező scripthez képest. (Természetesen terjedelmes, rövid ideig futó program esetén ez pont fordítva van, az értelmezés sokkal hosszabb ideig tarthat, mint a program futása).

A Perl program alapszerkezete

Hello world

Változók

Vezérlési szerkezetek

Input/Output

Szabályos Kifejezések

Kiterjesztett reguláris kifejezés

Példa: az egrep parancs:

LC_ALL, LC_COLLATE, LANG be van állítva, akkor azok ebben a kiértékelési sorrendben megváltoztatják a tartományok definícióját

LC_ALL, LC_CTYPE, LANG a karakterek típusát adják meg (mi a nem betû)

További bővítések

perl, java, python, tcl ...
ld. http://www.tropicsoft.com/Components/RegularExpression/SyntaxBcb3.htm

perl

\d	[0-9]	\D	[^0-9]
\w	[a-zA-Z0-9_]	\W	[^a-zA-Z0-9_]
\s	[ \r\t\n\f]	\S	[^ \r\t\n\f]

Zárójel (csoportosítás)	( ) (?: )
Sokszorozók	? + * {m,n} ?? +? *? {m,n}?
referenciapont	^ $ \b \B \A \Z (?= ) (?<= ) (?! ) (?<! )
váltakozás	\|

\b szóhatár
\B nincs szóhatár
(?: ) nem gyűjtő zárójel, a benne levő kifejezés nem kerül bele az \n (n egy szám) átmeneti változóba
(?=teljes_szöveg)teljes csak akkor illeszkedik a teljes-re, ha az a teljes_szöveg része. Egyenértékű a teljes(?=_szöveg) kifejezéssel.
(?<=\d) utóvizsgálat: az adott pont előtt számjegynek kell állnia.
(?! ) (?<! ) negatív elő- illetve utóvizsgálat
\A sor vagy karakterlánc eleje
\Z vagy \z sor vagy karakterlánc vége
?? +? *? {m,n}? lusta kvantorok (a legszűkebb egyezése veszik)
?+ ++ *+ {m,n}+ harácsoló kvantorok (a normális mohó kvantornál is mohóbb azáltal, hogy a közben előforduló opcionáis kifejezéseket a feldolgozás során azonnal elfelejti).

<B>ajtó</B> és <B>ablak</B> szövegre a

/<B>.*</B>/      az ajtó</B> és <B>ablak -ra illeszkedik
/<B>.*?</B>/     az ajtó</B> -ra illeszkedik   ugyanaz, mint /<B>((?!</?B>).)*</B>/

/i nem különbözteti meg a kis- és nagybetűket
/x szabad beosztás (a karakterosztályon kívüli whitespace karakterek nem számítnak) és megjegyzés (a # után sorvégig megjegyzés írható) regex üzemmód
/s pont-mindenre-illeszkedik illesztési üzemmód (a pont karakter újsorra is illeszkedik)
/m fejlett sorhorgony illesztés üzemmód (alapesetben a karakterláncban levő újsor karaktert a ^ és $ figyelmen kívül hagyja, a /m logikai sorokat definiál, minek következtében a ^ és $ a logikai sor elejét, illetve végét jelenti.)
/g globális helyettesítés
/o ne értékelje ki újra a regex-ben levő változókat (az első hívás kiértékelését befagyasztja). A perl rekurzívan értékeli ki a regex-et, amíg nem változik a tartalma.
/e a helyettesítő karakterláncra lefuttatja az eval függvényt. A módosító ismételhető, ekkor annyiszor futtatja le a perl az eval függvényt, ahányszot a módosító megjelenik

$pat = shift;
while (<>) {
   print if /$pat/o;
}

$string = "Placido P. Octopus";
$regex  = "P.";
$string =~ s/\Q$regex/Polyp/;

Ezek regex-en belül is ki-be kapcsolhatók:

<B>(?i:nagyon)</B>               # a nagyon állhat kis és nagy betúkből is.

Példa:

1. helyettesítsük az összes Jeffs kifejezést Jeff's -re

s/\bJeffs\b/Jeff's/g;                            # a triviális megoldás
s/\b(Jeff)(s)\b/$1'$2/g;                     # ugyanez csoportokkal
s/\bJeff(?=s\b)/Jeff'/g;                      # elővizsgálattal
s/(?<=\bJeff)(?=s\b)/'/g;                  # elő- és utóvizsgálattal
s/(?=s\b)(?<=\bJeff)/'/g;                  # ugyanaz, mint az előző

2. Csoportosítsuk egy egész szám számjegyeit hármas csoportokba

while ( s/(\d)((\d\d\d)+\b)/$1,$2/g) {}

3. szűrjük ki az ismétlődő szavakat egy HTML szövegben (lehet közben <parancs>, </parancs> alakú kifejezés is!)

$/ = ".\n";          # a beolvasásnál a . vagy az újsor a rekordhatár
while (<>) {
   next if !s/\b([a-z]+)((?:\s|<[^>]+>)+)(\1\b)/\e[7m$1\e[m$2\e[7m$3\e[m/ig;
   s/^(?:[^\e]*\n)+//mg;              # A jelöletlen sorok eltávolítása
   s/^/$ARGV: /mg;                    # Az állománynév beszúrása a sorok elejére
   print;
}

A tr parancs

tr/ab/ba/; # az előszőr megadott karakterlánc minden karakterét a második karakterlánc megfelelő karakterére cseréli. Ha a második karakterlánc rövidebb, akkor annak utolsó karakterét ismétli addig, amíg azonos hosszakat nem kap.
tr/áéíóöőúüű/aeiooouuu/; # ékezettelenítés
$_="szól a kakukk"; tr/a-z/x/; # "xxxx x xxxxxx" a fel nem sorolt karaktereket (pl. szóköz) nem változtatja.
A /d opcióval a második karakterláncban hiányzó betűket törli (nem egészíti ki a megfelelő számú karakterre az utolsó karakterrel):
$_="fred and barney"; tr/a-z/ABCDE/d; # "ED AD BAE"
$_="szól a kakukk"; $szamlalo = tr/a-z//; # nem változtatja meg a stringet (/a-z/ egy karakterosztály), de megszámlálta a betűk számát benne.
A /c opcióval megfordítjuk a helyettesítést: minden nem felsorolt karakterre történik
$_="szól a kakukk"; $szamlalo = tr/a-z//c; # nem változtatja meg a stringet, de a szamlalo értéke 2
$_="szól a kakukk"; tr/a-z/_/c; # "szól_a_kakukk"
$_="szól a kakukk"; tr/a-z//cd; # "szólakakukk" : törölte a "nem betűket"
A /s opció a kicserélt láncban az egymás után következő azonos karakterek közül csak egyet tart meg. $_="aaabbbcccdeffghii"; tr/defghi/abcddd/s; # "aaabbbcccabcd"
$_="szól a kakukk"; tr/a-z/_/cs; # "szól_a_kakukk"

\n	újsor
\r	kocsi vissza
\t	tabulátor
\f	lapdobás
\b	backslash
\a	csengő
\e	escape
\ddd	ASCII érték (oktális)
\xhh	hexadecimális érték
\cC	CTRL+C (C helyett más is állhat)
\\	backslash
\"	idézőjel
\l	a következő betű kisbetűs
\L	kisbetűsre váltás \E-ig
\u	a következő betű nagybetűs
\U	nagybetűsre váltás \E-ig
\Q	minden nem alfanumerikus karaktert elé backslash-t gondol \E-ig
\E	\L, \U és \Q lezárása

	Numerikus	Karakterlánc
egyenlő	==	eq
nem egyenlő	!=	ne
kisebb, mint	<	lt
nagyobb. mint	>	gt
kisebb vagy egyenlő	<=	le
nagyobb vagy egyenlő	>=	ge

-r	a fájl vagy könyvtár olvasható
-w	a fájl vagy könyvtár írható
-x	a fájl vagy könyvtár végrehajtható
-o	a fájlt vagy könyvtárat a felhasználó birtokolja
-e	a fájl vagy könyvtár létezik
-z	a fájl vagy könyvtár létezik és nulla méretű
-s	a fájl vagy könyvtár létezik és nem nulla méretű
-f	a bejegyzés egy sima fájl
-d	a bejegyzés egy könyvtár
-l	a bejegyzés egy symlink
-T	a fájl szöveges
-B	a fájl bináris
-M	a módosítás kora napokban
-C	a hozzáférés kora napokban

A Perl Script Nyelv

1973