Reguláris kifejezés


Példa:
man egrep > egrep.txt

tele van furcsa karakterekkel, a man jelölésében a karakter vissza (^H) karakter megismétlés jelenti a kiemelést a _^H az aláhúzást. Ezek eltüntetése:

%s/.^v^h//g
.

Kiterjesztett reguláris kifejezés

Példa: az egrep parancs:

A kiterjesztett reguláris kifejezés (egrep) tartalmazza a reguláris kifejezéseket , és
extrák:
függetlenek a locale beállításoktól és az ASCII kódtáblától.

A szögletes zárójelek az osztályelnevezés részei így a keresésben duplán jelenik meg a szögletes zárójel:
egrep '[[:digit:]]' file
egrep '[][:digit:]$&]' file


\w   : [[:alnum:]]
\W : [^[:alnum:]]
\b   : \< vagy \>
\B  : üres, nem szó eleji/végi string ??? (lehet szó belseje is?)



megkeresi, hogy hol fordul elõ az ajto vagy ablak szó magában.


(ablak)|(ajto){2,}

kifejezés az ablak legalább egyszeri, míg az ajto legalább kétszeri elõfordulását írja elõ. Az
(ajto)(ablak)|(ajto.*){2,}
viszont azt követeli meg, hogy egy sorban az ajto-t kövesse valahol az ablak VAGY az ajto ketszer szerepeljen. A | az elõtte levõ teljes kifejezést (reguláris kifejezések összefûzése) kapcsolja össze a mögötte álló reguláris kifejezéssel.


(ajto).*((ablak)|(ajto.*){2,})
az ajto után szerepeljen az ablak, vagy két ajto string.

((ajto)|(ablak)).*\1
az ajto vagy az ablak legalább kétszeri elõfordulását írja elõ.


?  +  *  .  { }  |  (  )  ^  $   \

karaktereket keressük, akkor le kell õket védeni a \ jellel. Míg egyszerû reguláris kifejezésben a
\(ablak\)
kifejezés az ablak stringet keresi, és azt eltárolja, ugyanez kiterjesztett reguláris kifejezésként a zárójelekkel körbevett ablak stringet keresi.


Alapesetben a tartományok és karaktertípusok kiértékelése az ASCII szekvencia alapján történik (ez a C locale). Ha az


További bővítések

perl, java, python, tcl ...
check http://www.tropicsoft.com/Components/RegularExpression/SyntaxBcb3.htm