Grep, sed, awk, sort... Non ! Zsh
Depuis plusieurs années maintenant, j’utilise Zsh comme shell par défaut. Et par la force des choses, il m’arrive de taper des commandes zsh, de faire des boucles zsh, de penser zsh. Bref, de coder en zsh. Bien que le langage a des inconvénients, il possède de nombreuses fonctionnalités qui recouvrent celles de certains utilitaires Unix.
Les gros avantage d’utiliser zsh plutôt que les commandes Unix sont au nombre de 3:
- Pas de post traitement pour mettre le résultat d’une commande dans une variable.
- Beaucoup plus rapide que lancer une commande. La création de process prend du temps et se ressent dans une boucle.
- Écrire en 3 lettres ce qu’on peut faire en 32. C’est-à-dire frimer ;).
Il y a aussi des inconvénients:
- Moins lisible, surtout lorsque l’on remplace une suite de pipe comme
aaa | bbb | ccc
. Mais on peut simplifier avec des variables intermédiaires. - Peut être plus lent lorsqu’il y a beaucoup de texte à manipuler. En gros, faire un grep d’un fichier de 1000 lignes est plus lent qu’avec zsh, mais plus rapide si le fichier fait 100000 lignes, car zsh ne travaille pas par flux.
Syntaxe de base
Le man
de zsh fait plus de 5 fois celui de bash. Le manuel est tellement gros qu’il est divisé en 16 parties + un man zshall
pour les afficher tous. Difficile de tout mettre en 1 article alors je me contente de certaines parties de zshexpn
(zsh expansion and substitution). Parmi celles utilisées ici il y a les options d’expansion de paramètres (${(@)x}
) et les modificateurs (${x:h}
ou $x:h
). Il existe un pdf compilant les options et syntaxe de zsh: http://www.bash2zsh.com/zsh_refcard/refcard.pdf.
Lire un fichier
Voici comment les scripts zsh peuvent lire un fichier et mettre chaque ligne dans un tableau grâce aux extensions de paramètres:
content=$(<file) # lire un fichier
content=$(<file1 <file2) # lire 2 fichiers (si multios est activé)
content=$(<file ; ls) # lire un fichier et le retour de la commande `ls`
lines=( ${(f)content} ) # tableau sans ligne vide
lines=( ${(s:\n:)content} ) # équivalent
lines=( "${(@f)content}" ) # tableau avec toutes les lignes (il faut les quotes et @)
lines=( ${(f)$(<file)} ) # forme condensée du premier cas
# -E permet de désactiver l'interpréation des séquences d'échappement (ex. \e)
echo -E ${(j:\n:)lines} # concatène les lignes avec \n
# ou
echo -E ${(F)lines}
# affiche chaque ligne d'un fichier dans des crochets
echo -E "[${(j:]\n[:)"${(@f)$(<file)}"}]"
Il y a encore de nombreux paramètres qui peuvent être trouvés dans le manuel ou via l’auto-complétion de zsh. Aussi, pour simplifier les exemples qui suivront, j’utiliserai directement les variables content
et lines
.
Petite note concernant echo
: comme cette commande prend des arguments, le contenu affiché peut influencer le résultat. Pour éviter tout problème, il vaut mieux partir sur une redirection de flux de cette forme >&1 <<<$content
. Équivalent à cat <<<$content
mais sans appel de commande.
Glob et glob étendu
L’une des grandes forces de zsh réside dans le globbing. Il ne se restreint pas qu’à la recherche de fichier, mais peut aussi s’appliquer sur les éléments d’un tableau ou des chaînes pour filtrer ou transformer. En plus de *
et ?
, zsh comprend [...]
, [^...]
et <x-y>
pour un nombre entre x
et y
inclu (<->
pour n’importe quel nombre).
Avec le glob étendu (setopt extendedglob
) on possède alors un équivalent des regex:
x#
0 ou plus dex
x##
1 ou plus dex
x~y
excluty
dex
^x
tous saufx
(#s)
début (équivalent de^
des regex)(#e)
fin (équivalent de$
des regex)
Ainsi que la syntaxe ksh si activée
ksh-like | glob operators |
---|---|
@(...) |
(...) |
*(...) |
(...)# |
+(...) |
(...)## |
?(...) |
(|...) |
!(...) |
(^(...)) |
Équivalent des commandes *Unix
Maintenant que la petite introduction syntaxique est faite, on peut s’attaquer au remplacement des commandes systèmes. Bien sûr, toutes les options d’une commande ne peuvent pas être simulées facilement avec zsh, mais je présente ici l’essentiel. Je précise que les commandes bash ont implicitement <<<$content
comme flux de lecture et que le résultat des commandes zsh est fait avec un echo -E
.
Je conseille aussi le petit Zsh Native Scripting Guide.
grep
bash | zsh |
---|---|
grep 'Alligator' |
${(M)lines:#*Alligator*} |
grep -v 'Alligator' |
${lines:#*Alligator*} |
grep '^Alligator .* Alligator$' |
${(M)lines:#Alligator * Alligator} |
grep -i 'alligator' |
${(M)lines:#(#i)*alligator*} |
grep -m1 'alligator' |
${lines[(r)*alligator*]} |
(#i)
pour insentive n’est utilisable qu’avec setopt extendedglob
et peut s’appliquer sur un groupe seulement de caractère (i.e. ((#i)a)lbator
). Il existe l’option inverse: #I
. Ainsi que #l
qui fait une recherche insensible à la case pour les lettres minuscules du pattern, et en majuscule pour celles en majuscule dans le pattern.
agrep
agrep
pour “approximate grep”. C’est un grep
qui autorise une marge d’erreur dans la recherche. Zsh possède une option de glob qui fait à peu près la même chose: (#a3)
pour une recherche avec 3 erreurs.
bash | zsh |
---|---|
agrep -3 'alligator' |
${(M)lines:#*((#a3)alligator)*} |
sed
bash | zsh |
---|---|
sed '3,6!d' ou sed -n '3,6p' |
$lines[3,6] |
sed s/alligator/crocodile/ |
${content/alligator/crocodile} |
sed s/alligator/crocodile/g |
${content//alligator/crocodile} |
sed 's/^alligator\*$/_/' |
${lines:s%alligator*%_} ou ${lines/(#s)alligator\*(#e)/_} |
sed 's/^\w\+$/[&]/' |
${lines:/(#m)[[:alnum:]]##/[$MATCH]} |
sed -E 's/^(\w+) = (\w+)$/\2 = \1/' |
${lines:/(#b)([[:alnum:]]##) = ([[:alnum:]]##)/$match[2] = $match[1]} |
head
bash | zsh |
---|---|
head -n3 |
${(F)lines[1,3]} |
tail
bash | zsh |
---|---|
tail -n3 |
${(F)lines[-3,-1]} |
Malheuresement, un nombre négatif en dehors du tableau va afficher un contenu vide. Si on veut un strict équivalent, il faut faire un petit calcul mathématique:
n=10
result=$lines[$((n > $#lines ? 1 : -n)),-1]
awk
Pour celui-là, l’entrée sera le texte ci-dessous. Le programme va coloriser le préfixe.
info: un alligator dort sur le balcon
avertissement: l'alligator se réveille
erreur: l'alligator attaque
note: penser à investir dans une porte plus solide
awk | zsh |
---|---|
BEGIN {
colors["erreur:"]="31"
colors["avertissement:"]="33"
colors["info:"]="35"
for (k in colors)
colorized[k]="\033[" colors[k] "m" k "\033[0m"
}
{
s=colorized[$1]
if (s)
print s substr($0, length($1)+1)
else
print $0
} |
setopt extendedglob
declare -A colors=(
erreur: 31
avertissement: 33
info: 35
)
declare -A colorized
esc=$'\e'
for k in ${(k)colors} ;
colorized+=($k "${esc}[$colors[$k]m$k${esc}[0m")
echo -E ${(F)lines/(#m)(#s)[a-z]##:/${colorized[$MATCH]:-$MATCH}} |
find
bash | zsh |
---|---|
find -name '*alligator*' |
**/*alligator* |
find -name '*alligator*' -a -not '*crocodile*' |
**/*alligator*~*crocodile* |
find -type d |
**/*(/) |
find -not -type d |
**/*(^/) |
find -type l |
**/*(@) |
find -atime 3 |
**/*(a3) |
Bon, vous l’aurez compris, zsh permet de nombreux filtres dans la recherche de fichier. Il peut trier la recherche par date, nom, groupe, etc ou même via une fonction personnalisée.
sort
bash | zsh |
---|---|
sort |
${(o)lines} |
sort -n |
${(on)lines} |
sort -rn |
${(On)lines} |
sort -u |
${(uo)lines} |
À noter que ${(u)lines}
élimine les doublons sans trier le tableau.
Manipulation de chemin
bash | zsh |
---|---|
dirname "$0" |
$0:h |
basename "$0" |
$0:t |
realpath "$0" |
$0:P |
Il y en a évidemment d’autres.
cut
bash | zsh |
---|---|
cut -d: -f2,1 |
echo -E ${(F)lines/(#m)*/$(() { >&1 <<< $2:$1 } ${(s-:-)MATCH})} |
Mais une boucle serait mieux ici. De plus cette ligne ne prend pas en compte l’absence de :
qu’il faudrait gérer pour être un strict équivalent à la commande cut
.
printf
bash | zsh |
---|---|
printf '%04d' 42 |
echo -E ${(l:4::0:)${:-42}} ou echo -E ${(l:4::0:)n} |
À noter que contrairement à printf
, le 4 correspond au nombre de caractère qui sera affiché. Ce qui signifie qu’un nombre sur 5 chiffres sera tronqué.