Типичные приемы работы



	Типичные приемы работы

Скрипты, псевдонимы (aliases) и функции (functions)
Временное исполнение
Поиск файлов на диске
Программа wget
Работа с дискетами Dos
Практические задания

Скрипты, псевдонимы (aliases) и функции (functions)

Что такое скрипты, зачем они нужны и как их делать

Что такое скрипт

Скрипт -- это программа на языке shell. Вместо термина скрипт иногда используется термин сценарий.
Скрипт в Unix -- это практически то же самое, что командный файл в Dos (.bat-файлы) и VMS (.com-файлы). Отличие в том, что, поскольку скрипты являются обычными программами, то вызываются они просто по имени (а не специальной командой типа "call" или "@"), могут иметь произвольное имя (специальное расширение типа .bat не нужно), и нет ограничений на глубину вызовов скриптов из других скриптов.
Простейший скрипт -- это несколько обычных команд shell, которые должны выполняться последовательно.
При обычной работе в командной строке shell зачастую приходится писать довольно длинные команды, постоянно набирать которые заново в конце концов попросту надоедает (да и вероятность допустить опечатку тем выше, чем длиннее команда). Некоторые последовательности команд приходится повторять также все снова и снова. Вот такие команды и их последовательности и являются хорошими кандидатами для помещения в скрипты, чтобы потом их можно было вызвать по короткому имени.
Язык shell, однако, довольно мощный -- он позволяет работать с переменными, содержит конструкции типа "while", "for", "if-then-else", функции и другие атрибуты, присущие языкам структурного программирования. Это позволяет выполнять на shell достаточно сложные действия. Многие программы в Unix являются именно скриптами -- например, startx и больщинство программ, выполняющих инициализацию/останов системы (они расположены в /etc/rc.d/).
Хотя термин "скрипт" обычно подразумевает сценарий на языке shell, в Unix есть и другие скрипт-языки, зачастую специализированные. Все они объединяются тем, что являются интерпретаторами -- т.е. программа является текстовым файлом, который исполняется сразу же, не требуя предварительной компиляции в бинарный файл.
В многообразном мире Unix у такого подхода есть большое достоинство: один и тот же скрипт может без всяких изменений использоваться в разных видах Unix (в том числе и браться ими непосредственно из одного файла -- например, по NFS).
Как сделать скрипт

Как говорилось выше, простейший скрипт -- это несколько команд shell, записанных в файл. Создавать файлы скриптов удобнее всего в текстовом редакторе, но можно и при помощи команды "cat >файл" -- при этом cat принимает ввод с клавиатуры до нажатия <Ctrl+D>.
Чтобы дать понять системе, что это исполняемый файл (программа), надо установить для него атрибут "x".
Пример: создание скрипта, содержащего команду "ls -l | less":
bobby:~% cat >lls ls -l | less <Ctrl+D> bobby:~% ls -l lls -rw-r--r-- 1 ivanov lab5 13 May 14 17:36 lls bobby:~% chmod +x lls bobby:~% ls -l lls -rwxr-xr-x 1 ivanov lab5 13 May 14 17:36 lls bobby:~% _

Запустить затем этот скрипт можно, набрав "./lls".
Но, находясь в другой директории, придется вызывать этот скрипт по полному имени (например, "~/lls"), что довольно неудобно. Поэтому следует поместить такую "свежесделанную" программу в одну из директорий, перечисленных в переменной окружения PATH.
Чтобы у каждого пользователя была возможность создавать и удобно запускать свои программы, в переменной PATH всегда присутствует ссылка на поддиректорию bin/ в home-директории пользователя:
bobby:~% echo $PATH /usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/users/ivanov/bin bobby:~% _

Если в home-директории bin/ отсутствует, то ее надо просто создать командой "mkdir ~/bin".
Скрипты (как, впрочем, и любые другие программы), расположенные в ~/bin/, вызываются просто по имени:
bobby:~% lls zsh: command not found: lls bobby:~% mkdir bin bobby:~% mv lls bin/ bobby:~% lls ...Запускается скрипт lls...

Если в первой строчке скрипта стоит "#!/bin/sh"...

Поскольку скрипты написаны на языке shell, то они должны исполняться (интерпретироваться) какой-то программой. По умолчанию в качестве интерпретатора система использует /bin/sh.
Но можно явно указать интерпретатор, если в начале самой первой строки файла поставить символы "#!" ("решетка" и восклицательный знак), а затем -- полный путь к программе-интерпретатору. Например, чтобы воспользоваться в скрипте дополнительными возможностями, предоставляемыми zsh по сравнению с sh, надо поставить первой строкой
#!/bin/zsh

Таким образом, при отсутствии "#!" система ведет себя так, как если бы там стояло "#!/bin/sh". Вообще говоря, хорошим тоном считается в обычных shell-скриптах ставить эту строку, хотя она и не обязательна -- тогда по файлу сразу ясно, что он является shell-скриптом.
В скриптах на других языках в первой строке обязательно указывается программа-интерпретатор -- например, для Perl -- "#!/usr/bin/perl".
Скрипты с параметрами

Поскольку обычные программы могут вызываться с некоторыми параметрами (например, "ls /etc"), то рано или поздно такая же необходимость возникает и в скриптах.
Для подстановки значения первого указанного параметра используется название "$1", второго -- "$2" и т.д. -- аналогично массиву "argv[]" в программах на языке C. Таким образом, если переделать наш скрипт lls из
ls -l | less
в
ls -l $1| less
то он будет показывать при помощи less длинный листинг не текущей, а указанной директории. Если при вызове lls не будет указана никакая директория, то "$1" будет равен "ничему" (пустой строке), и в результате получится команда "ls -l | less" -- та же, что и раньше.
Специальное название "$*" означает "все параметры". Таким образом, если переделать наш скрипт в
ls -l $* | less
то, к примеру, команда
lls /bin /usr/bin /usr/local/bin
будет воспринята как
ls -l /bin /usr/bin /usr/local/bin | less

Использование переменных

Как известно из теории программирования, практически любая программа рано или поздно потребует для гибкости использования переменных.
Переменные в языке shell -- это почти то же самое, что переменные окружения. В отличие от таких языков, как C или Pascal, все переменные в shell -- строковые (а не числовые).
Для присвоения переменной значения служит конструкция вида
ИМЯ=значение
(вокруг "=" не должно быть пробелов!).
Если присваиваемое переменной значение содержит пробелы или какие-либо символы, имеющие специальный смысл для shell (*, <, >, & и т.д.), то значение надо заключить в кавычки.
Для получения значения переменной используется конструкция $ИМЯ (в отличие от Makefile, скобки вокруг имени указывать не следует).
Заметьте, что это очень похоже на использование параметров $1, $2 и т.д. -- для shell они являются псевдопеременными ("псевдо" потому, что значения их изменять нельзя).
Таким образом, и использованием переменных наш скрипт можно переписать следующим образом:
LS="ls -l" VIEWER=less $LS $* | $VIEWER

(Конечно, не самый осмысленный пример, но весьма наглядный.)
Другие скрипт-языки

Кроме shell, в Unix существует еще довольно много языков для скриптов. В таблице ниже приведены наиболее распространенные и частоиспользуемые из них.
Какие бывают script-языки и зачем они нужны

Программа Язык Применение

/bin/sh Shell Основной язык системы, в т.ч. initscripts

/usr/bin/perl Perl Язык, похожий по синтаксису на C, для создания мощных скриптов, со сложными структурами данных

/bin/awk awk Мощнее shell, но проще perl

/bin/sed sed "Stream editor" -- Скорее не язык, а фильтр

/usr/bin/tclsh Tcl "Tool Command Language" -- язык для написания простых приложений

/usr/bin/wish Tcl/Tk Язык на основе Tcl для программ с оконным интерфейсом

/usr/bin/expect Expect Язык для мультизадачных сценариев

Замечание

В данной таблице перечислены стандартные пути к интерпретаторам, но в некоторых дистрибутивах они могут и отличаться.

Где можно почитать про создание shell-скриптов

Хорошим пособием является книги Б.Керниган, Р.Пайк "UNIX - универсальная среда программирования", главы 3-5, и У.Дэвис "Операционные системы", М., Мир, 1986.
В качестве справочника по конструкциям языка shell стоит использовать man-страницу на sh или bash (собственно, именно bash "работает" в Linux в качестве sh, в этом легко убедиться при помощи команды "ls -l /bin/sh").

Псевдонимы (aliases)

Для простых частоиспользуемых команд необязательно создавать скрипт -- достаточно сделать "псевдоним" (alias).
Shell всегда проверяет самое первое слово каждой команды (т.е. собственно имя команды), не является ли оно псевдонимом, и если да, то заменяет его "значением" псевдонима.
К примеру, если сделать "ll" псевдонимом для "ls -l", то команда
ll /etc
будет исполняться как
ls -l /etc

Для определения псевдонимов используется оператор alias. Пример:
alias ll='ls -l'
Аналогично определению переменных, вокруг символа "=" не должно быть пробелов, а если в "значении" псевдонима есть пробелы или спецсимволы, то его следует "закавычить".
Посмотреть список псевдонимов можно командой alias без параметров:
bobby:~% alias ls='/bin/ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% _

"Разопределить" псевдоним можно командой unalias:
bobby:~% alias ls='ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% alias ll='ls -l' bobby:~% alias ll='ls -l' ls='ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% unalias ll bobby:~% alias ls='/bin/ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% _

У псевдонимов есть две уникальных особенности. Во-первых, shell проверяет, не псевдоним ли это, до того, как начнет искать команду с таким именем. Во-вторых, после "подстановки" значения псевдонима первое слово получившейся команды опять проверяется на предмет того, не является ли оно псевдонимом, но "уже найденные" псевдонимы при этом не учитываются.
Таким образом, можно определить псевдоним с именем уже существующей команды, слегка модифицировав ее поведение или даже полностью заменив ее. В приведенном выше примере команда ls модифицирована так, чтобы всегда автоматически указывались коючи "--color=tty", "-F" и "-T 0".
Поскольку значения псевдонимов также проверяются на псевдонимы, то в приведенном примере при использовании псевдонима ll команде ls будут указываться дополнительные ключи.

"Вручную" псевдонимы практически никогда не делаются, а их определения обычно помещаются в стартовые файлы shell, аналогично определениям переменных окружения.
Единственное, чего псевдонимы не умеют -- так это "работать" в качестве скриптов с параметрами. Но для этого служат функции.

Функции (functions)

Функция в shell, как и в обычных языках программирования -- это небольшой фрагмент кода, выполняющий некое логически законченное действие, и, возможно, вызываемый из основной программы несколько раз.
Функция -- это как бы скрипт внутри скрипта.
Синтаксис определения функции следующий:
function ИМЯ_ФУНКЦИИ () { команды тела функции }

Внутри функции имена "$1", "$2" и т.д. содержат параметры, указанные в вызове функции, аналогично тому, как обычно они содержат параметры, указанные скрипту (которые, в свою очередь, изнутри функции недоступны).
Например, переписать наш скрипт lls в виде функции можно следующим образом:
function lls () { ls -l $* | less }

Посмотреть список функций можно командой "typeset -f", а "разопределить" функцию -- командой "unset -f":
bobby:~% typeset -f lls () { ls --color=tty -F -T 0 -l $* | less } setenv () { export $1=$2 } bobby:~% unset -f lls bobby:~% typeset -f setenv () { export $1=$2 } bobby:~% _

Функции удобно применять в скриптах, а псевдонимы -- в интерактивной работе (т.е. для команд, вводимых непосредственно в командной строке).

Замечание

В zsh (но не в скриптах!) вместо "typeset -f" для просмотра списка функций можно использовать команду functions, а для "разопределения" вместо "unset -f" -- команду unfunction.
В определении функций ключевое слово "function" необязательно, и его можно просто опускать.
В оболочках csh/tcsh функции не поддерживаются.

Временное исполнение

Что такое временное исполнение

Под временным исполнением понимается способность системы исполнять указанные команды в указанное время без участия пользователя. При этом требуется лишь, чтобы был включен компьютер и загружена операционная система.
Есть два варианта временного исполнения: однократное исполнение команд в указанный день в указанное время (команда at) и периодическое исполнение одних и тех же команд -- например, раз в сутки (команда crontab).
В обоих случаях можно запускать только неинтерактивные команды -- т.е. такие, которые не взаимодействуют с терминалом, т.к. команды запускаются "сами по себе", без терминала. Хотя, в принципе, можно запускать таким образом X-программы, делать это следует с осторожностью.
Результат исполнения команд (т.е. то, что они в обычной ситуации выдали бы на экран) будет послан по e-mail. Если выдача пустая, то письмо не посылается.

Исполнение скрипта в указанное время -- at

Команда at позволяет указать системе, что некую последовательность команд (реально -- скрипт на языке shell) надо исполнить в указанное время. Этот набор команд называется заданием. ("At" в переводе означает "в", т.е. "исполнить В такое-то время".)
Формат вызова at следующий:
at [-f файл-содержащий-команды] <время>

Если есть ключ "-f", то at считает скрипт из указанного файла, если нет -- то со стандартного ввода (обычно с клавиатуры, завершить ввод при этом надо комбинацией <Ctrl+D>).
Время исполнения можно указывать несколькими способами -- почти что на обычном английском языке. Во времени можно указывать собственно время суток и день.
Ниже приведено несколько примеров указания времени. При этом предполагается что они указываются в субботу, 15 мая 1999 года в 18:10.
Несколько примеров указания времени команде at

Указание Смысл

19:00 Сегодня в 7 часов вечера 0 минут

17:30 Завтра в 5 часов 30 минут после полудня

now + 53 minutes Через 53 минуты (т.е. в 19:03)

now + 1 day Завтра в это же время

13:20 tomorrow Завтра в 13:20

10:00 today + 5 days В 10 часов утра через пять дней (т.е. 20 мая)

14:30 Feb 15,2001 В 14:30 15 февраля 2001 года

День указывается после времени. Если день не указан, то подразумевается текущий день или, если это время уже прошло (как во втором примере), следующий. Аналогично, если указанные месяц/день уже прошли, то считается, что они относятся к следующему году.
Пробелы в указании времени неважны, а перед годом обязательно должна стоять запятая.
Если указывается уже прошедшее время, то разные системы ведут себя по разному -- к примеру, в ответ на "03:00 saturday" Linux выполнит скрипт немедленно, а Irix скажет "too late".
Приведенных примеров обычно достаточно, но если хочется посмотреть полную спецификацию формата указания времени, то она есть (в виде специальной формы нотации Бэкуса-Наура) в файле
/usr/doc/at-3.1.7/timespec

Пример использования at:
bobby:~% whoami ivanov bobby:~% at 23:00 today at> who at> <EOT> warning: commands will be executed using /bin/sh job 12 at 1999-05-15 23:00 bobby:~% _

В этом примере в 11 часов вечера текущего дня будет выполнена команда who (показывающая список пользователей), а результат ее исполнения будет отправлен пользователю "ivanov@bobby".
При чтении списка команд не из файла (т.е. без ключа "-f"), at предваряет каждую вводимую строку приглашением "at>". Символы "<EOT>" показывают то место, где мы нажали <Ctrl+D>.
В конце at печатает напоминание, что скрипт будет выполняться при помощи интерпретатора /bin/sh, а также идентификатор задания и время исполнения в виде "год-месяц-день часы:минуты".
Идентификатор задания служит для дальнейших ссылок на него -- он показывается в листинге заданий и должен указываться при необходимости удалить задание. В разных системах идентификаторы заданий имеют разный формат -- в Linux это просто последовательно увеличивающееся число, а в других системах оно может, к примеру, иметь вид "926798400.a" или "947883600.a+500".
Для просмотра списка заданий служит команда atq:
viper:~% atq 12 1999-05-15 23:00 a viper:~% _

Она отображает номер задания, время исполнения и номер очереди, в которой оно находится. По умолчанию все задания помещаются в очередь "a". У исполняющихся в данный момент заданий вместо очереди отображается символ "=":
bobby:~% at now at> sleep 120 at> w at> <EOT> warning: commands will be executed using /bin/sh job 14 at 1999-05-15 19:05 bobby:~% atq 12 1999-05-15 23:00 a 14 1999-05-15 19:05 = bobby:~% _

(Команда sleep "спит" (т.е. ничего не делает) в течение указанного количества секунд.)
Удалить задание из очереди можно командой atrm, ей указывается идентификатор задания:
bobby:~% atq 12 1999-05-15 23:00 a bobby:~% atrm 12 bobby:~% atq bobby:~% _

При попытке удалить уже исполняющееся задание выдается сообщение "Warning: deleting running job", и хотя задание из очереди удаляется, оно продолжает исполняться.
Просмотреть содержимое задания можно командой "at -c". Ее выдача довольно показательна: в начало скрипта добавляется настройка переменных окружения (т.е. всем переменным окружения, существующим на момент запуска at, присваиваются такие же значения).

Замечание

В системах клона SystemV (таких, как Solaris и IRIX) вместо команды atrm используется "at -r", а вместо atq -- "at -l". Команда "at -c" в них не поддерживается.

Периодическое исполнение команд -- crontab

Для периодического исполнения команд служит подсистема Cron, а команда для редактирования списка команд используется команда crontab. (Слово "cron" -- это сокращение от "chronograph".)
У каждого пользователя для управления периодическим исполнением своих команд есть собственный так называемый crontab-файл ("crontab" -- "CRON driving TABle" -- "таблица управления Cron'ом). Этот (изначально пустой) файл расположен в недоступной для самого пользователя директории, и может просматриваться и редактироваться только при помощи команды crontab.
У команды crontab есть четыре варианта вызова:

Команда Действие

crontab ФАЙЛ Скопировать ФАЙЛ в crontab-файл

crontab -l Выдать содержимое crontab-файла

crontab -r Удалить crontab-файл

crontab -e Редактировать crontab-файл

Для редактирования по умолчанию вызывается vi (причем в RedHat 5.2 crontab его не находит и "обламывается"). Чтобы использовать другой текстовый редактор (например, joe), надо указать его в переменной окружения EDITOR:
bobby:~% export EDITOR=joe bobby:~% crontab -e

В каждой строке crontab-файла указывается команда и периодичность ее запуска. Пустые строки и строки, начинающиеся с символа "#", игнорируются.
Каждая строка состоит из шести полей, разделенных пробелами или символами табуляции. Формат строки следующий:
Минута Час ДеньМесяца Месяц ДеньНедели Команда

Например, строка
0 23 * * 0 /usr/bin/who
будет каждый понедельник в 23:00 запускать команду who и отсылать по e-mail выдаваемый ею список пользователей.
Команды могут быть любыми, а не только скриптами. Вообще говоря, могут указываться любые сложные команды, допустимые в языке shell, в том числе содержащие перенаправление ввода/вывода. Но команды следует указывать с полным путем -- т.е. /home/users/ivanov/bin/mystatcmd, а не просто "mystatcmd". (Другой вариант -- присвоить в начале crontab-файла значение переменной окружения PATH, но мы это рассматривать не будем.)

Замечание

Узнать полный путь программы можно при помощи команды which. Например, команда "which finger" выдаст "/usr/bin/finger".

Месяцы нумеруются с 1 по 12, дни недели -- с 0 по 6 (0 -- воскресенье, 1 -- понедельник, 6 -- суббота). В Linux месяцы и дни недели можно указывать трехсимвольными именами (т.е. Jan, Feb, Mar...; Sun, Mon, Tue...).
Cron исполняет команду тогда, когда значения всех полей Минута, Час, Месяц и ДеньНедели или ДеньМесяца совпадают с текущим временем. Символ "*" означает "любое" или "каждое". Можно указывать несколько значений через запятую, например "10,30,50" в поле Минута означает "в 10, 30 и 50 минут". Допускаются также диапазоны через дефис, например, "1-5" в поле ДеньНедели означает "с понедельника по пятницу".
Для указания дня служат два поля: ДеньМесяца и ДеньНедели. Команда будет запускаться, когда значение любого из этих полей совпадает с текущим днем. Например, строка
30 4 1,15 * 5 /usr/bin/vmstat
будет запускать vmstat в 4:30 утра по первым и пятнадцатым числам каждого месяца, плюс каждую пятницу.
Несколько примеров:
# Запускать df каждый день в 7:00 утра 0 7 * * * /bin/df # Заказывать кофе каждый рабочий день в 10:00, 13:00 и 17:00 0 10,13,17 * * 1-5 echo Now| mail -s "Coffee, please" waitor@restaurant # Производить подсчет своего бюджета 6 и 21 числа каждого месяца 0 14 6,21 * * /home/users/ivanov/bin/calcbudget

Очень хорошая и полная документация на crontab-файлы есть в man-странице crontab(5) (т.е. для просмотра надо набрать "man 5 crontab").

Замечание

В старых BSD-системах пользоваться подсистемой Cron может только "root" (если только стандартный пакет Cron не заменен на Vixie-Cron, что, впрочем, в последнее время стало почти правилом).

Поиск файлов на диске

Команды для поиска файлов

Для поиска файлов в Unix предназначены две команды -- find и locate. Первая выполняет поиск непосредственно в момент запуска, а вторая делает поиск по списку файлов (базе данных), который обновляется обычно раз в сутки (в большинстве систем -- поздно ночью или рано утром).
У обеих команд есть как достоинства, так и недостатки. Так, find выдает результаты по текущему, "мгновенному" состоянию диска, но, к примеру, поиск по всему диску может занимать очень много времени. Напротив, locate выполняет поиск очень быстро, но во-первых, в базе данных может быть несколько устаревшая информация, а во-вторых, база данных составляется "из-под" пользователя "nobody" и не содержит информации о тех директориях, которые для него закрыты.
Кроме того, для быстрого поиска файлов, относящихся к программам, в RedHat Linux можно использовать команду rpm с ключом "-qal" в паре с командой grep.
Как find, так и locate позволяют указывать шаблон имени файла, содержащий специальные символы "*", "?" и т.д. Такие шаблоны надо заключать в кавычки, чтобы shell не пытался их интерпретировать.

Поиск по диску сейчас -- find

Вызов find

Команда find ищет в указанных директориях и ниже файлы, отвечающие заданному критерию ("test"). Причем критерием может быть не только имя файла, но и, к примеру, время модификации, размер или тип (файл/директория/линк и т.д). Критерии могут объединяться при помощи булевских операторов, так что можно найти, например, все файлы с расширением .txt размером не более 10К, модифицированные не позднее прошлого месяца.
Формат вызова find следующий:
find [список директорий] [критерий]

Если не указывать директории, то будут найдены все отвечающие указанному критерию файлы в текущей директории и ниже. Если не указывать критерий, то будет выдан список всех файлов из указанных директорий. Если же не указывать ни то, ни другое, то будет выдан список всех файлов из текущей директории.
Директории в списке указываются через пробел. Имена критериев всегда начинаются с "-", аналогично ключам.
Поиск файла по имени

Самое частое использование find -- поиск файлов по имени. Для этого служит критерий "-name", которому указывается шаблон имени. К примеру, чтобы найти на всем диске все файлы с расширением .txt, надо воспользоваться командой
find / -name '*.txt'

GNU-версия find, используемая в Linux, понимает также критерий "-iname", отличающийся тем, что маленькие и большие буквы не различаются. Так, команда
find / -name '*.exe'
найдет все файлы с расширениями .exe, .EXE, .Exe и т.д.
Поиск с несколькими критериями

Если указать несколько критериев, то find найдет только файлы, соответствующие всем критериям сразу.
К примеру, критерий "-type" позволяет указать тип файла -- обычный ("f"), директория ("d") и т.д. Таким образом, чтобы найти в директории /etc все директории, имена которых начинаются на "cron", надо сделать слежующее:
bobby:~% find /etc -name 'cron*' -type d find: /etc/X11/xdm/authdir: Permission denied /etc/cron.daily /etc/cron.hourly /etc/cron.monthly /etc/cron.weekly bobby:~% _

В то время как поиск просто по имени дал бы несколько лишних файлов:
bobby:~% find /etc -name 'cron*' find: /etc/X11/xdm/authdir: Permission denied /etc/rc.d/init.d/crond /etc/logrotate.d/cron /etc/cron.daily /etc/cron.hourly /etc/cron.monthly /etc/cron.weekly bobby:~% _

Исполнение команды с найденными файлами

Кроме критериев команде find можно указывать также действия ("actions"). Если никакое действие не указано, то find по умолчанию добавляет "-print", чтобы напечатать имя файла. Т.е. команда
find / -name '*.txt'
реально работает как
find / -name '*.txt' -print

Наиболее часто требуется действие "-exec", позволяющее выполнить с найденным файлом некую команду, чаще всего -- ls -l.
Пример (выдать "длинный" листинг всех файлов из директории /etc, в имени которых содержится "pass"):
bobby:~% find /etc -name '*pass*' -type f -exec ls -l '{}' ';' -rw-r--r-- 1 root root 1362 Apr 16 20:21 /etc/passwd -rwxr-xr-x 1 root root 97 Oct 13 1998 /etc/X11/wmconfig/u serpasswd find: /etc/X11/xdm/authdir: Permission denied -rw-r--r-- 1 root root 239 Apr 27 1998 /etc/pam.d/passwd -rw-r--r-- 1 root root 1362 Apr 16 20:10 /etc/passwd- -rw-r--r-- 1 root root 1363 Apr 16 20:20 /etc/passwd.OLD bobby:~% _

Необходимое пояснение: "-exec" воспринимает все, что стоит после него и до слова ";", как команду, которую надо выполнить. Причем сочетание символов "{}" заменяется на имя файла. Поскольку и ";", и "{}" являются специальными символами для shell, их надо "закавычить".

Поиск по списку файлов диска -- locate

Команда locate ищет указанные имена в базе данных, содержащей список файлов. Формат вызова locate следующий:
locate ИМЯ [ИМЯ...]

Пример:
bobby:~% locate Monitors /usr/X11R6/lib/X11/doc/Monitors /usr/X11R6/share/Xconfigurator/MonitorsDB bobby:~% _

При указании нескольких имен locate найдет файлы, соответствующие любому из имен:
bobby:~% locate xsnow xroach /etc/X11/wmconfig/xsnow /usr/share/icons/mini/mini-xsnow.xpm /usr/X11R6/bin/xsnow /usr/X11R6/include/X11/bitmaps/xsnow /usr/X11R6/man/man1/xsnow.1x /usr/X11R6/bin/xroach /usr/X11R6/man/man1/xroach.man /var/catman/X11R6/cat1/xroach.man.gz bobby:~% _

Если ИМЯ не содержит специальных символов шаблона, то locate находит все файлы, в любом месте полного имени которых (т.е. включая директорию) встречается указанная строка. Т.е. locate в этом случае работает просто как grep по списку файлов.
Если же ИМЯ содержит символы "*", "?" или "[]", то locate находит только строки, которые точно соответствуют шаблону.
Например, команда
locate '/usr/X11R6/*jewel'
покажет все файлы из директории /usr/X11R6, имя которых заканчивается на "jewel", а именно программу xjewel, но не man-страницу по ней:
bobby:~% locate '/usr/X11R6/*jewel' /usr/X11R6/bin/xjewel bobby:~% _

Для того же, чтобы увидеть все файлы из /usr/X11R6, в имени которых встречается "jewel", надо в конце шаблона также поставить "*":
bobby:~% locate '/usr/X11R6/*jewel*' /usr/X11R6/bin/xjewel /usr/X11R6/man/man1/xjewel.1x bobby:~% _

В любом случае символы "." и "/" не являются особенными. Таким образом, шаблон "*et*pass*" найдет файл /etc/passwd.

Предупреждение

По умолчанию в базу данных, которую просматривает locate, попадают лишь файлы с корневой файловой системы (т.е. /). Если же, к примеру, все home-директории пользователей расположены на отдельном разделе (который монтируется, например, в /home), то администратор системы должен добавить этот раздел в список индексируемых.
В Linux индексирование (т.е. создание базы данных) выполняется программой updatedb, которая автоматически запускается ежедневно при помощи Cron. В RedHat Linux это выполняется из файла /etc/cron.daily/updatedb.cron. Таким образом, чтобы заставить updatedb индексировать, к примеру, раздел, смонтированный в /home, надо просто добавить его (через пробел) в список разделов в ключе "--localpaths" (т.е. чтобы было что-то типа "--localpaths='/ /home").

Замечание

Команда locate есть только в BSD-системах и в Linux, в системах клона SystemV она отсутствует.

Программа wget

Что такое wget

Wget -- это программа для "вытягивания" файлов из Internet при помощи протоколов HTTP или FTP.
Основные достоинства Wget:

Wget -- неинтерактивная программа, что позволяет запускать ее в фоновом режиме или при помощи at.
Wget может выкачивать файлы "рекурсивно", т.е. автоматически следовать по "ссылкам". Это позволяет, например, скачивать web-страницы вместе с имеющимися в них картинками, или выкачивать по FTP целые директории вместе с содержимым (включая поддиректории).
Wget умеет "докачивать" файлы после обрыва соединений, что особо ценно при медленной или нестабильной связи (хорошим примером которой является ситуация в Академгородке в настоящий момент).

Wget выдает список всех опций при вызове с ключом "--help", причем поскольку выдача довольно длинная, лучше пользоваться командой
wget --help | less

Для того, чтобы узнать все возможности Wget, следует заглянуть в info-документацию по нему.

Использование

Поскольку у wget есть огромное количество ключей, модифицирующих его поведение, мы рассмотрим на примерах несколько наиболее часто используемых случаев.
Простое скачивание файла

В самом простом случае программе указывается один параметр URL -- ссылка на файл, который надо получить:
bobby:~/soft% wget ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/dosuti ls/lodlin16.tgz --15:23:43-- ftp://rdist.inp.nsk.su:21/pub/Linux/redhat-5.2/i386/dosutils /lodlin16.tgz => `lodlin16.tgz' Connecting to rdist.inp.nsk.su:21... connected! Logging in as anonymous ... Logged in! ==> TYPE I ... done. ==> CWD pub/Linux/redhat-5.2/i386/dosutils ... done. ==> PORT ... done. ==> RETR lodlin16.tgz ... done. Length: 87,210 (unauthoritative) 0K -> .......... .......... .......... .......... .......... [ 58%] 50K -> .......... .......... .......... ..... [100%] 15:23:43 (604.01 KB/s) - `lodlin16.tgz' saved [87210] bobby:~/soft% _

При скачивании каждого килобайта отображается один символ ".".
Можно указать подряд несколько URL -- в этом случае файлы будут скачаны один за другим.
Скачивание при плохой связи

Для того, чтобы wget повторял попытки взять файл до тех пор, пока не скачает его целиком, надо указывать ключи "-c" и "-t 0". Первый означает "продолжать качать с того места, где соединение оборвалось" (continue), а второй позволяет указать число попыток, 0 -- бесконечно.
Например, чтобы скачать исходные тексты проигрывателя .mp3-файлов X11Amp, можно воспользоваться командой
wget -c -t 0 http://www.x11amp.bz.nu/files/x11amp-0.9-beta1.1.tar.gz

Реально ключи "-c -t 0" стоит указывать практически всегда, кроме как разве что в локальной сети.
Шаблоны

При перекачке по FTP можно в именах файлов указывать шаблоны (естественно, "закавычивая" их). Например, команда
wget 'ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/updates/i386/XFree86*.rpm'
скачает все обновления к системе XFree86.
Рекурсивное скачивание

Для рекурсивного скачивания используются ключи "-r", "-l" и "-np". Ключ "-r" (recursive) включает рекурсивность. Ключ "-l" (level) позволяет указать насколько "глубоко" программа должна следовать по ссылкам; 0 -- бесконечно глубоко, по умолчанию установлено 5. И, наконец, ключ "-np" (no parent) запрещает следовать ссылкам выше указанной директории.
При рекурсивном скачивании wget автоматически создает соответствующее дерево директорий.
К примеру, следующая команда могла бы использоваться для скачивания целого домашнего сайта (адрес вымышленный):
wget -r -l 0 -np http://www.h-hosts.com/users/goofy/

При этом файлы будут помещаться в директорию ./www.h-hosts.com/users/goofy/.

Замечание

Wget, будучи культурной программой, при рекуррентном скачивании уважает т.н. "Протокол Web-роботов", и может пропускать часть файлов (запрещенных в файле robots.txt на сервере). Чтобы отключить эту "культурность", можно воспользоваться ключом "-e robots=off".
Почитать про Протокол Web-роботов можно в info-документации по Wget, воспользовавшись командой
info wget appendices robots
или по адресу
http://info.webcrawler.com/mak/projects/robots/robots.html

Фоновый режим

При указании ключа "-b" (background) программа сразу переходит в фоновый режим, так что пользователь может заниматься другими делами или даже выйти из системы -- wget будет продолжать свою работу.
При сообщения, которые выдавались бы на экран, будут идти в файл wget.log (а если он уже есть, то в wget.log.1, wget.log.2 и т.д.).
Пример:
bobby:~/soft% wget -b http://www.mit.edu/afs/sipb/user/xiphmont/cdpa ranoia/download/cdparanoia-III-alpha9.5.src.tgz Continuing in background. Output will be written to `wget-log'. bobby:~/soft% _

Для просмотра log-файла по мере скачивания удобно пользоваться командой "tail -f":
bobby:~/soft% tail -f wget-log --16:16:45-- http://www.mit.edu:80/afs/sipb/user/xiphmont/cdparanoia/down load/cdparanoia-III-alpha9.5.src.tgz => `cdparanoia-III-alpha9.5.src.tgz' Connecting to www.mit.edu:80... connected! HTTP request sent, awaiting response... 200 OK Length: 92,595 [application/octet-stream] 0K -> .......... .......... .......... .......... .......... [ 55%] 50K -> ..._

Использование прокси-серверов

Wget умеет пользоваться прокси-серверами как для HTTP, так и для FTP. Достаточно перед вызовом программы присвоить адрес прокси-сервера переменным окружения http_proxy или ftp_proxy соответственно (имена маленькими буквами!).
Wget понимает как "официальное" указание адреса, так и сокращенное. Поэтому команды
export http_proxy=http://proxy.nsc.ru:8080/
и
export http_proxy=proxy.nsc.ru:8080
эквивалентны.
Скачивание "через перевалочную базу"

Современные академгородковские реалии таковы, что зачастую скачать файл с некоего зарубежного сервера напрямую не удается из-за плохой связи. При этом иногда не помогает даже способность Wget к докачке.
Можно обойти эту проблему, если есть доступ (по telnet, rlogin или ssh) к unix-эккаунту где-нибудь за рубежом, где связь намного лучше.
При этом выполняются следующие действия:

При помощи Wget файл скачивается на зарубежную машину. Естественно, Wget на ней должен быть установлен. Если нет, то не является проблемой скомпилировать его из исходных текстов (см. пример в разделе "Установка программ из исходных текстов").
Там его стоит упаковать, если это еще не сделано (а .html-файлы пакуются очень хорошо), и, возможно, разбить на несколько более мелких файлов про помощи программы split.
Затем такой упакованный и/или разбитый файл скачивается с зарубежной машины к себе при помощи Wget по FTP или HTTP.

Такой подход дает большую гибкость по сравнению с прямой перекачкой, а уменьшение размера кусочков, на которые разбивается файл, иногда позволяет достичь необходимой надежности.

Предупреждение

Пользоваться таким приемом можно только в том случае, если это не нарушает политики, принятой в тех учреждениях, которых это касается.

Работа с дискетами Dos

Пакет mtools

Для копирования информации между компьютерами и в качестве архива очень часто используются дискеты. Хотя в принципе у каждой операционной системы (Dos/Windows, MacOS, SunOS/Solaris, Linux и т.д.) есть свой формат для дискет, чаще всего используются дискеты с разметкой MS-Dos.
Хотя самый прямой способ работы с дискетами Dos в Linux -- это просто смонтировать дискету, например, командой
mount -t msdos /dev/fd0 /mnt/floppy
есть более удобное средство -- пакет Mtools.
Программы из этого пакета позволяют работать как с дискетами 3.5 и 5.25 дюйма, так и с дисками Zip и Jaz. Причем поддерживаются длинные имена файлов Windows95/NT (т.е. расширения файловой системы VFAT).
Пакет Mtools содержит следующие основные программы, выполняющие те же действия, что и аналогичные программы MS-Dos: mdir, mcopy, mren, mdel, mmd, mrd, mformat и еще некоторые.
Несколько примеров использования программ из пакета Mtools

Команда Комментарий

mdir a: Показать директорию диска A:

mdel a:/report.txt Удалить с диска A: файл report.txt

mcopy a:/misc/nc110.tgz ./ Скопировать с диска A: из директории misc файл nc110.tgz в текущую директорию

mmd a:/papers mcopy conf99.tex a:/papers Создать в корне диска A: директорию papers и затем скопировать туда из текущей директории файл conf99.tex

mformat b: Отформатировать диск B:

Несколько общих правил и отличий от MS-Dos:

Вместо символа "\" (обратная косая черта) в качестве разделителя директорий следует использовать "/" (прямая косая черта), т.к. "\" является специальным символом для shell.
Шаблоны имен Dos, содержащие "*" и "?" следует "закавычивать", т.е. вместо команды
mdir a:*.txt
следует использовать
mdir "a:*.txt"

Кроме того, Mtools следует принятому в Unix соглашению о шаблонах -- "любой файл" это не "*.*", а просто "*".
По умолчанию A: означает первый флоппи-диск (устройство /dev/fd0), а B: -- второй (устройство /dev/fd1), причем в Linux тип диска (3.5/5.25) и его разметка определяются автоматически.
При доступе к дискетам программы из Mtools обращаются к соответствующим устройствам из директории /dev/, при этом используются права доступа этих устройств. По умолчанию доступ на чтение открыт всем, а доступ на запись -- только пользователю "root" и группе "floppy" (которая пуста):
bobby:~% ls -l /dev/fd? brw-rw-r-- 1 root floppy 2, 0 May 6 1998 /dev/fd0 brw-rw-r-- 1 root floppy 2, 1 May 6 1998 /dev/fd1 bobby:~% _

Таким образом, любой пользователь может просматривать директорию с дискеты и копировать оттуда файлы, но не писать туда:
bobby:~% mcopy a:autoexec.bat . bobby:~% mcopy files.bbs a: Can't open /dev/fd0: Permission denied Cannot initialize 'A:' Bad target a: bobby:~% _

Чтобы дать возможность записи, надо или открыть эти устройства всем на запись командой
chmod 666 /dev/fd?
или, что гораздо правильнее, занести тех, кто должен иметь возможность писать на дискеты, в группу "floppy"; всем остальным при этом лучше даже убрать право на чтение --
chmod 660 /dev/fd?

Форматирование дискет.

В отличие от команды format в Dos, команда mformat не выполняет низкоуровневого форматирования (т.е. mformat -- это эквивалент команды Dos "format /q"), поэтому оно должно быть выполнено заранее. В Unix для этого служит программа fdformat.
Программе fdformat следует указывать "плотность" дискеты. Это делается путем указания правильного файла устройства -- к примеру, /dev/fd0H1440 означает "дискета на 1.44М".
В свою очередь, программе mformat надо указывать количество дорожек, секторов и сторон (эти числа пишет fdformat при низкоуровневом форматировании). Это делается при помощи ключей "-t", "-s" и "-h" соответственно.
Кроме того, mformat не проверяет диск на испорченные блоки (bad-блоки), для этого служит программа mbadblocks. Впрочем, практически любой Unix (и Linux здесь не исключение) очень плохо относится к испорченным дискетам, так что лучше их просто выкидывать.

Детали по использованию каждой конкретной программы следует смотреть на ее man-странице. Кроме того, достаточно полное описание содержится в info-документации по mtools.

Практические задания

Сделать псевдоним с именем "l", который вызывал бы команду less с ключами "-i" и "-S" и поместить его в свой файл .zshrc.
Создать функцию с именем "ds", которая выполняла бы команду "du -s" для указанных директорий, и поместить ее в свой файл .zshrc.
Заставить Cron в текущем часу каждые пять минут выполнять команду w.
Прочитав в man-странице crontab(5) про указание "шагов", заставить Cron в текущем часу каждые две минуты выполнять команду uptime.
При помощи find найти в директории /etc/ все файлы, в имени которых встречается "syst".
Сделать то же самое при помощи locate.
При помощи wget начать скачивать файл
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/images/boot.img
и когда будет скачано около половины, прервать перекачку, нажав <Ctrl+C>. Затем докачать файл.
При помощи wget одной командой скачать в директорию /tmp/ все .exe-файлы из директории
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/dosutils/

При помощи wget скачать в директорию /tmp/ целиком директорию
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/doc/rhmanual/

При помощи at заставить wget скачать в поддиректорию htmls/ в своей home-директории одиночную страницу по адресу http://www.inp.nsk.su/people/ через 5 минут. (Естественно, htmls/ предварительно надо создать.)
Временно став пользователем "root", сделать себе доступ на запись к диску A:.
Выполнить низкоуровневое форматирование дискеты, а затем отформатировать ее в формате MS-Dos (при этом надо будет указать команде mformat число сторон, дорожек и секторов; воспользоваться значениями, которые напишет программа низкоуровневого форматирования).
Скопировать файл /etc/termcap на дискету.
Скопировать директорию /etc/X11/AnotherLevel на дискету.
Скопировать ту же директорию с дискеты в директорию /tmp/.


	Что такое временное исполнение



	Под временным исполнением понимается способность системы исполнять указанные команды в указанное время без участия пользователя. При этом требуется лишь, чтобы был включен компьютер и загружена операционная система. Есть два варианта временного исполнения: однократное исполнение команд в указанный день в указанное время (команда `at`) и периодическое исполнение одних и тех же команд -- например, раз в сутки (команда `crontab`). В обоих случаях можно запускать только неинтерактивные команды -- т.е. такие, которые не взаимодействуют с терминалом, т.к. команды запускаются "сами по себе", без терминала. Хотя, в принципе, можно запускать таким образом X-программы, делать это следует с осторожностью. Результат исполнения команд (т.е. то, что они в обычной ситуации выдали бы на экран) будет послан по e-mail. Если выдача пустая, то письмо не посылается.


	Команды для поиска файлов



	Для поиска файлов в Unix предназначены две команды -- `find` и `locate`. Первая выполняет поиск непосредственно в момент запуска, а вторая делает поиск по списку файлов (базе данных), который обновляется обычно раз в сутки (в большинстве систем -- поздно ночью или рано утром). У обеих команд есть как достоинства, так и недостатки. Так, `find` выдает результаты по текущему, "мгновенному" состоянию диска, но, к примеру, поиск по всему диску может занимать очень много времени. Напротив, `locate` выполняет поиск очень быстро, но во-первых, в базе данных может быть несколько устаревшая информация, а во-вторых, база данных составляется "из-под" пользователя "`nobody`" и не содержит информации о тех директориях, которые для него закрыты. Кроме того, для быстрого поиска файлов, относящихся к программам, в RedHat Linux можно использовать команду `rpm` с ключом "`-qal`" в паре с командой `grep`. Как `find`, так и `locate` позволяют указывать шаблон имени файла, содержащий специальные символы "`*`", "`?`" и т.д. Такие шаблоны надо заключать в кавычки, чтобы shell не пытался их интерпретировать.


	Что такое wget



	Wget -- это программа для "вытягивания" файлов из Internet при помощи протоколов HTTP или FTP. Основные достоинства Wget: Wget -- неинтерактивная программа, что позволяет запускать ее в фоновом режиме или при помощи `at`. Wget может выкачивать файлы "рекурсивно", т.е. автоматически следовать по "ссылкам". Это позволяет, например, скачивать web-страницы вместе с имеющимися в них картинками, или выкачивать по FTP целые директории вместе с содержимым (включая поддиректории). Wget умеет "докачивать" файлы после обрыва соединений, что особо ценно при медленной или нестабильной связи (хорошим примером которой является ситуация в Академгородке в настоящий момент). Wget выдает список всех опций при вызове с ключом "`--help`", причем поскольку выдача довольно длинная, лучше пользоваться командой `wget --help \| less` Для того, чтобы узнать все возможности Wget, следует заглянуть в info-документацию по нему.


	Практические задания



	Сделать псевдоним с именем "`l`", который вызывал бы команду `less` с ключами "`-i`" и "`-S`" и поместить его в свой файл `.zshrc`. Создать функцию с именем "`ds`", которая выполняла бы команду "`du -s`" для указанных директорий, и поместить ее в свой файл `.zshrc`. Заставить Cron в текущем часу каждые пять минут выполнять команду `w`. Прочитав в man-странице crontab(5) про указание "шагов", заставить Cron в текущем часу каждые две минуты выполнять команду `uptime`. При помощи `find` найти в директории `/etc/` все файлы, в имени которых встречается "`syst`". Сделать то же самое при помощи `locate`. При помощи `wget` начать скачивать файл ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/images/boot.img и когда будет скачано около половины, прервать перекачку, нажав `<Ctrl+C>`. Затем докачать файл. При помощи wget одной командой скачать в директорию `/tmp/` все .exe-файлы из директории ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/dosutils/ При помощи wget скачать в директорию `/tmp/` целиком директорию ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/doc/rhmanual/ При помощи `at` заставить wget скачать в поддиректорию `htmls/` в своей home-директории одиночную страницу по адресу `http://www.inp.nsk.su/people/` через 5 минут. (Естественно, `htmls/` предварительно надо создать.) Временно став пользователем "`root`", сделать себе доступ на запись к диску A:. Выполнить низкоуровневое форматирование дискеты, а затем отформатировать ее в формате MS-Dos (при этом надо будет указать команде `mformat` число сторон, дорожек и секторов; воспользоваться значениями, которые напишет программа низкоуровневого форматирования). Скопировать файл `/etc/termcap` на дискету. Скопировать директорию `/etc/X11/AnotherLevel` на дискету. Скопировать ту же директорию с дискеты в директорию `/tmp/`.