Что такое скрипт
Скрипт -- это программа на языке shell. Вместо термина скрипт иногда используется термин сценарий.
Скрипт в Unix -- это практически то же самое, что командный файл в Dos (.bat-файлы) и VMS (.com-файлы). Отличие в том, что, поскольку скрипты являются обычными программами, то вызываются они просто по имени (а не специальной командой типа "call" или "@"), могут иметь произвольное имя (специальное расширение типа .bat не нужно), и нет ограничений на глубину вызовов скриптов из других скриптов.
Простейший скрипт -- это несколько обычных команд shell, которые должны выполняться последовательно.
При обычной работе в командной строке shell зачастую приходится писать довольно длинные команды, постоянно набирать которые заново в конце концов попросту надоедает (да и вероятность допустить опечатку тем выше, чем длиннее команда). Некоторые последовательности команд приходится повторять также все снова и снова. Вот такие команды и их последовательности и являются хорошими кандидатами для помещения в скрипты, чтобы потом их можно было вызвать по короткому имени.
Язык shell, однако, довольно мощный -- он позволяет работать с переменными, содержит конструкции типа "while", "for", "if-then-else", функции и другие атрибуты, присущие языкам структурного программирования. Это позволяет выполнять на shell достаточно сложные действия. Многие программы в Unix являются именно скриптами -- например, startx и больщинство программ, выполняющих инициализацию/останов системы (они расположены в /etc/rc.d/).
Хотя термин "скрипт" обычно подразумевает сценарий на языке shell, в Unix есть и другие скрипт-языки, зачастую специализированные. Все они объединяются тем, что являются интерпретаторами -- т.е. программа является текстовым файлом, который исполняется сразу же, не требуя предварительной компиляции в бинарный файл.
В многообразном мире Unix у такого подхода есть большое достоинство: один и тот же скрипт может без всяких изменений использоваться в разных видах Unix (в том числе и браться ими непосредственно из одного файла -- например, по NFS).
Как сделать скрипт
Как говорилось выше, простейший скрипт -- это несколько команд shell, записанных в файл. Создавать файлы скриптов удобнее всего в текстовом редакторе, но можно и при помощи команды "cat >файл" -- при этом cat принимает ввод с клавиатуры до нажатия <Ctrl+D>.
Чтобы дать понять системе, что это исполняемый файл (программа), надо установить для него атрибут "x".
Пример: создание скрипта, содержащего команду "ls -l | less":
bobby:~% cat >lls ls -l | less <Ctrl+D> bobby:~% ls -l lls -rw-r--r-- 1 ivanov lab5 13 May 14 17:36 lls bobby:~% chmod +x lls bobby:~% ls -l lls -rwxr-xr-x 1 ivanov lab5 13 May 14 17:36 lls bobby:~% _ |
Запустить затем этот скрипт можно, набрав "./lls".
Но, находясь в другой директории, придется вызывать этот скрипт по полному имени (например, "~/lls"), что довольно неудобно. Поэтому следует поместить такую "свежесделанную" программу в одну из директорий, перечисленных в переменной окружения PATH.
Чтобы у каждого пользователя была возможность создавать и удобно запускать свои программы, в переменной PATH всегда присутствует ссылка на поддиректорию bin/ в home-директории пользователя:
bobby:~% echo $PATH /usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/users/ivanov/bin bobby:~% _ |
Если в home-директории bin/ отсутствует, то ее надо просто создать командой "mkdir ~/bin".
Скрипты (как, впрочем, и любые другие программы), расположенные в ~/bin/, вызываются просто по имени:
bobby:~% lls zsh: command not found: lls bobby:~% mkdir bin bobby:~% mv lls bin/ bobby:~% lls ...Запускается скрипт lls... |
Если в первой строчке скрипта стоит "#!/bin/sh"...
Поскольку скрипты написаны на языке shell, то они должны исполняться (интерпретироваться) какой-то программой. По умолчанию в качестве интерпретатора система использует /bin/sh.
Но можно явно указать интерпретатор, если в начале самой первой строки файла поставить символы "#!" ("решетка" и восклицательный знак), а затем -- полный путь к программе-интерпретатору. Например, чтобы воспользоваться в скрипте дополнительными возможностями, предоставляемыми zsh по сравнению с sh, надо поставить первой строкой
#!/bin/zsh
Таким образом, при отсутствии "#!" система ведет себя так, как если бы там стояло "#!/bin/sh". Вообще говоря, хорошим тоном считается в обычных shell-скриптах ставить эту строку, хотя она и не обязательна -- тогда по файлу сразу ясно, что он является shell-скриптом.
В скриптах на других языках в первой строке обязательно указывается программа-интерпретатор -- например, для Perl -- "#!/usr/bin/perl".
Скрипты с параметрами
Поскольку обычные программы могут вызываться с некоторыми параметрами (например, "ls /etc"), то рано или поздно такая же необходимость возникает и в скриптах.
Для подстановки значения первого указанного параметра используется название "$1", второго -- "$2" и т.д. -- аналогично массиву "argv[]" в программах на языке C. Таким образом, если переделать наш скрипт lls из
вls -l | less
то он будет показывать при помощи less длинный листинг не текущей, а указанной директории. Если при вызове lls не будет указана никакая директория, то "$1" будет равен "ничему" (пустой строке), и в результате получится команда "ls -l | less" -- та же, что и раньше.ls -l $1| less
Специальное название "$*" означает "все параметры". Таким образом, если переделать наш скрипт в
то, к примеру, командаls -l $* | less
будет воспринята какlls /bin /usr/bin /usr/local/bin
ls -l /bin /usr/bin /usr/local/bin | less
Использование переменных
Как известно из теории программирования, практически любая программа рано или поздно потребует для гибкости использования переменных.
Переменные в языке shell -- это почти то же самое, что переменные окружения. В отличие от таких языков, как C или Pascal, все переменные в shell -- строковые (а не числовые).
Для присвоения переменной значения служит конструкция вида
(вокруг "=" не должно быть пробелов!).ИМЯ=значение
Если присваиваемое переменной значение содержит пробелы или какие-либо символы, имеющие специальный смысл для shell (*, <, >, & и т.д.), то значение надо заключить в кавычки.
Для получения значения переменной используется конструкция $ИМЯ (в отличие от Makefile, скобки вокруг имени указывать не следует).
Заметьте, что это очень похоже на использование параметров $1, $2 и т.д. -- для shell они являются псевдопеременными ("псевдо" потому, что значения их изменять нельзя).
Таким образом, и использованием переменных наш скрипт можно переписать следующим образом:
LS="ls -l" VIEWER=less $LS $* | $VIEWER
(Конечно, не самый осмысленный пример, но весьма наглядный.)
Другие скрипт-языки
Кроме shell, в Unix существует еще довольно много языков для скриптов. В таблице ниже приведены наиболее распространенные и частоиспользуемые из них.
Программа | Язык | Применение |
---|---|---|
/bin/sh | Shell | Основной язык системы, в т.ч. initscripts |
/usr/bin/perl | Perl | Язык, похожий по синтаксису на C, для создания мощных скриптов, со сложными структурами данных |
/bin/awk | awk | Мощнее shell, но проще perl |
/bin/sed | sed | "Stream editor" -- Скорее не язык, а фильтр |
/usr/bin/tclsh | Tcl | "Tool Command Language" -- язык для написания простых приложений |
/usr/bin/wish | Tcl/Tk | Язык на основе Tcl для программ с оконным интерфейсом |
/usr/bin/expect | Expect | Язык для мультизадачных сценариев |
Замечание. В данной таблице перечислены стандартные пути к интерпретаторам, но в некоторых дистрибутивах они могут и отличаться.
Где можно почитать про создание shell-скриптов
Хорошим пособием является книги Б.Керниган, Р.Пайк "UNIX - универсальная среда программирования", главы 3-5, и У.Дэвис "Операционные системы", М., Мир, 1986.
В качестве справочника по конструкциям языка shell стоит использовать man-страницу на sh или bash (собственно, именно bash "работает" в Linux в качестве sh, в этом легко убедиться при помощи команды "ls -l /bin/sh").
Для простых частоиспользуемых команд необязательно создавать скрипт -- достаточно сделать "псевдоним" (alias).
Shell всегда проверяет самое первое слово каждой команды (т.е. собственно имя команды), не является ли оно псевдонимом, и если да, то заменяет его "значением" псевдонима.
К примеру, если сделать "ll" псевдонимом для "ls -l", то команда
будет исполняться какll /etc
ls -l /etc
Для определения псевдонимов используется оператор alias. Пример:
Аналогично определению переменных, вокруг символа "=" не должно быть пробелов, а если в "значении" псевдонима есть пробелы или спецсимволы, то его следует "закавычить".alias ll='ls -l'
Посмотреть список псевдонимов можно командой alias без параметров:
bobby:~% alias ls='/bin/ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% _ |
"Разопределить" псевдоним можно командой unalias:
bobby:~% alias ls='ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% alias ll='ls -l' bobby:~% alias ll='ls -l' ls='ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% unalias ll bobby:~% alias ls='/bin/ls --color=tty -F -T 0' run-help=man which-command=whence bobby:~% _ |
У псевдонимов есть две уникальных особенности. Во-первых, shell проверяет, не псевдоним ли это, до того, как начнет искать команду с таким именем. Во-вторых, после "подстановки" значения псевдонима первое слово получившейся команды опять проверяется на предмет того, не является ли оно псевдонимом, но "уже найденные" псевдонимы при этом не учитываются.
Таким образом, можно определить псевдоним с именем уже существующей команды, слегка модифицировав ее поведение или даже полностью заменив ее. В приведенном выше примере команда ls модифицирована так, чтобы всегда автоматически указывались коючи "--color=tty", "-F" и "-T 0".
Поскольку значения псевдонимов также проверяются на псевдонимы, то в приведенном примере при использовании псевдонима ll команде ls будут указываться дополнительные ключи.
"Вручную" псевдонимы практически никогда не делаются, а их определения обычно помещаются в стартовые файлы shell, аналогично определениям переменных окружения.
Единственное, чего псевдонимы не умеют -- так это "работать" в качестве скриптов с параметрами. Но для этого служат функции.
Функция в shell, как и в обычных языках программирования -- это небольшой фрагмент кода, выполняющий некое логически законченное действие, и, возможно, вызываемый из основной программы несколько раз.
Функция -- это как бы скрипт внутри скрипта.
Синтаксис определения функции следующий:
function ИМЯ_ФУНКЦИИ () { команды тела функции }
Внутри функции имена "$1", "$2" и т.д. содержат параметры, указанные в вызове функции, аналогично тому, как обычно они содержат параметры, указанные скрипту (которые, в свою очередь, изнутри функции недоступны).
Например, переписать наш скрипт lls в виде функции можно следующим образом:
function lls () { ls -l $* | less }
Посмотреть список функций можно командой "typeset -f", а "разопределить" функцию -- командой "unset -f":
bobby:~% typeset -f lls () { ls --color=tty -F -T 0 -l $* | less } setenv () { export $1=$2 } bobby:~% unset -f lls bobby:~% typeset -f setenv () { export $1=$2 } bobby:~% _ |
Функции удобно применять в скриптах, а псевдонимы -- в интерактивной работе (т.е. для команд, вводимых непосредственно в командной строке).
Замечание. В zsh (но не в скриптах!) вместо "typeset -f" для просмотра списка функций можно использовать команду functions, а для "разопределения" вместо "unset -f" -- команду unfunction.В определении функций ключевое слово "function" необязательно, и его можно просто опускать.
В оболочках csh/tcsh функции не поддерживаются.
Под временным исполнением понимается способность системы исполнять указанные команды в указанное время без участия пользователя. При этом требуется лишь, чтобы был включен компьютер и загружена операционная система.
Есть два варианта временного исполнения: однократное исполнение команд в указанный день в указанное время (команда at) и периодическое исполнение одних и тех же команд -- например, раз в сутки (команда crontab).
В обоих случаях можно запускать только неинтерактивные команды -- т.е. такие, которые не взаимодействуют с терминалом, т.к. команды запускаются "сами по себе", без терминала. Хотя, в принципе, можно запускать таким образом X-программы, делать это следует с осторожностью.
Результат исполнения команд (т.е. то, что они в обычной ситуации
выдали бы на экран) будет послан по e-mail. Если выдача пустая, то
письмо не посылается.
Команда at позволяет указать системе, что некую
последовательность команд (реально -- скрипт на языке shell) надо
исполнить в указанное время. Этот набор команд называется
заданием.
("At" в переводе означает "в", т.е. "исполнить В такое-то время".)
Формат вызова at следующий:
Если есть ключ "-f", то at считает скрипт из
указанного файла, если нет -- то со стандартного ввода (обычно с
клавиатуры, завершить ввод при этом надо комбинацией <Ctrl+D>).
Время исполнения можно указывать несколькими способами -- почти что
на обычном английском языке. Во времени можно указывать собственно
время суток и день.
Ниже приведено несколько примеров указания времени. При этом
предполагается что они указываются в субботу, 15 мая 1999 года в
18:10.
День указывается после времени. Если день не указан, то
подразумевается текущий день или, если это время уже прошло (как во
втором примере), следующий. Аналогично, если указанные месяц/день уже
прошли, то считается, что они относятся к следующему году.
Пробелы в указании времени неважны, а перед годом обязательно должна
стоять запятая.
Если указывается уже прошедшее время, то разные системы ведут себя
по разному -- к примеру, в ответ на "03:00 saturday" Linux
выполнит скрипт немедленно, а Irix скажет "too late".
Приведенных примеров обычно достаточно, но если хочется посмотреть
полную спецификацию формата указания времени, то она есть (в виде
специальной формы нотации Бэкуса-Наура) в файле
Пример использования at:
В этом примере в 11 часов вечера текущего дня будет выполнена
команда who (показывающая список пользователей), а результат
ее исполнения будет отправлен пользователю "ivanov@bobby".
При чтении списка команд не из файла (т.е. без ключа "-f"),
at предваряет каждую вводимую строку приглашением
"at>". Символы "<EOT>" показывают то место,
где мы нажали <Ctrl+D>.
В конце at печатает напоминание, что скрипт будет
выполняться при помощи интерпретатора /bin/sh, а также
идентификатор задания и время исполнения в виде "год-месяц-день
часы:минуты".
Идентификатор задания служит для дальнейших ссылок на него -- он
показывается в листинге заданий и должен указываться при необходимости
удалить задание. В разных системах идентификаторы заданий имеют разный
формат -- в Linux это просто последовательно увеличивающееся число, а в
других системах оно может, к примеру, иметь вид "926798400.a" или
"947883600.a+500".
Для просмотра списка заданий служит команда atq:
Она отображает номер задания, время исполнения и номер очереди, в
которой оно находится. По умолчанию все задания помещаются в очередь
"a". У исполняющихся в данный момент заданий вместо очереди
отображается символ "=":
(Команда sleep "спит" (т.е. ничего не делает) в течение
указанного количества секунд.)
Удалить задание из очереди можно командой atrm, ей
указывается идентификатор задания:
При попытке удалить уже исполняющееся задание выдается сообщение
"Warning: deleting running job", и хотя задание из очереди удаляется,
оно продолжает исполняться.
Просмотреть содержимое задания можно командой "at -c".
Ее выдача довольно показательна: в начало скрипта добавляется
настройка переменных окружения (т.е. всем переменным окружения,
существующим на момент запуска at, присваиваются такие же
значения).
Для периодического исполнения команд служит подсистема Cron, а
команда для редактирования списка команд используется команда
crontab.
(Слово "cron" -- это сокращение от "chronograph".)
У каждого пользователя для управления периодическим исполнением
своих команд есть собственный так называемый crontab-файл
("crontab" -- "CRON driving TABle" -- "таблица управления Cron'ом).
Этот (изначально пустой) файл расположен в недоступной для самого
пользователя директории, и может просматриваться и редактироваться
только при помощи команды crontab.
У команды crontab есть четыре варианта вызова:
Для редактирования по умолчанию вызывается vi (причем в RedHat
5.2 crontab его не находит и "обламывается"). Чтобы
использовать другой текстовый редактор (например, joe), надо указать
его в переменной окружения EDITOR:
В каждой строке crontab-файла указывается команда и периодичность ее
запуска. Пустые строки и строки, начинающиеся с символа "#",
игнорируются.
Каждая строка состоит из шести полей, разделенных пробелами или
символами табуляции. Формат строки следующий:
Например, строка
Команды могут быть любыми, а не только скриптами. Вообще говоря,
могут указываться любые сложные команды, допустимые в языке shell, в
том числе содержащие перенаправление ввода/вывода. Но команды следует
указывать с полным путем -- т.е.
/home/users/ivanov/bin/mystatcmd, а не просто
"mystatcmd". (Другой вариант -- присвоить в начале
crontab-файла значение переменной окружения PATH, но мы это
рассматривать не будем.)
Месяцы нумеруются с 1 по 12, дни недели -- с 0 по 6 (0 --
воскресенье, 1 -- понедельник, 6 -- суббота). В Linux месяцы и дни
недели можно указывать трехсимвольными именами (т.е. Jan, Feb, Mar...; Sun,
Mon, Tue...).
Cron исполняет команду тогда, когда значения всех полей
Минута, Час, Месяц и ДеньНедели или ДеньМесяца совпадают с текущим
временем. Символ "*" означает "любое" или "каждое". Можно указывать
несколько значений через запятую, например "10,30,50" в поле
Минута означает "в 10, 30 и 50 минут". Допускаются также диапазоны
через дефис, например, "1-5" в поле ДеньНедели означает "с
понедельника по пятницу".
Для указания дня служат два поля: ДеньМесяца и ДеньНедели. Команда
будет запускаться, когда значение любого из этих полей совпадает
с текущим днем. Например, строка
Несколько примеров:
Очень хорошая и полная документация на crontab-файлы есть в
man-странице crontab(5) (т.е. для просмотра надо
набрать "man 5 crontab").
Для поиска файлов в Unix предназначены две команды -- find
и locate. Первая выполняет поиск непосредственно в момент
запуска, а вторая делает поиск по списку файлов (базе данных), который
обновляется обычно раз в сутки (в большинстве систем -- поздно ночью
или рано утром).
У обеих команд есть как достоинства, так и недостатки. Так,
find выдает результаты по текущему, "мгновенному" состоянию
диска, но, к примеру, поиск по всему диску может занимать очень много
времени. Напротив, locate выполняет поиск очень быстро, но
во-первых, в базе данных может быть несколько устаревшая информация, а
во-вторых, база данных составляется "из-под" пользователя
"nobody" и не содержит информации о тех директориях, которые
для него закрыты.
Кроме того, для быстрого поиска файлов, относящихся к программам, в
RedHat Linux можно использовать команду
rpm с ключом "-qal" в паре с командой grep.
Как find, так и locate позволяют указывать шаблон
имени файла, содержащий специальные символы "*", "?" и
т.д. Такие шаблоны надо заключать в кавычки, чтобы shell не пытался их
интерпретировать.
Вызов find Команда find ищет в указанных директориях и ниже файлы,
отвечающие заданному критерию ("test"). Причем критерием может
быть не только имя файла, но и, к примеру, время модификации, размер
или тип (файл/директория/линк и т.д). Критерии могут объединяться при
помощи булевских операторов, так что можно найти, например, все файлы с
расширением .txt размером не более 10К, модифицированные не
позднее прошлого месяца.
Формат вызова find следующий:
Если не указывать директории, то будут найдены все отвечающие
указанному критерию файлы в текущей директории и ниже. Если не
указывать критерий, то будет выдан список всех файлов из указанных
директорий. Если же не указывать ни то, ни другое, то будет выдан
список всех файлов из текущей директории.
Директории в списке указываются через пробел. Имена критериев
всегда начинаются с "-", аналогично ключам.
Поиск файла по имени Самое частое использование find -- поиск файлов по имени.
Для этого служит критерий "-name", которому указывается шаблон
имени. К примеру, чтобы найти на всем диске все файлы с расширением
.txt, надо воспользоваться командой
GNU-версия find, используемая в Linux, понимает также
критерий "-iname", отличающийся тем, что маленькие и большие
буквы не различаются. Так, команда
Поиск с несколькими критериями Если указать несколько критериев, то find найдет только
файлы, соответствующие всем критериям сразу.
К примеру, критерий "-type" позволяет указать тип файла --
обычный ("f"), директория ("d") и т.д. Таким образом,
чтобы найти в директории /etc все директории, имена которых
начинаются на "cron", надо сделать слежующее:
В то время как поиск просто по имени дал бы несколько лишних файлов:
Исполнение команды с найденными файлами Кроме критериев команде find можно указывать также
действия ("actions"). Если никакое действие не указано, то
find по умолчанию добавляет "-print", чтобы напечатать
имя файла. Т.е. команда
Наиболее часто требуется действие "-exec", позволяющее
выполнить с найденным файлом некую команду, чаще всего --
ls -l.
Пример (выдать "длинный" листинг всех файлов из директории
/etc, в имени которых содержится "pass"):
Необходимое пояснение: "-exec" воспринимает все, что стоит
после него и до слова ";", как команду, которую надо выполнить.
Причем сочетание символов "{}" заменяется на имя файла.
Поскольку и ";", и "{}" являются специальными символами
для shell, их надо "закавычить".
Команда locate ищет указанные имена в базе данных,
содержащей список файлов. Формат вызова locate следующий:
Пример:
При указании нескольких имен locate найдет файлы,
соответствующие любому из имен:
Если ИМЯ не содержит специальных символов шаблона, то
locate находит все файлы, в любом месте полного имени которых
(т.е. включая директорию) встречается указанная строка. Т.е.
locate в этом случае работает просто как grep по
списку файлов.
Если же ИМЯ содержит символы "*", "?" или
"[]", то locate находит только строки, которые
точно соответствуют шаблону.
Например, команда
Для того же, чтобы увидеть все файлы из /usr/X11R6, в
имени которых встречается "jewel", надо в конце шаблона также
поставить "*":
В любом случае символы "." и "/" не являются
особенными. Таким образом, шаблон "*et*pass*" найдет файл
/etc/passwd.
В Linux индексирование (т.е. создание базы данных) выполняется
программой updatedb, которая автоматически запускается
ежедневно при помощи Cron. В RedHat Linux это выполняется из файла
/etc/cron.daily/updatedb.cron. Таким образом, чтобы заставить
updatedb индексировать, к примеру, раздел, смонтированный в
/home, надо просто добавить его (через пробел) в список
разделов в ключе "--localpaths" (т.е. чтобы было что-то типа
"--localpaths='/ /home").
Wget -- это программа для "вытягивания" файлов из Internet
при помощи протоколов HTTP или FTP.
Основные достоинства Wget:
Wget выдает список всех опций при вызове с ключом
"--help", причем поскольку выдача довольно длинная, лучше
пользоваться командой
Для того, чтобы узнать все возможности Wget, следует
заглянуть в info-документацию по нему.
Поскольку у wget есть огромное количество ключей,
модифицирующих его поведение, мы рассмотрим на примерах несколько
наиболее часто используемых случаев.
Простое скачивание файла В самом простом случае программе указывается один параметр URL --
ссылка на файл, который надо получить:
При скачивании каждого килобайта отображается один символ
".".
Можно указать подряд несколько URL -- в этом случае файлы будут
скачаны один за другим.
Скачивание при плохой связи Для того, чтобы wget повторял попытки взять файл до тех
пор, пока не скачает его целиком, надо указывать ключи "-c" и
"-t 0". Первый означает "продолжать качать с того места,
где соединение оборвалось" (continue), а второй позволяет
указать число попыток, 0 -- бесконечно.
Например, чтобы скачать исходные тексты проигрывателя .mp3-файлов
X11Amp, можно воспользоваться командой
Реально ключи "-c -t 0" стоит указывать
практически всегда, кроме как разве что в локальной сети.
Шаблоны При перекачке по FTP можно в именах файлов указывать шаблоны
(естественно, "закавычивая" их). Например, команда
Рекурсивное скачивание Для рекурсивного скачивания используются ключи "-r",
"-l" и "-np". Ключ "-r" (recursive)
включает рекурсивность. Ключ "-l" (level) позволяет
указать насколько "глубоко" программа должна следовать по ссылкам; 0 --
бесконечно глубоко, по умолчанию установлено 5. И, наконец, ключ
"-np" (no parent) запрещает следовать ссылкам
выше указанной директории.
При рекурсивном скачивании wget автоматически создает
соответствующее дерево директорий.
К примеру, следующая команда могла бы использоваться для скачивания
целого домашнего сайта (адрес вымышленный):
При этом файлы будут помещаться в директорию
./www.h-hosts.com/users/goofy/.
Почитать про Протокол Web-роботов можно в info-документации по
Wget, воспользовавшись командой
Фоновый режим При указании ключа "-b" (background) программа сразу
переходит в фоновый режим, так что пользователь может заниматься
другими делами или даже выйти из системы -- wget будет
продолжать свою работу.
При сообщения, которые выдавались бы на экран, будут идти в файл
wget.log (а если он уже есть, то в wget.log.1,
wget.log.2 и т.д.).
Пример:
Для просмотра log-файла по мере скачивания удобно пользоваться
командой "tail -f":
Использование прокси-серверов Wget умеет пользоваться прокси-серверами как для HTTP, так
и для FTP. Достаточно перед вызовом программы присвоить адрес
прокси-сервера переменным окружения http_proxy или
ftp_proxy соответственно (имена маленькими буквами!).
Wget понимает как "официальное" указание адреса, так и
сокращенное. Поэтому команды
Скачивание "через перевалочную базу" Современные академгородковские реалии таковы, что зачастую скачать файл с
некоего зарубежного сервера напрямую не удается из-за плохой связи. При этом
иногда не помогает даже способность Wget к докачке.
Можно обойти эту проблему, если есть доступ (по telnet, rlogin или
ssh) к unix-эккаунту где-нибудь за рубежом, где связь намного лучше.
При этом выполняются следующие действия:
Такой подход дает большую гибкость по сравнению с прямой
перекачкой, а уменьшение размера кусочков, на которые разбивается файл,
иногда позволяет достичь необходимой надежности.
Для копирования информации между компьютерами и в качестве архива
очень часто используются дискеты. Хотя в принципе у каждой операционной
системы (Dos/Windows, MacOS, SunOS/Solaris, Linux и т.д.) есть свой
формат для дискет, чаще всего используются дискеты с разметкой MS-Dos.
Хотя самый прямой способ работы с дискетами Dos в Linux -- это
просто смонтировать дискету, например, командой
Программы из этого пакета позволяют работать как с дискетами 3.5 и
5.25 дюйма, так и с дисками Zip и Jaz. Причем поддерживаются длинные
имена файлов Windows95/NT (т.е. расширения файловой системы VFAT).
Пакет Mtools содержит следующие основные программы, выполняющие те
же действия, что и аналогичные программы MS-Dos: mdir,
mcopy, mren, mdel, mmd,
mrd, mformat и еще некоторые.
Несколько общих правил и отличий от MS-Dos:
Кроме того, Mtools следует принятому в Unix соглашению о шаблонах --
"любой файл" это не "*.*", а просто "*".
Таким образом, любой пользователь может просматривать директорию с
дискеты и копировать оттуда файлы, но не писать туда:
Чтобы дать возможность записи, надо или открыть эти устройства всем
на запись командой
Детали по использованию каждой конкретной программы следует смотреть
на ее man-странице. Кроме того, достаточно полное описание содержится
в info-документации по mtools.
Исполнение скрипта в указанное время -- at
Указание Смысл 19:00 Сегодня в 7 часов вечера 0 минут 17:30 Завтра в 5 часов 30 минут после полудня now + 53 minutes Через 53 минуты (т.е. в 19:03) now + 1 day Завтра в это же время 13:20 tomorrow Завтра в 13:20 10:00 today + 5 days В 10 часов утра через пять дней (т.е. 20 мая) 14:30 Feb 15,2001 В 14:30 15 февраля 2001 года
bobby:~% whoami
ivanov
bobby:~% at 23:00 today
at> who
at> <EOT>
warning: commands will be executed using /bin/sh
job 12 at 1999-05-15 23:00
bobby:~% _
viper:~% atq
12 1999-05-15 23:00 a
viper:~% _
bobby:~% at now
at> sleep 120
at> w
at> <EOT>
warning: commands will be executed using /bin/sh
job 14 at 1999-05-15 19:05
bobby:~% atq
12 1999-05-15 23:00 a
14 1999-05-15 19:05 =
bobby:~% _
bobby:~% atq
12 1999-05-15 23:00 a
bobby:~% atrm 12
bobby:~% atq
bobby:~% _
Замечание.
В системах клона SystemV (таких, как Solaris и IRIX) вместо команды
atrm используется "at -r", а вместо atq
-- "at -l". Команда "at -c" в них не
поддерживается.
Периодическое исполнение команд -- crontab
Команда Действие crontab ФАЙЛ Скопировать ФАЙЛ в crontab-файл crontab -l Выдать содержимое crontab-файла crontab -r Удалить crontab-файл crontab -e Редактировать crontab-файл
bobby:~% export EDITOR=joe
bobby:~% crontab -e
будет каждый понедельник в 23:00 запускать команду who и
отсылать по e-mail выдаваемый ею список пользователей.
Замечание.
Узнать полный путь программы можно при помощи команды which.
Например, команда "which finger" выдаст
"/usr/bin/finger".
будет запускать vmstat в 4:30 утра по первым и пятнадцатым
числам каждого месяца, плюс каждую пятницу.
# Запускать df каждый день в 7:00 утра
0 7 * * * /bin/df
# Заказывать кофе каждый рабочий день в 10:00, 13:00 и 17:00
0 10,13,17 * * 1-5 echo Now| mail -s "Coffee, please" waitor@restaurant
# Производить подсчет своего бюджета 6 и 21 числа каждого месяца
0 14 6,21 * * /home/users/ivanov/bin/calcbudget
Замечание.
В старых BSD-системах пользоваться подсистемой Cron может только
"root" (если только стандартный пакет Cron не заменен на
Vixie-Cron, что, впрочем, в последнее время стало почти правилом).
Поиск файлов на диске
Команды для поиска файлов
Поиск по диску сейчас -- find
найдет все файлы с расширениями .exe, .EXE,
.Exe и т.д.
bobby:~% find /etc -name 'cron*' -type d
find: /etc/X11/xdm/authdir: Permission denied
/etc/cron.daily
/etc/cron.hourly
/etc/cron.monthly
/etc/cron.weekly
bobby:~% _
bobby:~% find /etc -name 'cron*'
find: /etc/X11/xdm/authdir: Permission denied
/etc/rc.d/init.d/crond
/etc/logrotate.d/cron
/etc/cron.daily
/etc/cron.hourly
/etc/cron.monthly
/etc/cron.weekly
bobby:~% _
реально работает как
bobby:~% find /etc -name '*pass*' -type f -exec ls -l '{}' ';'
-rw-r--r-- 1 root root 1362 Apr 16 20:21 /etc/passwd
-rwxr-xr-x 1 root root 97 Oct 13 1998 /etc/X11/wmconfig/u
serpasswd
find: /etc/X11/xdm/authdir: Permission denied
-rw-r--r-- 1 root root 239 Apr 27 1998 /etc/pam.d/passwd
-rw-r--r-- 1 root root 1362 Apr 16 20:10 /etc/passwd-
-rw-r--r-- 1 root root 1363 Apr 16 20:20 /etc/passwd.OLD
bobby:~% _
Поиск по списку файлов диска -- locate
bobby:~% locate Monitors
/usr/X11R6/lib/X11/doc/Monitors
/usr/X11R6/share/Xconfigurator/MonitorsDB
bobby:~% _
bobby:~% locate xsnow xroach
/etc/X11/wmconfig/xsnow
/usr/share/icons/mini/mini-xsnow.xpm
/usr/X11R6/bin/xsnow
/usr/X11R6/include/X11/bitmaps/xsnow
/usr/X11R6/man/man1/xsnow.1x
/usr/X11R6/bin/xroach
/usr/X11R6/man/man1/xroach.man
/var/catman/X11R6/cat1/xroach.man.gz
bobby:~% _
покажет все файлы из директории /usr/X11R6, имя которых
заканчивается на "jewel", а именно программу xjewel,
но не man-страницу по ней:
bobby:~% locate '/usr/X11R6/*jewel'
/usr/X11R6/bin/xjewel
bobby:~% _
bobby:~% locate '/usr/X11R6/*jewel*'
/usr/X11R6/bin/xjewel
/usr/X11R6/man/man1/xjewel.1x
bobby:~% _
Предупреждение.
По умолчанию в базу данных, которую просматривает locate,
попадают лишь файлы с корневой файловой системы (т.е. /).
Если же, к примеру, все home-директории пользователей расположены на
отдельном разделе (который монтируется, например, в /home),
то администратор системы должен добавить этот раздел в список
индексируемых.
Замечание.
Команда locate есть только в BSD-системах и в Linux, в системах
клона SystemV она отсутствует.
Программа wget
Что такое wget
Использование
bobby:~/soft% wget ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/dosuti
ls/lodlin16.tgz
--15:23:43-- ftp://rdist.inp.nsk.su:21/pub/Linux/redhat-5.2/i386/dosutils
/lodlin16.tgz
=> `lodlin16.tgz'
Connecting to rdist.inp.nsk.su:21... connected!
Logging in as anonymous ... Logged in!
==> TYPE I ... done. ==> CWD pub/Linux/redhat-5.2/i386/dosutils ... done.
==> PORT ... done. ==> RETR lodlin16.tgz ... done.
Length: 87,210 (unauthoritative)
0K -> .......... .......... .......... .......... .......... [ 58%]
50K -> .......... .......... .......... ..... [100%]
15:23:43 (604.01 KB/s) - `lodlin16.tgz' saved [87210]
bobby:~/soft% _
скачает все обновления к системе XFree86.
Замечание.
Wget, будучи культурной программой, при рекуррентном
скачивании уважает т.н. "Протокол Web-роботов", и может пропускать
часть файлов (запрещенных в файле robots.txt на сервере).
Чтобы отключить эту "культурность", можно воспользоваться ключом
"-e robots=off".
или по адресу
http://info.webcrawler.com/mak/projects/robots/robots.html
bobby:~/soft% wget -b http://www.mit.edu/afs/sipb/user/xiphmont/cdpa
ranoia/download/cdparanoia-III-alpha9.5.src.tgz
Continuing in background.
Output will be written to `wget-log'.
bobby:~/soft% _
bobby:~/soft% tail -f wget-log
--16:16:45-- http://www.mit.edu:80/afs/sipb/user/xiphmont/cdparanoia/down
load/cdparanoia-III-alpha9.5.src.tgz
=> `cdparanoia-III-alpha9.5.src.tgz'
Connecting to www.mit.edu:80... connected!
HTTP request sent, awaiting response... 200 OK
Length: 92,595 [application/octet-stream]
0K -> .......... .......... .......... .......... .......... [ 55%]
50K -> ..._
и
эквивалентны.
Предупреждение.
Пользоваться таким приемом можно только в том случае, если это не нарушает
политики, принятой в тех учреждениях, которых это касается.
Работа с дискетами Dos
Пакет mtools
есть более удобное средство -- пакет Mtools.
Команда Комментарий mdir a: Показать директорию диска A: mdel a:/report.txt Удалить с диска A: файл report.txt mcopy a:/misc/nc110.tgz ./ Скопировать с диска A: из директории misc файл nc110.tgz в текущую директорию mmd a:/papers
mcopy conf99.tex a:/papersСоздать в корне диска A: директорию papers и затем скопировать туда из текущей директории файл conf99.tex mformat b: Отформатировать диск B:
следует использовать
bobby:~% ls -l /dev/fd?
brw-rw-r-- 1 root floppy 2, 0 May 6 1998 /dev/fd0
brw-rw-r-- 1 root floppy 2, 1 May 6 1998 /dev/fd1
bobby:~% _
bobby:~% mcopy a:autoexec.bat .
bobby:~% mcopy files.bbs a:
Can't open /dev/fd0: Permission denied
Cannot initialize 'A:'
Bad target a:
bobby:~% _
или, что гораздо правильнее, занести тех, кто должен иметь возможность
писать на дискеты, в группу "floppy"; всем остальным при этом
лучше даже убрать право на чтение --
Практические задания
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/images/boot.img
и когда будет скачано около половины, прервать перекачку, нажав
<Ctrl+C>. Затем докачать файл.
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/dosutils/
ftp://rdist.inp.nsk.su/pub/Linux/redhat-5.2/i386/doc/rhmanual/