Что такое скрипт Скрипт -- это программа на языке shell. Вместо термина скрипт иногда используется термин сценарий. Скрипт в Unix -- это практически то же самое, что командный файл в Dos (.bat-файлы) и VMS (.com-файлы). Отличие в том, что, поскольку скрипты являются обычными программами, то вызываются они просто по имени (а не специальной командой типа "call" или "@"), могут иметь произвольное имя (специальное расширение типа .bat не нужно), и нет ограничений на глубину вызовов скриптов из других скриптов. Простейший скрипт -- это несколько обычных команд shell, которые должны выполняться последовательно. При обычной работе в командной строке shell зачастую приходится писать довольно длинные команды, постоянно набирать которые заново в конце концов попросту надоедает (да и вероятность допустить опечатку тем выше, чем длиннее команда). Некоторые последовательности команд приходится повторять также все снова и снова. Вот такие команды и их последовательности и являются хорошими кандидатами для помещения в скрипты, чтобы потом их можно было вызвать по короткому имени. Язык shell, однако, довольно мощный -- он позволяет работать с переменными, содержит конструкции типа "while", "for", "if-then-else", функции и другие атрибуты, присущие языкам структурного программирования. Это позволяет выполнять на shell достаточно сложные действия. Многие программы в Unix являются именно скриптами -- например, startx и больщинство программ, выполняющих инициализацию/останов системы (они расположены в /etc/rc.d/). Хотя термин "скрипт" обычно подразумевает сценарий на языке shell, в Unix есть и другие скрипт-языки, зачастую специализированные. Все они объединяются тем, что являются интерпретаторами -- т.е. программа является текстовым файлом, который исполняется сразу же, не требуя предварительной компиляции в бинарный файл. В многообразном мире Unix у такого подхода есть большое достоинство: один и тот же скрипт может без всяких изменений использоваться в разных видах Unix (в том числе и браться ими непосредственно из одного файла -- например, по NFS). Как сделать скрипт Как говорилось выше, простейший скрипт -- это несколько команд shell, записанных в файл. Создавать файлы скриптов удобнее всего в текстовом редакторе, но можно и при помощи команды "cat >файл" -- при этом cat принимает ввод с клавиатуры до нажатия <Ctrl+D>. Чтобы дать понять системе, что это исполняемый файл (программа), надо установить для него атрибут "x". Пример: создание скрипта, содержащего команду "ls -l | less":
Запустить затем этот скрипт можно, набрав "./lls". Но, находясь в другой директории, придется вызывать этот скрипт по полному имени (например, "~/lls"), что довольно неудобно. Поэтому следует поместить такую "свежесделанную" программу в одну из директорий, перечисленных в переменной окружения PATH. Чтобы у каждого пользователя была возможность создавать и удобно запускать свои программы, в переменной PATH всегда присутствует ссылка на поддиректорию bin/ в home-директории пользователя:
Если в home-директории bin/ отсутствует, то ее надо просто создать командой "mkdir ~/bin". Скрипты (как, впрочем, и любые другие программы), расположенные в ~/bin/, вызываются просто по имени:
Если в первой строчке скрипта стоит "#!/bin/sh"... Поскольку скрипты написаны на языке shell, то они должны исполняться (интерпретироваться) какой-то программой. По умолчанию в качестве интерпретатора система использует /bin/sh. Но можно явно указать интерпретатор, если в начале самой первой строки файла поставить символы "#!" ("решетка" и восклицательный знак), а затем -- полный путь к программе-интерпретатору. Например, чтобы воспользоваться в скрипте дополнительными возможностями, предоставляемыми zsh по сравнению с sh, надо поставить первой строкой
Таким образом, при отсутствии "#!" система ведет себя так, как если бы там стояло "#!/bin/sh". Вообще говоря, хорошим тоном считается в обычных shell-скриптах ставить эту строку, хотя она и не обязательна -- тогда по файлу сразу ясно, что он является shell-скриптом. В скриптах на других языках в первой строке обязательно указывается программа-интерпретатор -- например, для Perl -- "#!/usr/bin/perl". Скрипты с параметрами Поскольку обычные программы могут вызываться с некоторыми параметрами (например, "ls /etc"), то рано или поздно такая же необходимость возникает и в скриптах. Для подстановки значения первого указанного параметра используется название "$1", второго -- "$2" и т.д. -- аналогично массиву "argv[]" в программах на языке C. Таким образом, если переделать наш скрипт lls из в то он будет показывать при помощи less длинный листинг не текущей, а указанной директории. Если при вызове lls не будет указана никакая директория, то "$1" будет равен "ничему" (пустой строке), и в результате получится команда "ls -l | less" -- та же, что и раньше. Специальное название "$*" означает "все параметры". Таким образом, если переделать наш скрипт в то, к примеру, команда будет воспринята как
Использование переменных Как известно из теории программирования, практически любая программа рано или поздно потребует для гибкости использования переменных. Переменные в языке shell -- это почти то же самое, что переменные окружения. В отличие от таких языков, как C или Pascal, все переменные в shell -- строковые (а не числовые). Для присвоения переменной значения служит конструкция вида (вокруг "=" не должно быть пробелов!). Если присваиваемое переменной значение содержит пробелы или какие-либо символы, имеющие специальный смысл для shell (*, <, >, & и т.д.), то значение надо заключить в кавычки. Для получения значения переменной используется конструкция $ИМЯ (в отличие от Makefile, скобки вокруг имени указывать не следует). Заметьте, что это очень похоже на использование параметров $1, $2 и т.д. -- для shell они являются псевдопеременными ("псевдо" потому, что значения их изменять нельзя). Таким образом, и использованием переменных наш скрипт можно переписать следующим образом: LS="ls -l" VIEWER=less $LS $* | $VIEWER (Конечно, не самый осмысленный пример, но весьма наглядный.) Другие скрипт-языки Кроме shell, в Unix существует еще довольно много языков для скриптов. В таблице ниже приведены наиболее распространенные и частоиспользуемые из них.
Где можно почитать про создание shell-скриптов Хорошим пособием является книги Б.Керниган, Р.Пайк "UNIX - универсальная среда программирования", главы 3-5, и У.Дэвис "Операционные системы", М., Мир, 1986. В качестве справочника по конструкциям языка shell стоит использовать man-страницу на sh или bash (собственно, именно bash "работает" в Linux в качестве sh, в этом легко убедиться при помощи команды "ls -l /bin/sh"). | |||||||||||||||||||||||||||||||||||
Для простых частоиспользуемых команд необязательно создавать скрипт -- достаточно сделать "псевдоним" (alias). Shell всегда проверяет самое первое слово каждой команды (т.е. собственно имя команды), не является ли оно псевдонимом, и если да, то заменяет его "значением" псевдонима. К примеру, если сделать "ll" псевдонимом для "ls -l", то команда будет исполняться как
Для определения псевдонимов используется оператор alias. Пример: Аналогично определению переменных, вокруг символа "=" не должно быть пробелов, а если в "значении" псевдонима есть пробелы или спецсимволы, то его следует "закавычить". Посмотреть список псевдонимов можно командой alias без параметров:
"Разопределить" псевдоним можно командой unalias:
У псевдонимов есть две уникальных особенности. Во-первых, shell проверяет, не псевдоним ли это, до того, как начнет искать команду с таким именем. Во-вторых, после "подстановки" значения псевдонима первое слово получившейся команды опять проверяется на предмет того, не является ли оно псевдонимом, но "уже найденные" псевдонимы при этом не учитываются. Таким образом, можно определить псевдоним с именем уже существующей команды, слегка модифицировав ее поведение или даже полностью заменив ее. В приведенном выше примере команда ls модифицирована так, чтобы всегда автоматически указывались коючи "--color=tty", "-F" и "-T 0". Поскольку значения псевдонимов также проверяются на псевдонимы, то в приведенном примере при использовании псевдонима ll команде ls будут указываться дополнительные ключи. "Вручную" псевдонимы практически никогда не делаются, а их определения обычно помещаются в стартовые файлы shell, аналогично определениям переменных окружения. Единственное, чего псевдонимы не умеют -- так это "работать" в качестве скриптов с параметрами. Но для этого служат функции. | ||||
Функция в shell, как и в обычных языках программирования -- это небольшой фрагмент кода, выполняющий некое логически законченное действие, и, возможно, вызываемый из основной программы несколько раз. Функция -- это как бы скрипт внутри скрипта. Синтаксис определения функции следующий: function ИМЯ_ФУНКЦИИ () { команды тела функции } Внутри функции имена "$1", "$2" и т.д. содержат параметры, указанные в вызове функции, аналогично тому, как обычно они содержат параметры, указанные скрипту (которые, в свою очередь, изнутри функции недоступны). Например, переписать наш скрипт lls в виде функции можно следующим образом: function lls () { ls -l $* | less } Посмотреть список функций можно командой "typeset -f", а "разопределить" функцию -- командой "unset -f":
Функции удобно применять в скриптах, а псевдонимы -- в интерактивной работе (т.е. для команд, вводимых непосредственно в командной строке).
| |||||||||
Под временным исполнением понимается способность системы исполнять указанные команды в указанное время без участия пользователя. При этом требуется лишь, чтобы был включен компьютер и загружена операционная система. Есть два варианта временного исполнения: однократное исполнение команд в указанный день в указанное время (команда at) и периодическое исполнение одних и тех же команд -- например, раз в сутки (команда crontab). В обоих случаях можно запускать только неинтерактивные команды -- т.е. такие, которые не взаимодействуют с терминалом, т.к. команды запускаются "сами по себе", без терминала. Хотя, в принципе, можно запускать таким образом X-программы, делать это следует с осторожностью. Результат исполнения команд (т.е. то, что они в обычной ситуации выдали бы на экран) будет послан по e-mail. Если выдача пустая, то письмо не посылается. | ||
Команда at позволяет указать системе, что некую последовательность команд (реально -- скрипт на языке shell) надо исполнить в указанное время. Этот набор команд называется заданием. ("At" в переводе означает "в", т.е. "исполнить В такое-то время".) Формат вызова at следующий:
Если есть ключ "-f", то at считает скрипт из указанного файла, если нет -- то со стандартного ввода (обычно с клавиатуры, завершить ввод при этом надо комбинацией <Ctrl+D>). Время исполнения можно указывать несколькими способами -- почти что на обычном английском языке. Во времени можно указывать собственно время суток и день. Ниже приведено несколько примеров указания времени. При этом предполагается что они указываются в субботу, 15 мая 1999 года в 18:10.
День указывается после времени. Если день не указан, то подразумевается текущий день или, если это время уже прошло (как во втором примере), следующий. Аналогично, если указанные месяц/день уже прошли, то считается, что они относятся к следующему году. Пробелы в указании времени неважны, а перед годом обязательно должна стоять запятая. Если указывается уже прошедшее время, то разные системы ведут себя по разному -- к примеру, в ответ на "03:00 saturday" Linux выполнит скрипт немедленно, а Irix скажет "too late". Приведенных примеров обычно достаточно, но если хочется посмотреть полную спецификацию формата указания времени, то она есть (в виде специальной формы нотации Бэкуса-Наура) в файле
Пример использования at:
В этом примере в 11 часов вечера текущего дня будет выполнена команда who (показывающая список пользователей), а результат ее исполнения будет отправлен пользователю "ivanov@bobby". При чтении списка команд не из файла (т.е. без ключа "-f"), at предваряет каждую вводимую строку приглашением "at>". Символы "<EOT>" показывают то место, где мы нажали <Ctrl+D>. В конце at печатает напоминание, что скрипт будет выполняться при помощи интерпретатора /bin/sh, а также идентификатор задания и время исполнения в виде "год-месяц-день часы:минуты". Идентификатор задания служит для дальнейших ссылок на него -- он показывается в листинге заданий и должен указываться при необходимости удалить задание. В разных системах идентификаторы заданий имеют разный формат -- в Linux это просто последовательно увеличивающееся число, а в других системах оно может, к примеру, иметь вид "926798400.a" или "947883600.a+500". Для просмотра списка заданий служит команда atq:
Она отображает номер задания, время исполнения и номер очереди, в которой оно находится. По умолчанию все задания помещаются в очередь "a". У исполняющихся в данный момент заданий вместо очереди отображается символ "=":
(Команда sleep "спит" (т.е. ничего не делает) в течение указанного количества секунд.) Удалить задание из очереди можно командой atrm, ей указывается идентификатор задания:
При попытке удалить уже исполняющееся задание выдается сообщение "Warning: deleting running job", и хотя задание из очереди удаляется, оно продолжает исполняться. Просмотреть содержимое задания можно командой "at -c". Ее выдача довольно показательна: в начало скрипта добавляется настройка переменных окружения (т.е. всем переменным окружения, существующим на момент запуска at, присваиваются такие же значения).
| ||||||||||||||||||||||||||||
Для периодического исполнения команд служит подсистема Cron, а команда для редактирования списка команд используется команда crontab. (Слово "cron" -- это сокращение от "chronograph".) У каждого пользователя для управления периодическим исполнением своих команд есть собственный так называемый crontab-файл ("crontab" -- "CRON driving TABle" -- "таблица управления Cron'ом). Этот (изначально пустой) файл расположен в недоступной для самого пользователя директории, и может просматриваться и редактироваться только при помощи команды crontab. У команды crontab есть четыре варианта вызова:
Для редактирования по умолчанию вызывается vi (причем в RedHat 5.2 crontab его не находит и "обламывается"). Чтобы использовать другой текстовый редактор (например, joe), надо указать его в переменной окружения EDITOR:
В каждой строке crontab-файла указывается команда и периодичность ее запуска. Пустые строки и строки, начинающиеся с символа "#", игнорируются. Каждая строка состоит из шести полей, разделенных пробелами или символами табуляции. Формат строки следующий:
Например, строка будет каждый понедельник в 23:00 запускать команду who и отсылать по e-mail выдаваемый ею список пользователей. Команды могут быть любыми, а не только скриптами. Вообще говоря, могут указываться любые сложные команды, допустимые в языке shell, в том числе содержащие перенаправление ввода/вывода. Но команды следует указывать с полным путем -- т.е. /home/users/ivanov/bin/mystatcmd, а не просто "mystatcmd". (Другой вариант -- присвоить в начале crontab-файла значение переменной окружения PATH, но мы это рассматривать не будем.)
Месяцы нумеруются с 1 по 12, дни недели -- с 0 по 6 (0 -- воскресенье, 1 -- понедельник, 6 -- суббота). В Linux месяцы и дни недели можно указывать трехсимвольными именами (т.е. Jan, Feb, Mar...; Sun, Mon, Tue...). Cron исполняет команду тогда, когда значения всех полей Минута, Час, Месяц и ДеньНедели или ДеньМесяца совпадают с текущим временем. Символ "*" означает "любое" или "каждое". Можно указывать несколько значений через запятую, например "10,30,50" в поле Минута означает "в 10, 30 и 50 минут". Допускаются также диапазоны через дефис, например, "1-5" в поле ДеньНедели означает "с понедельника по пятницу". Для указания дня служат два поля: ДеньМесяца и ДеньНедели. Команда будет запускаться, когда значение любого из этих полей совпадает с текущим днем. Например, строка будет запускать vmstat в 4:30 утра по первым и пятнадцатым числам каждого месяца, плюс каждую пятницу. Несколько примеров:
Очень хорошая и полная документация на crontab-файлы есть в man-странице crontab(5) (т.е. для просмотра надо набрать "man 5 crontab").
| ||||||||||||||||||||||||||
Для поиска файлов в Unix предназначены две команды -- find и locate. Первая выполняет поиск непосредственно в момент запуска, а вторая делает поиск по списку файлов (базе данных), который обновляется обычно раз в сутки (в большинстве систем -- поздно ночью или рано утром). У обеих команд есть как достоинства, так и недостатки. Так, find выдает результаты по текущему, "мгновенному" состоянию диска, но, к примеру, поиск по всему диску может занимать очень много времени. Напротив, locate выполняет поиск очень быстро, но во-первых, в базе данных может быть несколько устаревшая информация, а во-вторых, база данных составляется "из-под" пользователя "nobody" и не содержит информации о тех директориях, которые для него закрыты. Кроме того, для быстрого поиска файлов, относящихся к программам, в RedHat Linux можно использовать команду rpm с ключом "-qal" в паре с командой grep. Как find, так и locate позволяют указывать шаблон имени файла, содержащий специальные символы "*", "?" и т.д. Такие шаблоны надо заключать в кавычки, чтобы shell не пытался их интерпретировать. | ||
Вызов find Команда find ищет в указанных директориях и ниже файлы, отвечающие заданному критерию ("test"). Причем критерием может быть не только имя файла, но и, к примеру, время модификации, размер или тип (файл/директория/линк и т.д). Критерии могут объединяться при помощи булевских операторов, так что можно найти, например, все файлы с расширением .txt размером не более 10К, модифицированные не позднее прошлого месяца. Формат вызова find следующий:
Если не указывать директории, то будут найдены все отвечающие указанному критерию файлы в текущей директории и ниже. Если не указывать критерий, то будет выдан список всех файлов из указанных директорий. Если же не указывать ни то, ни другое, то будет выдан список всех файлов из текущей директории. Директории в списке указываются через пробел. Имена критериев всегда начинаются с "-", аналогично ключам. Поиск файла по имени Самое частое использование find -- поиск файлов по имени. Для этого служит критерий "-name", которому указывается шаблон имени. К примеру, чтобы найти на всем диске все файлы с расширением .txt, надо воспользоваться командой
GNU-версия find, используемая в Linux, понимает также критерий "-iname", отличающийся тем, что маленькие и большие буквы не различаются. Так, команда найдет все файлы с расширениями .exe, .EXE, .Exe и т.д. Поиск с несколькими критериями Если указать несколько критериев, то find найдет только файлы, соответствующие всем критериям сразу. К примеру, критерий "-type" позволяет указать тип файла -- обычный ("f"), директория ("d") и т.д. Таким образом, чтобы найти в директории /etc все директории, имена которых начинаются на "cron", надо сделать слежующее:
В то время как поиск просто по имени дал бы несколько лишних файлов:
Исполнение команды с найденными файлами Кроме критериев команде find можно указывать также действия ("actions"). Если никакое действие не указано, то find по умолчанию добавляет "-print", чтобы напечатать имя файла. Т.е. команда реально работает как
Наиболее часто требуется действие "-exec", позволяющее выполнить с найденным файлом некую команду, чаще всего -- ls -l. Пример (выдать "длинный" листинг всех файлов из директории /etc, в имени которых содержится "pass"):
Необходимое пояснение: "-exec" воспринимает все, что стоит после него и до слова ";", как команду, которую надо выполнить. Причем сочетание символов "{}" заменяется на имя файла. Поскольку и ";", и "{}" являются специальными символами для shell, их надо "закавычить". | |||||
Команда locate ищет указанные имена в базе данных, содержащей список файлов. Формат вызова locate следующий:
Пример:
При указании нескольких имен locate найдет файлы, соответствующие любому из имен:
Если ИМЯ не содержит специальных символов шаблона, то locate находит все файлы, в любом месте полного имени которых (т.е. включая директорию) встречается указанная строка. Т.е. locate в этом случае работает просто как grep по списку файлов. Если же ИМЯ содержит символы "*", "?" или "[]", то locate находит только строки, которые точно соответствуют шаблону. Например, команда покажет все файлы из директории /usr/X11R6, имя которых заканчивается на "jewel", а именно программу xjewel, но не man-страницу по ней:
Для того же, чтобы увидеть все файлы из /usr/X11R6, в имени которых встречается "jewel", надо в конце шаблона также поставить "*":
В любом случае символы "." и "/" не являются особенными. Таким образом, шаблон "*et*pass*" найдет файл /etc/passwd.
| ||||||||||||||||||
Wget -- это программа для "вытягивания" файлов из Internet при помощи протоколов HTTP или FTP. Основные достоинства Wget:
Wget выдает список всех опций при вызове с ключом "--help", причем поскольку выдача довольно длинная, лучше пользоваться командой
Для того, чтобы узнать все возможности Wget, следует заглянуть в info-документацию по нему. | ||
Поскольку у wget есть огромное количество ключей, модифицирующих его поведение, мы рассмотрим на примерах несколько наиболее часто используемых случаев. Простое скачивание файла В самом простом случае программе указывается один параметр URL -- ссылка на файл, который надо получить:
При скачивании каждого килобайта отображается один символ ".". Можно указать подряд несколько URL -- в этом случае файлы будут скачаны один за другим. Скачивание при плохой связи Для того, чтобы wget повторял попытки взять файл до тех пор, пока не скачает его целиком, надо указывать ключи "-c" и "-t 0". Первый означает "продолжать качать с того места, где соединение оборвалось" (continue), а второй позволяет указать число попыток, 0 -- бесконечно. Например, чтобы скачать исходные тексты проигрывателя .mp3-файлов X11Amp, можно воспользоваться командой
Реально ключи "-c -t 0" стоит указывать практически всегда, кроме как разве что в локальной сети. Шаблоны При перекачке по FTP можно в именах файлов указывать шаблоны (естественно, "закавычивая" их). Например, команда скачает все обновления к системе XFree86. Рекурсивное скачивание Для рекурсивного скачивания используются ключи "-r", "-l" и "-np". Ключ "-r" (recursive) включает рекурсивность. Ключ "-l" (level) позволяет указать насколько "глубоко" программа должна следовать по ссылкам; 0 -- бесконечно глубоко, по умолчанию установлено 5. И, наконец, ключ "-np" (no parent) запрещает следовать ссылкам выше указанной директории. При рекурсивном скачивании wget автоматически создает соответствующее дерево директорий. К примеру, следующая команда могла бы использоваться для скачивания целого домашнего сайта (адрес вымышленный):
При этом файлы будут помещаться в директорию ./www.h-hosts.com/users/goofy/.
Фоновый режим При указании ключа "-b" (background) программа сразу переходит в фоновый режим, так что пользователь может заниматься другими делами или даже выйти из системы -- wget будет продолжать свою работу. При сообщения, которые выдавались бы на экран, будут идти в файл wget.log (а если он уже есть, то в wget.log.1, wget.log.2 и т.д.). Пример:
Для просмотра log-файла по мере скачивания удобно пользоваться командой "tail -f":
Использование прокси-серверов Wget умеет пользоваться прокси-серверами как для HTTP, так и для FTP. Достаточно перед вызовом программы присвоить адрес прокси-сервера переменным окружения http_proxy или ftp_proxy соответственно (имена маленькими буквами!). Wget понимает как "официальное" указание адреса, так и сокращенное. Поэтому команды и эквивалентны. Скачивание "через перевалочную базу" Современные академгородковские реалии таковы, что зачастую скачать файл с некоего зарубежного сервера напрямую не удается из-за плохой связи. При этом иногда не помогает даже способность Wget к докачке. Можно обойти эту проблему, если есть доступ (по telnet, rlogin или ssh) к unix-эккаунту где-нибудь за рубежом, где связь намного лучше. При этом выполняются следующие действия:
Такой подход дает большую гибкость по сравнению с прямой перекачкой, а уменьшение размера кусочков, на которые разбивается файл, иногда позволяет достичь необходимой надежности.
| |||||||||||||||||
Для копирования информации между компьютерами и в качестве архива очень часто используются дискеты. Хотя в принципе у каждой операционной системы (Dos/Windows, MacOS, SunOS/Solaris, Linux и т.д.) есть свой формат для дискет, чаще всего используются дискеты с разметкой MS-Dos. Хотя самый прямой способ работы с дискетами Dos в Linux -- это просто смонтировать дискету, например, командой есть более удобное средство -- пакет Mtools. Программы из этого пакета позволяют работать как с дискетами 3.5 и 5.25 дюйма, так и с дисками Zip и Jaz. Причем поддерживаются длинные имена файлов Windows95/NT (т.е. расширения файловой системы VFAT). Пакет Mtools содержит следующие основные программы, выполняющие те же действия, что и аналогичные программы MS-Dos: mdir, mcopy, mren, mdel, mmd, mrd, mformat и еще некоторые.
Несколько общих правил и отличий от MS-Dos:
Детали по использованию каждой конкретной программы следует смотреть на ее man-странице. Кроме того, достаточно полное описание содержится в info-документации по mtools. | ||||||||||||||||
| ||