Инструкция пользователям по использованию интерфейсов пакетных очередей в ЦКОХИ (ИОХ РАН)

В настоящем документе описана общая инструкция. Дополнения и уточнения к ней, касающиеся конкретных компьютерных ресурсов и программ, см. здесь. Убедительно просим Вас внимательно прочитать настоящий документ.

В связи с тем, что вычислительные ресурсы ЦКОХИ имеют структурную организацию, включающую как отдельные SMP-серверы, так и кластеры, создана унифицированная система посылки пакетных заданий, не зависящая от того, на какой вычислительный ресурс (компьютер, кластер) отправляется пакетное задание, и с помощью какой прикладной программы будет производиться расчет.

Эта система предполагает применение некоторого простого "языка заказа ресурсов", вкратце описанного ниже. Он включает последовательность строк, позволяющих идентифицировать пользователя и указать на требуемые ресурсы. Пользовательское задание, присылаемое по электронной почте, оформляется следующим образом.

user=имя_пользователя,passwd=пароль

сhk=имя_контрольной_точки

time=время_выполнения_задания

$класс_задания

Далее подряд следуют исходные данные для выполнения соответствующей прикладной программы.

Первая строка: имя_пользователя и его пароль сообщаются обслуживающим персоналом при регистрации пользователя.

Вторая строка: имя_контрольной_точки задается пользователем произвольно (длина имени не должна превышать 70 символов). Эта строка является не обязательной. Она используется только для кластеров и обеспечивает пользователю автоматический перенос контрольной точки на тот узел кластера, где будет запускаться прикладная программа. Для SMP-серверов (в частности, SGI Power Challenge) ее следует опустить.

Внимание ! Эта строка не является заменой для указания контрольной точки в "языке управления" прикладной программой (например, %chk для Gaussian-03/9x). Она не зависит от прикладной программы и обеспечивает лишь заказ переноса файла контрольной точки, а в исходных данных к прикладной программе следует указать, какая конкретно контрольная точка будет использоваться (см. ниже пример задания для Gaussian-03/9x).

Третья строка: указывает требуемое время в минутах (не более 9999).

Четвертая строка: указывает класс задания, зависящий от требуемых ресурсов (емкость оперативной памяти и дисковое пространство).

В настоящее время полностью поддерживается для SMP -серверов фирмы SGI.
При счете на кластерах для больших заданий при указании класса $big задание будет направлено в специальную очередь, где ему будет выделено большее число процессоров (зависит от кластера, см. здесь).

Пример задания для Gaussian-03/98, направляемого для решения в кластер Gigabit Ethernet

user=ivanov,passwd=idontremember
chk=h2o
time=600
%Nproc=2
%Сhk=g98.h2o.177.chk

#P RHF/STO-3G

далее следуют другие исходные данные Gaussian-03/98.

Числовое значение userid, в нашем примере равно 177,- это номер пользователя. Его пользователь получает от обслуживающего персонала; этот номер можно увидеть также в автоматически присылаемых сообщениях, в частности, о постановке задания в очередь на выполнение. Имя контрольной точки, которое указано в переменной chk "языка управления заданиями" - h2o.