GAUSSIAN-98

Gaussian, остается, вероятно, самым популярным средством выполнения квантово-химических расчетов среди основной массы химиков. Основные причины этого - широта охвата реализованных квантово-химических методик, высокая эффективность и удобный интерфейс пользователя. Недавно появмвшаяся версия Gaussian-98 (G98) отличается от Gaussian-94 (G94) в первую очередь расширением спектра поддерживаемых квантово-химических методов и их модификаций.

Методические усовершенствования в Gaussian-98

Как известно, комплекс программ Gaussian позволяет рассчитывать энергию, структуры молекул, частоты их колебаний, а также разнообразные свойства молекул в газовой фазе и в растворе, как в основном, так и в возбужденных состояниях.

Складывается впечатление, что основное направление, в котором развивалась версия G98 после G94, это развитие методов расчета сверхбольших молекулярных систем. Это вызвано, в частности, большим интересом к расчетам больших биомолекул, и в т.ч. потребностями задач конструирования лекарств. Среди таких методов можно отметить:

1) Методику парционирования молекул ONIOM, развитую проф. Морокума и др., в которой вся молекула разбивается на 3 области, которые рассматриваются с разной степенью точности. Такой подход эффективен, в частности, и для биомолекул. Например, "активное место" лекарства можно рассчитать с максимально высокой степенью точности, на наиболее высоком квантово-химическом уровне; непосредственное окружение активной части можно считать можно посчитать менее точно, а дальнее атомы - наоброт, учесть максимально приближенно.

2) Быстрый метод мультиполей (FMM) в схеме DFT в сочетании с использованием технологии разреженных матриц, реализованный в G98, позволяет, по мнению разработчиков, достигнуть линеаризации "вычислительной стоимости", что делает возможным применять DFT для молекул большего размера, в т.ч. в расчетах частот.

3) В G98 получила дальнейшее развитие методика оптимизации геометрии. В результате стало возможным проводить неэмпирические расчеты молекулярных систем, содержащих много тяжелых атомов, с оптимизацией геометрии.

По сравнению с G94, в G98 появились новые возможности расчета свойств:

Добавлены новые методы расчета возбужденных состояний: ZINDO для расчетов сверхбольших молекул и время-зависимые методы RBA на уровне ХФ и DFT, которые дополняют имеющиеся ранее вохможности CIS.

Получили дальнейшее расширение и методы учета сольватации. Теперь схема SCRF может использоваться для рачетов энергии, геометрии и свойств молекул в следующих модификациях:

Кроме того, перечислим еще некоторые новые особенности G98:

Текущая версия Gaussian-98

На момент подготовки данного материала (декабрь 1998) текущая версия G98 есть Release A.4/A.5. Эти варианты, А4 и А5, отличаются лишь исправлением в А5 некоторых ошибок для минисуперЭВМ Cray J90, что не представляет интереса для российских химиков.

Укажем на некоторые технологические особенности этого релиза G98:

Из собственно квантово-химичеких модернизаций укажем на поддержку SCRF PCM в более широком спектре методов (ХФ, DFT, MP2/3/4(SDQ), QCISD, CCD, CID, CISD); включение новых базисов EPR-II и EPR-III, эффективных для расчетов констант сверхтонкого взаимодействия в методе DFT; реализацию метода CBS-Q//B3; поддержку метода ММ в стиле известной программы AMBER и др.

Распараллеливание в Gaussian-98

В основном методика распараллеливания G98, похоже, не поменялась по сравнению с G94. Основу распараллеливания в стандартной поставке G98 составляет модель общего поля памяти, которая может применяться на ЭВМ SMP- и ccNUMA- архитектуры: Сray PVP (parallel vector processing, т.е. Cray T90/J90); SMP-серверах Compaq/DEC Alpha c ОС Digital Unix; SMP-cистемы от HP на базе PA-RISC с ОС HP-UX; IBM (RS/6000 с ОС IRIX), векторных SMP-систем NEC серии SX-4; SMP-серверах Sun на базе UltraSPARC c ОС Solaris, а также, по доборой традиции тесного сотрудничества с SGI, - на всех SMP- и ссNUMA- серверах этой фирмы, использующих микропроцессоры R4400/R5000/R8000/R10000, и, наконец, SMP-серверах с ОС Linux на базе микропроцессоров Intel от Pentium и выше. Напомним, что при использовании двухпроцессорных ПК на базе x86 ограничения пропускной способности системной шины приводят к конфликтам при работе с ОП, и даже две параллельно работающие независимые задачи заметно мешают работать друг другу.

Что касается применения методики распараллеливания, то в G98 реализованы прямые вызовы fork/exit с использованием UNIX-средств IPC. Кроме того, при использовании аппаратно-программных платформ, компиляторы которых имеют средства автоматического распараллеливания с использованием специальных директив распараллеливания типа PCF, KAP или OpenMP, (в частности, в SGI - Power Fortran или средства APO, и в Linux - f77 фирмы Portland Group), имеются дополнительные возможности распаарллеливания некоторых подпрограмм. При этом возможно и обращение к распараллеленным подпрограммам библиотеки BLAS (например, в серверах SGI Power Challenge и Origin).

При необходимости организации распараллеливания в модели обмена сообщениями на ЭВМ МРР-архитектуры с физически и логически распределенной ОП, или в кластерах, G98 требует применение средств Linda. Этот программный продукт (Linda Parallel Execution Environment) cтоит не менее $1500. Его распространяет фирма Scientific Computing Associates, Inc. http://www.sca.com

Основная идея Linda - создание у программиста иллюзии наличия виртуальной памяти, разделяемой узлами кластера. Однако за иллюзии надо платить. С точки зрения автора данного материала (Кузьминский М.Б., kus@free.net), такой подход не может привести к наиболее эффективному распараллеливанию, доступному при использовании более обычных подходов с прямым использованием средств PVM или cтандарта MPI.

Хотя понятна привлекательность использования средств Linda как элегантной конструкции, обеспечивающей переносимость на разные аппаратно-программные платформы, Linda не только представляется не самым эффективным средством, но и "далека" от стандартов в этой области - MPI. Разработанная в Италии распараллеленная на базе MPI версия G94 для Сray T3E не поставляется.

С другой стороны, в последнее время Linda привлекла к себе заметное внимание, поскольку была использована в новых широко рекламируемых разработках Sun Microsystems, что может поднять популярность самой Linda.

Кроме кластеров, для которых Linda достпуна на всех основных Unix-платформах (SGI, DEC, IBM, Sun, HP, Linux), она используется в G98 для IBM SP2. Gaussian, Inc. приводит на своем сервере материалы, иллюстрирующие качество распараллеливания при использовании средств Linda.

В кластерах на базе Ethernet это - расчеты гуанина (175 базисных функций) методом DFT, a priori хорошо распараллеливаемого из-за применения численного интегрирования, и бициклопентанона методом ХФ (240 базисных функций), которые дают хорошее качество распараллеливания вплоть до 6 узлов.

На уровне MP2 при использовании более быстрой сети FDDI, а в узлах кластера- RS/6000 mdl 350 (которые в несколько раз уступают современным ПК на базе Pentium II) для расчета молекулы C20H42F в базисе 6-31G* уже при числе узлов выше 3 кривая ускорения заметно "загибается". В "кластере" IBM SP2 (MPP-система с высокоскоростным коммутатором) расчет этой молекулы в базисе 3-21G (264 базисные функции) позволяет достичь хорошего ускорения вплоть до 8 процессоров.

Следует учесть также, что применение наиболее современных микропроцессоров, имеющих более высокий уровень производительности, должно привести к более низкому ускорению.

При подготовке этого материала использованы данные, размещенные на сервере Gaussian, Inc http://www.gaussian.com к которым мы отсылаем за более подробной информацией.