Perl で Gaussian のスキャン計算結果から TD-DFT 計算ファイルを生成する

2024/12/10

2025/02/26
8 min

Gaussian16 では、結合長、二面角といったパラメータを固定しながら構造最適化計算を繰り返す Relaxed Scan 計算が利用できます。今回は、Scan 計算の結果から最適構造の座標情報を抽出し、TD-DFT 計算を実行するためのインプットファイルを生成するスクリプトを Perl で作成しましたので、紹介します。

## ソースコード

Info

リポジトリを移しました。

GitHub - s-inoue0108/sotuken-code: TD-DFT 計算に基づく円二色性スペクトル解析を行うための Gaussian ユーティリティツールです。

TD-DFT 計算に基づく円二色性スペクトル解析を行うための Gaussian ユーティリティツールです。 - s-inoue0108/sotuken-code

github.com

GitHub - s-inoue0108/sotuken-code: TD-DFT 計算に基づく円二色性スペクトル解析を行うための Gaussian ユーティリティツールです。

## 参考

実装の方針はこちらの記事を参考にさせていただきました。Python を使った例が記載されています。

Gaussian の Scan 計算から結果を抽出する | yamnor.me

Gaussian の Scan 計算は、分子構造の一部（結合長、結合角、二面角など）を段階的に変化させながら、各ステップで構造最適化を行う計算方法です。これにより、異性化などの分子構造変化プロセスに伴うエネルギー変化を調べることができます。

yamnor.me

## 実装戦略

構造最適化計算のアウトプット opt_result.out (.log) のあるディレクトリに移動し、次のコマンドを実行してみましょう：

ターミナル

grep "Standard orientation" opt_result.out | wc -l

このコマンドは、計算された分子の座標情報の総数を表示します（詳しくはこちら↗）。

同様に、次のコマンドを実行してみましょう：

ターミナル

grep "Optimization completed" opt_result.out | wc -l

このコマンドは、Scan で得られた最終構造の数を表示します。正常に Scan 計算が実行されていれば、インプットファイルで指定したスキャン回数に等しくなるはずです。したがって、上の記事にもある通り、

Standard orientation という文字列に付帯する座標を抽出
Optimization completed という文字列が現れた段階で、直前に抽出された座標情報を最適構造として保存

というステップをスキャンした回数だけ繰り返し、アウトプットを解析します。

## Perl スクリプトの作成

gen-tddft.pl というファイル名でスクリプトを作成しました。

### アウトプットファイルの解析

1つのスキャンステップのブロックは概ね以下のようになっています：

calc.out

                         Standard orientation:                         
 ---------------------------------------------------------------------
 Center     Atomic     Atomic              Coordinates (Angstroms)
 Number     Number      Type              X           Y           Z
 ---------------------------------------------------------------------
    1          6             0       .........   .........    ........
    .          .             .       .........   .........    ........
    .          .             .       .........   .........    ........
    .          .             .       .........   .........    ........
 ---------------------------------------------------------------------

 **************************何やらいろいろ書いてある*************************

                          Standard orientation:                         
 ---------------------------------------------------------------------
 Center     Atomic     Atomic              Coordinates (Angstroms)
 Number     Number      Type              X           Y           Z
 ---------------------------------------------------------------------
    1          6             0       .........   .........    ........
    .          .             .       .........   .........    ........
    .          .             .       .........   .........    ........
    .          .             .       .........   .........    ........
 ---------------------------------------------------------------------

 **************************何やらいろいろ書いてある*************************

 Optimization completed.

Standard orientation をとらえた段階でその行数（$_ という特殊変数を参照します）を $ln に保存し、ブロック開始の合図である $is_block を 1 にします。
座標は4行をスキップして抽出し、$coordinate に書き足していきます。
ブロックの終わりとして ----- を検出したら $statinonary_coordinate にコピーします。
以上のステップを繰り返し、Optimization completed をとらえたら直前の $statinonary_coordinate をファイル生成関数に渡します。

gen-tddft.pl

#!/usr/bin/perl
use strict;
use warnings;

# ファイル名の取得
my $file = shift or die "Usage: gen-tddft <filename>.out\n";

# グローバル変数
my $ln = 0;                  # ファイルの行数
my $is_block = 0;            # 座標の抽出中であることを表すブール変数
my $count = 0;               # スキャン回数
my $coordinate = "";         # Standard orientation の座標を保存
my $stationary_coordinate;   # スキャンごとの最終座標を保存

# メインルーチン
open my $fh, '<', $file or die "Can't open file $file: $!\n";

# アウトプットファイルを1行ずつ読み込む
while (my $line = <$fh>) {
  
  if ($line =~ /Standard orientation/) {
    $ln = $.;
    $is_block = 1;
    print "Standard Orientation Found\n";
  } elsif ($. > $ln + 4 and $is_block == 1) {
    if ($line =~ /-----/) {
      $stationary_coordinate = $coordinate;
      $coordinate = "";
      $ln = $.;
      $is_block = 0;
    } else {
      $coordinate .= "$line";
    }
  } elsif ($line =~ /Optimization completed/) {
    $count++;
    print "Optimized Structure Found\n";
    
    gen_tddft($file, $stationary_coordinate, $count);
  }
}
close $fh;

実際に活用しているスクリプトでは、Term::ReadLine モジュールを用いた対話型インタフェースの実装や、入力のバリデーションなどをしています。

### TD-DFT 計算ファイルの生成

正規表現で $file をリネームし、拡張子を *.tddft.com にしたファイルを生成します。
座標データは適切に加工します（後述）。
探索する励起構造の数や汎関数、基底関数系はハードコーディングしていますが、ユーザの入力を受け取れるようにするとよいと思います。

gen-tddft.pl

sub gen_tddft {
  my ($file, $coordinate, $count) = @_;

  my $tddft_file = $file;
  my $chk_file = $file;
  my $title = $file;

  $tddft_file =~ s/\.[^.]+$/\.$count.tddft.com/;
  $chk_file =~ s/\.[^.]+$/\.$count.tddft.chk/;
  $title =~ s/\.[^.]+$/\ | No.$count/;

  my $new_coordinate = processed_coordinate($coordinate);

  open my $fh, '>', $tddft_file or die "Can't open file $tddft_file: $!\n";

print $fh <<"EOF";
%nprocshared=8
%mem=1GB
%chk=$chk_file
# td=(nstat=10) b3lyp/6-31g(d)

$title

0 1
$new_coordinate

EOF

  close $fh;
}

### 座標データの加工

アウトプットの座標ブロックにおける各行は以下のようになっています：

calc.out

    1          6             0       .........   .........    ........

このうち、デカルト座標の部分と、2列目の Atomic Number 列が xyz 形式のインプットで必要になります：

 C   .........   .........    ........
 H   .........   .........    ........
 H   .........   .........    ........

よって、Atomic Number は対応する元素記号に置換する必要があります。ハッシュ（連想配列）を定義して対応します¹。

以上の処理を join メソッド等を使って実現します²。

gen-tddft.pl

# 原子番号と元素記号のハッシュ
my %atoms = (
    1 => 'H',
    2 => 'He',
  # -- 割愛 --
  118 => 'Og'
);

sub processed_coordinate {
  my ($coordinate) = @_;

  my $label_droped_coordinate = join("\n", map {
    # 行をスペースで分割
    my @columns = split(/\s+/, $_);
    
    # ラベル列を drop
    splice(@columns, 1, 1);
    
    # 残りのカラムをスペースで再結合
    join(" ", @columns);

  } split(/\n/, $coordinate));

  my $type_droped_coordinate = join("\n", map {
    # 行をスペースで分割
    my @columns = split(/\s+/, $_);
    
    # タイプ列を drop
    splice(@columns, 2, 1);
    
    # 残りのカラムを空白で再結合
    join(" ", @columns);

  } split(/\n/, $label_droped_coordinate));

  my $number_replaced_coordinate = join("\n", map {
    # 行をスペースで分割
    my @columns = split(/\s+/, $_);
    
    # 原子番号を元素記号に置換
    foreach my $row (@columns) {
      if (exists $atoms{$row}) {
        $row = $atoms{$row};
      }
    }
    
    # 残りのカラムをタブで再結合
    join("\t", @columns);

  } split(/\n/, $type_droped_coordinate));

  # 行ごとに分割して処理
  my @lines = split /\n/, $number_replaced_coordinate;

  # 行頭のタブを除去して、再度\nで結合する
  my $cleaned_coordinate = join("\n", map { s/^\t/ /r } @lines);
  
  return $cleaned_coordinate;
}