## ソースコード
## 参考
実装の方針はこちらの記事を参考にさせていただきました。Python を使った例が記載されています。
![Gaussian の Scan 計算から結果を抽出する | yamnor.me](https://res.cloudinary.com/dfhjad2jo/image/upload/l_text:yuseimagic.ttf_65:Gaussian の Scan 計算から結果を抽出する,co_rgb:000,w_950,c_fit,y_10/v1704005021/n8bl9ujbmutvpnq24mm4.png)
## 実装戦略
構造最適化計算のアウトプット opt_result.out (.log)
のあるディレクトリに移動し、次のコマンドを実行してみましょう:
$ grep "Standard orientation" opt_result.out | wc -l
このコマンドは、計算された分子の座標情報の総数を表示します(詳しくはこちら↗)。
同様に、次のコマンドを実行してみましょう:
$ grep "Optimization completed" opt_result.out | wc -l
このコマンドは、Scan で得られた最終構造の数を表示します。正常に Scan 計算が実行されていれば、インプットファイルで指定したスキャン回数に等しくなるはずです。したがって、上の記事にもある通り、
Standard orientation
という文字列に付帯する座標を抽出Optimization completed
という文字列が現れた段階で、直前に抽出された座標情報を最適構造として保存
というステップをスキャンした回数だけ繰り返し、アウトプットを解析します。
## Perl スクリプトの作成
gen-tddft.pl
というファイル名でスクリプトを作成しました。
### アウトプットファイルの解析
1つのスキャンステップのブロックは概ね以下のようになっています:
Standard orientation:
---------------------------------------------------------------------
Center Atomic Atomic Coordinates (Angstroms)
Number Number Type X Y Z
---------------------------------------------------------------------
1 6 0 ......... ......... ........
. . . ......... ......... ........
. . . ......... ......... ........
. . . ......... ......... ........
---------------------------------------------------------------------
**************************何やらいろいろ書いてある*************************
Standard orientation:
---------------------------------------------------------------------
Center Atomic Atomic Coordinates (Angstroms)
Number Number Type X Y Z
---------------------------------------------------------------------
1 6 0 ......... ......... ........
. . . ......... ......... ........
. . . ......... ......... ........
. . . ......... ......... ........
---------------------------------------------------------------------
**************************何やらいろいろ書いてある*************************
Optimization completed.
Standard orientation
をとらえた段階でその行数($_
という特殊変数を参照します)を$ln
に保存し、ブロック開始の合図である$is_block
を1
にします。- 座標は4行をスキップして抽出し、
$coordinate
に書き足していきます。 - ブロックの終わりとして
-----
を検出したら$statinonary_coordinate
にコピーします。 - 以上のステップを繰り返し、
Optimization completed
をとらえたら直前の$statinonary_coordinate
をファイル生成関数に渡します。
#!/usr/bin/perl
use strict;
use warnings;
# ファイル名の取得
my $file = shift or die "Usage: gen-tddft <filename>.out\n";
# グローバル変数
my $ln = 0; # ファイルの行数
my $is_block = 0; # 座標の抽出中であることを表すブール変数
my $count = 0; # スキャン回数
my $coordinate = ""; # Standard orientation の座標を保存
my $stationary_coordinate; # スキャンごとの最終座標を保存
# メインルーチン
open my $fh, '<', $file or die "Can't open file $file: $!\n";
# アウトプットファイルを1行ずつ読み込む
while (my $line = <$fh>) {
if ($line =~ /Standard orientation/) {
$ln = $.;
$is_block = 1;
print "Standard Orientation Found\n";
} elsif ($. > $ln + 4 and $is_block == 1) {
if ($line =~ /-----/) {
$stationary_coordinate = $coordinate;
$coordinate = "";
$ln = $.;
$is_block = 0;
} else {
$coordinate .= "$line";
}
} elsif ($line =~ /Optimization completed/) {
$count++;
print "Optimized Structure Found\n";
gen_tddft($file, $stationary_coordinate, $count);
}
}
close $fh;
実際に活用しているスクリプトでは、Term::ReadLine
モジュールを用いた対話型インタフェースの実装や、入力のバリデーションなどをしています。
### TD-DFT 計算ファイルの生成
- 正規表現で
$file
をリネームし、拡張子を*.tddft.com
にしたファイルを生成します。 - 座標データは適切に加工します(後述)。
- 探索する励起構造の数や汎関数、基底関数系はハードコーディングしていますが、ユーザの入力を受け取れるようにするとよいと思います。
sub gen_tddft {
my ($file, $coordinate, $count) = @_;
my $tddft_file = $file;
my $chk_file = $file;
my $title = $file;
$tddft_file =~ s/\.[^.]+$/\.$count.tddft.com/;
$chk_file =~ s/\.[^.]+$/\.$count.tddft.chk/;
$title =~ s/\.[^.]+$/\ | No.$count/;
my $new_coordinate = processed_coordinate($coordinate);
open my $fh, '>', $tddft_file or die "Can't open file $tddft_file: $!\n";
print $fh <<"EOF";
%nprocshared=8
%mem=1GB
%chk=$chk_file
# td=(nstat=10) b3lyp/6-31g(d)
$title
0 1
$new_coordinate
EOF
close $fh;
}
### 座標データの加工
アウトプットの座標ブロックにおける各行は以下のようになっています:
1 6 0 ......... ......... ........
このうち、デカルト座標の部分と、2列目の Atomic Number 列が xyz 形式のインプットで必要になります:
C ......... ......... ........
H ......... ......... ........
H ......... ......... ........
よって、Atomic Number は対応する元素記号に置換する必要があります。ハッシュ(連想配列)を定義して対応します1。
以上の処理を join
メソッド等を使って実現します2。
# 原子番号と元素記号のハッシュ
my %atoms = (
1 => 'H',
2 => 'He',
# -- 割愛 --
118 => 'Og'
);
sub processed_coordinate {
my ($coordinate) = @_;
my $label_droped_coordinate = join("\n", map {
# 行をスペースで分割
my @columns = split(/\s+/, $_);
# ラベル列を drop
splice(@columns, 1, 1);
# 残りのカラムをスペースで再結合
join(" ", @columns);
} split(/\n/, $coordinate));
my $type_droped_coordinate = join("\n", map {
# 行をスペースで分割
my @columns = split(/\s+/, $_);
# タイプ列を drop
splice(@columns, 2, 1);
# 残りのカラムを空白で再結合
join(" ", @columns);
} split(/\n/, $label_droped_coordinate));
my $number_replaced_coordinate = join("\n", map {
# 行をスペースで分割
my @columns = split(/\s+/, $_);
# 原子番号を元素記号に置換
foreach my $row (@columns) {
if (exists $atoms{$row}) {
$row = $atoms{$row};
}
}
# 残りのカラムをタブで再結合
join("\t", @columns);
} split(/\n/, $type_droped_coordinate));
# 行ごとに分割して処理
my @lines = split /\n/, $number_replaced_coordinate;
# 行頭のタブを除去して、再度\nで結合する
my $cleaned_coordinate = join("\n", map { s/^\t/ /r } @lines);
return $cleaned_coordinate;
}
## 使用法
calc.out
のあるディレクトリまで移動して次のコマンドを実行します:
$ perl ./gen-tddft.pl ./opt_result.out
同様の記事を Zenn にも公開しています:
![Gaussian のスキャン計算結果から TD-DFT 計算ファイルを生成する](https://res.cloudinary.com/zenn/image/upload/s--K-kwe2DB--/c_fit%2Cg_north_west%2Cl_text:notosansjp-medium.otf_55:Gaussian%20%E3%81%AE%E3%82%B9%E3%82%AD%E3%83%A3%E3%83%B3%E8%A8%88%E7%AE%97%E7%B5%90%E6%9E%9C%E3%81%8B%E3%82%89%20TD-DFT%20%E8%A8%88%E7%AE%97%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E7%94%9F%E6%88%90%E3%81%99%E3%82%8B%2Cw_1010%2Cx_90%2Cy_100/g_south_west%2Cl_text:notosansjp-medium.otf_37:S.Inoue%2Cx_203%2Cy_121/g_south_west%2Ch_90%2Cl_fetch:aHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzBlZTc2ZmE4NzYuanBlZw==%2Cr_max%2Cw_90%2Cx_87%2Cy_95/v1627283836/default/og-base-w1200-v2.png)