2010年9月5日日曜日

入出力とコマンド実行の注意点まとめ - AWK

AWKの入出力とコマンド実行機能
**** 処理系共通の注意点
o Windows版では、コマンドの括り文字は「"」(= 二重引用符)だけの処理系が、ほとんどです。
   + 「"」を文字列中に書きたい時は、「\"」と書きます。


**** 特定の処理系に関する注意点
** Gawk系特有の動作
o Windows版の各処理系では、「|& コマンド」や「コマンド |&」の書き方は非対応です。
   + 確認したバージョン
   + Gawk on Windows 3.1.7
   + Gawk for Windows 3.1.6
o UTF-8のテキストファイルを読み込む場合、1行目に限り、$0と $1について、表示されている文字数よりも多く数える事があります。
     + Gawk on Windows 3.1.7 = 1文字多く数えます。
     + Gawk for Windows 3.1.6 = 2文字多く数えます。
   + 原因は、UTF-8で保存したファイルの先頭にあった、UNICODE特有の見えない文字(= BOM = EF BB BF)。
   + Windows XPのメモ帳で保存する時に UTF-8を指定すると、BOMが付くみたいです。
      + メモ帳に限らず、Windows 上の UTF-8ファイルは、BOMが付く方が便利です。(= ファイルを開く時に文字化けしません。)
   + 対策方法は「UTF-8のファイルから、BOMを除去する方法


==
関連ページ:
    ▼AWKの入出力関数とコマンド実行機能▼ABC順
    ▼AWKプログラムを書く▼ABC順
    ▼AWK
    ▼制作メモ
    > ファイルからデータを読み込む
    タブ区切りでファイルを読み込む
    AWKでバイナリ出力する(mawk, Gawk専用)
    +
    文字列操作関数使用時の注意点まとめ
    数値計算関数使用時の注意点まとめ
    時刻取得関数を使う時の注意点まとめ
    配列を使う時の注意点まとめ