入出力とコマンド実行の注意点まとめ - AWK
**** 処理系共通の注意点o Windows版では、コマンドの括り文字は「"」(= 二重引用符)だけの処理系が、ほとんどです。
+ 「"」を文字列中に書きたい時は、「\"」と書きます。
**** 特定の処理系に関する注意点
** Gawk系特有の動作
o Windows版の各処理系では、「|& コマンド」や「コマンド |&」の書き方は非対応です。
+ 確認したバージョン
+ Gawk on Windows 3.1.7
+ Gawk for Windows 3.1.6
o UTF-8のテキストファイルを読み込む場合、1行目に限り、$0と $1について、表示されている文字数よりも多く数える事があります。
+ Gawk on Windows 3.1.7 = 1文字多く数えます。
+ Gawk for Windows 3.1.6 = 2文字多く数えます。
+ 原因は、UTF-8で保存したファイルの先頭にあった、UNICODE特有の見えない文字(= BOM = EF BB BF)。
+ Windows XPのメモ帳で保存する時に UTF-8を指定すると、BOMが付くみたいです。
+ メモ帳に限らず、Windows 上の UTF-8ファイルは、BOMが付く方が便利です。(= ファイルを開く時に文字化けしません。)
+ 対策方法は「UTF-8のファイルから、BOMを除去する方法」
==
関連ページ:
▼AWKの入出力関数とコマンド実行機能(▼ABC順)
▼AWKプログラムを書く(▼ABC順)
▼AWK
▼制作メモ
> ファイルからデータを読み込む
タブ区切りでファイルを読み込む
AWKでバイナリ出力する(mawk, Gawk専用)
+
文字列操作関数使用時の注意点まとめ
数値計算関数使用時の注意点まとめ
時刻取得関数を使う時の注意点まとめ
配列を使う時の注意点まとめ