囲碁SNS goxi

docMM

<< 2014年12月 >>

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

docMMさんの日記

(Web全体に公開)

前の日記

次の日記

2014年 12月19日 10:33: perl苦闘日記（３）～use utf8

タグ : perl
ファイルから文字列を読み込んだ場合は、decodeを使ってunicodeに変換すればよいことは前回書いた。
では、programの中に文字を書きたい場合はどうすればいいか。

my $s = "黒";
if( $s =~ /黒/) {print " black";}

これはうまく動くが

my $s = <DATA>;
if( $s =~ /黒/) {print " black";}

これはうまく行く場合と行かない場合がある。
これはprogram内に書かれた”黒”という文字とファイルに書かれた文字がどんな文字コードで表記されているのかに起因する。
Programもファイルも同じ文字コードで書かれていれば思ったとおりに動いてくれるが、一方がShift-JISで、一方がUTF-8だったりするとアウトである。

この問題を解決するためには冒頭に書いた

use utf8;

というおまじないを書くとうまくいく。
このおまじないは文字が現れるとそれを'UTF-8'コードで書かれたものと認識し、自動的に'unicode'に変換してくれるありがたい関数である。

use utf8;

my $s = decode('UTF-8',<DATA>);
if( $s =~ /黒/) {print " black";}

と

my $s = decode('UTF-8',<DATA>);
my $t = decode('UTF-8',"黒");
if( $s =~ /$t/) {print " black";}

とは同じ意味である。

もちろん、use utf8 と書きながらprogramをshift-jisで書いたらアウト。使っているテキストエディタがどの文字コードを使っているか気をつけないといけない。

ぃーね！ (1) えどわーど

棋譜作成

docMMさんの日記

囲碁SNS goxi

<< 2014年12月 >>

最新日記

docMMさんの日記