昨日は、暇だったから・・・というわけでもないのですが、
新宿にテレビ用のアッテネータを買いに行って、
その後、Punycodeのデコーダを書いていました。
Punycodeって?
国際化ドメインを作るときに使うエンコード方式です。
”つれづれ日記”が”k9jc0jb9939dwn3b”になるという。代物です。
これをもとにドメイン名にするときは、
”つれづれ日記”⇒”k9jc0jb9939dwn3b.jp”の先頭に
Punycodeの多言語ドメインを示す”xn--”を付加して、
”xn--k9jc0jb9939dwn3b.jp”となります。
Punycodeは半角英数はそのまま表現されます。
”MyDomain”⇒”MyDomain-”となります。
但し、ドメイン記述で使う場合には、
・大文字小文字を意識せず、すべて小文字として扱う。
・先頭と最後には”-”が来てはいけない。
・・・などなど
のルールにより、
”MyDomain”⇒”mydomain”となります。
では、なぜ最後に”-”が来るのでしょう?
それは、英文字と日本語が混じった場合のためです。
RFC-3492に載っている例ですが、
”3年B組金八先生”は、”3”と”B”は半角英数なので、そのまま左に集められ、
"3B-"となります。
”年組金八先生”が挿入位置の情報とともにエンコードされ、
”ww4c5e180e575a65lsy2b”となり、くっつけて
"3B-ww4c5e180e575a65lsy2b”となります。
つまり”-”は半角英数のまま使う部分の終わりを意味しているのです。
参考文献:
Punycode: アプリケーションにおいてドメイン名国際化(IDNA)を行うためのUnicodeのBootstringエンコーディング出来上がったら、ライブラリー化して提供しますね。
.NET3.5ですけど(^^;
では(^^)/
スポンサーサイト
- 2010/04/05(月) 12:34:23|
- 未分類
-
| トラックバック:0
-
| コメント:0