メニューをスキップして本文へ


ここから本文

Unicode と UTF

  • 2005年8月21日(日) 18:16 JST
  • 投稿者:
  • 閲覧数
    2,639
TeraPad を使用していて、Unicode が複数あることに気づく、というか秀丸でも複数あったんだけど...

TeraPad には以下の3種類が定義されている。
  1. Unicode
  2. UTF-8
  3. UTF-8N

秀丸では TeraPad と異なり、Unicode という体系の中に以下の4種類が定義されている。
  1. UTF-16
  2. UTF-16,Big-Endian
  3. UTF-8
  4. UTF-7


秀丸はわかりやすいが TeraPad の Unicode と UTF-8 ってなんだ?
どうやら、Unicode は UTF-16 のリトルエンディアンらしいのだが UTF-8N は UTF-8 の BOM 無しの様です。
Unicode に付いてはこちらのぺージが参考になるかも?UCS-2とUTF-8
あと、どうやら TeraPad はクリップボードの中のエンコードを確認していないようだ。DreamWeaver からコピーペーストを行うと文字化けを起こす。同様のことを Delphi で試した。すると、Delphi Win32版は各エディションとも全く同じ文字化けを起こした。.Net版は正しく変換して張り付いた。どうやら Win32環境で Delphi で対応しようとすると自前で実装が必要なようですね。 あとで、サポート掲示板に不具合内容を書いておいたら、てらおさんが暫定(0.89a)で修正してくれました。

トラックバック

このエントリのトラックバックURL:
http://www.blackcatlab.com/trackback.php/unicode_utf
表示形式
コメント投稿

サイト管理者はコメントに関する責任を負いません。

サブメニュー1をスキップしてサブメニュー2へ

ログイン

ログイン

あくせすかうんたぁ

テーマ変更

広告


ここからサブメニュー2

サブメニュー2をスキップしてフッタへ


ここからフッタ