サイトカレンダー

サイトカレンダーをスキップ

2018年 01月
«
»
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

記事カテゴリ

ユーザー機能


 2018年1月19日(金) 22:46 JST

Unicode と UTF

  • 2005年8月21日(日) 18:16 JST
  • 投稿者:
  • 表示回数
    4,471

TeraPad を使用していて、Unicode が複数あることに気づく、というか秀丸でも複数あったんだけど...

TeraPad には以下の3種類が定義されている。

  1. Unicode
  2. UTF-8
  3. UTF-8N


秀丸では TeraPad と異なり、Unicode という体系の中に以下の4種類が定義されている。

  1. UTF-16
  2. UTF-16,Big-Endian
  3. UTF-8
  4. UTF-7



秀丸はわかりやすいが TeraPad の Unicode と UTF-8 ってなんだ?
どうやら、Unicode は UTF-16 のリトルエンディアンらしいのだが UTF-8N は UTF-8 の BOM 無しの様なのだ。
Unicode に付いてはこちらのぺージが参考になるかも?UCS-2とUTF-8
あと、どうやら TeraPad はクリップボードの中のエンコードを確認していないようだ。DreamWeaver からコピーペーストを行うと文字化けを起こす。同様のことを Delphi で試した。すると、Delphi Win32版は各エディションとも全く同じ文字化けを起こした。.Net版は正しく変換して張り付いた。どうやら Win32環境で Delphi で対応しようとすると自前で実装が必要なようですね。

あとで、サポート掲示板に不具合内容を書いておいたら、てらおさんが暫定(0.89a)で修正してくれました。

トラックバック

このエントリのトラックバックURL:
http://www.blackcatlab.com/trackback.php/unicode_utf

以下のコメントは、その投稿者が所有するものでサイト管理者はコメントに関する責任を負いません。