JavaのEUCとUnicodeとUTF-8の変換について

・JavaのString型やchar型の文字コードは16ビットUnicode
・EUC-JPやUTF-8はbyte配列として扱う必要がある!!

つまりEUC-JPからUTF-8に直接変換はできないので
一旦String(Unicode)を経由する
EUC-JPのbyte配列 → String(Unicode) → UTF-8のbyte配列

例)
byte[] eucCode; // EUC-JP
String strChar; // UNICODE
byte[] utf8Code; // UTF8
// EUC→Unicodeデータ
strChar = new String(eucCode, “EUC-JP”);
// Unicode→UTF-8データ
utf8Code = strChar.getBytes(“UTF-8”);

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です