UTF-8/UTF-16 バイト計算ツール
入力文字列の UTF-8・UTF-16 バイト数を BOM 有無とあわせて比較し、チャート・要約表・文字単位詳細表でエンコーディング差分を確認できる開発ツールです。
UTF-8/UTF-16 バイト計算ツール
入力した文字列の UTF-8 / UTF-16 バイト数を即時比較し、文字単位の詳細表でどこでバイトが増えるかを確認できます。
UTF-8 vs UTF-16 バイト比較 (棒グラフ)
計算後にチャートが更新されます。同じ情報は下の表でも確認できます。
エンコーディング要約表
| 項目 | Bytes | メモ |
|---|---|---|
| 入力後に計算すると UTF-8 / UTF-16 の要約が表示されます。 | ||
文字単位の詳細表
| # | 文字 | コードポイント | UTF-8 | UTF-16 | UTF-16 位置 | メモ |
|---|---|---|---|---|---|---|
| 入力後に計算すると文字ごとの詳細分析が表示されます。 | ||||||
すべての計算はブラウザ内で実行され、入力テキストはサーバーへ送信されません。
UTF-8/UTF-16 バイト計算ツールとは?
UTF-8/UTF-16 バイト計算ツールは、同じ文字列をエンコーディング別に比較し、保存容量や転送量を素早く確認できるツールです。文字列長が bytes 基準の API や DB カラムを設計・検証するときに便利です。
合計バイトだけでなく文字単位の詳細表も提供するため、絵文字・日本語・記号などバイト増加の原因をすぐに把握できます。
こんな場面で役立ちます
- bytes 制限のある API / DB フィールドを事前に確認したいとき
- 日本語や絵文字を含むメッセージの転送コストを見積もりたいとき
- UTF-8 と UTF-16 のどちらが有利か比較したいとき
- BOM の有無で実ファイルサイズがどう変わるか確認したいとき
- 文字単位でバイト使用量をデバッグしたいとき
主な機能
- 要約カード: 文字数・コードユニット数・UTF-8/UTF-16 バイト・差分を一画面で確認
- 棒グラフ: UTF-8 と UTF-16 の総バイトを視覚的に比較
- 要約表: BOM なし/ありの値を同時表示
- 文字単位詳細表: コードポイント、文字ごとの UTF-8/UTF-16 バイト、UTF-16 位置を表示
- 結果コピー: 主要数値をテキストでコピーして共有可能
使い方
- 入力欄に分析したいテキストを入力または貼り付けます。
- BOM を含めて計算したい場合は UTF-8 / UTF-16 BOM オプションを選択します。
- 計算するを押すと、カード・チャート・表が同時に更新されます。
- 詳細表でバイトが増える文字を確認し、エンコーディング方針に反映します。
- 必要なら結果をコピーで数値を共有します。
計算基準
- UTF-8: 文字あたり 1〜4 bytes(ASCII 1、日本語 3、絵文字 4)
- UTF-16: コードユニットあたり 2 bytes、補助平面文字は 4 bytes(サロゲートペア)
- BOM: UTF-8 は +3 bytes、UTF-16 は +2 bytes をオプション反映
チャートが表示できない環境でも、同じデータは要約表と詳細表に保持されるため結果解釈には影響しません。
よくある質問
なぜ UTF-8 と UTF-16 のバイト数は異なるのですか?
エンコーディング方式が異なるためです。ASCII 中心のテキストでは UTF-8 が有利な場合が多く、文字構成によっては UTF-16 が同等または小さくなることもあります。
文字数と UTF-16 コードユニット数が違うのはなぜですか?
絵文字などの補助平面文字は UTF-16 で 2 つのコードユニット(4 bytes)を使います。そのため文字数よりコードユニット数が大きくなることがあります。
BOM オプションはいつ有効にすべきですか?
実際に BOM 付きファイルとして保存する場合は有効化してください。BOM を使わない API/DB 文字列の計算なら無効のままが一般的です。
入力したテキストは外部に送信されますか?
いいえ。計算はブラウザ内部でのみ実行され、入力データはサーバーに送信されません。
UTF-16LE と UTF-16BE でバイト数は変わりますか?
このツールで扱うテキストの総バイト数は同じです。違いはバイト順(エンディアン)であり、文字列全体のサイズ自体は変わりません。