UTF-8/UTF-16 バイト計算ツール

入力文字列の UTF-8・UTF-16 バイト数を BOM 有無とあわせて比較し、チャート・要約表・文字単位詳細表でエンコーディング差分を確認できる開発ツールです。

最終更新: 2026/03/05

UTF-8/UTF-16 バイト計算ツール

入力した文字列の UTF-8 / UTF-16 バイト数を即時比較し、文字単位の詳細表でどこでバイトが増えるかを確認できます。

テキスト入力
文字数 (Code Point)
0
UTF-16 コードユニット
0
UTF-8 バイト
0
UTF-16 バイト
0
差分 (UTF-8 – UTF-16)
0

UTF-8 vs UTF-16 バイト比較 (棒グラフ)

計算後にチャートが更新されます。同じ情報は下の表でも確認できます。

エンコーディング要約表

項目 Bytes メモ
入力後に計算すると UTF-8 / UTF-16 の要約が表示されます。

文字単位の詳細表

# 文字 コードポイント UTF-8 UTF-16 UTF-16 位置 メモ
入力後に計算すると文字ごとの詳細分析が表示されます。

すべての計算はブラウザ内で実行され、入力テキストはサーバーへ送信されません。

UTF-8/UTF-16 バイト計算ツールとは?

UTF-8/UTF-16 バイト計算ツールは、同じ文字列をエンコーディング別に比較し、保存容量や転送量を素早く確認できるツールです。文字列長が bytes 基準の API や DB カラムを設計・検証するときに便利です。

合計バイトだけでなく文字単位の詳細表も提供するため、絵文字・日本語・記号などバイト増加の原因をすぐに把握できます。

こんな場面で役立ちます

  • bytes 制限のある API / DB フィールドを事前に確認したいとき
  • 日本語や絵文字を含むメッセージの転送コストを見積もりたいとき
  • UTF-8 と UTF-16 のどちらが有利か比較したいとき
  • BOM の有無で実ファイルサイズがどう変わるか確認したいとき
  • 文字単位でバイト使用量をデバッグしたいとき

主な機能

  • 要約カード: 文字数・コードユニット数・UTF-8/UTF-16 バイト・差分を一画面で確認
  • 棒グラフ: UTF-8 と UTF-16 の総バイトを視覚的に比較
  • 要約表: BOM なし/ありの値を同時表示
  • 文字単位詳細表: コードポイント、文字ごとの UTF-8/UTF-16 バイト、UTF-16 位置を表示
  • 結果コピー: 主要数値をテキストでコピーして共有可能

使い方

  1. 入力欄に分析したいテキストを入力または貼り付けます。
  2. BOM を含めて計算したい場合は UTF-8 / UTF-16 BOM オプションを選択します。
  3. 計算するを押すと、カード・チャート・表が同時に更新されます。
  4. 詳細表でバイトが増える文字を確認し、エンコーディング方針に反映します。
  5. 必要なら結果をコピーで数値を共有します。

計算基準

  • UTF-8: 文字あたり 1〜4 bytes(ASCII 1、日本語 3、絵文字 4)
  • UTF-16: コードユニットあたり 2 bytes、補助平面文字は 4 bytes(サロゲートペア)
  • BOM: UTF-8 は +3 bytes、UTF-16 は +2 bytes をオプション反映

チャートが表示できない環境でも、同じデータは要約表と詳細表に保持されるため結果解釈には影響しません。

よくある質問

なぜ UTF-8 と UTF-16 のバイト数は異なるのですか?

エンコーディング方式が異なるためです。ASCII 中心のテキストでは UTF-8 が有利な場合が多く、文字構成によっては UTF-16 が同等または小さくなることもあります。

文字数と UTF-16 コードユニット数が違うのはなぜですか?

絵文字などの補助平面文字は UTF-16 で 2 つのコードユニット(4 bytes)を使います。そのため文字数よりコードユニット数が大きくなることがあります。

BOM オプションはいつ有効にすべきですか?

実際に BOM 付きファイルとして保存する場合は有効化してください。BOM を使わない API/DB 文字列の計算なら無効のままが一般的です。

入力したテキストは外部に送信されますか?

いいえ。計算はブラウザ内部でのみ実行され、入力データはサーバーに送信されません。

UTF-16LE と UTF-16BE でバイト数は変わりますか?

このツールで扱うテキストの総バイト数は同じです。違いはバイト順(エンディアン)であり、文字列全体のサイズ自体は変わりません。