UTF-8/UTF-16 바이트 계산기
입력 문자열의 UTF-8·UTF-16 바이트를 BOM 포함 여부와 함께 계산하고, 차트·요약표·문자 단위 상세표로 인코딩 비용을 한눈에 비교하는 개발 도구입니다.
UTF-8/UTF-16 바이트 계산기
입력한 문자열의 UTF-8/UTF-16 바이트 수를 즉시 비교하고, 문자 단위 상세 표로 어디서 바이트가 늘어나는지 확인할 수 있습니다.
UTF-8 vs UTF-16 바이트 비교 (막대 차트)
차트는 계산 후 업데이트됩니다. 동일 정보는 아래 표에서도 확인할 수 있습니다.
인코딩 요약표
| 항목 | Bytes | 비고 |
|---|---|---|
| 입력 후 계산하면 UTF-8/UTF-16 요약이 표시됩니다. | ||
문자 단위 상세표
| # | 문자 | 코드포인트 | UTF-8 | UTF-16 | UTF-16 위치 | 메모 |
|---|---|---|---|---|---|---|
| 입력 후 계산하면 문자별 상세 분석이 표시됩니다. | ||||||
모든 계산은 브라우저에서만 수행되며 입력한 텍스트는 서버로 전송되지 않습니다.
UTF-8/UTF-16 바이트 계산기란?
UTF-8/UTF-16 바이트 계산기는 텍스트 길이를 인코딩 기준으로 비교해 저장 용량과 전송량을 빠르게 확인하는 도구입니다. 동일한 문자열도 인코딩 방식에 따라 바이트가 달라지므로, API 페이로드/DB 컬럼/로그 저장 전략을 점검할 때 유용합니다.
총합 바이트만 보여주는 방식에서 더 나아가 문자 단위 상세표를 제공해 이모지·한글·특수문자처럼 바이트 사용량이 큰 구간을 즉시 식별할 수 있도록 구성했습니다.
이런 상황에서 활용해 보세요
- 문자열 길이 제한이 bytes 기준인 API/DB 필드를 점검할 때
- 한글/이모지 포함 메시지의 전송 비용을 예측할 때
- UTF-8과 UTF-16 중 어떤 인코딩이 유리한지 비교할 때
- BOM 포함 여부에 따른 실제 파일 크기 차이를 확인할 때
- 문자 단위로 바이트 사용량을 디버깅해야 할 때
주요 기능
- 요약 카드: 문자 수, 코드 유닛 수, UTF-8/UTF-16 바이트, 차이를 한 화면에서 확인
- 막대 차트: UTF-8과 UTF-16 총 바이트를 시각적으로 즉시 비교
- 인코딩 요약표: BOM 제외/포함 기준 값을 함께 제공
- 문자 단위 상세표: 코드포인트, 문자별 UTF-8/UTF-16 바이트, UTF-16 위치 추적
- 결과 복사: 핵심 수치를 텍스트로 복사해 문서/티켓에 바로 공유
사용 방법
- 입력창에 분석할 텍스트를 입력하거나 붙여넣습니다.
- BOM 포함 기준이 필요하면 UTF-8/UTF-16 BOM 옵션을 체크합니다.
- 계산하기를 누르면 카드/차트/표가 동시에 갱신됩니다.
- 상세표에서 바이트가 큰 문자 구간을 확인하고 인코딩 전략을 조정합니다.
- 필요하면 결과 복사 버튼으로 요약값을 공유합니다.
계산 기준
- UTF-8: 문자별 1~4 bytes (ASCII 1, 한글 3, 이모지 4)
- UTF-16: 코드 유닛 기준 2 bytes, 보조평면 문자는 4 bytes(서로게이트 페어)
- BOM: UTF-8은 +3 bytes, UTF-16은 +2 bytes를 옵션으로 반영
차트가 로드되지 않아도 동일한 데이터가 요약표와 상세표에 유지되므로 결과 해석에는 영향이 없습니다.
자주 묻는 질문
왜 UTF-8과 UTF-16 바이트가 다르게 나오나요?
인코딩이 문자를 저장하는 방식이 다르기 때문입니다. ASCII 위주 텍스트는 UTF-8이 유리한 경우가 많고, 특정 언어/문자 구성에서는 UTF-16이 더 작거나 비슷할 수 있습니다.
문자 수와 UTF-16 코드 유닛 수가 다른 이유는 무엇인가요?
이모지처럼 보조평면 문자는 UTF-16에서 코드 유닛 2개(4 bytes)를 사용합니다. 그래서 문자 수보다 코드 유닛 수가 더 크게 나올 수 있습니다.
BOM 옵션은 언제 켜야 하나요?
파일 저장 시 BOM을 실제로 붙이는 워크플로라면 켜서 계산하세요. BOM을 사용하지 않는 API/DB 문자열 계산이라면 끄는 것이 일반적입니다.
입력 텍스트가 외부로 전송되나요?
아니요. 계산은 브라우저 내부에서만 수행되며 입력 데이터는 서버로 전송되지 않습니다.