バイトサイズ計算ツール

テキストのバイトサイズをリアルタイムで計算。文字種別の内訳も視覚的に表示します。

テキスト入力

0 / 10,000 文字
UTF-8: 英数字1バイト、日本語3バイト(世界標準・推奨)

計算結果

文字数
0
Characters
バイト数
0
Bytes
行数
0
Lines

詳細情報

KB換算 0.00 KB
MB換算 0.0000 MB
空白文字 0
空白除く 0

文字種別の内訳

このツールの使い方

  1. テキストエリアにテキストを入力します(入力と同時に自動計算されます)
  2. エンコーディングを選択します(デフォルトはUTF-8)
  3. 文字数、バイト数、行数がリアルタイムで表示されます
  4. 文字種別の内訳が視覚的なバーグラフで表示されます

このツールの特徴

  • リアルタイム計算:入力と同時に自動的にバイトサイズが計算されます
  • 視覚的な分析:文字種別(英数字、ひらがな、カタカナ、漢字など)を色分けバーで表示
  • 複数エンコーディング対応:UTF-8、UTF-16、Shift_JIS、EUC-JPに対応
  • 詳細な単位変換:バイト、KB、MBでの表示
  • シンプルで使いやすい:必要な情報だけを表示する洗練されたUI
  • ブラウザ内完結:すべての処理はブラウザ内で完結、データは外部送信されません
  • レスポンシブデザイン:PC・タブレット・スマホすべてに対応
  • 完全無料:登録不要、回数制限なし

バイトサイズとは

バイトサイズは、テキストデータがコンピュータ上で占める記憶容量のことです。同じ文字数でも、使用する文字(英数字、日本語など)やエンコーディング方式によってバイト数は異なります。

バイトの単位

  • 1 KB (キロバイト) = 1,024 Bytes
  • 1 MB (メガバイト) = 1,024 KB = 1,048,576 Bytes
  • 1 GB (ギガバイト) = 1,024 MB = 1,073,741,824 Bytes

エンコーディングについて

エンコーディングは、文字をコンピュータが理解できるバイト列に変換する方式です。同じ文字でもエンコーディングによってバイト数が変わります。

エンコーディング 英数字 ひらがな・カタカナ 漢字 特徴
UTF-8 1バイト 3バイト 3バイト 世界標準、Web・メールで広く使用
UTF-16 2バイト 2バイト 2バイト すべて2バイト、Windows内部で使用
Shift_JIS 1バイト 2バイト 2バイト 日本語の旧標準、Windowsで使用(概算)
EUC-JP 1バイト 2バイト 2バイト Unix系で使用(概算)

UTF-8の詳細

  • ASCII文字(英数字記号):1バイト(0x00-0x7F)
  • ラテン文字拡張・ギリシャ文字など:2バイト
  • 日本語(ひらがな・カタカナ・漢字):3バイト
  • 絵文字・一部の特殊文字:4バイト

活用シーン

  • データベース設計:VARCHAR/TEXTフィールドのサイズ設定時
  • API開発:リクエストボディのサイズ制限チェック
  • メール送信:メール本文のサイズ確認(添付ファイル制限)
  • SMS送信:文字数・バイト数制限の確認(SMS: 全角70文字、半角160文字)
  • Twitter/SNS投稿:文字数制限の確認
  • ファイル容量計算:テキストファイルの概算サイズ
  • CSV/JSON作成:データサイズの見積もり
  • プログラミング:文字列処理のデバッグ
  • SEO対策:メタディスクリプションの文字数・バイト数確認

文字種別について

このツールでは、テキストを以下の文字種別に分類してカウントします:

  • 半角英数字:A-Z、a-z、0-9(ASCII文字)
  • 数字:0-9の数字文字
  • ひらがな:あ-ん、ぁ-ゔ
  • カタカナ:ア-ン、ァ-ヴ(全角・半角)
  • 漢字:常用漢字、JIS第1-2水準漢字など
  • 記号:句読点、括弧、演算子など
  • 空白・改行:スペース、タブ、改行コード

実用例

1. データベースのVARCHAR設定

例: ユーザー名フィールドに「山田太郎」を格納する場合

  • UTF-8:12バイト(4文字 × 3バイト)→ VARCHAR(12)以上が必要
  • UTF-16:8バイト(4文字 × 2バイト)→ VARCHAR(8)以上が必要

安全のため、最大文字数の3〜4倍のバイト数を設定するのが一般的です。

2. SMS送信の文字数制限

SMSの文字数制限(日本のキャリア):

  • 半角英数字:160文字まで
  • 全角文字(日本語):70文字まで

このツールで事前に文字数をチェックし、制限内に収めることができます。

3. API のペイロードサイズ制限

多くのAPIには、リクエストボディのサイズ制限があります:

  • AWS API Gateway:10MB制限
  • Google Cloud Functions:10MB制限
  • 一般的なREST API:1〜10MB程度

送信前にバイトサイズを確認し、制限を超えないようにします。

ご利用時の注意点

  • 入力内容はすべてブラウザ上でのみ処理され、サーバーには送信・保存されません
  • Shift_JISとEUC-JPは概算値です。正確な値が必要な場合はUTF-8またはUTF-16を使用してください
  • 改行コードもバイト数にカウントされます(LF: 1バイト、CRLF: 2バイト)
  • 絵文字はUTF-8で4バイト以上になることがあります
  • サロゲートペア(一部の漢字や絵文字)は2文字としてカウントされる場合があります
  • ブラウザによって改行コードの扱いが異なる場合があります

よくある質問

Q1. 文字数とバイト数の違いは?

文字数は人間が認識する文字の個数、バイト数はコンピュータが扱うデータの大きさです。日本語などのマルチバイト文字は、1文字が複数バイトになります。

Q2. どのエンコーディングを選べばいい?

現代のWeb開発ではUTF-8が推奨されます。UTF-8は世界標準で、英語圏・日本語圏どちらでも効率的にデータを扱えます。

Q3. なぜShift_JISとEUC-JPは「概算」なの?

JavaScriptではこれらのエンコーディングを直接扱えないため、文字の種類から推定した概算値を表示しています。正確な値が必要な場合は、サーバーサイドで計算するか、UTF-8/UTF-16を使用してください。

Q4. 絵文字のバイト数は?

UTF-8では絵文字は通常4バイトです。例:😀 = 4バイト。一部の絵文字は複数の文字の組み合わせで、さらに大きくなることがあります。

Q5. データベースのVARCHARは文字数?バイト数?

データベースによって異なります。MySQL(UTF-8)では文字数で指定しますが、内部的には1文字あたり最大3バイト(utf8mb4では4バイト)として扱います。PostgreSQLも文字数ベースです。

Q6. 入力したデータは保存される?

いいえ、すべてブラウザ内で処理され、サーバーには一切送信されません。安心してご利用ください。