バイトサイズ計算ツール
テキストのバイトサイズをリアルタイムで計算。文字種別の内訳も視覚的に表示します。
テキスト入力
計算結果
詳細情報
文字種別の内訳
このツールの使い方
- テキストエリアにテキストを入力します(入力と同時に自動計算されます)
- エンコーディングを選択します(デフォルトはUTF-8)
- 文字数、バイト数、行数がリアルタイムで表示されます
- 文字種別の内訳が視覚的なバーグラフで表示されます
このツールの特徴
- リアルタイム計算:入力と同時に自動的にバイトサイズが計算されます
- 視覚的な分析:文字種別(英数字、ひらがな、カタカナ、漢字など)を色分けバーで表示
- 複数エンコーディング対応:UTF-8、UTF-16、Shift_JIS、EUC-JPに対応
- 詳細な単位変換:バイト、KB、MBでの表示
- シンプルで使いやすい:必要な情報だけを表示する洗練されたUI
- ブラウザ内完結:すべての処理はブラウザ内で完結、データは外部送信されません
- レスポンシブデザイン:PC・タブレット・スマホすべてに対応
- 完全無料:登録不要、回数制限なし
バイトサイズとは
バイトサイズは、テキストデータがコンピュータ上で占める記憶容量のことです。同じ文字数でも、使用する文字(英数字、日本語など)やエンコーディング方式によってバイト数は異なります。
バイトの単位
- 1 KB (キロバイト) = 1,024 Bytes
- 1 MB (メガバイト) = 1,024 KB = 1,048,576 Bytes
- 1 GB (ギガバイト) = 1,024 MB = 1,073,741,824 Bytes
エンコーディングについて
エンコーディングは、文字をコンピュータが理解できるバイト列に変換する方式です。同じ文字でもエンコーディングによってバイト数が変わります。
| エンコーディング | 英数字 | ひらがな・カタカナ | 漢字 | 特徴 |
|---|---|---|---|---|
| UTF-8 | 1バイト | 3バイト | 3バイト | 世界標準、Web・メールで広く使用 |
| UTF-16 | 2バイト | 2バイト | 2バイト | すべて2バイト、Windows内部で使用 |
| Shift_JIS | 1バイト | 2バイト | 2バイト | 日本語の旧標準、Windowsで使用(概算) |
| EUC-JP | 1バイト | 2バイト | 2バイト | Unix系で使用(概算) |
UTF-8の詳細
- ASCII文字(英数字記号):1バイト(0x00-0x7F)
- ラテン文字拡張・ギリシャ文字など:2バイト
- 日本語(ひらがな・カタカナ・漢字):3バイト
- 絵文字・一部の特殊文字:4バイト
活用シーン
- データベース設計:VARCHAR/TEXTフィールドのサイズ設定時
- API開発:リクエストボディのサイズ制限チェック
- メール送信:メール本文のサイズ確認(添付ファイル制限)
- SMS送信:文字数・バイト数制限の確認(SMS: 全角70文字、半角160文字)
- Twitter/SNS投稿:文字数制限の確認
- ファイル容量計算:テキストファイルの概算サイズ
- CSV/JSON作成:データサイズの見積もり
- プログラミング:文字列処理のデバッグ
- SEO対策:メタディスクリプションの文字数・バイト数確認
文字種別について
このツールでは、テキストを以下の文字種別に分類してカウントします:
- 半角英数字:A-Z、a-z、0-9(ASCII文字)
- 数字:0-9の数字文字
- ひらがな:あ-ん、ぁ-ゔ
- カタカナ:ア-ン、ァ-ヴ(全角・半角)
- 漢字:常用漢字、JIS第1-2水準漢字など
- 記号:句読点、括弧、演算子など
- 空白・改行:スペース、タブ、改行コード
実用例
1. データベースのVARCHAR設定
例: ユーザー名フィールドに「山田太郎」を格納する場合
- UTF-8:12バイト(4文字 × 3バイト)→ VARCHAR(12)以上が必要
- UTF-16:8バイト(4文字 × 2バイト)→ VARCHAR(8)以上が必要
安全のため、最大文字数の3〜4倍のバイト数を設定するのが一般的です。
2. SMS送信の文字数制限
SMSの文字数制限(日本のキャリア):
- 半角英数字:160文字まで
- 全角文字(日本語):70文字まで
このツールで事前に文字数をチェックし、制限内に収めることができます。
3. API のペイロードサイズ制限
多くのAPIには、リクエストボディのサイズ制限があります:
- AWS API Gateway:10MB制限
- Google Cloud Functions:10MB制限
- 一般的なREST API:1〜10MB程度
送信前にバイトサイズを確認し、制限を超えないようにします。
ご利用時の注意点
- 入力内容はすべてブラウザ上でのみ処理され、サーバーには送信・保存されません
- Shift_JISとEUC-JPは概算値です。正確な値が必要な場合はUTF-8またはUTF-16を使用してください
- 改行コードもバイト数にカウントされます(LF: 1バイト、CRLF: 2バイト)
- 絵文字はUTF-8で4バイト以上になることがあります
- サロゲートペア(一部の漢字や絵文字)は2文字としてカウントされる場合があります
- ブラウザによって改行コードの扱いが異なる場合があります
よくある質問
Q1. 文字数とバイト数の違いは?
文字数は人間が認識する文字の個数、バイト数はコンピュータが扱うデータの大きさです。日本語などのマルチバイト文字は、1文字が複数バイトになります。
Q2. どのエンコーディングを選べばいい?
現代のWeb開発ではUTF-8が推奨されます。UTF-8は世界標準で、英語圏・日本語圏どちらでも効率的にデータを扱えます。
Q3. なぜShift_JISとEUC-JPは「概算」なの?
JavaScriptではこれらのエンコーディングを直接扱えないため、文字の種類から推定した概算値を表示しています。正確な値が必要な場合は、サーバーサイドで計算するか、UTF-8/UTF-16を使用してください。
Q4. 絵文字のバイト数は?
UTF-8では絵文字は通常4バイトです。例:😀 = 4バイト。一部の絵文字は複数の文字の組み合わせで、さらに大きくなることがあります。
Q5. データベースのVARCHARは文字数?バイト数?
データベースによって異なります。MySQL(UTF-8)では文字数で指定しますが、内部的には1文字あたり最大3バイト(utf8mb4では4バイト)として扱います。PostgreSQLも文字数ベースです。
Q6. 入力したデータは保存される?
いいえ、すべてブラウザ内で処理され、サーバーには一切送信されません。安心してご利用ください。