iPhoneでWhatsAppのボイスをテキストに変換する方法 (2026)。
3つのアプローチ、率直な長所と短所、ボイスごとに3秒未満で完結するワークフロー。
WhatsAppを開く。4分のボイスメッセージが届いている。今は聴けない — 会議中、バスの中、AirPodsで別のものを再生中。要点をテキストで欲しい。2026年に利用可能な3つの選択肢を、悪い方から良い方の順で紹介します。
1. iOS 26標準の文字起こし
iOS 16以降、AppleはiMessageのボイスメッセージに標準の文字起こしアクションを搭載しています。iOS 26では、システムメディアプレーヤーで再生するすべてのボイスメッセージに拡張されました。
使い方。 iMessageでボイスメッセージのバブルを長押し → 文字起こし。WhatsAppに直接の経路はありません:まずファイルを保存するか、iOSのネイティブプレーヤーで再生する必要があります — WhatsAppはデフォルトでこれを行いません。
長所と短所。
- 無料、プライベート(最近のiPhoneでは端末上で実行)。
- 要約なし。生の文字起こしのみで、TL;DRは出ません。
- WhatsApp、Telegram、Signalとは統合されない — iMessageのみ。
- 英語以外の音声では品質が大幅に低下します。
- タスク抽出やフォローアップなし。
向いている用途。 英語の短いiMessageボイスを1つ、生のテキストだけ欲しくスクロールも気にしない場合。
2. 汎用の文字起こしアプリ
Otter.ai、Rev、Descriptなど。これらは自分の声や会議を録音するために設計されており、他人のボイスメッセージを消費するためではありません。
使い方。 ボイスをiOS共有メニュー経由で転送 → アプリに貼り付け。実際には音声ファイルの共有を受け付けないアプリが多いので、ファイルアプリに保存してから手動でアップロードすることになります。
長所と短所。
- 英語は非常に正確、主要なヨーロッパ言語(日本語含む)もまずまず。
- プロのミーティング文字起こし向け価格 — 月10〜25ドルが一般的。
- ほとんどがアカウント登録、メール認証、ブラウザ経由のワークフローを要求。
- 長時間の録音用に設計され、他人の2分のボイスをサッと消費する用途には向かない。
- 要約なし — または要約は上位プランのみ。
向いている用途。 1語1語完璧な文字起こしが必要な長い会議録音。お母さんからのボイスにはオーバースペック。
3. 共有メニュー経由のフロー (VSkipの方式)
VSkipは、あらゆるメッセンジャーで他人のボイスメッセージを消費するという特定のワークフローのために作られたiOSアプリです。
使い方。
- WhatsAppでボイスメッセージのバブルを長押し。
- 共有をタップ。
- 共有シートでVSkipをタップ(初回はその他 → よく使う項目で上段に固定)。
- 約3秒後:3行の要約、抽出されたアクション、感情タグ、必要なら完全な文字起こし。
長所と短所。
- iOSの共有に対応するすべてのメッセンジャーで動作 — WhatsApp、Telegram、iMessage、Signal、Viber、Threema、Discordのボイス。
- 文字起こしではなく要約を生成 — 実際に聴くより速く読める。
- 10言語に標準対応、翻訳付き。
- 3日間無料トライアル、その後は1日2件の要約まで無料・アカウント不要。
- Groq(Whisper + Llama)を使うため、インターネット接続が必要。
- 有料プラン:週¥450、月¥780、年¥4,500。
向いている用途。 この投稿の冒頭の状況そのもの — 誰かにボイスを送られて、今すぐ要点が欲しく、来週も同じことを考えずにできるようにしたい。
TL;DR 比較
| アプローチ | 要約 | 言語 | コスト | |
|---|---|---|---|---|
| iOS 26 標準 | なし(iMessageのみ) | なし | 英語に偏る | 無料 |
| Otter/Rev/Descript | 手動アップロード | 上位プラン | 主要西欧言語 | 月$10〜25 |
| VSkip 共有メニュー | あり(直接) | あり | 10言語 | 週¥450・3日間無料 |
関連記事
In English: WhatsApp voice messages to text on iPhone · На русском: Расшифровать голосовое WhatsApp · VSkipの全機能 · VSkip for ADHD brains