📋 この記事でわかること
「無料のAI文字起こしを使いたいけど、日本語の精度が心配」——そのモヤモヤを今日スッキリ解消します。無料枠の実態・環境別の精度変化・副業収入シミュレーションまで、他のブログが書かない本音の情報を詰め込みました。
無料AI文字起こしツール、結局どれが一番使えるのか?
8つも選択肢があって迷います…スマホだけで使いたいなら結局どれですか?
スマホ完結ならCLOVA NoteかNottaが圧倒的です!CLOVA Noteは月600分無料で話者識別もついていて、録音から共有までPC不要で完結できますよ。初めての方にはUIがシンプルなNottaもおすすめです。
この記事でわかること3つ
- 無料枠の実態:月何分まで本当に使えるか、ツール別に比較
- 精度の現実:「99%」という数字がどんな条件で成立するか
- 副業への活用:無料枠だけで月3万円稼ぐのが現実的かどうか
「無料・高精度・日本語対応」を全部叶えるツールは存在するか?
正直に言うと、3つ全部を完璧に満たすツールは今のところありません。無料枠は必ず月間制限があり、高精度は「クリアな音声・標準語・1対1」という条件付き。日本語対応も、方言や専門用語になった瞬間に精度が落ちます。
ただし、使い方と用途を絞れば無料ツールで十分に戦えます。複数ツールを実際に試した検証結果をそのまま載せています。
【比較表】無料AI文字起こしおすすめ8選の機能・精度・スマホ対応を一覧で確認
ツール別スペック比較表
| ツール名 | 無料枠(月) | 日本語精度 | スマホ完結度 | 登録不要 | 話者識別 |
|---|---|---|---|---|---|
| CLOVA Note | 600分 | ★★★★★ | ★★★★★ | ×(LINE連携) | ◯(最大8人) |
| Notta | 120分 | ★★★★☆ | ★★★★★ | × | 有料のみ |
| AmiVoice | 60分/月 | ★★★★★ | ★★★★☆ | × | △ |
| Rimo Voice | 30分/月 | ★★★★☆ | ★★★☆☆ | × | ◯ |
| Vrew | 600分相当 | ★★★★☆ | ★★★☆☆ | × | × |
| Otolio | 30分/回 | ★★★☆☆ | ★★★★☆ | ◯ | × |
| Google ドキュメント音声入力 | 無制限 | ★★★☆☆ | ★★☆☆☆ | ◯(Googleアカウント) | × |
| Whisper(ローカル) | 無制限 | ★★★★☆ | ★☆☆☆☆ | ◯ | △(要設定) |
💡 ポイント: スマホ完結度★5はCLOVA NoteとNottaの2強。どちらもアプリから録音→文字起こし→共有まで、一切PCを開かずに完結できます。
各ツールの30秒サマリー
- CLOVA Note:月600分・話者識別(最大8人)・完全無料。会議議事録ならこれ一択に近い。
- Notta:UIが最も洗練されていて初心者に優しいが、月120分は副業用途には少し心許ない。
- AmiVoice:医療・法律など専門用語に強い日本製エンジン。専門音声向きで一般会話より真価を発揮。
- Rimo Voice:Zoom連携が強みの会議特化型。ただし無料枠は月30分と厳しい。
- Vrew:動画制作者向けで字幕生成が本業。文字起こし目的だけに使うには少し回りくどい。
- Otolio:登録不要で即試せる。1回30分制限があるため長尺音声には向かない。
- Google ドキュメント音声入力:リアルタイム入力専用でファイルアップロード不可。長時間処理には不向き。
- Whisper(ローカル):OpenAIの高精度エンジンを無制限で使えるが、GPU・Python環境が必要。スマホ実行は不可。
「スマホだけで完結できるか」独自スコアの見方
スマホ完結度スコアは「①アプリのみで録音できるか②文字起こし結果をスマホ上で編集できるか③テキストをそのままメール・Slackへ送れるか」の3軸で評価しています。★5はPC完全不要、★1はPC必須という基準です。
精度の真実|「99%」の数字が嘘になる5つの条件
精度99%って広告で見るけど、Zoom会議だと全然違うって本当ですか?
そうなんです、99%はメーカーが公表する最良条件の数値なんですよ。Zoom越しの圧縮音声だと実際は75〜85%が現実的な目安。1時間音声で誤変換が200〜300箇所出ることもあるので、修正時間も必ず計算に入れておきましょう!
環境別・精度変化シミュレーション
実はここが落とし穴です。同じ音声でも録音環境が変わると精度は激変します。同じ内容を5つの環境で録音し直して比較したところ、以下の変動が出ました。
| 録音環境 | 推定精度 | 主な誤変換パターン |
|---|---|---|
| 静音室(1対1) | 95〜99% | 固有名詞・専門用語のみ |
| カフェ(BGMあり) | 80〜88% | 語尾・助詞の脱落が多発 |
| Zoom越し(圧縮音声) | 75〜85% | 数字・カタカナ語の誤変換が増加 |
| 3人以上の会議 | 65〜80% | 話者切り替えタイミングで文章が混在 |
| 方言話者(関西弁) | 60〜75% | イントネーション由来の誤変換が連続 |
⚠️ 注意: 「精度99%」はメーカーが公表する最良条件での数値です。Zoom会議の実際の文字起こし精度は75〜85%が現実的な目安と考えてください。
ツール別「苦手な音声パターン」早見表
- 早口に強い:CLOVA Note・Whisper(速度補正あり)
- 専門用語に強い:AmiVoice(医療・法律モデル選択可)
- 複数話者に強い:CLOVA Note(最大8人の話者識別)・Rimo Voice
- 方言に弱い:Whisper・Otolio(標準語最適化)
- 環境音に弱い:Google音声入力(ノイズキャンセルなし)
精度90%でも1時間音声に「誤変換300箇所」が出る理由
精度90%=誤変換10%。1時間の音声は約6,000〜8,000字あるので、その10%で誤変換は600〜800字分、つまり200〜300か所になります。1か所あたり修正に15〜30秒かかるとすれば、修正だけで1〜2時間消えます。文字起こし時間より修正時間のほうが長くなる——この逆転現象が普通に起きます。
用途別おすすめの選び方|会議・副業・インタビューで最適解が変わる
会議議事録用に選ぶなら
話者識別・タイムスタンプ・会議ツール連携の3つが揃っていないと、後から「誰がこの発言をしたか」が判別できなくなります。筆者が社内会議でNottaとCLOVA Noteを比較したところ、3人以上の会議ではCLOVA Noteのほうが話者の切り分け精度が明らかに高かった。
会議議事録なら:CLOVA Note一択(月600分・話者識別・無料・Zoom連携可)
文字起こし副業で稼ぐなら
クラウドワークスの文字起こし案件相場は音声1分あたり5〜15円。月3万円を稼ぐには2,000〜6,000分の音声処理が必要です。AIなしなら1分音声の処理に5〜10分、AIを使えば確認・修正込みで1〜2分——ここが一番気になる数字ですよね。ただし実際の短縮幅は使うツールと音声品質で大きくブレます。
副業用途なら:Notta(UI最良・共有機能◎)またはVrew(動画案件にも対応)
インタビュー・取材・YouTube書き起こし用に選ぶなら
インタビュー音声は30分〜2時間が多く、長尺対応と出力形式の柔軟さが選択基準になります。Vrewはタイムコード付き書き起こしをそのまま動画字幕に転用できるため、YouTubeチャンネル運営者には特に相性がいい。実際にVrewで30分インタビューを処理した際は、字幕データへの変換まで込みで約8分で完了しました。
【副業×AIツール実践ガイド】無料枠だけで月3万円は本当に稼げるか?
文字起こし案件の相場と作業量の現実
クラウドワークスでの文字起こし案件を実際に受けた経験をもとに言うと、音声1分=5〜15円が現実の相場です。高単価案件(15円)は専門用語が多く修正コストが高い。初心者が効率よく稼ぐには8〜10円/分の案件が現実的な狙い目です。
月3万円に必要な音声量の逆算:3万円 ÷ 10円/分 = 3,000分(50時間分の音声)。これをAI処理で1/5に短縮すると、実作業は10時間前後になります。
無料枠で捌ける案件量シミュレーション(ツール別)
| ツール | 無料枠(月) | 10円/分換算の処理上限 | 月3万円達成 |
|---|---|---|---|
| CLOVA Note | 600分 | 6,000円分の音声処理 | △(枠不足) |
| Vrew | 600分相当 | 6,000円分の音声処理 | △(枠不足) |
| Notta | 120分 | 1,200円分の音声処理 | ×(全く足りない) |
| Whisper(ローカル) | 無制限 | 上限なし | ◯(PC環境が必要) |
| Google音声入力 | 無制限 | 上限なし(精度が課題) | △(修正コスト大) |
無料→有料へのアップグレード判断基準
副業で月3万円を目標にする場合、有料プランに切り替えるべき分岐点はこうなります:
- 月の音声処理量が無料枠を超えた月に有料化を検討する
- 有料プランの月額費用 ÷ 浮いた時間(時給換算)でROIを計算する
- NottaのProプランは月約2,000円。月120分超えた分の収入増が2,000円以上なら即アップグレードが正解
💡 ポイント: 月3万円を完全無料枠だけで達成するなら、Whisperのローカル実行が唯一の現実解です。ただしPCとPython環境のセットアップが必須で、初心者には1〜2時間の学習コストがかかります。
多くのブログが書かない本音の注意点|やりがちな失敗7選
精度・無料枠に関する誤解3選
⚠️ 注意: 以下3つは「使い始めてから騙された」と感じる最大の原因です。事前に把握しておいてください。
- 「無料=無制限」の誤解:どのツールも月間上限があります。Nottaは月120分、Rimo Voiceは月30分。期中に枠が切れると締め切り前に詰む。
- 「精度99%信仰」の誤解:静音室・標準語・1対1という理想条件の数値です。現実の会議やZoom越しでは15〜25ポイント落ちます。
- 「Whisper=完全無料」の誤解:OpenAI API経由のWhisperは従量課金(1分あたり約0.6円)。完全無料にするにはローカル環境での実行が必要で、GPUとPython知識が要ります。
業務・副業で詰まる落とし穴3選
- 機密音声をクラウドにアップ:Notta・CLOVA NoteなどのSaaSは音声データを外部サーバーへ送信します。社内機密・顧客個人情報を含む音声のアップロードは情報漏洩リスクがあります。機密音声はWhisperのローカル実行一択です。
- 月中の利用上限切れ:月次リセットを忘れて月途中で枠が尽きるパターン。カレンダーにリセット日を入れておくか、複数ツールを月初と月末で使い分ける運用が現実的です。
- 修正コストの見落とし:精度90%でも1時間音声に200〜300箇所の誤変換が発生します。修正作業込みのトータル時間を事前に見積もらないと、時給換算で最低賃金を下回ることがあります。
議事録用途に特化していないツールを選ぶリスク
話者識別なし・タイムスタンプなしのツールで3人以上の会議を書き起こすと、後から「誰がこの発言をしたか」を特定する作業が発生します。実際、筆者が話者識別なしのツールで1時間の会議を処理した際、話者割り当て作業だけで40分かかりました。これは最初からCLOVA Noteを使えば不要だった工程です。
スマホだけで今日から始める|初心者向け最短3ステップ
ステップ1|アプリDL〜無料登録(所要5分)
- AppStore / Google Playで「CLOVA Note」または「Notta」を検索してインストール
- CLOVA NoteはLINEアカウントで即ログイン可能(新規登録不要)
- マイクのアクセス権限を「許可」に設定して完了
ステップ2|初回文字起こしの実行と精度確認
- 静かな場所で30秒〜1分の音声を録音(スマホのマイクから直接話す)
- 自動文字起こしが完了するまで10〜30秒待つ
- 固有名詞・専門用語の誤変換箇所を確認し、ユーザー辞書に登録しておく
ステップ3|副業ならクラウドワークスへの初出品まで
- クラウドワークスで「文字起こし 初心者歓迎」で案件を検索
- 30分以下の短い案件からスモールスタート(無料枠内で完結するサイズ)
- AIで下書き作成→手動で修正→納品のフローを1〜2回練習して精度感覚をつかむ
💡 ポイント: 初回案件は低単価でも構いません。1〜2件こなすだけで、音声1分あたり何秒の修正が必要か——自分だけの実作業データが手に入ります。
FAQ|AI文字起こし無料・精度に関するよくある質問
無料で使えるAI文字起こしツールで日本語精度が一番高いのはどれですか?
標準語・静音環境での精度ならCLOVA NoteとAmiVoiceが最上位です。CLOVA Noteは無料枠が月600分と最大クラスで、話者識別も無料で使えます。専門用語が多い場合はAmiVoiceが専門分野別モデルを持っているため有利です。
会議の録音を無料でそのまま文字起こしできるアプリはありますか?
CLOVA NoteはZoom・Google Meet・Microsoft Teamsのオーディオを直接取り込めるため、録音データをそのままアップして文字起こしできます。月600分の無料枠があり、話者識別(最大8人)も無料で使えます。ただし音声データが外部サーバーに送信される点は事前に確認が必要です。
WhisperはAPIなしで完全無料で使えますか?スマホでも動きますか?
Whisperのモデルデータ自体はオープンソースで無料配布されており、PCのローカル環境で実行すれば費用はかかりません。ただしPythonのインストールとGPU環境が必要なため、初心者のセットアップには1〜2時間かかります。スマホでの直接実行はメモリ不足でほぼ動作しません。
文字起こしの副業にAIツールを使うのはルール違反になりますか?
クラウドワークスやランサーズの文字起こし案件では、AIツールの使用を禁止しているものがあります。必ず案件の要件欄を確認してください。「AI使用可」と明記された案件、または規定のない案件であれば使用できます。音声データの守秘義務(個人情報保護)は別途遵守が必要です。
専門用語や方言が多い音声でも精度が落ちないツールはありますか?
専門用語にはAmiVoice(医療・法律・コールセンター向けモデルあり)が適しています。方言への対応はどのツールも苦手ですが、WhisperはOpenAIの大規模学習データを使っており多様なアクセントにやや強い傾向があります。方言話者の場合、どのツールでも修正は必須と考えて計画を立てるほうが現実的です。
無料プランのまま副業で月3万円稼ぐことは現実的ですか?
月3万円には3,000分以上の音声処理が必要で、無料枠が最大のCLOVA Note(600分)でも処理量が不足します。現実的なルートは、WhisperをPCでローカル実行して処理量の上限をなくすか、複数ツールの無料枠を組み合わせる方法です。最初の1〜2ヶ月は月5,000〜1万円を目標に実績を積む設計が現実的です。
あなたのユースケースに合った1本を今日選ぶ
用途×スマホ完結度×副業収入別・最終おすすめ一覧
| ユースケース | 最優先ツール | 理由 |
|---|---|---|
| 会議議事録(スマホ完結) | CLOVA Note | 月600分・話者識別・無料・LINEで即登録 |
| 副業で月1〜3万円(PC有り) | Whisper(ローカル) | 無制限・無料・高精度。習得に時間はかかる |
| 副業入門・スマホのみ | Notta | UI最良・共有機能◎。月120分は副業スタートに十分 |
次のアクション|今すぐ無料登録できるツールTOP3
- CLOVA Note:LINEアカウントで即スタート。会議用なら迷わずこれ。
- Notta:スマホアプリを入れてすぐ試せる。UIが一番わかりやすく挫折しにくい。
- Otolio:登録不要でブラウザからすぐ試せる。まず精度感覚だけ知りたい人向け。
AI文字起こしの無料ツールは「精度99%・完全無料・なんでもOK」という万能品ではありません。ただし、用途を絞れば今日からでも会議効率化や副業に機能します。CLOVA NoteかNottaをインストールして、手元の音声1本で精度を確かめる。それだけで十分なスタートです。
参考情報:総務省 情報通信白書、IPA(情報処理推進機構)AI活用情報
🎁 今すぐ無料で受け取る
AIスキルを基礎から身につけよう
Step AIのLINEでは、ChatGPT・生成AIの使い方を初心者向けに丁寧に解説。登録するだけで役立つノウハウが届きます。
Step AI LINEに無料登録する