SUMMARY
GoogleがGemmaモデルを使ったオフライン動作の音声入力アプリをiOS向けにリリース。データがサーバーに送信されない設計。日本語対応: 不明。
背景
Wispr FlowやOtter.aiなど既存の音声入力ツールはクラウド処理前提で、機密性の高い企画案や打ち合わせ内容の口述には向かないという課題があった。GoogleがGemmaモデルをデバイス上で動かす選択をしたのは、そのプライバシー懸念への直接の回答といえる。
変更点
Gemmaモデルを端末内で処理することで、インターネット接続なしに音声をテキスト化できる。音声データがサーバーに送信されない設計で、Wispr Flowなどクラウド型ツールのオルタナティブとして位置づけられている。現時点ではiOSのみで提供。
Web制作への影響
移動中や打ち合わせ直後にアイデアをテキスト化したい場面で活用できる。電波の入りにくい現場や屋外ロケ時のメモ取り、クライアント先でのヒアリング記録など、ネット環境に左右されない点が実務での強みになる。議事録の下書きとして使えるかが最初の評価ポイントになるだろう。
注意点
日本語対応については一切の言及がなく、英語向けに最適化されている可能性が高い。使用されているGemmaのバージョンも不明で、精度はリリース後の実測が必要だ。現時点では過度な期待は禁物で、まずは試用ベースでの評価を推奨する。