
Apple新文字起こしAPI、速度テストでWhisperを圧倒
-
FromMacRumors
Apple、新文字起こしAPIで驚異的進化 競合Whisperを速度で圧倒
AppleがiOS 26とmacOS Tahoeで導入する新たな音声テキスト変換(文字起こし)APIが、OpenAIの「Whisper」を含む競合ツールを圧倒する劇的な速度向上を実現していることが、MacStoriesによるベータテストで明らかになりました。
MacStoriesのジョン・ヴォーヒーズ氏が実施したテストによると、Appleの新しいAPIは、34分間・7GBの動画ファイルをわずか45秒で処理。
これは、同ファイルを1分41秒で処理するMacWhisperのLarge V3 Turboモデルに比べ、約55%の高速化です。他のWhisperベースのツールはさらに時間を要し、一方で文字起こし品質には目立った差がないことも確認されています。
この高速化は、Appleが採用する「オンデバイス処理」によるものです。クラウドベースのサービスで発生するネットワーク通信の遅延を回避することで、圧倒的な高速処理を実現しています。
個々のファイルでは時間の差が小さく感じられるかもしれませんが、複数の動画や長時間のコンテンツを処理する際には、このパフォーマンス向上が飛躍的な効果を生むとヴォーヒーズ氏は指摘します。字幕作成や講義の文字起こしなどを頻繁に行うユーザーにとっては、大幅な時間短縮につながるでしょう。
新しいSpeechフレームワークは、iPhone、iPad、Mac、Vision Proの各プラットフォームで利用可能です。将来的には、Appleのこの技術がMacの文字起こしアプリにおける主流のソリューションとして、Whisperに取って代わると期待されています。

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
このサイトはアフィリエイト広告(Amazonアソシエイト含む)を掲載しています。