FFTrans Neu 1.3でさらなる軽量・高速化

CoreML対応の軽量版、オフライン、話者分離・長時間対応文字起こしアプリ「FFTrans Neu」ですが、立て続けにバージョンアップして1.3をリリースいたしました。

1.3までに追加した内容は以下の通りです。

[ Version 1.3.0 ]
・文字起こし処理を見直し、Neural Engineのみでの処理として高速化
・行編集機能を追加

[ Version 1.2.0 ]
・アプリ非アクティブ時に完了通知する機能を追加
・文字起こし結果の文字サイズを少し大きめに

[ Version 1.1.0 ]
・カスタム辞書の高速化
・プログレスバーを追加
・文字起こし中止ロジックを改善
・CSVの時間形式を修正

やはりいちばん大きいのは1.3.0で対応したNeural Engineのみでの文字起こし処理への改良でしょう。
Mac Studio M2 Maxでは6分のニュース動画で50秒→49秒と微々たる変化ですが、MacBook Air M3 8GBではなんと1分8秒→40秒と圧倒的な高速化となりました。
初回はCoreML対応のキャッシュをOSが生成する都合もあり、多少待たされる(最大で1分程度)ことがありますが、以後は高速に動作するようになります。

処理の見直しもありますが、何より新しい世代のNeural Engineが非常に強力になっているということでしょう。
GPU使用が一切なくなったので、省電力や発熱の少なさも大きく改善していますし、メモリ消費も減っているはずです。

FFTrans Pro固有の機能のうち、文字起こし結果の編集機能もほぼ同等のものを装備しました。
プログレスバーや完了通知など、Swiftベースだからこそ実現しやすくなった部分もあるくらいです。
精度の部分は話者分離を筆頭にやはりProとは少し差はありますが、そこはFFTrans-DSR搭載のProには敵わない部分です。
これも今後、AppleのSpeaker Diarizationやその他のEmbeddingsが扱えるようになれば改善の見込みはあるでしょう。

バージョンアップしても価格は永久ライセンスの4,980円で変わらずです。
ますます充実を図っていくFFTransシリーズを今後ともよろしくお願い申し上げます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)