
CoreML対応の軽量版、オフライン、話者分離・長時間対応文字起こしアプリ「FFTrans Neu」ですが、立て続けにバージョンアップして1.3をリリースいたしました。
1.3までに追加した内容は以下の通りです。
[ Version 1.3.0 ]
・文字起こし処理を見直し、Neural Engineのみでの処理として高速化
・行編集機能を追加[ Version 1.2.0 ]
・アプリ非アクティブ時に完了通知する機能を追加
・文字起こし結果の文字サイズを少し大きめに[ Version 1.1.0 ]
・カスタム辞書の高速化
・プログレスバーを追加
・文字起こし中止ロジックを改善
・CSVの時間形式を修正
やはりいちばん大きいのは1.3.0で対応したNeural Engineのみでの文字起こし処理への改良でしょう。
Mac Studio M2 Maxでは6分のニュース動画で50秒→49秒と微々たる変化ですが、MacBook Air M3 8GBではなんと1分8秒→40秒と圧倒的な高速化となりました。
初回はCoreML対応のキャッシュをOSが生成する都合もあり、多少待たされる(最大で1分程度)ことがありますが、以後は高速に動作するようになります。
処理の見直しもありますが、何より新しい世代のNeural Engineが非常に強力になっているということでしょう。
GPU使用が一切なくなったので、省電力や発熱の少なさも大きく改善していますし、メモリ消費も減っているはずです。
FFTrans Pro固有の機能のうち、文字起こし結果の編集機能もほぼ同等のものを装備しました。
プログレスバーや完了通知など、Swiftベースだからこそ実現しやすくなった部分もあるくらいです。
精度の部分は話者分離を筆頭にやはりProとは少し差はありますが、そこはFFTrans-DSR搭載のProには敵わない部分です。
これも今後、AppleのSpeaker Diarizationやその他のEmbeddingsが扱えるようになれば改善の見込みはあるでしょう。
バージョンアップしても価格は永久ライセンスの4,980円で変わらずです。
ますます充実を図っていくFFTransシリーズを今後ともよろしくお願い申し上げます。

