FFTrans Pro 2.0.1をリリース

Apple Silicon搭載Mac専用のオフライン、話者分離・長時間対応文字起こしアプリ「FFTrans Pro」の最新バージョン、2.0.1をリリースしました。

変更点は以下の通りです。

・プレーンテキスト/CSVでの保存に対応

字幕ファイルのSRTに加え、話者と本文のみのプレーンテキストと、タイムライン、話者、本文を列ごとに分解したCSVファイルの出力に対応しました。
SRTだと上手く動作しないLLMでの要約や、文字起こし後の分析・加工に活用いただけます。

なおプレーンテキストはNSSavePanelとpySideの相性問題で、拡張子に「.txt」を指定すると保存ダイアログで拡張子が正しく付加されない場合が多く、これを回避するため「.log」での保存としています。
中身はutf-8の普通のテキストファイルですので、テキストエディタ等で普通に読み込むことが可能です。
CSVファイルはExcelとNumbersで正しく読み込めることを確認しております。

また、FFTrans Pro 2.0.0から搭載されたDynamic Speaker Re-embeddingをさらに活用し、字幕のタイムラインを自動的に発話に合わせて補正する機能「DSR Time Align」を次期バージョン2.1.0に搭載を検討しています。
話者分離で生成された字幕の表示タイミングを実際の話者の発話に合わせて自動的に微調整するもので、字幕の表示タイミングの精度向上はもちろんのこと、話者の発話期間の精度が上がることで話者の誤認識(DER)もさらに減ることを見込んでいます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)