SRTからローカルAIでニュース記事要約

FFTrans活用事例として、文字起こししたSRTファイルからローカルAIで要約してみました。
対象の音声はBBC Newsの「What is behind the rise in anti-tourism protests?」を使ってみました。

せっかく文字起こしをローカルでやったのですから、要約もオフラインでやりたいですよね。
まずはApple Intelligenceを使ってみます。
SRTファイルをテキストエディタで開き、全体を選択して「要約」を選びます。

結果はこんな感じ。

While tourism contributes significantly to global economies, some cities, like Barcelona, are experiencing backlash due to overcrowding, increased housing costs, and strain on local resources. This sentiment is not universal, as countries like France, Thailand, and Vietnam welcome tourists, viewing them as a vital economic driver. The varying attitudes towards tourism highlight the complexities of balancing economic growth with local well-being and cultural preservation.

The rise in affordable travel, fueled by budget airlines and social media, has led to a surge in tourism, causing backlash from local communities. This backlash, exacerbated by the COVID-19 pandemic, has prompted some destinations to implement measures like tourist taxes and bans on short-term rentals. While governments strive to balance resident satisfaction with tourism revenue, travelers are encouraged to be more mindful of their impact on local resources and communities.

Short trips can put acute pressure on destinations, making locals feel like strangers in their own homes. The MP in Mallorca suggests considering alternative travel options and longer stays in local areas.

英語ニュースだから当然ながら英語で要約されます。
速度はクラウドAIよりむしろ速いくらいで、なかなか快適です。

次はこれを日本語に翻訳してみます。
それもApple Intelligenceを使います。
テキストを選択して右クリックから「”xxxxx”を翻訳」を選びます。

初回だとオフライン辞書のダウンロードが必要な場合もあると思います。
結果はこんな感じです。(見やすさのために改行だけ修正しています。)

観光は世界経済に大きく貢献していますが、バルセロナのようないくつかの都市は、過密、住宅費の増加、地元の資源への負担のために反発を経験しています。
フランス、タイ、ベトナムなどの国は観光客を歓迎し、彼らを重要な経済推進力と見なしているため、この感情は普遍的ではありません。

観光に対するさまざまな態度は、経済成長と地域の福祉と文化の保存のバランスをとることの複雑さを強調しています。
格安航空会社とソーシャルメディアに支えられた手頃な価格の旅行の増加は、観光の急増につながり、地域社会からの反発を引き起こしています。
COVID-19のパンデミックによって悪化したこの反発は、一部の目的地に観光税や短期賃貸禁止などの措置を実施するよう促しました。
政府は住民の満足度と観光収入のバランスをとるよう努めていますが、旅行者は地元の資源やコミュニティへの影響にもっと気を配ることが奨励されています。

短い旅行は目的地に深刻な圧力をかけることができ、地元の人々は自分の家で見知らぬ人のように感じさせます。
マヨルカの国会議員は、代替の旅行オプションを検討し、地元での長期滞在を検討することを提案しています。

直訳的ではありますが、これもあっという間に翻訳できて意外とApple Intelligenceも良いですね。
SDKとして呼び出すこともできるので、要約や翻訳を自動化するユーティリティを別途作っても良いのかもしれません。

ただせっかくの話者ごとの要約はできないので、今度はLM Studioを使って話者ごとに要約させてみます。
モデルは「bartowski/mistralai_Mistral-Small-3.1-24B-Instruct-2503-GGUF」を使ってみました。

プロンプトはこんな感じで、一気に日本語にしてもらいます。

このSRTを話者ごとに日本語で要約して。マークダウンではなく、プレーンテキストで。

そして結果はこんな感じです。

以下は、提供されたSRTファイルの内容を話者ごとにまとめたものです。

**アナウンサー:**
– バルセロナやメキシコなどで反観光デモが起きている理由について説明。
– 観光客が多すぎることによる住民への影響(混雑、家賃高騰、資源不足)を強調。
– COVID-19パンデミック後の旅行需要増加とその背景にある問題点について触れている。

**コメント者1:**
– マヨルカでの観光客による影響(交通渋滞、水や電力の供給不足など)を具体例で説明。
– スペイン人がパンデミック中に自国を見直し、常時観光客がいる状況への反発を感じたことを述べる。

**コメント者2:**
– 東南アジア(タイやベトナム)での観光客増加について肯定的な見解を示す。
– 社会問題としてではなく経済成長のために観光客を受け入れている現状を説明する。

結局マークダウンになってますが、内容としては上手くまとまっていると思います。
ただ生成には72秒ほどかかっていて、メモリ消費も多いです。

次に「openai/gpt-oss-20b」を使ってやってみます。
こちらはなぜか添付ファイルだと上手くいかなかったので、プロンプトにSRTのテキストを全文貼り付けて実行しました。

**Announcer(ナレーター)**
– タイのマヤ湾は観光客が多く船が行き来した結果珊瑚礁が完全に破壊された。
– そのため、当局は利益よりも土地を守ることを選び、島を3年間閉鎖して回復させた。
– 観光客への反発が高まっている理由として、旅行費用の低下とCOVID‑19後に多くの人が早めに出かけたいと考えた点を挙げる。
– さらに、ソーシャルメディアで人気スポットが集中し、観光客が同じ場所へ集まりすぎて混雑や交通渋滞が発生していることを指摘する。
– 観光税の導入(ヴェネツィア)や短期賃貸禁止(バルセロナ)の施策を紹介し、政府は住民と観光収益の両立を図る必要があると述べる。
– 最後に、旅行者としてできる「迷惑を減らす」行動例(公共交通利用、車のレンタルを控える、長期滞在など)を提案する。

**Commentator1(コメントーター1)**
– スペインではCOVID‑19で観光客がいない状態を初めて体験し、ビーチやカフェが空っぽになったことに気づく。
– その結果、「いつもこうなるのか」「このレベルの観光に耐えなければならないのか」という疑問が生まれたと語る。
– 観光客として自らを省み、資源への要求(シャワー二重使用・廃棄物・車利用)や地元交通の活用、長期滞在による圧力軽減について考える必要があると訴える。
– マロカの議員に質問した際、「自分たちの住む場所で見知らぬ人になってしまう」感覚を抱くようになる点を指摘。

**Commentator2(コメントーター2)**
– 観光客が同じ人気スポットへ集中する「群集行動」が昔からあるが、SNSの影響でそのスピードと規模が加速していると説明。
– こうした状況は既に多くの場所で破壊を招いており、新たな観光地が発見される過程も早まっていると指摘。

こちらは43.86 tok/secとかなり高速で、ローカルのAIモデルもかなり進歩してきているなと感じます。
内容的にも議事録のような文書作成の土台として十分使える素材になっているでしょう。

参考までにこれまでの要約とクラウドAIに直接ニュースURLを渡して要約してもらったものを、議事録や記事作成の土台として評価してもらった結果がこんな感じです。

話者分離をできていないApple Intelligenceも意外と良い勝負をしていますね。
アプリ作るならSRTから話者ごとに分解して渡して要約させれば、他と同等くらいまで行ける可能性も高そうです。
いずれにしても、これならクラウドに頼らずとも、ローカルAIで十分要約はできると考えて良いでしょう。

本来なら会議音声があればもっと実運用に沿ったものも提示できるのですが、なかなかピッタリなものがなかったのでニュース音声で試してみました。
FFTransの活用の補助になれば幸いです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)