2021年10月28日 報道発表
AI音声認識エンジン「AmiVoice®」を採用し、地方議会などでリアルタイムに、精度の高い文字起こしが可能
~発言内容の文章表示や字幕表示を実現し、議会運営のユニバーサルデザイン対応を推進~
JVCケンウッドグループの株式会社JVCケンウッド・公共産業システムは、JVCブランドより、発言者の音声を自動で文字に変換し、文章あるいは字幕で表示をすることができる音声認識表示ソフトウェア「TZ-TRACER」を本日10月28日より発売します。
本ソフトウェアは、AI音声認識エンジン「AmiVoice®」を採用し、リアルタイムに、精度の高い文字起こしが可能。地方議会などにおける発言内容を、傍聴席の場内モニター画面には文章で表示し、インターネット中継や庁内配信などの発言者の映像には、字幕で表示することができます。本ソフトウェアにより、議会における発言を可視化することで、議会運営における難聴者支援など、ユニバーサルデザイン対応への推進をサポートします。
品 名 |
型 名 |
希望小売価格(税込) |
発売時期 |
---|---|---|---|
音声認識表示ソフトウェア |
TZ-TRACER |
オープン価格 |
10月28日 |
*本商品はお客さまのご要望に応じたシステムでの販売を前提としています。詳細は株式会社JVCケンウッド・公共産業システムまでお問い合わせください。
当社は、長年培ってきた音響・映像機器の独自技術とノウハウを生かし、マイクなどの主要ハード機材から制御ソフトウェアに至るまで、自社で開発・施工・保守を行ってきました。特に当社の議会ソリューションの歴史は約50年にわたり、機能と使いやすさを追求したシステムは、全国のお客さまから大変好評を得ています。
全国の地方議会では昨今、「開かれた議会」に向けた取り組みが推進されており、「障がいの有無、年齢、性別などに関わらず、多様な人々が議会に参加・傍聴できる環境を整える」といったユニバーサルデザインへの対応が求められています。しかし従来の議会運営における傍聴席の難聴者支援については、赤外線ラジエーター方式や磁気ループ方式といった通信システムや、手話通訳の導入が主流であり、設置費用などのコスト面や継続的な運営面で課題を抱えています。
そこで当社は、議会における発言者の音声をリアルタイムに文字起こしすることで可視化し、難聴者の方々の傍聴をサポートする音声認識表示ソフトウェア「TZ-TRACER」を発売します。本ソフトウェアは、自治体への導入実績も多い株式会社アドバンスト・メディア(以下、アドバンスト・メディア)の音声認識エンジン「AmiVoice®」を採用。「AmiVoice®」は、最新のディープラーニング技術を実装し、高い認識率を誇り、専門用語にも強いため、より自然な発話で音声認識が可能です。
音声認識によりテキスト化された情報は、議場の様子をリアルに見ることができる傍聴席では場内モニターに文章情報で表示し、遠隔で視聴するインターネット中継や庁内配信では、発言者の映像に字幕で表示できます。本ソフトウェアと最低限の映像・音響設備があれば、「リアル」と「遠隔」それぞれに適した2種類の画面表示が可能となり、コストを最低限に抑えた議会運営のユニバーサルデザイン対応の推進を実現します。
なお、本ソフトウェアの開発にあたり、株式会社大和速記情報センター(以下、大和速記情報センター)、株式会社ジェイ・フィット(以下、ジェイ・フィット)、および当社が共同で、全国の議会事務局へのヒアリングによる市場調査を実施。また、3社が長年培ってきた自治体の議会運営に関する知見も生かし、仕様の検討を行いました。その結果を踏まえて、当社が本ソフトウェアを開発しています。当社は、本ソフトウェアと当社映像・音響システムを連携するほか、大和速記情報センターが提供する辞書作成支援や導入後の辞書メンテナンスサポート、およびジェイ・フィットが提供する議会のライブ・録画映像のインターネット配信サービスと連携するなど、さまざまなニーズに合わせた議会ソリューションを提案します。
音声認識エンジンには、特に議会などの発言に多く含まれる専門用語の認識に強く、自治体への導入実績も多いアドバンスト・メディアの「AmiVoice®」を採用しました。ローカル認識型を使用しており、ネットワークに接続することなくオフラインでの使用が可能です。また、「AmiVoice®」は国内シェアNo.1※1の音声認識エンジンで、最新のディープラーニング技術を実装し、高い認識率を誇ります。アクセントやイントネーション、会話スピードに左右されず、自然な発話で認識できます。
※1:ITR「ITR Market View : AI市場2021」音声認識市場ベンダー別売上金額シェア(2015~2021年度予測)による。
地方議会などにおける発言内容を、会場でリアルに聞いている傍聴席の方々に対しては文章で表し、インターネット中継や庁内配信などの映像を遠隔で視聴する方々に対しては発言者の映像に字幕で表示することが可能。会場と遠隔地の両方から議会を傍聴できる環境を提供します。
<文章表示イメージ>
<字幕表示イメージ>
当社の議会ソリューションでは、カラーユニバーサルデザインに配慮した色使いで、誰にでも見やすい画面づくりを行っており、本ソフトウェアも文章表示と字幕表示のそれぞれにカラーバリエーションがあります。今回、その全ての表示画面および管理画面でカラーユニバーサルデザイン認証を取得。不特定多数の傍聴者や遠隔視聴者が見ることに配慮し、見続けても疲れにくく、明度の高いトーンでやさしい色使いを基本としています。また、議会に特化した配信サービスを提供するジェイ・フィットが蓄えた知見に基づき、字幕表示時に、映像エリアと文字エリアのバランスのパターンを6種類から選べるようにするなど、適切に情報を認識できる画面レイアウトを追求しています。
*「CUDマークはNPO法人カラーユニバーサルデザイン機構により、認証された印刷物、製品等に表示できるマークです。
<カラーパターン(ブルー)>
新しい条例名や、地域特有の人名や地名など、デフォルトでインストールされていない単語を登録ができます。特有の単語を「読み」と「単語」を入力するだけで登録できるため、認識できる単語を簡単に増やすことが可能です。
音声認識されたテキストデータは、パソコン上に保存されるため、議事録作成時にも有効に活用できます。テキストデータには、大和速記情報センターが得意とする議事録作成の視点と、ジェイ・フィットが得意とする映像制作の視点を盛り込み、3種類のフォーマット(csv、tsv、txt)による保存を可能としました。
当社製のタッチパネル式会議システムソフトウェア「jmee®」との連動設定が可能。「jmee®」での会議開始に本ソフトウェアを連動させることで、音声認識が自動で開始されます。両方のソフトウェアを操作する煩雑さがなくなり、操作ミスを防止します。
オペレーティングシステム |
Windows® 10 Pro |
---|---|
CPU |
Intel Core i5 以上 |
メモリ |
8GB以上 |
ディスプレイ解像度 |
1920×1080 |
映像出力 |
1~3系統 (マルチモニター対応) |
<傍聴席への文章表示システムイメージ>
<インターネット中継などへの字幕表示システムイメージ>
<商標について>
本件に関するお問い合わせ先
【報道関係窓口】
株式会社JVCケンウッド 企業コミュニケーション部 広報・IRグループ
TEL : 045-444-5310
〒221-0022 神奈川県横浜市神奈川区守屋町3丁目12番地
【お客様窓口】
株式会社JVCケンウッド・公共産業システム マーケティング統括部 音響ソリューション推進部
TEL : 045-443-3158
〒221-0022 神奈川県横浜市神奈川区守屋町3丁目12番地
本資料の内容は発表時のものです。最新の情報と異なる場合がありますのでご了承ください。