2020.11.02 【NHK技研90周年特集】開発と放送現場を支える有力企業・団体 NHKエンジニアリングシステム 山本真理事長
山本 理事長
放送業界の働き方改革「字起こしシステム」注力
NHKエンジニアリングシステム(NES)は、これまで多くの新技術の実用化に資するとともに、NHKが開発した技術の普及に向けて幅広く取り組んできた。
19年7月には「広く社会に、放送技術の可能性を届けたい」をモットーに、NHKの技術の社会還元という当財団の基本的な役割を一層推進するため、新たに「NESラボ」を立ち上げた。
NESラボでは、これまで行ってきた要素技術の技術移転にとどまらず、高度化・多様化するお客さまのニーズに合わせて柔軟にカスタマイズしていく。
現在注力するのは放送業界の働き方を変える「字起こしシステム」で、本サービスは4月から開始した。取材映像や記者会見などの音声を認識し、文字に書き起こす字起こしサーバーを設置して使うもので、同時に複数がサーバーにアクセスして修正を行えるので作業時間を大幅に短縮できる。この音声認識技術はリアルタイムに動作し字幕の制作作業にも使える。
NHKの放送を4500時間分学習した音響モデルと、放送された字幕を10年以上にわたり学習した原稿モデルによる高い認識精度が特徴。お客さまの要望に沿って開発からのカスタマイズにも対応する。現在、全国のNHK放送局や在京民放で使われ、作業時間の大幅な短縮や、部局をまたいで字起こし結果を共有できたことなどから、好評だ。
8K技術は放送以外の分野での活用も期待されている。特に医療分野では内視鏡手術での8Kカメラの小型化・高感度化などが求められており、池上通信機と共同で世界最小の医療用8K解像度カメラを開発。今後様々な分野での活用が見込まれる。AR/VR関連技術や顔画像認識技術を使ったシステムも展開している。
今後のサービスとして、多様な口調や声質を高い次元で実現するAI音声合成技術とそれを用いたソリューション「音声合成システム」の開発も推進。
これらの技術が、NHKが強化しているユニバーサルサービスにもつながる。視覚や聴覚に障害のある方が情報を享受し利用できるよう、音声の情報を字幕で、映像の情報を音声で提供するサービスが可能になる。社会貢献できるサービスを念頭に置いて研究開発を進める。