2024.10.04 熊本大とTOPPAN、古文書5万枚の解読に成功 くずし字AI-OCRを活用

 熊本大学とTOPPANは、解読の難易度が高い、くずし字に対応したAI-OCR(光学文字認識技術)を活用し、未解読の古文書の解読に成功した。

 熊本大が公益財団法人永青文庫から委託を受けている歴史資料「細川家文書」のうち約5万枚の未解読の古文書を、TOPPANの光学認識技術「くずし字AI-OCR」を用いて短時間で解読し、約950万文字のテキストデータを生成した。さらに、くずし字資料の解読システムと連動するキーワード検索システムを...  (つづく)