くずし字解析AI

小話 | 2019.11.14

こんにちは。プログランドスタッフHです。

「AIを用いてくずし字を解読する」システムのコンペティションが開催されたというニュースがありました。
https://www3.nhk.or.jp/news/html/20191111/k10012173121000.html

くずし字は、その名の通り文字の形がくずれている上に、前後の文字と繋がって書かれていることも多く、あまりにも種類が多すぎるため、正確に読み解くのが難しいそうです。
昔の人はどうやって読んでいたのでしょうか。

現在のAI(Artificial Intelligence、人工知能)は、簡単にいうと、膨大なデータを元に「確からしい」答えを導き出すものです。
元となるデータ量が多ければ多いほど、正解に近い答えを出すことができるようになります。
今回優勝したくずし字解析AIには、約68万字を読み込ませ、正解率は95%に上ったそうです。

解析されていない古文書は国内に数億点も眠っているとのこと。
これらの中には、歴史を変えるような発見や、自然災害に対する重要な知見が含まれている可能性があります。
そして、AIが文字を解析したとしても、その文書の意味を読み解くことは、人間にしかできません。
『読解力』を鍛えることが、今後のIT社会では重要になってくるかもしれません。

※当ブログの内容は個人の見解であり、所属団体とは無関係です。ご了承ください。