メインコンテンツ
人文科学と情報科学を
コンピュータでつなぐ
木簡・くずし字解読システム「MOJIZO」を共同研究で開発
「人文科学領域へのコンピュータ活用をテーマに研究を進めています。その代表的な成果が、奈良文化財研究所や東京大学史料編纂所、さらに複数の大学教授と共同で開発した木簡・くずし字解読システム『MOJIZO』です。このシステムは、古文書に記された文字の画像を用いて、画像検索するためのデータベースであり、名前は『文字の蔵』という発想に由来しています」
そう語るのは、リベラルアーツ学群の耒代誠仁准教授。このデータベースでは、検索対象の画像を解析し、奈良文化財研究所が蓄積する木簡の字形・字体と、東京大学史料編纂所が集める古文書・古記録・典籍類の字形・字体のそれぞれから、類似する文字画像を表示。また、解読が難しい文字についても、似た「字形」の文字を連携検索することで、効率的に調査を進められる仕組みを実現している。
木簡・くずし字解読システム「MOJIZO」
古文書研究においてデジタルアーカイブの活用が課題となっており、ツールの利便性向上を目指して開発されたのが「MOJIZO」だ。2017年の開発当時は、現在ほどAIや機械学習が高度に発展していなかったこともあり、本システムでは、人間が古文書のデータをデジタル化し、字形をキーとして検索可能にする技術が採用された。
注目すべきは、同システムが漢字の「字種」を対象としなかった点だ。「字種」とは、同じ音や意味を持つ漢字のまとまりを指す。現代のコンピュータでは文字コードの形で整理された字種を用いることが多い。しかし、古文書には字種が定かではない字形が多く見られる。現代語の知識が古文書の取扱いに過度に影響することを防ぐため、「MOJIZO」では画像情報である字形をキーとした設計がなされている。
古文書のデジタルアーカイブ化の課題
古文書の字画像データをデジタルアーカイブする過程では、さまざまな課題が存在する。例えば、荷札や役所での事務処理などの実務的用途に広く使われた「古代木簡」の多くは地中に捨てられた状態で発見される。焼却されるより幸運といえるが、破損や腐食による影響は大きい。さらに、人為的に破壊された古代木簡も散見される。木片の再利用のために鉋(カンナ)で文字を削って消す方法が広く利用されていたが、文字の列が断片化するため読むことは難しくなる。消し切れなかった字形の一部が新しく書かれた字形と重なり、前述の破損や腐食の影響も重なって字形全体が不鮮明になることもある。結果としてほとんどの古代木簡は原形を留めておらず、コンピュータが文字を正確に認識するのが難しいケースも多い。
「近年のAI技術や画像認識技術の進化により、古文書に対しても関連画像を自動的に抽出・検索することが可能になりつつあります。しかし、誤った結果を引き出したり、誤読したりするリスクも依然として残されています。『MOJIZO』が目指しているのは、情報処理を過度に複雑にすることなく、字形だけを客観的に評価・検索し、それ以上のことは歴史学の専門家に委ねるという『古文書解読支援』の仕組みです。とはいえ、AIの進歩は日進月歩ですので、今後はもっと複雑で高度な仕組みも求められるでしょう」
古文書のデジタルアーカイブ普及に寄与する「MOJIZO」の反響
「MOJIZO」の実装は、古文書研究の現場に大きな影響を与えた。このシステムの導入をきっかけに、奈良文化財研究所や東京大学史料編纂所が公開するデータベースの利用頻度が大幅に増加したことがデータで示されている。また、それまでは利用が限られていた既存のデジタルアーカイブの検索回数も増加し、研究者の間で注目を集めたという。
「利用者数が増えた要因の一つは、システムの使いやすさにあると考えています。画像をアップロードするだけで簡単に情報検索ができる点が、ユーザーにとって非常に魅力的だったのでしょう。『MOJIZO』がリリースされた当時、ニュースでも取り上げられ話題になりました。その後、古文書の検索・解読支援のためのアプリやシステムが続々と開発されていったことを考えると、この研究がデジタルアーカイブ分野の発展に貢献する道標の一つになったのではないかと思います」

大学入学時は情報系の学びに苦労したが
自分の名字が研究者への道を切り開いた
インターネット黎明期の中学生時代にコンピュータに興味を抱いた
耒代准教授が初めてコンピュータに触れたのは、1980年代後半の中学生時代。当時はまだインターネットが一般家庭に普及しておらず、学校へのパソコン教室導入が始まったばかりの時期だった。耒代准教授はコンピュータに強い関心を抱き、両親に懇願して50万円以上もするパソコンを購入してもらったという。そして、それに触れるたびに新しい発見があり、次第にその魅力に引き込まれていった。高校進学後にはプログラミングに興味を持ち、大学では電子情報工学科への進学を決意。しかし、大学生活の始まりは決して順風満帆ではなかったと耒代准教授は振り返る。
「周囲の学生の中にはすでにパソコンやプログラミングに詳しい人が多い一方で、私は完全な初学者でした。課題に取り組む時間が膨大で、遊びやアルバイトをする余裕もなく、必死に取り組んでいました。振り返ってみると非常に苦労したことばかりが思い出されます」
自身の名字が研究活動の原点に
耒代准教授が研究への道を切り開いたのは、手書き文字の画像認識をテーマとする研究室に配属されたことがきっかけだった。その研究に興味を持った背景には、自身の名字「耒代」にまつわるユニークなエピソードがある。
「私の名字『耒代』は、もともとは『来代』と表記されていました。古い親戚のお墓なども『来代』と彫られています。しかし、戦後の混乱期に役所で書類を作成する際、誰かが誤って『耒』と記載してしまったようです。その結果、3本線の文字が正式な名字として登録されました。この字形は手書きでは読めるものの、コンピュータでは正しく扱えないことが多いのです。これに対応するために農機具を意味する『耒』の字が当てられましたが、実際には『キタダイ』とは読めません。小学生時代、読書感想文で表彰された際に校長先生が名字を正しく読めなかったこともありました」
こうした経験から、耒代准教授は字画像データの研究に関心を抱くようになった。プログラミングに苦戦した過去を乗り越え、「これが自分の研究だ」と思えるテーマに向き合うことで、学びが一気に楽しくなったという。
その後、研究を進めるなかで、国立民族学博物館で研究員を務めていた及川昭文氏や、奈良文化財研究所の研究者との出会いが転機となり、古文書のデジタルアーカイブを対象とする共同研究に取り組むようになった。
自分のなかに眠る関心が
独自の研究につながる
高等教育における情報教育の実践
近年、耒代准教授が力を注いでいるのは情報教育の分野だ。この取り組みには、大学1・2年生を対象とした基礎教育と、3・4年生を対象とした研究指向型教育の2つのアプローチがあり、桜美林大学で実践されている。
「1・2年生向けの授業では、プログラミングや数式を使った内容よりも、レポート作成や研究活動で役立つツールの使い方を身に付けることを重視しています。そうした実際的な学びを通して、テクノロジーへの興味を引き出すのです。また、近年、高校の情報科目が充実したことで、これまで大学1年生が初めて学んでいた内容が、すでに高校で扱われるようにもなっています。そのため、学生がどのような学びを経験してきたのかを把握し、それに基づいた大学での情報リテラシー教育のアップデートも必要でしょう」
情報リテラシー科目では、例えば、画像認識技術を活かしたアプリを操作して結果を確認するようなアクティビティを通じて、学生が興味を持てる工夫を凝らしているという。一方で、より専門的な学びを求める学生には、リベラルアーツ学群の情報系教員と協力し、専門的な領域を披露することで、研究へのビジョンを示している。こうした取り組みを進めるなかで、桜美林大学の学生の興味が着実に高まっていることを、アンケート調査などから実感しているという。
研究活動のキーワードは、「楽しさ」と「嬉しさ」
3・4年生向けの教育では、学生が自分の興味や関心に基づいたテーマを見つけ、主体的に取り組む姿勢を育てることが重要だと耒代准教授は考えている。自身の名字にまつわるエピソードをきっかけに研究を始めた経験からも、「これが自分の研究だ」と思えるテーマの発見が研究へのモチベーションにつながると感じているのだ。
「研究を続ける上で大切なのは、『楽しさ』と『嬉しさ』です。自分が研究していて楽しいと感じられること、その結果が他者の課題解決につながり嬉しさを共有できること。この2つが揃うことで、研究はより充実したものになります。楽しいだけで終わらせず、その成果を外部に発信し、他者の反応を得る。良い評価が得られるとさらに嬉しくなりますし、たとえ思うような結果が得られなくても、そこから学べることも多い。これが研究の本質だと思います」

その理念を反映した授業として、「システム設計論」がある。この授業では、4人程度のチームで成果物を作成し、自分の「楽しい」と感じるテーマを他者と協働しながら形にしていく。そしてその過程で「嬉しさ」を共有することで、学生が自分の研究への手がかりを掴むことを目指している。
「AIをはじめとするテクノロジーの進展により、労働から解放される未来がしばしば語られます。しかし、そのような時代においても、人間が主体的に活動し、創造性を発揮する場面は必ず残るでしょう。その際、『楽しいから取り組む』という純粋な動機が、他者に喜びをもたらす原動力になると考えています。私自身、この理念を大切にしながら、人文科学の領域でコンピュータを活用する研究に取り組んできました。未来を見据え、自分自身が楽しさや嬉しさを感じられる研究を追究し続けることが、研究の質を高めるとともに、次の世代にその価値を伝える道になると信じています。こうした研究者としての姿勢や体験を、桜美林大学の学生たちに共有することこそ、私が取り組む情報教育の核であると考えています」
教員紹介
Profile

耒代 誠仁教授
Akihito Kitadai
1976年生まれ。東京農工大学 博士課程修了 博士(工学)。東京農工大学 産官学連携・知的財産センター 研究員、東京農工大学 助手/助教、東京農工大学 特任准教授、桜美林大学 総合科学系/基盤教育院 専任講師、桜美林大学 リベラルアーツ学群 専任講師などを経て、2017年より現職。人文科学領域におけるコンピュータ活用が専門に、近年は、情報リテラシー教育の開発にも取り組んでいる。
教員情報をみる