アイヌ語口承文芸コーパス―音声・グロス付き―とは

 ここ10年間で、言語が消滅の危機にさらされているということは世界的に認知されてきました。また、言語ドキュメンテーションは、危機言語のデータを用いた多目的コーパスの構築を中心に独立の分野として確立されてきています。

 現在、アイヌ語の危機的な状況は深刻です。しかし、アイヌ語はもともと文字を用いない言語でしたが、一世紀以上前からさまざまな表記法が模索され、また筆録や音声の録音によって人々が記録に努めてきたおかげで、アイヌ語やアイヌ文化、アイヌの口承文芸に関する資料は豊富に残されています。よって、アイヌ研究は今後も絶えることなく、国際的により広く発表されることで成長もしていくことでしょう。そうした研究は、これから先、似たような状況にあるほかの危機言語コミュニティとの繋がりも強めていくはずです。

 『アイヌ語口承文芸コーパス―音声・グロスつき―』は、日本語と英語による訳とグロスや注解がついた初めてのアイヌ口承文芸デジタル集成です。ここで扱った音声資料は、中川裕が1977年から1983年に記録し、非常に優れたアイヌ語話者で語り部でもあった木村きみさん(1900-1988、沙流川上流域のペナコリ出身)が語ったものです。きみさんは、日本語よりもアイヌ語を自由に使えるほどの技量を持っていた方でした。その物語の豊富なレパートリーと語り口のテンポのよさには圧倒されます。

 ロンドン大学SOASの危機言語アーカイヴでは、言語資料を安全に長期間保管する場所が提供されており、当該音声ファイルもRausing基金による危機言語ドキュメンテーションプログラムの研究費プロジェクト「アイヌ語沙流方言のドキュメンテーション」(2007-2009;研究代表者:アンナ・ブガエワ)の研究成果の一部としてそこに保管されていました。保管されたファイルhttp://elar.soas.ac.uk/deposit/0107は、物語23編(ウエペケㇾ(散文説話)20編、カムイユカㇻ(神謡)3編;全録音時間は約7時間、アイヌ語の延べ語数は44,717語)です。

 2015年度、ここにグロスつきの物語10編(ウエペケㇾ(散文説話)8編、カムイユカㇻ(神謡)2編)を公開することができました。これは録音時間にして約3時間分です。次年度は、本コーパスに使用する残りの4時間分を公開予定です。

 本コーパスは、2015年度成果物刊行助成経費を受け、国立国語研究所共同研究プロジェクト「日本列島と周辺諸言語の類型論的・比較歴史的研究」(プロジェクトリーダー:ジョン・ホイットマン;そのなかのアイヌ語班リーダー:アンナ・ブガエワ)と「日本の消滅危機言語・方言の記録と伝承」(プロジェクトリーダー:木部暢子)の研究成果の一部として作成したものです。

 アイヌ語テキストの文字化は、中川裕(千葉大学教授、アイヌ語班メンバー)とアンナ・ブガエワ(国立国語研究所特任准教授、アイヌ語班リーダー)、和訳は中川裕、英訳はブガエワ・アンナ(協力:セラー・ルメ氏)が担当しました。英語と日本語によるグロス(形態論情報)付けは、アンナ・ブガエワの監督のもと小林美紀(千葉大学博士課程、国立国語研究所プロジェクト非常勤研究員、アイヌ語班メンバー)が行いました。そして何よりも、このオンラインシステムを構築した赤瀬川史朗氏(Lago言語研究所)の協力があってはじめて、このような成果が実現したと言えるでしょう。

 このコーパスが、今まさにアイヌ語・アイヌ文化復興への道のりを歩むアイヌ民族に、言語学者や文化人類学者の国際的なコミュニティに、アイヌ語に興味を抱くすべての人に役立つことを、そして、人類の知的遺産としてかけがえのない口承文芸のためになることを心より願っています。

2016 年2 月23 日、東京

中川裕、アンナ・ブガエワ、小林美紀