研究の背景と目的(第1章)

従来の近代語の一人称代名詞の研究は、文芸作品中の会話文を資料として当時の話し言葉における体系と通時的変化を解明することに焦点があてられてきた。一方で、当時の書き言葉(不特定多数の読者に向けた論説文・報道文の類)の一人称代名詞の研究はほとんど進んでいない。その解明のためには、当時の膨大な書き言葉の資料からその縮図となるように研究対象の資料を選定し、そこから網羅的に一人称代名詞の語形群を抽出し、語形相互の関係から体系や通時的変化を考察することが望ましい。しかし、人手による用例抽出を主とする従来の研究手法ではこうした研究を行うことは困難であった。そこで本研究は、明治・大正期の書き言葉で使用される一人称代名詞を網羅的に調査し、計量的な分析に基づき、その体系と通時的変化を明らかにすることを目的とする。そして、網羅的な用例抽出の実現のため、均衡性・代表性を担保した大規模な「近代雑誌コーパス」の構築を行う。

近代雑誌コーパスの設計と構築(第2章)

明治・大正期の大規模な言語資料として、国立国語研究所にて構築・公開された近代総合雑誌のコーパス『日本語歴史コーパス 明治・大正編Ⅰ雑誌』(以下、『明治・大正編Ⅰ』と呼ぶ)がある。本稿筆者は本コーパスの開発担当者の一人として設計・構築を主導した。その設計は、共時的・通時的な均衡性・代表性に配慮して収録雑誌を選定し、言語研究に必須の形態論情報(語境界・品詞情報等の情報)をはじめ、言語研究に有用なアノテーション(コーパスをより高度に利用するために付加された検索用情報)を高密度に付与するものとした。さらに本研究を進めるにあたり、『明治・大正編Ⅰ』の収録雑誌の年代的不足を補うため、『東洋学芸雑誌』を追加資料として選定し『明治・大正編Ⅰ』の設計に合わせて独自にコーパス化を行った。また、一人称代名詞の研究の観点として欠かせない話者の性別・社会階層に関するアノテーションの付与も独自に行った。このように『明治・大正編Ⅰ』に本研究に必要なデータを増補して構築した「近代雑誌コーパス」により、均衡性・代表性を担保した大規模なコーパスから、形態論情報を利用して網羅的に用例を抽出し、それと同時にアノテーションを利用して言語使用場面に関わる情報も取得し、それらを計量的に分析して使用場面による言語変種間の差異を考察できる研究環境を整えることができた。

一人称代名詞と使用場面属性の抽出・分類(第3章)

本研究で分析対象とする一人称代名詞の用例の抽出にあたり、コーパスの形態論情報を利用した抽出方法とその用法(「単数/複数」の2種)の分類規準を示した。また、用例分析の観点として、①文章種類(「文語体地の文/口語体地の文/口語体会話文」の3種)、②口語文体Ⅰ(常体・敬体の文末辞の多寡による口語体の分類で「常体/混合体(常体多)/混合体(敬体多)/敬体」の4種)、③口語文体Ⅱ(敬体の文末辞の種類の多寡による口語体の分類で「常体/ですます体/ございます体」の3種)、④使用者性別(「男性/女性/不明」の3種)、⑤使用者社会階層(「知識層/非知識層/不明」の3種)、⑥雑誌種類(収録雑誌7誌とその刊行年による分類で「明六(『明六雑誌』1874-75年)/東洋(『東洋学芸雑誌』1881-82年)/国民(『国民之友』1887-88年)/太陽Ⅰ(『太陽』1895年)/太陽Ⅱ(『太陽』1901年)/太陽Ⅲ(『太陽』1909年)/太陽Ⅳ(『太陽』1917年)/太陽Ⅴ(『太陽』1925年)/女雑(『女学雑誌』1894-95年)/女世(『女学世界』1909年)/婦倶(『婦人倶楽部』1925年)」の11種)をとりあげ、その分類規準とアノテーションを利用した情報抽出方法を示した。

言語量から見る近代雑誌コーパスの資料特性(第4章)

近代雑誌コーパスを研究に使用する前提としてその資料特性を明らかにするために、コーパスのアノテーションを利用して本研究に必要な観点から言語量の計量的な分析・考察を行った。その結果、近代雑誌コーパスは延べ語数1272万語という研究に十分な言語量を持つ資料であることをまず確認した。そして、非文芸記事の地の文について、①文体割合や口語文体割合に通時的変化が見られる、②著者の性別によって文体割合や口語文体割合に差異が見られる、③雑誌の読者層の性別によって文体割合や口語文体割合に差異が見られる、等を明らかにした。また、小説・戯曲記事中の口語体会話文について、話者の性別・社会階層によって会話文の言語量や口語文体割合に差異が見られる、等を明らかにした。

文語体書き言葉の一人称代名詞(第5章~第9章)

雑誌種類「明六/東洋/国民/太陽Ⅰ/太陽Ⅱ/太陽Ⅲ/太陽Ⅳ/太陽Ⅴ」の文語体地の文を資料として、当時の文語体書き言葉の一人称代名詞の体系・通時的変化を明らかにすべく分析・考察を行った。研究の前提として、3種の文章種類で使用される一人称代名詞の語形は全66種類あるが、文章種類間で各語形の使用頻度に大きな差異があることを明らかにし、文章種類別に一人称代名詞の体系・通時的変化を考察することの重要性を確認した。

文語体地の文の分析・考察の結果、①単数用法では候文体、複数用法では一人称代名詞の指示する範囲に対応した語形の使い分けが見られる、②著者と使用する語形には対応関係が見られ、一人称代名詞の語形は著者の好みにより選択され、著者の文章を特徴づける要素となっていた側面がある等、雑誌種類に共通する傾向を明らかにした。一方で、①「東洋」は使用される語形の種類数が少なく特定の語形が集中して用いられる、②「国民」は無署名記事で「吾人(ごじん)」を専用する、等の各雑誌種類に特有の傾向も明らかにした。

次に、雑誌種類の刊行年の時系列順に分析結果を比較し、通時的変化について考察した。その結果、複数用法の「吾人」が単数用法を進展させ、単数用法の主たる語形が「余(よ)」から「吾人」へと置き換わっていくという「吾人」を軸とした通時的変化を明らかにした。その変化は、著者が自身の論を展開する際、論に一般性を持たせるために、著者個人を指示する語形として本来複数用法の語形を使用することによりもたらされたと考えられる。

口語体書き言葉の一人称代名詞(第10章)

雑誌種類「太陽Ⅰ/太陽Ⅱ/太陽Ⅲ/太陽Ⅳ/太陽Ⅴ」の口語体地の文を資料として、当時の口語体書き言葉における一人称代名詞の体系・通時的変化を明らかにすべく分析・考察を行った。その結果、「私(わたくし・わたし)」を単数用法の主たる語形としながら、文語体地の文に特徴的な「余」「吾人」「我が輩」が勢力を持つ時期を挟む通時的変化を明らかにした。この変化は、口語体書き言葉の口語文体Ⅰが当初「混合体(敬体多)」が主流であったものが「常体」が主流となるという通時的変化において、「常体」に対応した語形として「余」「吾人」「我が輩」が選択されたことよってもたらされたものである。口語体書き言葉が、話し言葉的性質を脱し書き言葉として確立していく過程で、すでに書き言葉として確立していた文語体書き言葉の影響を受けつつ変化したことを示す事例と見なされる。

口語体会話文の一人称代名詞(第11章)

雑誌種類「太陽Ⅰ/太陽Ⅱ/太陽Ⅲ/太陽Ⅳ/太陽Ⅴ」の口語体会話文を資料として、当時の話し言葉の一人称代名詞の体系・通時的変化と口語体書き言葉との関係を明らかにすべく分析・考察を行った。その結果、①性別・社会階層でそれぞれ異なる一人称代名詞の体系を持つ、②知識層男性話者の口語体会話文の体系・通時的変化は知識層男性著者による口語体地の文の体系・通時的変化と密接に関係している、等を明らかにした。

女性雑誌の書き言葉の一人称代名詞(第12章)

女性を主な読者層とする雑誌種類「女雑/女世/婦倶」の文語体地の文・口語体地の文を資料として、女性著者による書き言葉や女性読者向けの書き言葉の一人称代名詞の体系を明らかにすべく分析・考察を行った。その結果、①女性著者は文語体では「われ」、口語体では「わたし」を主に使用し、男性著者とは異なる一人称代名詞の体系を持つ、②女性著者の使用する語形は、女性著者に特徴的な文体(文語体では和文体、口語体では敬体の文末辞を多用する文体)に対応して選択される、③女性雑誌では女性読者を意識して、男性著者も女性著者の一人称代名詞の体系に沿った語形を選択する傾向がある、等を明らかにした。

研究の成果と課題(第13章)

本研究の成果として、①近代雑誌コーパスの構築により、従来の人手による研究手法では困難であった、大規模コーパスの使用による包括的調査と計量的分析に基づく実証的研究を近代語研究で可能とし、今後の近代語研究の発展に寄与する環境を整備した、②明治・大正期の書き言葉の一人称代名詞の体系と通時的変化を明らかにしたことにより、近代語の新たな側面に光をあて新しい知見をもたらした、等があげられる。また今後の課題として、①本研究で構築したコーパスデータの未公開部分を公開する、②一人称代名詞の体系について、明治・大正期とその前後の時代との連続性を検討し、日本語史全体のなかに位置づける、③一人称代名詞以外の言語項目でも、近代の文語体書き言葉での通時的変化や文語体書き言葉から口語体書き言葉への影響が見出されるのか、コーパスを使って調査・分析し、近代文章史における新たな知見を得る、等があげられる。