→前ページ

第1回アラビア文字文献入力規則WG議事要旨


日時 平成13年6月8日(金) 13時00分〜17時00分

場所 国立情報学研究所20階講義室

出席者  林,後藤(イスラム地域研究),福田,中善寺(東洋文庫),山田,加藤,徳原(東外大),泉沢(アジ研),酒井,米澤,阿蘓品(NII)

 

議事1. 参加機関の動向報告についての報告: 東京大学文学部図書館の関係者と、アラビア語文献整理状況について相談した。現在、東洋史研究室の方で、アラビア語・ペルシア語図書の入力を希望しており、作業をどうすすめるかが図書館と話しあわれた。

議事2. アラビア文字文献の取扱いの基本方針について「アラビア文字文献の取り扱いについて」(配付資料)に基づいて審議を行った。

議事3. NACSIS-CAT上のフィールド毎の検討

「アラビア文字文献の取り扱いについて(別紙 DB構造一覧表)」,「アラビア語データベース入力マニュアル(東洋文庫 2001年6月版)」,「NACSIS-CATアラビア語入力基準作成にあたって(東京外国語大)」及び「アラビア文字資料の取扱いにおける検討事項及び検討スケジュール(案)(国立情報学研究所)」を参考にしながら,各フィールドでどのように記録するかを審議し,以下の方向で原案の作成を進めることとした。

 

VOL 資料に表示されたとおりに記録するが、数詞の部分は、AACR2に準拠し,洋数字とするか<案1>、または、表示のとおりにアラビア文字の数字を用いるか<案2>で、ペンディングとなった。
TR TRのよみのフィールドに翻字をいれる。

・ヨミとして翻字を記録することについて議論があったが,VTフィールドに翻字を記録する方法では,PTBLフィールドの場合,親書誌のオリジナル・スクリプトだけしか表示されず,ローカルシステムで不便であるため,このフィールドに記録することとした。

・翻字にどういう方式を用いるかについては、議論がわかれ<案1><案2>、ペンディングとなった。

<案1>
形式は,「(TRD)オリジナル・スクリプト||(TRR)LC翻字」
翻字として標準的なLC翻字を、必須とする。

<案2>
形式は,「(TRD)オリジナル・スクリプト||(TRR)自動変換翻字||(TRVR)LC翻字」とする。

翻字として最も標準的なものはLC翻字であるが,LC翻字を必須としてしまうと,作業効率が極端に悪くなり,入力が進展しない。そのため,単純な文字変換による翻字形を必須として自動的に埋込み,LC翻字は選択項目とする。

検索上は,自動変換翻字で十分であり,書誌の識別も可能である。 

・いずれの場合も、キリル文字等,翻字をVTフィールドに記録する方式と整合しないことになる。これに伴い,従来の「ヨミフィールド」を「異なるスクリプトでの表示形フィールド」(仮称)に読み替える。

VT TRと同じ。
ED 資料に表示されたとおりに記録する。
PUB 出版地,出版者,出版年については,資料に表示されたとおりに記録する。出版地,出版者が不明の時は,AACR2にしたがって,[S.l.],[s.n.]を用いる。出版年については,資料に表示された年号が西暦以外であれば,その年号に続けて西暦を補記する。また,必要があれば暦号を補記する。(出版年が西暦で2年にまたがる場合,YEARフィールドには最初の年を記録する。)
PHYS AACR2にしたがって記録する。
NOTE 定型句,導入語句等は,AACR2にしたがって英文を用いる。
CW TRと同じ
PTBL 番号等のうち,番号についてはVOLと同じ。中位の書誌についてはTRと同じ。
AL,UTL,CLS及びSH 次回に検討する。

議事4. その他

○区切り記号の問題

アラビックカンマ,セミコロン,スラッシュなどアラビア語として記録する記号類がNACSIS-CAT上で通常どおりに動作するかどうか,可能性がありそうな記号類を洗い出すなど,さらに検証することにした。

○ストップワードの問題

アラビア語では,定冠詞alや場合によっては前置詞・接続詞が,その後ろに出現する単語につながって表記される。したがって,単純な空白を区切りとして検索インデクスを作成すると,通常想定される単語からの検索が不可能となる,との問題があることが判明した。

○検索時の正規化の問題

翻字での検索におけるEXC(記号)の扱い,自動変換翻字を検索インデクスとすることに伴い,入力検索キーをどのように正規化するか,等について検討することとした。    

以上