日時 平成13年6月8日(金) 13時00分〜17時00分
場所 国立情報学研究所20階講義室
出席者 林,後藤(イスラム地域研究),福田,中善寺(東洋文庫),山田,加藤,徳原(東外大),泉沢(アジ研),酒井,米澤,阿蘓品(NII)
議事1. 参加機関の動向報告についての報告: 東京大学文学部図書館の関係者と、アラビア語文献整理状況について相談した。現在、東洋史研究室の方で、アラビア語・ペルシア語図書の入力を希望しており、作業をどうすすめるかが図書館と話しあわれた。
議事2. アラビア文字文献の取扱いの基本方針について「アラビア文字文献の取り扱いについて」(配付資料)に基づいて審議を行った。
議事3. NACSIS-CAT上のフィールド毎の検討
「アラビア文字文献の取り扱いについて(別紙 DB構造一覧表)」,「アラビア語データベース入力マニュアル(東洋文庫 2001年6月版)」,「NACSIS-CATアラビア語入力基準作成にあたって(東京外国語大)」及び「アラビア文字資料の取扱いにおける検討事項及び検討スケジュール(案)(国立情報学研究所)」を参考にしながら,各フィールドでどのように記録するかを審議し,以下の方向で原案の作成を進めることとした。
VOL 資料に表示されたとおりに記録するが、数詞の部分は、AACR2に準拠し,洋数字とするか<案1>、または、表示のとおりにアラビア文字の数字を用いるか<案2>で、ペンディングとなった。 TR TRのよみのフィールドに翻字をいれる。 ・ヨミとして翻字を記録することについて議論があったが,VTフィールドに翻字を記録する方法では,PTBLフィールドの場合,親書誌のオリジナル・スクリプトだけしか表示されず,ローカルシステムで不便であるため,このフィールドに記録することとした。
・翻字にどういう方式を用いるかについては、議論がわかれ<案1><案2>、ペンディングとなった。
<案1>
形式は,「(TRD)オリジナル・スクリプト||(TRR)LC翻字」
翻字として標準的なLC翻字を、必須とする。<案2>
形式は,「(TRD)オリジナル・スクリプト||(TRR)自動変換翻字||(TRVR)LC翻字」とする。翻字として最も標準的なものはLC翻字であるが,LC翻字を必須としてしまうと,作業効率が極端に悪くなり,入力が進展しない。そのため,単純な文字変換による翻字形を必須として自動的に埋込み,LC翻字は選択項目とする。
検索上は,自動変換翻字で十分であり,書誌の識別も可能である。
・いずれの場合も、キリル文字等,翻字をVTフィールドに記録する方式と整合しないことになる。これに伴い,従来の「ヨミフィールド」を「異なるスクリプトでの表示形フィールド」(仮称)に読み替える。
VT TRと同じ。 ED 資料に表示されたとおりに記録する。 PUB 出版地,出版者,出版年については,資料に表示されたとおりに記録する。出版地,出版者が不明の時は,AACR2にしたがって,[S.l.],[s.n.]を用いる。出版年については,資料に表示された年号が西暦以外であれば,その年号に続けて西暦を補記する。また,必要があれば暦号を補記する。(出版年が西暦で2年にまたがる場合,YEARフィールドには最初の年を記録する。) PHYS AACR2にしたがって記録する。 NOTE 定型句,導入語句等は,AACR2にしたがって英文を用いる。 CW TRと同じ PTBL 番号等のうち,番号についてはVOLと同じ。中位の書誌についてはTRと同じ。 AL,UTL,CLS及びSH 次回に検討する。
議事4. その他
○区切り記号の問題
アラビックカンマ,セミコロン,スラッシュなどアラビア語として記録する記号類がNACSIS-CAT上で通常どおりに動作するかどうか,可能性がありそうな記号類を洗い出すなど,さらに検証することにした。
○ストップワードの問題
アラビア語では,定冠詞alや場合によっては前置詞・接続詞が,その後ろに出現する単語につながって表記される。したがって,単純な空白を区切りとして検索インデクスを作成すると,通常想定される単語からの検索が不可能となる,との問題があることが判明した。
○検索時の正規化の問題
翻字での検索におけるEXC(記号)の扱い,自動変換翻字を検索インデクスとすることに伴い,入力検索キーをどのように正規化するか,等について検討することとした。
以上