第2回アラビア文字文献入力規則WG議事要旨 |
●日時: 平成13年7月12日(木)13時15分〜15時30分
●場所: 国立情報学研究所20階講義室
●出席者: 福田,中善寺(東洋文庫),内島,山田(東外大),酒井,米澤,阿蘓品(NII)、林,後藤(イスラム地域研究)
配布資料:
第1回アラビア文字文献入力規則WG議事要旨
アジア経済研究所:泉沢さんからのメール
翻字および数詞の問題について(東京外国語大学附属図書館)
アラビア文字からローマ字への自動変換テーブル(案)
東洋文庫ペルシア語目録データベース入力規則
議事:
議事に先立ち、web公開された東洋文庫・東外大・東洋文化研究所所蔵のアラビア語図書総合データベースの紹介がおこなわれた。
1. ストップワードの取扱い
配布資料4に基づき,ストップワードとすべき定冠詞・前置詞の取扱いについて検討した。
その後ろに出現する単語と結合するストップワードは,ヨミで示すと次の5種類である。
AL-, BI-, LI-, BAL-, LIL- (追加: VA-, VAL-, KA-. KAL-)
これらを機械的に分割することは困難である。
各単語について,そのままの形のインデクスと,先頭から上記5語を省いた形のインデクスを作成してはどうか。
その場合,BALとLILは2語からなるものであるから,その2語(BAL,LIL)を省いた形のインデクスと,先頭の1語だけ(BA,LI)を省いた形のインデクスを作成するのが望ましい。ただし,LILはもともとLIALの中間のAが落ちた形であるので,先頭1語を省いて残す文字はLではなくALとなる。
KA 等他にストップワードがないか,再度確認する。
2. 翻字形の取扱い
LC翻字形及び子音だけの自動変換翻字形について,配布資料2〜4を参照しながら検討した。
それぞれの考え方を参加機関に提示した上で,9月に開催予定の連絡会議で意見をとりまとめることとした。
3. 典拠の取扱いについて
原則としてAACR2に従い,現行の標目形のままとすることで問題ないと思われる。オリジナルスクリプトはSFフィールドに記述する。
4. 入力規則の取扱い
9月の連絡会議の結果により,本WGとしての案をまとめてNIIに提示する。最終的にNACSIS-CATでの取扱いをどうするかについては,NII側の検討にまかせることとする。