討 論

<著作権か公共財か>
小杉 討論を進めるに際して、いくつかのポイントを提出したいと思います。第1に、保坂さんの議論と関連するものですが、インターネット上での学術発表という問題です。これには2つの問題があるかと思います。まず著作権をめぐる問題。インターネット上での著作権をいかに保護するかということですが、これは音楽関係の配信とも共通しています。ただこれとは異なる立場もあって、それはインターネットでは著作権を考えるべきではないというものです。得られるのは「名誉」だけ、フリーでどんどん出していって、インターネット上での情報は公共財とするという発想です。

 もう1つ、インターネットでの発表は、研究成果として認められるのか、そして業績としてカウントされるのかという問題があります。理系の場合、同一目標へのより早い到達を競争しあっているわけですから、研究成果はインターネットにどんどん出したほうがいい。また公刊が義務付けられている博士論文も大量に発表されていますから、必ずしもすべてが出版されるわけではない。むしろ、インターネット上に1年間掲載されていれば、それで公刊とみなされるところまできている。

 しかし人文・社会科学系では、そこまで早さを争うことはないし、我々にはまだ学術論文は印刷物であるという思考がある。いずれは文系でも、理系と同じようになるかと思いますが、今はちょうど狭間の時期にあるわけです。つまり一方ではインターネットを使った情報の公開が求められており、研究者もそれに応えていくべきなのですが、しかし現状では論文をインターネットで発表しても、業績としてもカウントされない。

保坂 研究成果として認められるかという点についてですが、もしアインシュタインが相対性理論を自分のホームページで発表していたら、と考えてみてください。これを正規の学術論文ではないから引用しないというのは、あまりにも杓子定規に過ぎるでしょう。

小杉 なるほど、研究成果はある特定の人間のものとして認知され、引用もしてもらえると。学術性はあるわけですね。ただし、たとえば公募書類の業績リストにインターネット上での発表を書いても認めてはもらえない。この問題はどうすればいいんでしょうか。

赤堀 情報の種類によりけりのところもあるでしょう。出された成果が何らかの新たな発見に関わっている学問では、発表媒体が紙であれ、インターネットであれ、その発見の事実は残っていきます(1928年、フレミングがペニシリン発見、というように)。しかし文学や人類学のように、成果が解釈として提出されるものの場合、「みなで共有」では学問自体が成立しなくなる。そうした学問ではさしあたり、インターネットでの発表は、すでに紙媒体で発表済みのものに限られ、その場合には小杉さんがおっしゃるような問題は生じないかと思います。


 もう1つの考え方は、「これは私の業績にならなくてもいい、サービスで提供します」という情報も発信するというものです。そうした情報のあり方は、私の研究しているベドウィンの伝統歌謡のあり方と似ています。ベドウィンにあっては、歌というものは「誰か」のものではありません(近年、プロの歌手が出てきて多少状況は変わりつつありますが)。同じテーマの歌が、100年あるいは200年のうちに少しずつ変化をしながら、みなに共有された知的財産となっており、誰が作ったのか、誰が歌ったのかはあまり気にされません。インターネットは新たな部族社会の出現かもしれないわけです(笑)。


保坂 つまりその場合、この「素材」は基本的にフリーであり、付加価値をつけて本にする、あるいは論文にする人があっても構いませんよ、オープン・ソースですと覚悟しなければならないわけですよね。そこから話が展開する事例として、Linuxを取り上げた『伽藍とバザール』という本があります。Linuxはもともと「金をとらない、誰がリンクしてもいい」という姿勢でやっていたわけです。誰が作ったのでもない、いろんな人があちらに手を入れ、こちらに手を入れして改良されてできたものです。しかしある時期から著作権が発生し、値段をつけて売られるようになっていく。つまり付加価値の部分への著作権を、少なくとも買う側の人間は認めているわけです。

 さらに付け加えると、この『伽藍とバザール』はもともとインターネットでしか読めなかった。日本語の翻訳も同様です。それが超有名なサイトとなって、本としても出版されることになったわけです。オンラインから本になるという事例は、今までの議論とは逆方向で面白いかと思います。

<新しい媒体として>
林 インターネット上の論文が業績として認められるかどうか、今は過渡期という話が出ましたが、私はこの過渡期は10年くらい続くんじゃないかと思っています。ただPDFがこれだけ出てきたということは、印刷に変わるものが生まれつつあると認めてもいいでしょう。PDFはいわば半分デジタル・データということで、オリジナルの勝手な変更を許さずにインターネットに掲載できるわけです。つまり、紙しか考えられないという時代では明らかになくなったわけです。

小杉 インターネットと紙の中間ともいうべき電子媒体、つまりフロッピーやCD-Rももっと使っていい。研究会の成果報告など、書籍として何千部も印刷するには不向きだが、成果を積極的に還元したいという場合に、電子媒体は安価で有効な発表媒体になり得ますよね。増刷も容易なわけですから、在庫を持たずに求めに応じて作っていけばいい。新プロの成果の一部をこの方法で発表したり、あるいは将来的には学会のジャーナルを電子化したりする方向も考えられるかと思います。

林 そうですね。媒体はどんどん多様化するでしょうから、インターネットでの発表も、単にこれまでの代替品としてではなく、やはり積極的に画像、音声、あるいは双方向のコミュニケーションといったものを活用しなければ意味がありません。またその方向に特化していくことによってこそ、インターネット上の論文のオリジナリティ、ならびに発表者の権利も認められていくかと期待しています。

小杉 論文とは違いますが、公共財の提供という観点からは、林さんのお作りになったフォントにしても、アラビア語のユニオン・カタログにしても、たいへんな意義があるわけです。もちろんどんな作業もまずは自分の興味や関心があって、「こんなものを作ってみたい」というところから出発しているかと思いますが、しかし誰もができるわけではない。デジタル時代の研究環境を整えていくには、今後も個人ではとてもできない膨大な手間隙のかかる作業を、大いに進めていかなければならない。このような社会的インフラを構築する仕事に対しても、その意義を業績として評価していくべきだと私は思います。

<多言語環境>
小杉 ワープロでアラビア語と日本語を混ぜて使う場合、ほかの言語でも同様ですが、これまでは圧倒的にマックに分があった。たとえば、ウインドウズ98上でのグローバル・ライターは、ものすごく使い勝手が悪かった。日本語は単漢字変換だし、複数言語を混ぜて使用していて一方の言語のフォントを変えると、ほかの言語の方も一緒に変わってしまう。マックでナイサス・ライターならばその問題は起こらず、フォントをそれぞれの言語ごとに処理してくれる。ウインドウズ2000になって、だいぶマックに追いついてきた感じでしょうか?

保坂 そうですね。フォントの問題は大丈夫になりました。私が大きいと感じるのは、アラブ人から原稿をもらっても、問題なく読めるようになったことです。つまりアラビア語版のウインドウズ上で動く、アラビア語のワードで作られた文章を、こちらでも読める。ナイサス・ライターは、マルチ・リンガルのワープロとしてはかなり優れているとは思います。しかし私の知っている限り、アラブ圏でマックを使っている人は皆無ですから、これからの情報の交換はウインドウズでということになりそうです。ただしアメリカでは、アラビア語を使う研究者でもマックを愛好する人は多いようですから、そこは考えていかなくてはならない。

小杉 林さんが発表のときに、マックとウインドウズを変換するとき、文字コードがうまくあわないとおっしゃっていましたが、あれはいくつかの文字ということですか?

林 マックはマックで、ウィンドウズはウィンドウズでそれぞれに転写文字フォントを使えますが、同じコードに同じ形の文字を割り当てるのは難しい、という意味です。このため、あとから変換作業が必要になってきます。ただ、256文字中の主要な部分は共通のabc ですから、変換が必要な数はそれほど多くなく、それ自体はそんなに手間のかかる作業ではありません。

小杉 そうするとマックでもウインドウズでも大差がなくなってきたようですね。

林 アラビア語の場合、マック・アラビックからウインドウズ・アラビックへ変換するソフトが開発されています。現状では100%問題なしとはいきませんが、これは需要の問題であって、これからウインドウズの方でアラビア語が使えるようになればニーズも高まって、改良されていくでしょう。

小杉 データベースの多言語化はいかがでしょう。日本語とアラビア語を混ぜる場合、ファイルメーカー・プロのマック版はかなりいいと思うんですが、まだ文章を入れることはできません。

林 そうですね。そこの問題をクリアしようとしたら、4th Dimension というデータベースソフトでやるしかないですね。

小杉 4Dでは、日本語とアラビア語を混ぜることは可能なんですか?

林 いいえ、あとの処理を考えると領域ごとに分けた方が無難です。自由度が高く何でもできる分、設定が難しいので、誰でもが使えるというソフトではありませんね。ファイルメーカー・プロよりずっと難しい。

赤堀 ウインドウズ2000で、アクセス2000ならばどうでしょう?

保坂 通常の使用では、まず問題ないかと思います。私個人のアラビア語蔵書のリストをアクセスで作成しましたが、データの並べ替えもできますし、選択もできます。ただ若干問題はあるようで、たとえば「括弧()」を入力すると、きちんと処理されない。並べ替えの基準も、アラビア文字に母音記号がつくかつかないかで変わってくるようで、今一つよくわからない。まあ、これらは製品版の段階では改良されているかもしれませんが。

<文章作成とバックアップ>
小杉 一太郎にせよワードにせよ、文章を作成している途中で、「こわれる」ことがある。それを防ぐには、やはりエディタで文章作成する方がいいというのが私の持論なんですが、みなさんはどうしていらっしゃいますか?

林 私は頭からナイサス・ライターです。ほとんど問題は起こらないですね。

保坂 ウインドウズ2000になってからは、ワードでそのままやっています。NTでも言えることですが、やはり95や98よりはずっと堅牢ですね。それから、エディタではアラビア語を直接入力できないという問題もあります。

赤堀 私はさっき言ったように秀丸エディタを使っています。ただし、これは書く効率を上げるためで、特殊な文字や書式の問題がありますので、後からワードで読み直して完成させ、保存自体はワードのファイルで行っています。

小杉 知的生産に従事する我々にとって、書くことはもちろんですが、書いたものをきちんと保管することこそ、デジタル時代の研究作法の要と言えるでしょう。ウインドウズ2000になってだいぶ安定するようですが、これまで95、98で我々はだいぶ泣かされてきた(笑)。バックアップはどうなさっていますか?

保坂 私は気が向いたときに、システムごとCD-Rに焼いています。

林 日々行っている作業はZIPに保存しています。今ZIPの容量は250Mありますから、テキスト・ファイルだったらそれでかなり入ります。

赤堀 以前はシステムも含めてまるごとMOに保存していました。しかし作業に結構時間がかかる上、MOでも1枚では収まらなくなってきましたので、今はハードディスクの中にパーティションを切って、保存したいデータをそこに集中させています。そしてこれだけを1ヶ月に1回、MOにコピーしています。ハードディスク全体のバックアップは、とにかく作業に時間がかかって大変です。OSやプログラムはだめになったら入れ直せばよいと考えて、自分の作ったデータだけは頻繁にバックアップを取ることが肝心かと思います。

<ユニコードの抱える問題>
百瀬 私は現在、東京工業大学の大学院に在籍していますが、もともとは史学科で卒論はモンゴル史について書きました。そういう人間が見た理系の状況を2点ほどお話させていただきます。今、理系では学会レベルで論文のデータベース作りを進めています。ものすごいお金をつぎ込んだ非常に大掛かりな作業で、単位も「テラ」を使っています。1テラ=1024ギガですが、何十テラバイトという記憶容量を用意して、そこにがんがん蓄積しています。これは文系でも見習わなくてはならないと思います。検索技術も、概念検索という新しいタイプのものを開発中です。これはあるキーワードなり文章なりを入れると、コンピュータが一番近いと思われる内容の論文を引き出してくるというものです。

 マルチリンガルに関して一番の問題は、ユニコードです。ウインドウズ2000でマルチリンガルが実現できたのは、すなわちユニコードを完全にシステムに組み込んだということにほかなりません。ユニコードを使うためには、ユニコードに対応したOSとアプリケーション、そしてフォント、の3つが必要です。しかしこれですべて解決というわけにはいきません。なぜならユニコードが、文字コードそのものとして問題を抱えているからです。もともとユニコードのプロジェクトは、企業が推進したもので、そこでの論理は単純に言えばコストダウンを図るということです。これまでたとえばウインドウズは、まず英語版を出し、次にそのフォントデータや文字コードを移し変えて日本語版を作ってきました。しかしこの作業には、たいへんな時間と経費をかけなければなりません。それならば、最初から多言語を設定した文字コードを組み込んで、文字セットを切りかえるだけでローカライズできるようにしよう、というのがユニコードの根本にある発想です。しかしそこではユーザーのことはあまり考えられていません。特にCJK、つまりチャイナ、ジャパン、コリアの漢字は「これ似てるから1つにしちゃえ」という無理がまかり通っています。当然この中には、日本では使用されない漢字が入っています。文句を言うべき日本の技術者は、しかしユニコード作成中に何のクレームもしなかった。理系の人間は、我々のやっていることなどほとんど知らないし、理解しようとも思っていない。アラビア語なんて見たこともないんですね。彼らに言うことを聞いてもらうには、言葉は悪いですが「こうしろ」と脅迫しないとだめです。たとえばマイクロソフトに学会レベルでこちらの要求を突きつける、そのくらいやらないといけません。もちろん、こちらもそれなりに理論武装した上での話ですが。

 同じような例を挙げましょう。Javaというプログラム言語があって、これも完全にユニコードを取り込んでいます。最近、「一太郎」で有名なジャストシステムさんが、このJavaを使って「一太郎Ark」というソフトを作りました。Javaで作られているからには、アラビア語が使えてしかるべきなのですが、実際には「右→左」型の言語には対応していません。なぜかというと、製作会社の人間が、そういうニーズがあるということにまったく気が付いていないからです。潜在的に能力があるのに、使うことができない。この状況を変えるには、やはりこちらからの積極的な申し入れが必要です。

保坂 今年の8月にクウェートとアブダビに行って、主に図書館を巡ってきました。そこではユニコード一本槍で、ほかの選択肢は全然考えていません。ユニコードが正しいのかどうかといった議論すら存在しないんですね。しかし、英語とアラビア語がきちんと一緒になるというだけではだめなんだということを、我々は中東に向かって訴えていかなければならない。

小杉 では最後に、新プロの情報システム構築の進展具合について、新プロを代表して小松さんからお願いします。

小松 コンピュータによる新しい研究方法の開発、あるいはデータの蓄積は、新プロ発足当初からの目標です。しかし3年前、打ち合わせに参加した研究者の多くはe-mailさえ使っていなかった(笑)。そこから見ると、自画自賛になりますが、長足の進歩を遂げたのは間違いない。この間、新プロが情報システム構築として何をやってきたかをご紹介します。

 まず「地理情報システム」(データベース)ですが、これには詳細な地図、歴史、および統計の情報が盛り込まれている。私自身、中央アジアの地域研究にこれを応用しようとしています。民族紛争やイスラーム復興の動きが、ある特定の地域にどうして生じるのかを、地図や統計情報をもとに考えていこうというわけです。最近キルギスで起こった日本人誘拐事件を例に出すまでもなく、このようなデータベースの構築は、地域研究の社会的貢献にもつながるものです。しかし私も作業をやっていて痛感するのですが、いかんせん文系には、これを構築していく技術をもった人間がいない。最新の技術をもった専門家をリクルートしてきて、チームを編成することが緊急の課題となっています。

 そのほかにも、マイクロフィルムのデジタル情報化を進めるための機器を、東大(新プロ1班)と民博(3班)に入れました。また写真やビデオテープなどの映像資料のデジタル化およびデータベース化ですが、これは東文研(6班)で機器を購入しました。これらの作業も、新プロ期間中に大きく前進させたいものです。

 林さんのお話に出た多言語資料のデータベース化は、かなり進みました。連携をうまく進めて、イスラーム関係のユニオン・カタログを実現させたいものです。「串刺し検索」をするための機器も、東文研と民博に入っていますから、みなさんのニーズにもお応えできるかと思います。

 さて、国立大学に独立行政法人化の波が押し寄せるなど、今後ますます研究の公開性が求められることになるかと思います。特に科研費の場合がそうですが、研究者にインターネット上での業績公開が求められるでしょう。つまり「論文を書いて雑誌に掲載」という従来の研究発表の手段も大きく変わってくることになります。いったんインターネットで公開すれば、あちこちからリアクションがくるので、自分の議論に改定を求められることも生じます。これはある意味ではいいことだろうと思います。これまでの雑誌掲載では、読者は両手で数えられるくらいで、業績は増えても議論は起こらないわけです。このインターネット活用のメリットを享受するには、英語でもどしどし書くことです。「言うは易く、行うは難し」ですが、研究のインフラを整備する一方で、我々自身がインターネット上で積極的に発表することの重要性を認識することが、今一番求められているのではないでしょうか。

小杉 ありがとうございました。それではみなさん、懇親会の場でさらに議論を続けましょう。


デジタルのトップへ

1班のホームページへ