学術論文データベース


はじめに

特に新しい分野を研究する際, 多数の文献を漁って既にどういうことが成されているか調査する必要があります. 大体, 学会誌の特集を見たり, 最近では WEB で検索をして, まずは近い分野の文献を一個見つけ, その文献で参考にしている文献を芋づる式に辿って知識を蓄えます.

と言っても量が膨大ですし, 複数人で共同する場合, 知識や収集情報の共有が大変です. 特に大学の研究室など構成員が時間と共に変わる場合, 情報の引継ぎというのも必要でしょう.

そういう用途のため, CGI によるデータベースを作ってみました. CGI にしたのは, 参考文献というのは一種のリンクですので, WEB との相性がいいと考えたためです.

インストール

一式は こちらです. WEB から見える・実行できる環境に展開し, bin/TDBlib.pl に $BASEDIR の値を 展開したディレクトリの絶対パスに書き換えてください.

namazu がある場合, キーワードによる検索が可能です. インデックス生成の雛形が maintenance/makeindex.sh にありますので, パスを適当に書き換えてください. また, bin/namazu.cgi のシンボリック先を環境に合わせ書き換えてください.

展開先にある index.html がトップページです. あまり凝ってもしょうがないとシンプルに作ってますので, 必要なら好みに合わせ書き換えてください. また, namazu が入ってない/使わない場合 namazu 検索のフォームを消してください.

一方, namazu が入っている場合, 現状では検索対象はタイトル・著者・ 雑誌名及びコメントのみです. PDF も検索対象にしたい場合, 適当にフィルタを入れて makeindex.sh を書き換えてください.

使い方及びしくみ

適当なブラウザで一番上にある index.html (以下トップページ) にアクセスします. 新しく論文を登録する場合は「新規作成」を選びます. 「タイトル」及び「年 (西暦)」は必須項目です.

というのは, タイトルから適当な 20 文字の文字列を生成し, 年と併せて文献を管理しているからです. という訳で同じ年に発表された同じタイトルの文献は複数登録できません. また, 違うタイトルでも同じ文字列になる可能性も否定できません. その際は運が悪かったと諦めてください. 初め文字列生成に雑誌名や 1st author を含めようかとも考えたのですが, これらは略称で書かれることがあるため止めました. でも運用してみると, 結構英文字の大文字小文字が原文通りでなかったり誤植が多いことに気づきましたが... まぁそれは運用でなんとかしてください.

入力した文献を表示するには発表年数による文献一覧か namazu によるキーワード検索を行います. いずれもトップページで行うことができます.

その文献が引用している文献を登録するには参考文献の所で [新規追加] を選んでください. また, 近年は WEB で論文を公開してあったり, 講演会の資料が CD-ROM 配布であったりすることが多いですし, スキャナで PDF ファイルを作ることもできるご時世です. そこで, 本文の [追加] を選ぶと PDF ファイルをアップロード・閲覧できるようにしてあります. なお, 余計かもしれませんが PDF ファイルをアップロードすると, それは公開されます. 一般に PDF ファイル (スキャナで生成したものを含む) の著作権は, 著者もしくは学会に所属していますので, ファイヤーウォール等で守られたローカルな仲間内だけの環境等に限定するなど, 公開範囲に気をつけてください (個人的には見たい論文がすぐ WEB で手に入るとわざわざ図書館に行かずに済みうれしいんですけど... なかなか世の中難しいです).

引用文献ですが, 論文によっては 20 個も 30 個も参考文献に挙げているものがあり, その全てを登録することは現実的ではありません. そこで引用の一部分だけ登録できるようになっています. その際の管理ですが, 一般に引用は番号等のラベリングを行って記述されていますので, タイトルと発表年の他文献中でのラベル名が必須入力項目になっています.

登録した内容の編集や削除は [編集] を選択すると行えます. ただし上述したように, 発表年およびタイトルはデータの管理に使っているため変更はできません. 修正する場合は, 一旦削除してから入れなおしてください.

プログラムは, 念のため排他処理は入れてますが, 10〜20 人くらいのグループで同時に 2,3 名しかアクセスしないような環境を想定し, 結構いい加減に作ってます. 多人数が同時にアクセスしても, 一応動くとは思いますが, 反応が非常に鈍くなるのではと考えられます. また, 上述したように閉ざされた環境下で使われることを想定しているため, PDF ファイルの制限等セキュリティはまったく考慮してません.

全体的に動けばいいやと表示はシンプルですし, 特に文字コードの処理は手抜きです. そこらへんは必要に応じ適当に書き換えて使ってください.

最後にお約束ですが, 本プログラムによって生じたいかなる損失も作者は一切関知しません. あくまで自己責任でお願いします.


追記


[戻る]