データの管理

 職場でシステム管理をしているということは何度も書いているのですが、今日はその打合で半日つぶれました。
 いや、つぶしたのは自分なので、巻き込まれた同僚がそう思っているのですね。


 それはさておき、今日の話し合いで一番印象に残ったことが、タイトルの通り。博物館で保持する膨大なデータについてです。先般書いた通り、セキュリティということで、外部からのアクセスには神経を使うように指示がきていますが、そうして一カ所に蓄積してあるデータの利用についてははっきりしていないような。
 もちろんはっきりさせるような話ではないのですが、これまで、博物館の創立から考えれば数十年分のデータが蓄積されています、デジタル化されているものだけでも結構な量になっています。
 そこにはプレーンテキストだけではなく、今はなきワープロソフトとか*1、そういうデータから、よく分からない画像データまで*2。で、そういうデータがハードディスクに蓄積されているのですね。全文検索である程度処理できるとはいえ、はたして管理できるのでしょうか?
 自分の胸に手を当てても結構(今となっては)なぞなデータを持っていますが、これが多数になれば…
 多分全データの総量は大したことはないのでしょうが、これを管理するというのは…
 いや、管理っていっても、統制しようというのではなく、有意義なデータをどうやってすくい上げようかという話なのですが、これが、今なら作った人の多くが存命ですし、ソフトを聞くとか、なんとかなるのですが、今後は誰が何時*3作ったデータか分からなくなると、どう使ってよいデータかも分からなくなるでしょうし。そう考えるとやっかいです。
 行政的な考えでは、使えない文書は作られるはずもないし*4、研究的な立場ではデータは個人に還元されるともいえます*5


 いや、現在で数ギガ、数年後にはテラのオーダーにのると思います。こういうデータってどうすればいいのでうかね。
 自分の個人データを考えてもそうですが、これが公的なものと考えると、なにか方策を考えないといけないのかな〜*6、という気になった次第です。

*1:自分で持っている中ではEGワードなんてありますね

*2:自分ではQV10のオリジナルデータ。これどうすれば見られるのか、誰か知りません?

*3:タイムスタンプはありますが

*4:もちろんファイルタイプなど考えられていない。この発送が紙ベースですから

*5:行政の研究はこの問題があるような気がします。業務(公費)で行った研究データは誰が保持するのか、ということですね。二次利用も含めて

*6:ぜんぜん浮かばないのですが