Lifelog~毎日保存したログから見えてくる個性

第7回整理は続くよいつまでも

問題は増えたファイルをどう整理するか

ハードウェアはハードディスクで決まりです。問題はソフトウェアとデータの構造です。 筆者の場合、ファイルの数は、この10年間、年間に5~12万程度を推移しています。

10年間のファイル数と容量の推移
10年間のファイル数と容量の推移
直近の10年分のファイルの数と容量の推移。デジタルカメラの解像度の向上にともなって、年々容量は増え続けました。ここ数年は開発をメインにしてきたので生活スタイルが変わり、容量はすこし頭打ちです。これを見る限り、1年分のデータでさえBlu-rayディスク1枚(50GB)に入らないことは明らかです。

これをどう整理するか、ということが肝心なのです。

5万という規模

年間に5万としても、これほどのモノは、コンピュータのファイル以外では扱えないだろうと思います。連載の3回目で、澁澤龍彦の蔵書数が1万冊だったという話をしました。1万冊の本は、書棚でざっと15本を超えます。幅80cmで50冊/1段×前後に置いたとして2倍×7段×15本という計算です。すべての本の表紙を見えるようにしたら、本棚の数は30本です。家中が本だらけ、という感覚になるでしょう。

ファイルのほうは、格段に容量をとりません。数字でいえば、1万ファイルは、わずか2~3カ月で達成してしまう量です。達成しても、部屋がコンピュータのファイルであふれるわけではありません。モノとファイルは根本的に異なるのです。

よく例に出すのですけれど、モノの整理というのは、じっさいにはあまりたいした数を扱っているわけではないことが大半です。モノは空間を占めるので、それほど大量のモノを扱うことはむずかしいのです。

モノに必要なのは空間的な整理

大量のモノといえば、梅棹忠夫が館長を務めていた国立民族学博物館は、モノの整理では、有数のノウハウをもっていると思います。一度その倉庫を見学したことがあります。体育館のような空間は、アジア、アフリカなどのように地域ごとに棚が作られていて、モノを地理的・空間的に整理しているのでした。

いっぽうで、コンピュータの中のファイルは、物理的な手がかりをほとんどもっていません。そこでこれをどう整理するか、というのが重要になってくるわけです。

国立民族学博物館
国立民族学博物館
大阪の万博記念公園にあり、大量のモノを収容整理している。
アフリカの人形
アフリカの人形
ちょっと怖いかな。夜には見たくない感じ。地域ごとに区分された棚がうしろに見えます。。

整理革命=検索技術の進歩

整理の点で、ひとつ革命的なことが起きているのは、もうみなさんご存じの通りです。

検索技術の大進歩です。インターネットに掲載されたテキスト情報に関しては、かなり検索によって情報を得られるケースが増えてきました。

検索があれば、整理はいらない、というような論調もあるみたいです。

それはあまりに楽観的だろうと筆者には思えます。それでも、検索でできることは、とても多いものです。

ローカルファイルの検索技術

筆者の扱っているような大規模なローカルファイルや、画像ファイルの検索に関してポピュラーなめだった技術は少ないのです。

筆者はMacintoshのユーザーでもあるのですが、Mac OS XのSpotlightという全文検索機能には、なかなか感慨深いものがあります。Spotlightでは、写真にタグをつければ、そのタグで写真を検索できる、といいます。

Windowsにも、同様の検索技術が搭載され始めました。

タグをつければ検索できる。では、タグがついていなかったら?

先の年間5万から10万のファイルには、タグはほぼ皆無です。検索できなければ意味がないのでしょうか。

ローカルファイルの検索技術

整理するか、タグづけするか、それはひとつの事柄の表裏を別の表現でいっているだけなのです。整理する手間も、タグづけする手間も、ユーザーにとっては結局はおなじで、整理のための整理、タグづけのためのタグづけというのは、とても正気で継続してつづけることはむずかしいと考えてしまうのです。シジフォスの苦行のようなものです。

タグがついていれば検索できるが、タグはついていない。ではどうやってタグをつけるのか、というところが最大の問題なのです。声を大にしてていいたい。世界にはタグがついていないのだ!

この議論抜きで、⁠Spotlightでは、写真を検索できます」というのは、ほとんどなにもいっていないのに等しい、と感じるわけです。逆にいえば、タグさえついていれば、SpotlightでなくてもGoogleでもWindowsでもなにを使っても検索できるわけですし。

結論からいえば、整理(のための整理を)しない

重要なことは、整理のための整理、タグづけのためのタグづけは不毛であるということです。なんらかのモチベーションがなければ、どんなことも無理だろうし、続かないでしょう。

整理のためのタグづけでなく、どうやってタグをつけるか。

これが大問題です。

この連載で作成している図版には、じつはタグがついています。このあたりが筆者的にはひとつの回答だろうと思っています。

その点、インターネットやフォークソノミーを新しいものと捉える向きには、だれかがタグづけしてくれるなにかを検索して手に入れられるのなら、後から来るユーザーのコストはゼロだ、ということになるのかもしれません。

問題なのは、筆者は「後から来るユーザー」でないことです。

画像とタグ
画像とタグ

この連載で作成している図版には、じつはタグがついています。公開版はサイズの関係で タグなしになっているようです。

タグづけをだれがする?

筆者の場合、音楽CDを買ってもすべての曲名をつけなおすほどこだわったりもするので、だれかがタグづけしてくれたものには価値をあまり見いだせていません。残念なことです。これがローカルにこだわる理由でもあります。

だいたい、インターネットはさまざまな理由で突如使えなくなることがあるので、依存度の低いローカルシステムのほうが安心でもあります。

音楽CDとタグ
音楽CDとタグ
取り込んだ音楽CDは、スキャンしたジャケットといっしょにフォルダに入れてすべてタグをつけ直しています。ボックスなどの場合には、ジャケット写真にfolder.jpgという名前をつけて、音楽プレイヤーなどに反映するようにもしています。
音楽CDとタグ2
音楽CDとタグ2
ジャケット写真のファイル名をfolder.jpgとすることで、アルバムのような感覚で表示できます。アルバムの種類なども記載しています。あ、誤植を発見してしまった…。7th albumがふたつもある…。調べると、(氷室京介はベスト盤が多いので、どれをアルバムと数えるかはいろいろ課題もありますが、オリジナルアルバムというてんでいうと、⁠I・DE・A』が6thアルバム、⁠MELLOW』が7thアルバムになるようです。

Amazonのデータベース

タグ、すなわちデータベースといえばAmazonは充実しています。筆者はAmazonのヘビーユーザーのひとりだと思います。年間で平均してン十万円くらい使っています。Amazonでは、おなじ本を二重買いしても警告をしてくれません。先日、山田祥平さんもおなじことを指摘してました。

これもデータベースを他人に預けておくことの不満のひとつです。ただデータがあってもしかたないのです。そういうのは整理のための整理にすぎない。

Amazonにしてみれば、間違いであっても売り上げがアップすればよいのかもしれません。しかたないのでローカルで重複チェックシステムを構築しています。購入したかどうかの チェックのためだけに毎回Amazonにログインするのは手間がかかりすぎます。

トップランナー

余談ですが、新譜の音楽CDを発売日に買うと、まだデータベースが整理されていなかったりして、結局自分で曲名を入力することになりますし、CDデータベースの日本語版は、アルファベットと数字をカタカナに開いたり全角で書いてあったりして、とても使えたもんじゃない、と感じます。全角で書いたアルファベットのまのぬけた感じ。カタカナや「~」などの記号を半角にした例さえあります。半角カタカナを使うなといいたい。

CDのIDはユニークではないので、まったく別のCDのタイトルが入力されることさえあります。油断も隙もあったもんじゃない。所有している約1万曲は、すべて曲名を修正しています。

後から来るユーザーは楽だろうなと本気で思います。筆者の場合、走っていたらいつのまにか一番前に立っていたというか、筆者の走る方向に向かっているのは筆者だけだのかもしれません。

そんなことはどうでもいいのです。スティーブ・ジョブズも有名なスタンフォード大学卒業祝賀スピーチで、⁠Your time is limited, so don't waste it living someone else's life.」といっています。

音楽CDとタグ3
音楽CDとタグ3

発売日に購入した音楽CDのタイトルは、ついていないこともよくあります。たとえばこれ は、2008/06/18(水)発売のMEG『STEP』です。タイトルその他はまったく入力されず、 ⁠トラック1」のままでした。

タグはないしあっても問題は少なくない

結局感じていることを言葉にすると、もっている情報にタグがついていることはないし、整理できていることもない、これに尽きます。複数人がタグづけを行うフォークソノミーの場合、表記の揺れを吸収する辞書なしには、ほとんどデータベースの体をなさないと思うし、あらかじめ整理された情報などない、ということに尽きます。

タグについての問題意識は共通のようで、佐々木正悟氏の『1 よくある問題「タグ」を扱う難しさ Google世代の整理術デジタル情報整理ハックス⁠』の2008/05/19でも、同じようなテーマをとりあげていらっしゃいました。

データベースも不完全

表記の揺れは、情報整理のプロフェッショナルであるはずのTRC図書流通センターのデータベースMARKにさえ存在します。

揺れはあってもいいのです。修正できればいい。でも、データベースの管理権限をもっていないと修正できないのです。

結局世界にあるものは、筆者の求めるものとは微妙に齟齬があるようです。だいたい、⁠尾辻克彦」⁠赤瀬川原平⁠⁠。表記が揺れているのは当然です。

もしも、筆者の生まれてくるのがあと100年遅かったら、求める情報はすべてデジタルで手にはいったのかも、という気がします。10~20年くらいだとまだむずかしい感じです。30年違ったら、ひと世代ですから、見ている風景はそうとう違っていたかもしれないな、と感じることはあります。

ともあれ、ないものねだりをしてもしかたないのでした。どんなものであっても、なければ作る以外に手にできる方法はないのです。わかってしまえば、ないことは苦にならないのです。所与だからです。重要なことは、整理のための整理ではなく、目的を実現するための整理です。

念のためにつけ加えれば、表記の揺れや誤記が「悪い」などとは筆者はまったく考えていません。筆者自身のデータでも、相当の間違いはあるのであり、日々それを変更しつづけることが重要だからです。間然するところがないデータなどありはしないのです。修正できるかどうかが重要なのだと思っています。

音TRC図書流通センター
TRC図書流通センター

図書用のデータベースMARKを提供していますが、相当内容にはばらつきというか表記の揺 れがあります。

落穂舎『落ち穂拾い通信』2004年春号
落穂舎『落ち穂拾い通信』2004年春号

ちなみに、ここでも誤記があり、たしか赤瀬川原平は、⁠源」ではなく「原」だったはず。 それをいうと、⁠辻」の点も2点だったような気もします。調べたら2点しんにょうでした。

おすすめ記事

記事・ニュース一覧