【絵文録ことのは】HOME > [編集] > 極私的百科「閾ペディアことのは」のための「ことのは十進分類法」
ふと思いついて、自分のための極私的百科「閾ペディアことのは」を作ってみた、という話は前回の続き。これはWikiPedia(ウィキペディア)と同じく「MediaWiki」というWikiツールを使っている。そのため、見かけというか操作などはほとんど同じ。ただ、自分の好みの記事をガンガン登録できるという仕組みである。
ブログだとある程度その時点で固まった内容であることが多いが、ウィキならいつでも編集可能。そういう意味で両方あれば便利である。
ところで、MediaWikiが使いやすい理由として、カテゴリ分けが非常に柔軟に使えることが挙げられる。あとでいくらでも変更できるし、どれだけ深い階層でも何とかなる。この点、一応カテゴリ階層化もできるが、その分タイトルがどんどん長くなってしまうPukiWikiなどよりずっと使いやすい。つまり、カテゴリによる整理をしようと思ったら(知る限り、現状)MediaWikiが最適ということである。
ところが、このカテゴリ分けをどうするかでふと悩んだ。ウィキペディアの分類はあまり整理されていない。そこでいろいろと考えてみたのだった。
WikiPedia日本語版ではあまり整理されてないが、こんな分類。
もっと簡単に、WikiPediaにはこんな分け方もある。
そしてWikiPediaの「主要カテゴリ」はこう分類されている。
本当にまとまりがない感じだ。何となく網羅しているような感じはあるし、何となく収まった分類なのだろうが、わかりにくいところもある。「学問」が独立してるのも、ウィキペディアの現状には合っていても、自分のところにはあてはめにくい。何かほかに参考になるものはないだろうか。
そこで目をつけたのが、図書館の本の分類に使われている日本十進分類法(NDC)だ。すでに「ウェブログ図書館」がNDCによるブログ記事の分類を実行している。
十進分類法については、Myrmecoleon in Paradoxical Library. はてな分館 - ジャンルコードと分類法・3にわかりやすい説明がある。
まず十進分類法というのはどういうものなのかというと,端的にいえば「0-9の数字だけを用いてあらゆる主題を階層的に表現する分類法」という感じ。具体的にいうと,だいたい以下のような形式で分類されている。
- まず,この世のありとあらゆる本があるとする。
- これらの本を,大きなまとまり毎に9つに分け,それぞれに1から9までの番号をつける。
- 分けきれなかったものをまとめて,0の番号をつける。
- 0から9の10の各まとまりに対して,同じ作業を繰り返す。1のまとまりを9個に割った中で1の番号をつけられたまとまりを11と表す。ほかも同じ。
- 10のまとまりをさらに10に割った100のまとまりに対して,同じ作業を繰り返す。
- 同上。各まとまりに対し,必要なだけ同じ作業を繰り返す。
この分類法は,構造上いくつかの問題点はあるものの*2数字のみで表現できること,それでもほとんどの主題が網羅的に扱えること,主題が一意に整列できること*3といった利点があり,第一号であるDDC*4や,その国際向けの改良版であるUDC*5など,世界中でけっこうなところがこれを使っている。*6日本ではもちろんNDCがこれで,公共図書館を中心にほとんどの図書館でこれを使っている*7。
NDCは日本の図書館の分類で使われているものだから、自分が項目として取り上げるものもたいていはその分類のどこかに入るわけだ。数字で10ずつに分類していくのもわかりやすい。「女優」=「778.3 映画監督・俳優 演技 配役」とか。だから、よくできている。しかし、難点も多い。
実はNDCでは、「歴史」と「地理」における地域分類がずれている。
つまり、歴史では「北陸/中部」なのに、地理では「中部/東海」と分かれている。理由はあるだろうが、すっきりしない。まあこれは余談。ここ削除。詳細はコメント欄参照のこと。
そういうわけで、NDCをそのまま採用することはできず、どうしても自分流にアレンジする必要が出てくる。
国立国会図書館では、また別の分類法を採用しており、これはアルファベットを使っている。ただ、これはやはり「国会」図書館なので政治・経済・社会に重点が置かれ、科学技術関連には複数のアルファベットが使われるというように、やはり極私的な分類にはちょっと合わないような気もした。また、「歴史・地理」が一つであったり、Rで始まるのが生物学と農林水産学というように、やはり自分のニーズからいえば偏りが見られる。
ここで気になるのが、人文科学・社会科学・自然科学・工学/技術関連、つまり学問分野の分類だ。そこで京大の学部・学科を見てみた。調べてみたら、以前とはずいぶん変わっていて焦る。
学問分野については大体こんな感じのところだろうか。基礎科学と応用科学が混ざっていたりするけれども、世の中割り切れるものではない。
ついでなのでどんどん見ていこう。今度はAmazonである。表現物(著作物)に関しての分類では、日本の現状を反映しているに違いない。
音楽の分類は参考になりそうだ。だが、全体に散漫な印象もある。やはり、大分類10、それぞれを各10ずつに中分類、さらにそれを10ずつに小分類という十進分類のパターンに当てはめたくなる。
ネットの情報を分類しているといえば、Yahoo!カテゴリがある。これはYahoo!掲載サイトを一覧にしているわけだから、そのカテゴリ分けはネット上の情報の分類としては効果的だろう。
しかし、問題は、そのカテゴリがあまりにも多種多様かつ複雑で、階層も深くなっていることである。カテゴリ自体が毎日のように追加されており、とうてい追いつけない。2007年2月9日までで大カテゴリが14、次のレベルのカテゴリが(重複入れずに)約380に及ぶ。第2レベルでもかなり細分化されたカテゴリもあれば、広範に扱っているカテゴリもあり、なかなか難しい。
現代の事象について網羅しているといえるのが現代用語事典。その分類も参考になるに違いない。ということで、三誌の大分類を見てみた。
知恵蔵の8分類が一番コンパクトにまとまっている気がする。
極私的百科のカテゴリ分けを念頭に置いて、まず、現代用語事典3誌の内容を統合して、大体どんなジャンルがあれば埋まるのかを考えてみる。
現代用語事典は国際関係・各国事情が充実しているのが特徴だが、私的wikiではそこまで詳しく扱うジャンルでもないので、これは「地理・情勢」というふうにくくってしまっていいと思う。
政治関係はあまりやる気もないので、社会と統合してもかまわない。経済・産業・経営というお金まわりもセットでいいだろう。さらに、「政治・社会」と「経済・産業・経営」もまとめて社会系セットにしてしまおうか。
科学・技術は自然科学系統と応用科学系統をセットにしてしまう。理論と実用とか分けてるとキリがないし。
情報とメディアは、ネットの話、表現の話が書きたいので必要なのだが、これも「科学・技術」枠だろうか。
文化・芸術・趣味・ホビーはひっくるめてしまおう。本・音楽・映画・芸能関係はここに入れてしまう。
生活・健康・スポーツが思案どころ。食べ物の話題をどこに入れるかだな。スポーツはあまり必要ないのだが。
さて、このセットをNDCと突き合わせてみて、不足を補充してみる。
まず、0番:総記はメタな話を書くところなどで必要。番外として、あと9種類に分類しなければならない。
というわけでNDCの空いたところに現代用語風ジャンル分けを当てはめて整理すると、こういう感じ。
あ、うまく10項目に入ってしまった。というわけで、並べ替えてみる。
かなり自分の納得できる分類になったように思う。では、これを「閾ペディアことのはカテゴリ分類」の大分類に据えてしまおう。
大分類だけだと粗いので、中分類以下も作ってみた。ここからあとは考えたプロセスは書かない。
これをひとまず「ことのは十進分類法=KDC」(Kotonoha Decimal Classification)ver.1.0と名付けてみた。詳細は以下のページに。
MediaWikiを使った分類が便利なのは、一つの項目に対して複数のカテゴリーを割り当てられること。そのおかげで柔軟な運用ができそうである。
なお、カテゴリ決定については、とにかく入れたい項目がある程度増えたところで結果的に分類をしていくという手もある。KJ法的な手法といえようか。しかし、記事を書くときにとりあえずカテゴリは決めておかないと目次からたどり着けなくなるので、結局、全体の構成を決めてしまったという次第。ただ、もちろん、運用につれて変更する可能性もある。その変更をやりやすいというのもWikiシステムのいいところだ。
Myrmecoleon in Paradoxical Libraryの人がやっているような「同人誌図書館構想のための分類一覧」みたいなのを、ニーズのある人はそれぞれに作れば面白いと思う。
今回の「KDC」は汎用性があるものではないので(たとえば政治経済社会に関心の強いブロガーなら、こんなところに押し込めるなと言うだろう)、使いやすい分類法はまだ模索していく必要があると思われる。おそらく、汎用性の高い分類方法としては、NDCと国立国会図書館分類法を土台に、Amazonによる音楽・映画関連ジャンルの充実、ならびに現代用語事典の分類を取り入れた形で仕上がっていきそうな気がする。
そして、十進法による分類となっているが、PC時代だから16進法(0123456789ABCDEF)でやってもいいんじゃないだろうか。第一段階が16分野、第二段階で最大256分野、第3段階で最大4096分野。あるいは、基本10だけど16までは増やしてもいいことにするとか。
まあ別に何進法でもいいのだが、数の縛りがあるというのは案外いいシステムだと思った。数字のついていないYahoo!やWikipediaやAmazonのシステムは、柔軟に変えられるけれども、逆にまとまりがなく思えたのも事実である。
【絵文録ことのは】HOME > [編集] > 極私的百科「閾ペディアことのは」のための「ことのは十進分類法」
≫ 次:バレンタインデーの起源と歴史
≪ 前: 「集合知」ウィキペディアの限界と可能性(Wikipediaの役割について)
コメントとトラックバック
[No.1] 投稿者:myrmecoleon[2007年2月11日 00:13]
トラックバックありです。で,図書館の人として見過ごせないのが一点。
>実はNDCでは、「歴史」と「地理」における地域分類がずれている。
「291.4 中部地方」なんてことはないです。290の「地理」の区分は地理区分表という補助表を使って分類する(「地理」独自の分類ではなく,他の項目でも使える)のですが,これはほぼ完全に210~280の「歴史」の区分と一致してます(というか,「歴史」も細かくは地理区分表を使って分類する)。ですから,291.4は歴史と同じく「北陸地方」となります。
また「291.5 東海地方」は間違ってはいないのですが,正式な分類名としては「291.5 中部地方」の方が適切です。
たぶん,参照された分類表が間違っていたのでは? あるいは,古い版だとそうだったのかもしれません(これは未確認)。少なくとも,最新のNDC第9版については,地理区分は共通しています。
このことについては事実誤認と思われますので,コメントしておきました。記事の趣旨について否定しているわけではないので念のため。
KDCは,民俗学をやっていたものとしてちゃんと思想関係の項目に入ってるのが嬉しいのと,メディアとか健康とかNDCでは不当に細分化されてるのがまとめられてる点でいいと思いますねー。
まあ使っていくうちに見直さなきゃいけない部分も出てくると思いますので,がんばって下さいねー。
[No.2] 投稿者:松永[2007年2月11日 00:28]
ご指摘ありがとうございます。もう少しきちんと調べてみます。
まあ結局、沖縄を独立させるために、中部・北陸・東海全部まとめて中部にしました。
ほとんど自分の興味でまとめてますので、これから進化させたいと思ってver.1という表現をしました。これからどこまでバージョンアップできるか。
[No.3] 投稿者:ブログ図書館の人[2007年2月11日 06:31]
当方で配列変数として用意している補助表が間違っておりました。お詫びします。基本データなのに...(;´∀`)
誤字脱字や入力間違いは発見し次第修正するようにしていますが、まだどこかに間違いは潜んでいるかもしれません。その際ご指摘いただけると幸いです。
[No.4] 投稿者:ブログ図書館の人[2007年2月11日 06:50]
ちなみに、訂正が必要な箇所はNDCで、281、291、351、の三箇所です。
[No.5] トラックバック:「地理区分にかかる補助表を修正しました」(Weblog::moralaturgie)[2007年2月11日 07:41]
松永英明氏による記事「極私的百科「閾ペディアことのは」のための「ことのは十進分類法」」における“立論”と、コメント欄におけるid:myrmecoleo...……[全文を読む][No.6] トラックバック:「階層的分類と非階層的分類は表裏の関係」(Weblog::moralaturgie)[2007年2月12日 17:56]
先日公開されたことのは十進分類法(KDC)*1においては、コンテンツに対して階層的な分類法を採用している。それと同時にコンテンツに対しては、複数の分類...……[全文を読む]このエントリー登録状況一覧
★
はてなブックマーク
★
★MM/Memo
★
LivedoorClip
★
トラックバック(参照元逆リンク)用URL
この記事へトラックバックする場合は、このトラックバック用URLを、あなたのウェブログ等の投稿ページの「トラックバック先のURL」欄に入れて更新してください。
トラックバックが重複しても削除依頼コメントは不要です。見つけ次第適当に消します。
こちらの記事へのリンクのないトラックバックは受け付けていません。無関係な記事からのトラックバック、宣伝のみのspamトラックバックは削除することがあります。
記事内容と関係のないコメントは削除します。
コメント(ご意見・ご感想)を投稿する