多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック

 現在の日本のウェブサイトには、主要な文字コードが3種類ある。Shift-JIS、EUC-JP、そしてUTF-8である。

 今までページ作成といえばShift-JISがメイン、CGIなどのスクリプトを使う場合はEUC-JPがメイン、という流れであったが、最近はUTF-8が勢力を伸ばしてきた。このブログもそうであるが、これは多国語を同時に扱える文字コードなのである。Shift-JISもEUC-JPも日本語専用だ。

 私のサイトは中国語サイトからの情報や話題も多いので、日本語だけが表示できても困る。最低限、日本語と簡体字中国語・繁体字中国語をそのまま表示できないと厄介だ。そこで必然的にUTF-8サイトでなければならないということになる。

 しかし、世間では多国語を同時に扱う必要性がほとんど認識されていない(日常的には当然と言えば当然)。というわけで、多国語(UTF-8)を扱えるブログツールも限定されてくるし、また、そのような観点からサービスを比較したものもほとんど見られない。

 で、誰もやろうとしないことなら自分でやるしかない。今回は、ブログサービスで使われている文字コードを洗いざらい調べてみた。

2005年5月 9日14:13| 記事内容分類:ブログ/ウェブログ| by 松永英明
この記事のリンク用URL| ≪ 前の記事 ≫ 次の記事
| コメント(39) | トラックバック(30)
twitterでこの記事をつぶやく (旧:

ブログサービスの文字コード一覧

 ブログ比較表に載っているサービスを片っ端からチェックしています。順不同。2005/5/9現在、全124サービス。間違い等あればご指摘を。

UTF-8

EUC-JP

Shift-JIS

全体を見ての感想

 UTF-8が41サービス、EUC-JPが44サービス、Shift-JISが43サービスということで、規模の差を考慮しなければ3文字コードそれぞれ同じくらいの勢力である。

 UTF-8派としては、実はサーバーインストール型ブログツールの巨星MovableTypeを忘れてはならない(今回はインストール型は一覧に入れなかった)。もともと国際化を視野に入れてUTF-8をデフォルトとしているMovableTypeだが、そのレンタル版であるTypepad、それからTypepadエンジンのココログ、ブログ人といった大手サービスがいずれもUTF-8となっている。また、MSN系は世界展開が当然なのでやはりUTF-8。韓国発で、日本語・ハングルの双方を同時に扱う必要があるNaverがUTF-8なのも当然と言えば当然。

 EUC-JPは、プログラマーにとっては最も馴染みの深い日本語文字コードだろう。したがって、プログラマーの力が大きいサービスなのかもしれない。Yahoo!、楽天、livedoorの「御三家」がそろってEUC-JPであるのに加えて、goo、はてな、Ameba Blogなど有力なレンタルサービスが軒並みこの派閥である(ただし、はてなグループはUTF-8)。

 Shift-JISは日本語ウェブページ最有力文字コードであるが、これを採用しているサービスはその出力結果(できあがりのHTMLの文字コードを普通のサイトのようにすること)を重視しているともいえる。また、この文字コードだと携帯で直接見られるので、携帯ブログサービスのほとんどが含まれるのも特徴的。

旅行系ブログ3派

 旅行記ブログだけをピックアップし直してみると、見事に3サービスとも文字コードが違うのが面白い。日本国内、あるいは英語圏のみを旅行する人にはどのサービスでも同じ(というか純粋にその他の機能だけで比べるといい)だが、中国・台湾・韓国や、ヨーロッパでも特殊文字の必要な仏独やギリシア、スラブ圏、あるいはタイ語・アラビア語・ヘブライ語などの文字を使う可能性がある場合はやはりUTF-8でないと後々面倒なことになってしまいそうである。

わたしはなぜUTF-8にこだわるのか

 実のところUnicodeでなければならないというわけではない。別にTRONでも何でもいいし、UTF-8だろうと16だろうとかまわないのだが、要するに「多国語を同時に扱える環境を提供してください」の一言に尽きる。だから、このエントリーに対して、UnicodeやUTF-8の不備・欠陥を一生懸命主張されても意味がない。つまり、「UTF-8の布教」をしようとしているのではなく、「多言語対応を考えない鎖国的島国根性への反発」なのである。

 以前、はてなでかなり煽り気味の質問をしたことがある。

日本人の開発したCGIやフリーソフトは、なぜいつまでたってもEUCやShift-JISに固執し、Unicodeをベースに作成しないのでしょうか。

この質問は「島国根性プログラマー」への煽りです。

ファイル名が外国文字の圧縮ファイルを解凍できず、同じく画像ファイルを閲覧できず、日本語化CGIは外国語を扱えず……。いつまで島国根性を続けるんでしょうか?

Windowsも2000からUnicodeベースになっている現在、もし日本語を扱うのにUnicodeではまずい合理的な理由があれば滔々と述べていただければ幸いです。

ちなみに、はてなはグループでUTF-8化してくださったので非常に感謝してます。

 この質問へのトラックバックを含めて、最も多かったのは「すでにUnicode以外が普及してしまっているから、変えるのが面倒」という理由で、次いで「Unicodeには欠陥がある」というものだった。しかし、「多言語を同時に扱いたい」という思いそのものさえも断念するほどの理由はまったく見受けられなかった。

 この質問に対して、中国語を扱うソフトなどを使っているCtransさんは大いに共感してくれている。妄言砂漠 はてなの質問:CGIとかUnicodeとかより。

こういう質問をしたくなる気持ち、よく分かります。多分EUCやShift-JISに固執しているわけではなく、現在のところUnicodeに対応してなくても問題にならない(誰も文句を言わない)からじゃないかと。あとUnicode悪者説。

良さそうなツールを見つけて、わくわくしながらダウンロードして、中国語が使えなくてがっくり、という経験がある人、多いと思うんです。こういう可哀相な我々を救済しようというプログラマの方が増えるととてもうれしい。

 逆に、JULYの日記 - 文字コード問題に書かれているのが、今の日本人に多い意識なのだろうか。

ソフトを作る側としてどうか、と考えると、なかなかそこまで意識して作るのが「面倒」という感じはあるでしょう。自分の作ったソフトが、友達に中国人と韓国人がいる人が使う、という場面自体をあまり想像できないし

 だからこそ「島国根性」と煽ってみたわけだが。

多言語対応の3段階

 「Unicodeを使って各国版に一気に対応しようとするより、日本語版を日本語文字コードで作っておいて、必要があれば他言語にはそれぞれの言語パッチで対応すればいい」というようなプログラマーの人の発言を読んだような記憶がある。出典を思い出せないのだが、tDiaryのただただしさんだったかもしれない。

 誰が言ったかはともかく、そういう考え方のプログラマーは結構いると思う。しかし、それでは困るのだ。多言語対応には3段階あって、

  1. 1言語のみ対応:日本語だけとか
  2. 複数言語切り替え対応:日本語、中国語等それぞれで使えるが共存はしない
  3. 複数言語同時使用可能:どんな言語でも同時に扱える

例えば、XnViewという画像ビューワーがあって、インストールするときに何語の使用者かを自動的に判断し、各国版がインストールされる。日本人ならいちいち日本語版だと指定する必要さえない。あるいは中国語Windowsを使っていれば、自動的に中国語版がインストールされる。ところが、これで日本語化されてしまうと、たとえば中国特有の文字がファイル名に含まれたファイルが扱えなくなってしまうのだ。逆に中国語版XnViewでは、中国語文字コードに含まれない日本の記号などを含むファイルが扱えなくなる。

 つまり、「多国語に対応」と、「多国語を同時に扱える」は意味が違うのである。

 したがって、たとえば日本語版・中国語版・韓国語版・アラビア語版・ロシア語版・ドイツ語版・スウェーデン語版・デンマーク語版がそれぞれに提供されていたとしても、わたしにとってはそれはどれも「使えない」ことになってしまうのである。しかし、多国語対応であれば、一部の日本文字(「~」など)に問題は出るとしても、おおむね「使いものになる」わけだ。

 Sleipnirの次期ブラウザが開発されるということで、次期ブラウザへの要望/43 - Unicodeベースでという要望を出してある。タブブラウザ Sleipnir 開発日記にはUnicode対応のことは書かれていないが、日本語以外のサイトのタイトルが化けてしまうのも、この「多国語対応」で解消できるはずなので、ぜひ取り入れていただきたいと思っている。

 それから、tDiaryが本格的にUnicode対応になれば即日にでも使いたいのだけれど、ただのにっき(2005-04-01)に「tDiary: 2.1系開発指針……フルUTF-8化」ってのは単なるエイプリルフールネタですかそうですか(ρ_ ; )ノ

 というわけで、プログラマー、CGI作者の方々には、多言語を同時に扱えるスクリプトやソフトを開発していただきたいというのが正直なところである((といっても、HTML4+CSSに対応していないFONTタグ・tableタグ使いまくりデザインの掲示板CGIがいまだに主流を占めるという遅れた現状にあって、さらに文字コードまで考えてほしいというのは無理なのだろうか?))

追記

コメントをいろいろいただいたので、六番目までを見たところで、ボイスブログの方でお返事しました。文字で書くとギスギスしそうなんで。

あと、sbは自分の希望に近い機能がついてそうなので試してみようと思います。それにしてもSleipnir作者さんとか、コメント欄が凄いメンツだΣ( ̄□ ̄;

追記2

5/10 18:00 「島国根性」という言葉にこれほど過敏な反応が返ってくるとは思いませんでした。みんな島国根性と言われるのを気にしてるんですね。一つ勉強になりました。さて、このエントリーの趣旨は民族論でも何でもなく「多国語を使うというニーズが存在する」というアピール以上でも以下でもないので念のため。ただ、日本国内と英語圏以外を扱う旅行/語学などに関連したブログサービスは少なくとも多言語対応したほうがいいのではないかと。別に「何が何でもUTF-8」とは言ってないのだけどなあ(携帯メインならShift-JISが適しているのは言うまでもないし)。

5/11 09:00 アサブロがUTF-8と指摘を受けたので修正。

反響から一部紹介(順不同)

これは中華芸能系(中文学習系)blogerには切実な問題だったりする。

中国語扱っててストレス感じることはよくある。

ニュース記事の見出しをそのままコピペすることすらままならないって、記事を書く前段階の作業が増えるし、書く気力も削がれる。

私みたいな面倒くさがりにとってこういうのは致命的(^_^;)

ツールなどの開発に携わっている方には、多言語対応というのにもう少し目を向けて欲しいなぁと思う。需要はあると思いますし、これからも増えることはあっても減ることはないと思います。ワタクシは上に書いたように、ただでさえ混乱したわけのわからない情況下で、いろいろ苦労しつつ日々をやり過ごしております。出来ることは自分でやりますが、餅は餅屋という言葉もありますので、素敵なソリューションを創造していただけると本当にありがたいです。

日頃OSXなんぞを使っていると、多言語対応なんて当たり前の様に感じているので反発している人の感情がよくわからないんですが、普通に日本語版のWindowsを使用していると、言語の多様性を実感する箇所って少ないのかもしれません。

 それから、”島国根性”ってのはうまいな、って気はしました。反応を見るとちょっと刺激が強すぎたみたいですけど。

台湾、中国へ向けてお店をアピールするという目的で、動機は確定。

でも、とりあえずプログラム内で扱う文字列を全部Unicodeで統一しておけばそれだけで、(各国語の扱いの細かいところで不備はでるでしょうが)まあ、どの言語の環境でも一応使えるものにはなる。少なくとも、たいていの場合は運用でカバーできる程度の不都合で収まります。

おまけ。

そのほか、文字コードはUnicodeになっており、国際化も容易に行えるようになっています。このことで、ようやく本格的な海外展開が現実的になると考えています。

【広告】★文中キーワードによる自動生成アフィリエイトリンク
以下の広告はこの記事内のキーワードをもとに自動的に選ばれた書籍・音楽等へのリンクです。場合によっては本文内容と矛盾するもの、関係なさそうなものが表示されることもあります。
2005年5月 9日14:13| 記事内容分類:ブログ/ウェブログ| by 松永英明
この記事のリンク用URL| ≪ 前の記事 ≫ 次の記事
| コメント(39) | トラックバック(30)
twitterでこの記事をつぶやく (旧:

トラックバック(30)

※当ブログへトラックバックされる場合は必ずこのページへのリンクを入れてください。こちらへのリンクのない一方通行トラックバックは承認されません。

トラックバックURL: http://www.kotono8.com/mt5/mt-tb.cgi/400

おれがUTF-8を使ってこなかったのは、単に閲覧環境がまだ整ってないと考えていたからだ。世の中、IEとFirefoxとSafariだけで成り立っていると思ったら大間違いで、おれが愛用しているw3mも... 続きを読む

ハッスルsbブログ(ハッスルサーバー内サービス)多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック [絵文録ことのは]2005/05/09えぇと、ハッスルsbブログはほぼsb... 続きを読む

無いならご自分で作ってみてはいかがでしょう。 続きを読む

いつも拝読してる絵文録ことのはさんにこんな興味深いエントリーが。多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック... 続きを読む

松永さんよりヴォイスにて返信がありましたので、かみさんと息子と娘を起こさないように小さな音で2回ほどこっそり聞いてみました。 続きを読む

「多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック」あたりのネタへの反応。 非プログラマの人がわかりやすいようなたとえにすると、「文章を書くときには... 続きを読む

絵文禄ことのはさんが多国語で書けるブログはどこ? という記事で多言語を扱えるブログサービスについてまとめてくださっています。その記事の中で、日本製のフリーソフトやCG... 続きを読む

たださんのところ から.彼の気持ちはよくわかります.チャットとか IM とかでも,日本人とは 日本語で,韓国人とはハングルで会話することになりますが,いちいち環境や ソフトを... 続きを読む

結局、松永さんはどうしたい・どうして欲しいのだろう。真意が見えないです。 続きを読む

私は煽り芸とかできないんで、ことの成り行きにびっくりしてますけど、先日こちらで紹介させていただいた松永さんの「多国語で書けるブログは... 続きを読む

多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック [絵文録ことのは]2005/05/09 「島国根性」発言で要らんところがヒートアップしてますが(苦笑)、まず有料無料... 続きを読む

島国根性という言葉は思っている以上に紛糾させてしまっているみたいですね。私はこの言葉から松永さんの”不満”や”いらだち”は感じましたが”侮蔑”や”見下したような態度”... 続きを読む

渋谷系@はてな - UTFー8の話 (2005年5月13日 02:29)

http://sho.tdiary.net/20050509.html#p03 http://kotonoha.main.jp/2005/05/09charactercode.html   >> ブラウザの最大派閥である携帯電話のことも忘れてはいけない > さらに(常識的に考えて)、多国語を表示し... 続きを読む

事業者blogについて語っているはずの記事で、プログラマ論理で作られているオープンソースのtDiaryもまぜこぜで煽ってしまった。そして「自分はプログラマ文化じゃないんだからそっち... 続きを読む

松永さんのエントリー 多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック で、議論沸騰中  松永さんの多言語対応のサービスの多少あおり気味な要望に対して、... 続きを読む

The blog of Yutaka Hirata - TeraTermのメンテナー (2005年5月15日 14:51)

現在のTeraTermは実質ぼく一人が開発作業をしているように見えますが、実際には以下のように各種モジュールごとにメンテナーが分かれています。  TTProxy … 蛭子屋さん  LogMeTT ... 続きを読む

巷で話題になっているわたしはなぜUTF-8にこだわるのかという話ですが、プログラムを作る人(プログラマ)は多言語化のことを考えていないわけではなくて、プログラムの多言語化は技... 続きを読む

理系に反論された文系がとる態度は、おおむね3つに大別される。  1.あなたの言う事は分かりません。あなたは嘘を言っているのでしょう?    つべこべ言わずにやりなさい。 ... 続きを読む

理系に反論された文系がとる態度は、おおむね3つに大別される。  1.あなたの言う事は分かりません。あなたは嘘を言っているのでしょう?    つべこべ言わずにやりなさい。 ... 続きを読む

理系に反論された文系がとる態度は、おおむね3つに大別される。  1.あなたの言う事は分かりません。あなたは嘘を言っているのでしょう?    つべこべ言わずにやりなさい。 ... 続きを読む

Proving grounds of the mad over logs - 味の素 (2005年5月25日 09:53)

嘆かわしい二つのエントリについて。... 続きを読む

お気づきだと思いますが、携帯専用ページに続き、先日から韓国語、英語、中国語版のページを作ろうと、四苦八苦しています。どうにかオープンだけはできましたが、まさしく文字化け... 続きを読む

ブログ124サービス【文字コード】全チェック すごい労作。Shift-JISじゃ 続きを読む

htmlで手を加えてあるのはアクセスアナライザーだけ、 コンテンツの画像表示も辞めたし、 ヘッダ部分の多言語表示のためのリンクもやめた。 可能な限りベー... 続きを読む

htmlで手を加えてあるのはアクセスアナライザーだけ、 コンテンツの画像表示も辞めたし、 ヘッダ部分の多言語表示のためのリンクもやめた。 可能な限りベー... 続きを読む

htmlで手を加えてあるのはアクセスアナライザーだけ、 コンテンツの画像表示も辞めたし、 ヘッダ部分の多言語表示のためのリンクもやめた。 可能な限りベー... 続きを読む

私の母は中国マニア。中国語を熱心に勉強している。 そんな母が、私のブログを見ていて、ブログにも興味を持ったようだが、ブログを書くに当たって1つ絶対条件が... 続きを読む

まだ決まってないのです… - てぃーだで初投稿です。 (2006年4月24日 12:05)

自分でHTMLをいじったりしなくても、デフォルトの時点でサブカテゴリが作れるブログサービスはないかと探していて、このてぃーださんを見つけました。 大手の... 続きを読む

『多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック』で、《eXcite》がUTF-8に挙げられていた。韓国語も中国語も使ったことな... 続きを読む

2年あまり使用していたココログフリーのブログから、この blog.motoyuk 続きを読む

コメント(39)

*1 に対して、その通りですよと申し上げたい。
その様なCGIスクリプトは古い環境に配慮して作られています。
「利便性があるからUTF化しましょう」は正論ですが、
そのコストは誰が持つの?と言うのが現実。
場合によっては環境をリプレースせねばなりません。

Sleipnirも古い環境(Win98/Me)を配慮してMBCSで作成しています。
次期ブラウザは Win98/Me も切り捨てず、かつご期待に沿えるように開発しています。

松永さんのお気持ちはすごくよく分かるのですが、世の中のプログラマの大多数は、外国語表示にはまったく興味がないと思います。

一般人が英語以外の外国語に興味がないのと同じです。プログラマも一般人ですから。

日本のソフト会社は日本だけで市場が成り立ちますからね。マイクロソフトなど大手ソフト会社のように会社の方針でユニコード化を進めているところは別ですけど。

的外れな意見だったらすみません。
一つ思ったのがShift-JISやEUC-JPからUTF-8にすることで日本語のデータが1.5倍~2倍に増加しますよね。
これってブログのホスティングサービスの場合結構問題ですよね。
新規にUTF-8でスタートするならまだしも、Shift-JISやEUC-JPで問題なく動いてるところに、UTF-8化のメリットとデータ量の増加による回線や機材への設備投資を天秤にかけたら慎重にならざるをえないのではないかと。

talk to oneselfさんに賛成
文句だけ言って自分で動かないのは島国根性以下

うわ~ ものすごい同感です。

>多言語対応を考えない鎖国的島国根性への反発」なのである。

僕の場合、日本語と韓国語を利用するためUTF化は必須なんですが、この国は、もう本当に頭にくるほど全然そーゆーの考えてないんですよ。CGIを使うとき最初にやる作業が手動でのUTF化です。はっきりいってもう辛いです。
少しでも文句いうと「UTFなんて駄目だ!UNIXの文化!EUC!エスジス!うおおおぉぉ~!!」って物凄いこだわりがある?のか誰も相手してくれないんです。もう諦めた。
でもま、鎖国主義は文字コードだけの話じゃないからね。どうしようもないです。素直に自力で改造しましょう(^^;)

ちなみに僕の使っているブログツールはこれまで韓国語専用だったんですが、次のverアップで多言語化対応するそうです。韓国は若い人が中国語や日本語をペラペラになってきましたから需要があるのでしょう。

日本はないってことかな。

6番までのところはボイスブログと追記でお返事しましたのでご参照ください。
http://www.voiceblog.jp/kotonoha/4616.html
7番ちくたくさん。文字データが1.5~2倍というのは大したことがないと思います。たとえばこのhtmlファイルは結構長文だけどそれでも43KB。htmlファイルだけで数十MBも食うような巨大サイトはほとんどないでしょう。むしろ、容量を食うのは画像や音声、動画でしょうし、それについてはgooブログの最大1テラバイトを筆頭にあまり容量的には問題ないはずです。さらにいえば、htmlファイルの容量を増やす要素としては、テーブルタグとかフォントタグとか、要するに旧来のデザイン用タグが大きいのではないかと。これをなくすだけでもかなり違いますからね。というわけで、データ量増大という問題は文字データについては微々たるものであり、設備投資云々は大げさすぎると思います。
8番、おまえこそがな。すでにやれることはやれる範囲でやってますが、みんながみんなプログラミングできないといけないの?というかお前の作品を見せてみろよ、今すぐ!!!ほれほれ!!!嗤い。(あくまでもこれは罵倒芸ですのでマジギレしないように。あ、君だけはマジか。必死だな(´ー`)y-~~)

生憎と僕はeuc以外で作る気は無いので松永様ごときの御期待には応えられそうにありません
芸だのと言って論点をずらすような姑息な手段は松永様様とも思えぬ言いよう
『プログラマー、CGI作者の方々』と言っておられますがその殆どは趣味でやってる方が多いでしょう
それを鑑みれば松永様様様ほどの方ならばすぐに言語の1つや2つは覚えられることでしょう
仮に御自分で書かないとしても然るべき手段にて明確な指針を示すなりの事は松永様様様様ほどのお方なら御出来になるでしょう
それをせずに識者ぶって勝手な事を言ってるだけの松永様様様様様の姿勢は如何なものかと存じ上げます
で、「やれる範囲でやってる」ってのは何だ?

偉そげな事を言っておきながらIPブロックだかをするという松永様様様様様様様様様の姑息さと言うのは如何なものでしょう?

> 絵文録ことのは
> コメントの登録エラー
> コメントの登録が失敗しました:
>
> You are not allowed to post comments.

IPブロックされてる割には投稿できてるな(´ー`)y-~~
もう学校に行った時間かな(´ー`)y-~~帰ってきてから読めよ

若干ズレた話ですが、Web上の機械翻訳サービスを介して(簡易的な)多言語表示対応したサイトを作ろうとすると、UTF-8だと通らないサービスが多くて泣けてきます。で、やっとUTF-8が通るのを見つけたと思ったら、brタグで改行するとそこが文末だと勘違いしやがって「ほぼ日」スタイルの文脈改行を多用したデザインが使えなかったり。あー腹立つヽ(`Д´)ノ 多言語対応さぼってるのは日本人だけじゃなかとですよ。

関係ないけど、GmailもUTF-8ですね。

アサブロは(本体は)UTF-8のような。

> 5/10 18:00 「島国根性」という言葉にこれほど過敏な反応が返ってくるとは思いませんでした。みんな島国根性と言われるのを気にしてるんですね。一つ勉強になりました。

全然解ってないというか勉強できてないと思います。「島国根性」と言われるのを気にしているというよりかは、侮蔑のニュアンスでの発言を問題視しているだけに思います。まあ、同じといえば同じといえますが、本質が違うはず。

id3libのUnicode対応の腐りっぷり(ASCII文字じゃないと結局うまく動かない)にブチ切れて自力で直した経験からすると、「国際化」のことを考えてないのは毛t^H^Hおっとっと欧米圏の連中も同じやん、と思うのだけど。

英字26文字+数字+記号で満足してるユーザの方が多いのだから、日本語なんか捨ててグローバルなスタンダードに合わせようぜ!
って事でどうでしょう?

「島国根性」が云々ではなく、もともとの提起の仕方があまりに浅はかだったので...。

Java や C# などだとプログラミング言語自体が多言語を想定してますが、他はプログラマが意識してライブラリを使わないといけなかったりします。既に指摘があるように UTF-8 だと閲覧できない環境もまだ残っているという問題もあり、「過渡期だから」というのは「ただ面倒だから」と並んで、対応されない正当な言い訳といえそう。
「面倒だから」も正当であるというのは、例えば UTF-8 を使ったとしても「多言語化」が完了するわけではありませんから、どこまでやるかという程度問題で捨てられているということでして、需要がなくて自分も興味ないものを作る人はいない、と。
だから需要があると分からせる必要がある、ということで、望む人からのこういったアピールが結局重要であるということになりますねぇ。

私はなに作るときでも国際化は意識しますが、多言語化を明確に意識することはまだ多くはないですね。ローカライズを楽にするという目的で、基本的に UTF-8 を使ってはいますけれど。たまたまその「位置」に自分の意識があったってことですね。

「ボクなんかは最初からエクスポート狙ってるからね。日本語ロックなんてのには興味ないんだよ」

私が違和感を覚えるのは、「なぜ〜しないのか?」と質問調子でありながら、それはただ「島国根性」にほかならない、と断言しているところです。解釈すると、「どうせろくな理由なんかないのは決まりきってるけどね」ということが背景にあるように見えます。これは、相手の事情を軽視した暴言、と受けとられてもまあ、しかたないかなと。もちろん、多国語対応したほうがユーザは便利だというのはたしかです。

「島国根性」って何ですか? 侮蔑の意味で言っているのなら問題です。世界には日本以外にも島国が多数あります。この言葉はそれら日本以外の国々も侮蔑してしまうことになるので止めた方が良いと思います。世界に島国が日本しかなければ問題ではありませんが・・・。

多重TBをしてしまいました。失礼しました……。

多言語なんて気にしないのは,島国根性じゃなくてワールドスタンダード。
英語圏の人たちなんか,ASCII が使えればそれでOKだと思ってる。
それでXOOPSなんか開発が分裂しちまったわけだし。
http://jp.xoops.org/modules/news/article.php?storyid=303

だから,島国根性と煽っても無意味。
「おまいら毛唐の言いなりかよ!」方向に煽った方がいいんじゃないかな。

多言語なんて気にしないのは,島国根性じゃなくてワールドスタンダード。
英語圏の人たちなんか,ASCII が使えればそれでOKだと思ってる。
それでXOOPSなんか開発が分裂しちまったわけだし。
http://jp.xoops.org/modules/news/article.php?storyid=303

だから,島国根性と煽っても無意味。
「おまいら毛唐の言いなりかよ!」方向に煽った方がいいんじゃないかな。

文字コードがUTF-8のブログサービスでも、
多言語で入力できないところがあります。
記事の編集画面では、中国語で入力できているのに、
それを保存して表示すると、「?」や「・」に変更されているのです。

私が確認した限り、「So-net blog」,「みんなのワブログ」がそうでした。

ありがとうございます。
こういう情報をさがしていたので助かります。
감사합니다..

初めまして。 Doblogユーザーのcoronetと申します。
興味深く読ませていただきました。
No.47のMOSSさんと同じくなのですが、この記事でDoblogは文字コードUTF-8との事ですが、韓国語の入力は出来ませんでした。
編集欄で記入する事は出来ても、実際のページには反映されません。
・・・・・ といった表示も無く、何も入力されていなかったかのようになってしまいます。
逆に、gooブログは、韓国語の入力が可能ですよ。

はじめまして
私の率直な意見から言うと、一度自分でCGIスクリプトを作ってみられた方がよいのでは、
サーバー上でCGIを動かす際、Unix系OSではプログラムをEUC-JPで書かないとならないため、(プログラムを実行できない)EUC-JPであったり、Shift-JISやUTF-8を使っているCGIでもjcode.plやJcodeを使って文字コード変換しているにすぎず、内部コードはEUCやEUC-JPだったりするのです(MovableTypeもこれと同じ)
そのため、何らかのEUCとUTF-8に変換する物がなければプログラムとして実行できなかったわけです。
日本語圏ではJcodeなどがありましたが、これらは日本語だけに対応していて他の2byte言語には対応してません。
どんな言語でもEUCからUTF-8に変換できる物がなかったんです、
最近になってEncodeというperlモジュールが組み込まれたことによって、ある程度他言語にも対応できましたが。
そもそも、OS側やプログラムの実行環境が標準でUTF-8を使えればこんな問題にならないのですがね(最近Fedora LinuxがUTF-8を標準にしているので、ほかのUnix系OSも追従してくれればよいのですが)

こんな調査を探していました!!
すごい!!のひと言です。
じっくり読ませてもらいます。
韓国語環境の整っているブログを
探しています。
ありがとうございました♪

こんな調査を探していました!!
すごい!!のひと言です。
じっくり読ませてもらいます。
韓国語環境の整っているブログを
探しています。
ありがとうございました♪

どこが島国根性なのですか?
島国根性という言葉に反応しているのではなく、あなたが的違いな批判をしているから不快に感じているだけでは?
多言語対応という需要が低いという理由から世に出ていないだけで、あなたがどうしても欲しいというのなら、お金を出して有償で作成依頼するか、自分で勉強して作ればいいだけの話です。
私もこういうアプリがあったらいいなと思う時はありますが、ないからといって文句をぶちまけるのではなく、自分で作りますよ。

自分が努力もせず、安易に他を批判する事こそ島国根性ではないでしょうか。と思ったりします。

中国語を勉強しているものです。ブログに中国語を表記したくても、ほとんどの所は多言語は無理・・・・。
まだPCや文字フォントに詳しくなかった頃、ふざけるな!とあちこちのブログを登録しては何度登録解除したことか;;
最近になってCGIを使ってBBSを作ることになり、そのときに文字コードというものがあって、普段使っているJISでは中国語や韓国語は表記できないと知りました・・・しかしブログを自作するなんて無茶なので、いっそ海外のを。。。いやいや、そんな怪しいのは危険すぎるし、逆に日本語が書けなくちゃ本末転倒。。。とさ迷う事半年、こちらのHPにたどり着きました。
同じ思いを抱えている方がやっぱり沢山居たのだと思って、ちょっとうれしく、これからどんどん進化していくことを願ってやみません。
あ、アサブロですが、実際のブログはUTF-8にはなっていません。というか機能していません・・・文字化けしまくりです。アサブロのTOPページはUTF-8なのに・・・w多言語ブログとしてははっきり言って使えませんでしたので、一度確認願います。
まだしばらく放浪の旅が続きそうですが、いちおうMSNが仮の住まいとなってます。

島国根性、別に紛糾するほどの言葉じゃない気がするのですが^^;日本人の一面には確かにある性質ですしね・・・・。でも、それだけ団結力の強い国民性であると言うことでもあると思うんですけど。いや、最近の個人主義で薄れてますね。。。やれやれ。(年寄りです、ハイ)プラスに動かすか、マイナスにするか、それはこれからの人にかかってると言うことで。。。
外国でもイギリスなんかは他の大陸ヨーロッパ民族に比べると島国根性が有るそうですよ^^;日本独自の国民性を表す言葉だと思ってました。面白いですねー。鎖国的って事なんでしょうけどね。
外国人に英語で道を聞かれると日本に来るなら日本語勉強して来い!と思うのはコレまさに島国根性なのかなと(笑)

多言語対応、需要が低いというわけではないと思います、むしろ増えていく。ただ、使ってる人たちは表だって言わない(PC言語なんて分からない世界だし、普通の人は現状に甘んじるしかない)だけだと思います。デフォルトでストレスなく思いついたときに好きな国の文字を使うことが出来たら良いなあ。。。旅行記とか書けるし。。。と、ド素人の年寄り考えですが思うわけです。乱文申し訳ありませんでした。

はじめまして。
ボクも多言語表示には前々から興味を持っていたので、
この記事はとても参考になりました。

更に、今回、ボクの使用しているseesaaブログが、
どういうわけかボクのブログで「記事投稿エラー」と「コメント投稿エラー」の
エラーW連発という災難にあい、
結果的にトラックバックが3つも送信されてしまいました。
すいません。

現在、記事を参考にTypepadかココログに引っ越し検討中です。

プログラミング言語と文字エンコードの関係をわかってるのかなぁ?
わかってないからこんなコメントかけるんだと思うけど。

興味を持って見させて頂きました。
私も早く多言語できないかと思っています。
その多言語に関わっているのもありますが^^
開発を伴うので、サポートして、やろうというところがあればいいなーとか思います・・・

中国語・ハングル語・日本語混ぜ混ぜ文のblogが書きたくて、UTF-8対応だという「ココログ」に登録してみました。
ところが「投稿欄」のHTMLを見てみると、「!DOCTYPE」宣言欄の下しっかりと「html lang="ja"」と宣言してあります。

 それでもUTF-8対応のエディターで書いた混在文をNetspaseやfirefoxで貼り付けると、文字化けせずに書き込むことが出来、ブラウザ上でも文字化けせずに見ることが出来ます。

 ただし同じURLをInternet ExplorerやLunascapeなどというマイナーなブラウザで見ると、ハングル語や中国語は文字化けを起こし、全く読み取ることが出来ません。ココログで規定されている「lang="ja"」は当然の如く外せません。
 「投稿欄」が日本語しか受け付けないのであるならば、UTF-8対応って意味あるのでしょうかー???
 ただ単にUTF-8の日本語でしかblogは書けないって事なんじゃないでしょうか?私よく分かりません。

そういえばUTF化して2バイト文字になったときの影響をhtmlだけとかのテキストファイルだけ考えてるようだけど、DB側は考えてます?
そりゃぁ既存のEUC-JPのデータをUTFにエンコードさせれば(エンコードできる言語であれば)問題ないけど、フィールド名とか利用できなくなるんですよね。
だからDBもUTF化して2バイトにしないといけない。
すでに運用されているDBの容量が2倍になったら、そのサービスはレスポンスが悪くなるか、もしかしたらDBが死にますね。
#それにドメインで.co.jpとかJPドメイン使ってるところで多言語対応する方がドメインの意味を無視する行為だと思うんですがね。

20年以上前のシングルバイト、ダブルバイトの議論そのまんまに近いとこもありますね。
パフォーマンス、データ量、開発コスト等々。
日本語を表現するのに苦労した先達、ようやくダブルバイトが当たり前になったら、今度は多言語化。^^;)

はじめまして。海外からMMSを使ってモブログするのに、どのプログサイトがいいか探していたところ、ここに来ました。最高に参考になりましたよ。
で、現在so-net、cocolog、Voxを使用してます。3つとも、投稿がキャリアに依存しないですし、画像、文字ともMMSでばっちりです。
どうもありがとうございました。

一応プログラマで、かつ(仕事以外で)アラビア語を扱うことがとても多いです。ご意見に大変共感します。
1ユーザーとしてブログサービスを申し込み、いざアラビア語を入力して受け付けられず、ガックリきたり(って登録する前に調べようよ・・)。
アラビア語の場合、文字コードを乗り越えてもカーソル、ピリオド、スペースの制御など、面倒な問題が山積みで、ブログサービス以前にテキストエディタにすら不自由するのですが・・(アラビア語単体ならスムーズでも、日本語・英語と混在させてストレスなく使えるものが見当たらない)。

コメントする

OpenID対応しています OpenIDについて

このブログ記事について

このページは、松永英明が2005年5月 9日 14:13に書いたブログ記事です。
同じジャンルの記事は、ブログ/ウェブログをご参照ください。

ひとつ前のブログ記事は「『教科書には載らないニッポンのインターネットの歴史教科書』バナー作ったよ」です。

次のブログ記事は「アメリカは2007年に滅亡する?無意味な数字合わせ予言の実態を暴く」です。

最近のコンテンツはインデックスページで見られます。
過去に書かれたものは月別・カテゴリ別の過去記事ページで見られます。