前回「仕事」が多くてヘコんだの巻の続き。
茶筌辞書にIT用語約5000語を登録してリベンジ。このブログより名詞を引っこ抜いて出現頻度をリストアップ。
つっても、テキストをリストアップしても面白くないので、視覚化した。
視覚化はProcessingでの処理なので日本語が使えない。なので出てきたキーワードをムリヤリ機械翻訳で英語にして処理してみた(画像クリックで全景1920×1200)。大きい文字ほど高頻度。抽出した名詞は約1900ワード。
考えていた目的とはてんで違うがこう言うサービスがあっても良いんでない。
レイアウトするコードはざっくり作っちゃったのでたくさん改良の余地あり。色なんかランダムやし(たぶん、Windowsでみると暗めなんじゃないかな)、ばらつき具合はガウス分布だ。奥行き感をもうちょいつけたいところ。あと日本語が使えないのがイタいなぁ。
載せるほどではないけどこちらがレイアウト用コード→keyWordCroud1.pde
こういうことって面白いわ、「CGでデザインする」って言うより「CGをデザインする」って感じ。
徹夜明けなのに、な〜んかテンション上がってきます。
あっちょっと問題、前回ぶっちぎりで優勝された「仕事」さんが入ってないぞ、名詞を抽出するところで問題ありか?
感想よろ〜。
追記:いろんなレイアウトor配色を楽しむつもりなのでページにします。
Gallery»Keyword Cloud
genji
2006-02-22 — 21:56
予想してない作品っておもろい。
デジタルだけどアナログなカンジ。俗に言うアートですか?
newsネタなんかで綴られると、それだけで世界情勢みたいな。
htaka
2006-02-22 — 22:21
ブログのバックアップデータを送ると、ポスターにしてもらえるとか。
レイアウトテンプレートをそろえれば、結構ウケると思うねんけどね。