仕事人間確定?

茶筌で形態要素解析ができるようになったので。
このブログの自分の投稿より名詞を取り出して単語出現頻度を出してみた。

今回は思いつくままに処理したのでええ加減。

で見つかった2257単語中、上位の結果(数字の単位は”個”出現頻度)
仕事ておい、、、
上位4つは意味なし、なので1位は仕事

仕事、、、

し、仕事、、、

ぁあぁ、、、

あ、アカン、ここに書いたらまた頻度が上がる、、、
名詞のみ抜きだせばいいから形態要素の解析は必要ないかもね。
とにかく現状ではおかしな単語が拾われるので
IT用語、CG用語で辞書を強化して、あと検索部分を見直してからからリベンジ!


以下は実行手順。
続きを読む “仕事人間確定?”


XSL Test

徹夜でXSLTの書き方調べて、ようやく出来たとおもって.xslファイルをアップしても表示されなかった。
あれこれ調べてようやく結論。

.xslファイルはIP制御のかかったサーバにあると読み込まれない。

半日も無駄な時間を費やしてしもた。
ちゅーコトでMac.comへアップロードした、あっさり解決。

AWS Simple Test w/XSLT

XSLTを使用した整形テスト終わり。

以下RESTへのリクエスト

http://xml-jp.amznxslt.com/onca/xml?Service=AWSECommerceService
&Version=2005-10-05
&AWSAccessKeyId=[AccessKeyID]
&Operation=ItemSearch
&SearchIndex=DVD
&Keywords=starwars
&AssociateTag=[associateID]
&Style=http://leavebehind.iobb.net/wordpress/wp-content/uploads/olddata/xsl/firstXSLTest.xsl
&ContentType=text/html

Amazon Web Service 簡単なテスト

AWSへの登録が終わったので、ちょっとしたテスト。

AWS Simple Test

http://webservices.amazon.co.jp/onca/xml?Service=AWSECommerceService
&Version=2006-01-15
&AWSAccessKeyId=[AccessKeyID]
&Operation=ItemSearch
&SearchIndex=DVD
&Keywords=starwars
&ContentType=text/xml
&AssociateTag=[associateID]

XSLTを定義していないので結果はXMLになるが、STARWARSに関してのDVDの結果が出る。

なかなか面白い。自分のブログに言及のある名詞をとりだして検索をかけサイドに表示とかなんて簡単にできる。アフィリエイトもばっちり。

要は言及しているであろう名詞をいかに自動で抜き出すか?ってこと。

データマイニングっていうんかな。その辺を掘り下げてみよう。