2011年7月27日 星期三

使用HTML5的正體中文文字雲產生器,分析RSS、Blog、微網誌、臉書裡面所使用到的詞句,頗有趣。

在找HTML5資料時,在異塵行者那邊看到別的高手做的好玩東西,使用HTML5和Javascript製成。
可以分析文字內容,把用到的字彙依使用頻率弄成標籤雲的圖。

現在功能有分析本機文字檔,以及線上的網頁、RSS、Blog、微網誌、臉書等等,最後可以匯出成PNG圖檔。

我這個記事本篇數不多,拿來試了一下,發現在我常使用的Google Chrome 14 (Dev)上有問題,會跑成放射藍色塊。
改用FireFox 5.0,反而沒問題,找出六千多個詞,排列時間不會很久。
我試了兩次,原來我都用到這些字眼啊~還蠻有趣的!

「可以」這個字眼真是使用頻繁啊!
另外,我也使用了許多「使用」、「我們」、「一個」、「這個」、「就是」、「功能」、「氣功(?)」。
最大(常出現)的字是「http」,也許我引用許多網頁資料,也貼了不少連結吧!

或先看看作者timdream的說明:http://blog.timc.idv.tw/posts/wordcloud/

沒有留言:

張貼留言