« 山中玄三郎先生、猪股裕一先生、ありがとうございました | トップページ | 世界からの祈り »

2011年03月10日

言葉の頻出度の歴史がわかる"Google Books Ngram Viewer"

Google Books Ngram Viewer

Google labsのサービス「Google Books Ngram Viewer」が、世界のすべての情報を網羅し検索できるようにするというGoogleのポリシー(ソーシャル・メディアによってゆらいでいるが)に沿ったものでおもしろい。

1500万冊以上の本(英語)からの5000億語のデータベース(日々増え続けている)から、近現代における言葉がどのような割合頻度で出てきているかを時系列に折線グラフで表示する。
ことばは単独でもいいし、カンマで区切れば複数でも可。
さらに各年代をクリックすれば、その言葉が現れるその年代の本がGoogle Booksの書籍検索で表示、用例も見られる。

「N-Gram」というのは言語処理アルゴリズムなのだが私もまだよく理解はできていない。
言語選択に仏・独・西・露・中国簡体字などがあるが、これは英語の本の中に出てきたそれぞれの言語のものという意味だと思う。

もしこれと同等の機能の日本語版(万葉から明治以来の書籍、新聞、雑誌、ビラ等を網羅)があったら、と夢想する。

画像は「Arts」と「Design」という言葉をモダンデザインが発祥した1880年から2008年まで表示させたもの。
  

3 10, 2011 08.ことばとコミュニケーション・文字・タイポグラフィ, 09.ネットワーク・コミュニケーション |

トラックバック

この記事のトラックバックURL:
http://radical-imagination.net/mt/mt-tb.cgi/5333

この記事へのトラックバック一覧です 言葉の頻出度の歴史がわかる"Google Books Ngram Viewer":

コメント

コメントを書く