Rubyで形態素解析
以前から興味のあったMeCabに手を出しました。
$ brew install mecab $ brew install mecab-ipadic
でインストールは完了です。mecab-ipadicは辞書だと思います。
試しに「お腹空いた。そろそろご飯食べたい」という文章を形態素解析してみました。
$ mecab お腹空いた。そろそろご飯食べたい お腹 名詞,一般,*,*,*,*,お腹,オナカ,オナカ 空い 動詞,自立,*,*,五段・カ行イ音便,連用タ接続,空く,アイ,アイ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 。 記号,句点,*,*,*,*,。,。,。 そろそろ 副詞,助詞類接続,*,*,*,*,そろそろ,ソロソロ,ソロソロ ご飯 名詞,一般,*,*,*,*,ご飯,ゴハン,ゴハン 食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ
おおお...。
「助動詞」で「たい」の単語がある場合、その一つ前の単語(さきの文章でいう「食べ」)を変数に代入......なんてことは可能なんですかね?
明日やってみよう
余談
YAHOOの形態素解析APIが優秀らしいと聞いたので機会があれば使ってみたいです