言語処理100本ノック2
全然正解してないし汚コードを書いてしまった...反省...そのうち書き直す...
第4章: 形態素解析
31.動詞 動詞の表層形をすべて抽出せよ.
32.動詞の原形 動詞の原形をすべて抽出せよ.
33.サ変名詞 サ変接続の名詞をすべて抽出せよ.
34.「AのB」 2つの名詞が「の」で連結されている名詞句を抽出せよ. 35.名詞の連接 名詞の連接(連続して出現する名詞)を最長一致で抽出せよ.
36.単語の出現頻度 文章中に出現する単語とその出現頻度を求め,出現頻度の高い順に並べよ.
37.頻度上位10語 出現頻度が高い10語とその出現頻度をグラフ(例えば棒グラフなど)で表示せよ.
38.ヒストグラム 単語の出現頻度のヒストグラム(横軸に出現頻度,縦軸に出現頻度をとる単語の種類数を棒グラフで表したもの)を描け.
39.Zipfの法則 単語の出現頻度順位を横軸,その出現頻度を縦軸として,両対数グラフをプロットせよ.