KLiS TODAY Vol.22
4/8

4KLiS TODAY No. 22February 2014池田 彩佳    卒業研究の最終発表を終えると同時に、私の4年間の大学生活もほぼ終わりを迎えました。振り返ってみると、卒業研究をした4年次の1年間が一番濃い時間を過ごせた年になったのではないかと思います。 卒業研究の題目は「PageRankに基づく複数トピックをもつ文書に対応したキーワード抽出」です。文書への適切なキーワードの付与を自動的に行うための新しい方法を提案しました。高校時代は文系でしたが、プログラミングでアルゴリズムを実装するという文系とは程遠い研究をしました。興味に従ってあらゆることができる大学の可能性を、偉大だなと感じたものです。 PageRankとは、Googleのサーチエンジンにも採用されている、Webページを順位づけするアルゴリズムです。これをキーワードの抽出に応用する手法は数多く提案されていますが、私は文書のトピックを考慮するという観点から新しい手法を提案しました。文書のトピックとは、文書に複数存在する著者の主張の流れを表すまとまりのことです。“より的確なキーワード抽出を行うには複数あるトピックから万遍なくキーワードを選択することが必要である”というアイデアを基に精度の良い手法を模索しました。 下の図は、ある科学論文に出現した単語と、それぞれのキーワードらしさをグラフ化したものです。同じ文章に同時に使われていた単語どうしが結び付けられています。より多くのトピックと関わっているような単語がキーワードであると判断されるのが、提案した手法の特徴です。 研究を進めるにあたっては既存手法を調べるのが大変で、先行研究は星の数ほどあるのではないかと思われるほどでした。印象に残ったのは、自分がどのように考えて新しい手法を提案するかによって、先行研究を捉える視点も変わっていくことです。最初に思い描いていたような手法が上手くいくとは限りません。夏休み中に試行錯誤していた作業が行き詰まり、別のアプローチに方向転換したこともありました。研究は刻々と変化していくものです。その経験の後に、研究を始めたばかりの頃に読んだ論文をもう一度読み返してみると全く新しい発見があり、奥の深い研究の世界を感じられました。 研究は、その人が与えられた1年間をどのように使ってきたのかを如実に表します。特に提案手法を実装する形の研究では、自分がやったことのすべてが研究成果として返ってくるようでした。あれをやっておけばよかった、これをやってみればよかったという思いはまだまだありますが、自分の1年間が目に見える形になったことは嬉しいものです。完成した論文を見ていると自身の足りないところが浮き彫りになっているように感じます。これからも、研究を通してわかった自分の未熟な部分と向き合って、成長していきたいと思います。(いけだ・あやか 知識情報・図書館学類 4年次)卒業研究を終えて ̶ 知識情報システム主専攻論文に出現した主な単語のキーワードらしさ

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer10.2以上が必要です