2月21日の業務報告

こんばんは、B3の栗山です。

本日の質問と回答です。
=========================
<知識情報演習III>
Q1. tfを求めたファイルを入力としたときに,各単語が出現する文書の数(df)を求めるプログラムをどうやって書けばいいか分からない。
A1. tfを求めるプログラムを説明してもらいました。
その上で,tfを求めるプログラムと似たように,「単語をキーとし,文書の数をバリューとするハッシュ」を作ることを考えました。

Q2. 各単語が出現する文書の数(df)を単語をキーとしたハッシュに代入したが、dfが上書きされない。
A2. キーに文書番号と単語を指定していたため、意図した通りに値が代入されていませんでした。
何をキーとすればよいのか考えてもらいました。

Q3. 文書群から索引語を抽出するプログラム(extract.prl)で、実行しても抽出した単語が表示されない。
A3. プログラムをトレースしたところ、splitメソッドの使い方に誤りがあったので、一緒に調べて修正しました。

(回答: Q1安永、Q2鈴木、Q3栗山)
=========================

(文責:栗山)