3月4日の業務報告

こんばんは、B3の栗山です。

本日の質問と回答です。
==========================
<統計>
Q1. 標準正規分布にあてはまるように標準化する方法及び標準正規分布から求めたい確率を導く方法が分からない。
A1. 教科書から似た問題を探し、その解法を説明しました。

<知識情報演習III>
Q2. idf値(逆文書頻度)を求めるプログラムidf.prlの作り方が分からない。
A2. idf値を求める公式を確認し、索引語tが出現する文書総数df(t)をカウントする必要があることを説明しました。
df(t)をカウントするためにどのような手順が必要か、質問者と一緒に考えていきました。

(回答 Q1:鈴木、Q2:栗山)
==========================

試験期間中もチュータデスクは平常通り開室しています。
分からない点がありましたら、KLCに足を運んでみて下さいね。

(文責:栗山)

2月21日の業務報告

こんばんは、B3の栗山です。

本日の質問と回答です。
=========================
<知識情報演習III>
Q1. tfを求めたファイルを入力としたときに,各単語が出現する文書の数(df)を求めるプログラムをどうやって書けばいいか分からない。
A1. tfを求めるプログラムを説明してもらいました。
その上で,tfを求めるプログラムと似たように,「単語をキーとし,文書の数をバリューとするハッシュ」を作ることを考えました。

Q2. 各単語が出現する文書の数(df)を単語をキーとしたハッシュに代入したが、dfが上書きされない。
A2. キーに文書番号と単語を指定していたため、意図した通りに値が代入されていませんでした。
何をキーとすればよいのか考えてもらいました。

Q3. 文書群から索引語を抽出するプログラム(extract.prl)で、実行しても抽出した単語が表示されない。
A3. プログラムをトレースしたところ、splitメソッドの使い方に誤りがあったので、一緒に調べて修正しました。

(回答: Q1安永、Q2鈴木、Q3栗山)
=========================

(文責:栗山)

2月20日の業務報告

こんばんはB2の古澤です.
本日の質問と回答になります.
=========================
<知識情報演習Ⅲ>
Q1. idfの求め方がわからない
A1.自己代入でdfをカウント計算する場合、どのような場合に増やすのか、
  増やしてはいけないのかを確認した後、条件分岐の構文を使えば求められると伝えました。

Q2. idfがうまく表示されない。エラーになる
A2. dfの求め方に不備があったので指摘しました。また、dfの求め方について上記のような助言をしました。

Q3. retrieval.prlの作り方がわからない。
A3. query.txtにある複数の検索語で検索したとき、どの文書がより検索結果として欲しいかを
  ランキング付きで求める、という旨をテキストを一緒に見ながら伝えました。

回答: Q1-Q3三浦
=========================

(文責:古澤)

2月19日の業務報告

こんばんはB4の水本です.
本日の質問と回答になります.
=========================
<知識情報演習Ⅲ>
Q1. tfやidfの求め方が分からない。
A1. テキストや授業のスライドを参照して,tfやidfの求め方について確認しました。

Q2. idfが正しく表示されない。
A2. プログラムを確認したところ、ループの中に誤りがあったので、そこを指摘しました。

Q3. 多重ハッシュの作り方と取り出し方が分からない。
A3. 多重ハッシュの作り方と取り出し方を例にしてみせて,課題のプログラムに適用してもらいました。

回答: Q1-2 森川 Q3水本
=========================

(文責:水本)

2月8日の業務報告

こんばんは。B2の古澤です。

本日の質問と回答です。

==================
<知識情報演習Ⅲ>
Q1. 単語の出現頻度を表す重みづけの式が分からない
A1. レジュメを参照しながら、重みづけの式が
いくつかの単純な式の組み合わせであることを説明しました。

(回答者:Q1 古澤)
==================

(文責:古澤)