2月4日の業務報告

こんばんは、B4の古澤です。

本日の質問です。

本日の質問と解答です.
=======================
<知識情報演習Ⅲ>
Q1. idfの計算がうまくいかない
A1. 演算の仕方に誤りがあったので指摘しました。

Q2. ハッシュの値がうまく取り出せない
A2. foreach文でkeyに対してsortをしながら処理を行ってもらったところ、ハッシュの値がうまく取り出せました。

回答:Q1: 清水、Q2: 古澤
=======================

プログラミングで自分の想定している出力が得られなかった場合
printなどを用いながら、変数の中身がどうなっているかを細かく
確認していくのが良いと思います。

(文責:古澤)

2月3日の業務報告

こんばんは、B3の野沢です.

本日の質問と解答です.
=======================
<知識情報演習Ⅲ>
Q1. extract.plで必要な文字だけを取得したいのだが空白になってしまいうまくいかない
A1. 例の、「の間の文字を取得する」という正規表現の書き方のみを使って処理を行なおうとしていたため、該当する文字がなかったことが原因でした。While文の中では文章を1行ずつ読み込むことを意識すればよいと伝えました。

Q2. tfの表示結果がD001~という順ではなく単語のアルファベット順になってしまう
A.2 tfの値を入れているハッシュの構造が単語->id->tfの値の順になっており、この順でforeach文を使うと、まず単語でソートされ、そのあとidの順に処理されていくということを伝え、表示を逆にすることを伝えました。

Q3. tfで総文書数を表示しないようにしているのに総文書数が出てくる
A3, tfの処理を行うために読み込ませる文書群の中で、文書が終わると空行を入れていました。その空行を読み込んで頻度を数えていったため、総文書数と同じ数が表示されていたことを確認しました。

Q4. idfを計算する場所がわからない
A4. dfの計算まで行なっていたので、それとはまた別にforeach文を作り、その中でidfの計算を行なえばいいと伝えました。

回答:Q1-4: 品木
=======================

知識情報演習Ⅲのレポート締切は今週末なので,締切直前にとりかからずに,早めに片付けてしまいましょう.
(文責:野沢)

2月2日の業務報告

こんばんは、B3の功刀です。
2月初めての業務となりました。秋学期ももうすぐ終了ですね。

本日の質問と解答です.
=======================
<知識情報演習Ⅲ>
Q1. 重みを計算するためにはどうすればよいか
A1.重みがどういうものであるか、foreachのはたらきと二重ハッシュの値の取り出し方について説明したうえで、計算方法について考えました。

回答:Q1: 岩井
=======================

終盤に差し掛かってきた知識情報演習Ⅲですが、作成したプログラムが多くなりどのプログラムがどんな役割を担っているのかがわかりづらくなっているかもしれません。現在の演習は今まで取り組んできた内容が繋がりあって単語の重み付けの動きをするので、いったん全体の大きな動きを再確認してみると頭の整理がつくかと思います。

(文責:功刀)

1月30日の業務報告

こんばんは、B3の功刀です。

本日の質問と解答です.
=======================
<知識情報演習Ⅲ>
Q1. ストップワードを判断するための正規表現を書いたが上手く動かない。
A1.正規表現の中でストップワードを|で区切ることで判断していたが、|が一本余分に含まれていたためストップワード以外の語句もマッチしたと判断されていました。

Q2.ストップワードを判断するための正規表現を書いたが、単語の中に部分文字列としてストップワードが登場したときにその単語をストップワードとみなしてしまう。
A2.単語の前に現れるスペースと単語の終わりを考慮した正規表現に書き換えることによって単語の中にストップワードが出現する場合にも対処できることを説明しました。

Q3.接辞処理をするために正規表現を書いたが上手く動作しない。
A3.if分の条件式にeqを用いていたのが上手く動作しない原因でした。=~を使えば良いことを確認しました。
回答:Q1-3:功刀
=======================

正規表現は記号も多く間違いに気づきづらいです。
web上には正規表現のテストや確認を行ってくれるサービスが多く公開されているので、正規表現の確認をしたい方はぜひ探してみてください。

(文責:功刀)

1月29日の業務報告

こんばんは,B3の野沢です.

本日は卒業生講演がありました.
社会で活躍されている先輩のお話を聞くことはよいことですね.

本日の質問と解答です.
=======================
<知識情報演習Ⅲ>
Q1. キーはストップワードで値は1のハッシュを用意し,ファイルから読みこんだ単語がもしハッシュのキーにあれば出力しない,なければ出力するコードを書いた.実行したらストップワードを含めて全て出力されてしまう,
A1. ifの条件式が”==”ではなく”=”だったので,すべて出力されていました.

回答:Q1:野沢
=======================

変数名を入力し間違えたり,現在編集していないファイルを実行していたり,簡単なミスほど気がつかないものです.
自分でどうしてもわからないときは,周りの人に聞いてみましょう.
(文責:野沢)