6月25日の業務報告

  1. こんにちは。B2の三塚です。

本日は、統計についての質問がありました。

Q.母分散と不偏分散の違いが分からない。

A.母分散を標本分散で代用しようとしたとき、標本分散では母分散よりも小さくなってしまうので、その標本分散にn/n-1をかけて、母分散に近づけるようにしたものが不偏分散という説明を教科書で確認しました。(ゼロから学ぶ統計解析p117)

(文責:三塚)

6月18日の業務報告

こんにちは。B2の三塚です。

本日は、KLCにあるプリンターの利用についての質問をいただきました。

Q1. 正規表現での論理和を表す方法がわからない。
A1. 授業資料や公式ドキュメント(https://docs.python.org/ja/3/library/re.html)を一緒に確認してしました。

Q2. 統計で両側検定と片側検定の違いがよくわからない。
A2. わかりやすく解説していたサイト(https://best-biostatistics.com/hypo_test/one-way.html)があったので参照してもらいました。

(文責:三塚)

12月2日の業務報告

こんばんは、B2の高橋です。

本日は統計とプログラミング演習Ⅱに関する質問が3件ありました。

=======================
<統計>
Q1:課題のメディアンの出し方が分からない
A1:階級値と度数のみが与えられている問題で、メディアンを求める際に階級値をそのまま用いるのではなく、近似値を用いるように指示されていたので、教科書を参考にしながら自分で適切な階級(階級幅)を設定して解けば良いのではと提案しました。

<プログラミング演習Ⅱ>
Q1:課題1(木曜クラス)で分散を出す方法が思いつかない
A1:まず文ごとの単語数など、後々にも使用しそうな数値・単語群などをそれぞれ配列に格納する方法を提案しました。そして、分散の公式を簡単に分解して一つずつ処理するよう提案しました。
 1.(平均-各数値)の二乗を算出する
 2.1で出した数値を順々に足していく
 3.全体の文の数で2の値を割る

Q2:ファイルの入力と、ファイルの中身を一行ずつ読み込む処理がよくわからない
A2:”open”や”gets”、”chomp”の役割について説明しました。

回答 Q1,Q2,Q3:高橋
=======================

来週はプログラミング演習Ⅱ(木曜クラス)の締め切りがあります。
この土日でプログラムをある程度形にするよう頑張ってみてはどうでしょう。

(文責:高橋)

12月7日の業務報告

こんばんは。B2の鈴木です。

今日は統計の質問がありました。
=======================
<統計>
Q1:統計の課題B(2)について
   教科書に似ている問題があった為その通りに解いたが、上位1000人目の得点が満点(200点)を超えてしまう
A1:メールにて後日対応する事を伝えました。

回答 Q1:鈴木
=======================

基本はデスクに質問に来てもらってやり取りをする形ですが、
質問者が多く順番待ちになってしまう時や時間が無い場合など、メールで後日対応する事もできます。
KLCへの質問者は締め切り前の駆け込みが多いのですが、課題は余裕を持って取り組めるようにすると
きちんと見直しをすることができます。特に統計の課題では小数点ミスや小さな計算ミスも厳しく減点されます。
ケアレスミスで評価を下げないように3回は見直しをしましょう。

(文責:鈴木)

1月26日の業務報告

こんばんは、B3の功刀です。

本日の質問と解答です。
=======================
<知識情報演習Ⅲ>
Q1. クエリが書かれたファイルと各文書の出現単語と重みが書かれたファイルの二つを読み込んで、最後に各文書のスコアを計算するプログラムがうまくつくれない。エラーが出ているが原因がわからない。
A1. @ARGVが何を表しているのか、と<>の使い方の違いなどについて説明したうえで、二つのものをそれぞれ別に読み込むにはどうすればよいか考えました。

Q2. 文字列の末尾を取り出したくてpopメソッドを使っていたが、エラーが出て先に進めない。
A2. pop関数は配列を扱うための関数であることを確認し、文字列の末尾を取り出すにはどのような方法があるのか、正規表現などの文字列処理について確認をしました。

Q3. dfの計算ができたが、そのあとどのような流れでidfとw(t,d)の値を求めていけば良いかわからない
A3. 単語の重み付けにおいて各値を計算するのに必要となるハッシュを用意するための方法について一緒に考えた上で、作成したハッシュを用いてどのように計算をすればいいかを考えるよう促しました。

<統計>
Q4. 統計の問題が解けなくて困っている(独立性の検定の問題ができない)
A4. 与えられた数値(表)から理論値の数値を求めて表にまとめる作業をしてからカイ二乗検定を行うまでの流れを確認するように説明しました。

回答:Q1:岩井 Q2-4:功刀
=======================

tf-idfを求めるプログラムはテキストファイルの読み込みやハッシュの操作がスムーズに進まないと、なかなか思うように作業が進みません。どこでどういったデータを処理しているのか、自分の書いたコードの動きがわからなくなってきたときはこまめに出力をして動作を確認するようにしましょう。
ハッシュの%や配列の@などの記号に関わる間違いでプログラムが上手く動かないという人も多い様です。Rubyに慣れているので、なかなか大変だとは思いますが、原因不明のエラーで困ったときは細かく確認してみてください。

(文責:功刀)