加藤 誠

2020年度 卒業研究指導方針(綿抜豊昭)

2021年度 卒業研究指導方針

氏 名:加藤 誠 (かとう まこと)
所 属:知識情報システム主専攻
研究室:7D308

基本情報

2019年4月から新設されたそこそこ新しい研究室です.第二期生を募集しています.

Webサイト https://kasys.slis.tsukuba.ac.jp/
Twitter @kasys_lab
E-mail kasys-contact-ml [at] klis.tsukuba.ac.jp
教員部屋
7D308
学生部屋
ユニオン2F共同研究会議室2
学生数 学類生(5名),博士前期課程(3名),博士後期課程(2名)

説明が重複するところもありますが,こちらの学生募集のページも併せてご覧ください.
このページ,または,研究室Webサイトの右下に表示されているアイコン()をクリックするとチャットができます.お気軽に連絡ください.

オープンラボ

下記の時間帯にオープンラボを開催する予定です.下記の時間であれば,どのタイミングでも,5分でも2時間でも好きな時間だけ,何名でもお越しいただけるので,お気軽に参加ください.
場所はZoom https://zoom.us/j/94176868385 ,パスコードは 104175 です.念のため,表示名にはご自身の氏名を設定ください.
すでに配属されている学生から自由な意見が聞ける場と私と雑談をする場の2つの機会を提供する予定です.
オープンラボは面談ではなく,下記の時間帯には面談を行っておりませんのでご注意ください.

時間 場所
第1回 10月12日(月) 11:25〜13:30 Zoom
第2回 10月13日(火) 11:25〜13:30 Zoom

面談

下記の期間,面談を実施しています.配属希望の方は必ず面談を行ってください.予約にはGoogleカレンダーを利用しており,面談時間の24時間ほど前までに予約してもらえれば対応可能だと思います.

  • 期間: 2020年10月12日〜2020年10月21日
  • 場所: Zoom ( https://zoom.us/j/94176868385  パスコード: 104175 )
  • 予約: 面談予約ページ
  • 備考: 面接では「Okapi BM25」について質問をしますので予習をしておいてください.

受け入れの条件

  • 面談をすること
  • 希望するテーマが指導可能なものであること
    • もし事前に希望テーマがある場合には面談時に聞いて判断します

選考方法

  • 選考基準
    • 面談を行った上で,「本研究室で研究をすすめる上で相性のいい人」をより満たし,「本研究室で研究をすすめる上で相性の良くない人」をより満たさない人を優先します
    • 面接において「Okapi BM25」に関する質問への回答が優れていた人を優先します
    • 大学院に進学を希望する人を優先します
  • 内定者には10月21日中までに連絡します

指導可能な研究領域

主な研究分野

本研究室では「情報検索分野」の下記の研究分野を主な対象としています:

  • 検索モデルとランキング
  • ランキング学習
  • 検索意図推定
  • 知識ベース構築
  • 知識ベース応用
  • Webマイニング
  • 情報抽出
  • 検索ユーザ行動分析
  • 検索ユーザモデリング
  • 推薦システム
  • オンライン評価

主な研究トピック

本研究室の主な研究トピックは「知識獲得システム」です:

  • 多くのリソースから知識を自律的に獲得するシステムを構築する
    • 簡単な研究テーマの例: テキストから「AならばBである」という関係を抽出する.
  • 構造化された知識を人が検索するためのシステムを構築する
    • 簡単な研究テーマの例: 人物検索,商品検索

重点テーマ(2020年現在)

本研究室の2020年現在の重点テーマは「データ検索」です.以下に研究テーマの例を挙げます:

  • 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために,Webから客観的な統計データを検索する
  • グラフや統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
  • グラフや統計データから自動的にその内容を要約するようなグラフを生成する
  • Webで公開されている表データなどを解析することによって,それらを知識として活用できるように変換し集積するシステムを構築する
  • Webを徘徊して役に立つデータを自動的に集めてくるようなクローラを設計する
  • TwitterやWeb検索エンジンのログなどから,明日の豆腐の消費量や筑波山の登山者数などを自動的に推定する

(注意: 基本的に上記のようなテーマを奨励しますが,適正・興味にあわせてテーマ設定も可能です)

研究指導・ゼミの概要

3・4年生の年間予定案

  • 教科書輪講(3年生1月〜4年生6月)
    • 情報検索の基礎(1月-2月)
    • 言語処理のための機械学習入門(3月-4月)
    • しくみがわかる深層学習(5月-6月)
  • プログラミング輪講(3年生1月〜4年生6月)
    • 言語処理100本ノック
    • 実践的プログラミング(競技プログラミング・機械学習)
  • プロジェクト研究(3年生1月〜3年生3月)
    • ゴールが明確で,作業量が多くない研究を体験してもらいます
  • プロジェクト研究発表会(3年生3月)
    • プロジェクト研究の発表会を行います
  • ゼミ(週1回,75分,3月と8月を除く)
    • 近況・趣味,自分の研究内容や読んだ論文などを紹介
  • 研究ミーティング(週1回程度,30分〜60分)
    • 基本的に1対1でのミーティング
  • ECIR締切(4年生10月)
    • ヨーロッパの情報検索の国際会議ECIRの締切が10月にあります.
      順調に研究が進んだ人はショートペーパーの投稿に挑戦してもらいます.
  • SIGIR締切(4年生1月)
    • 情報検索の国際会議SIGIRの締切が1月にあります.
      順調に研究が進んだ人はショートペーパーの投稿に挑戦してもらいます.
  • DEIM締切(4年生2月)
    • 国内の学会DEIMの論文投稿締切が2月にあります.
      こちらは基本的に全員に投稿してもらいます.

テーマの決め方

配属されたタイミングで,まずはプロジェクト研究に挑戦し,研究の方法や関連研究を学びながら,
自身に興味がありそうな研究テーマを選んでもらいます.

基本的には,いくつかあるテーマの中から好きなテーマを選んでもらうか,
ミーティングを通して好きそうテーマを提案していきます.

ただし,強く希望する研究テーマがあり,「情報検索分野」に関係するテーマであれば,
その研究テーマに取り組んでもらうこともできます.

研究をすすめる上で望ましい条件

必要知識(or 習得予定知識)

本研究室の研究テーマに取り組むに当たり下記の知識が必要となります(ので,配属されたばかりの人には勉強会にて基礎を学んでもらいます):

  • 英語(例外的にこれだけは事前に必要,苦手でなければ良い)
  • 数学
    • 確率・統計
    • 線形代数
  • 情報検索(参考: 情報検索の基礎(共立出版))
    • 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
    • Web検索(索引,クローリング,リンク解析)
    • 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
  • 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
    • 上記の参考書で習得できる程度の基礎
  • 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
    • 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
    • 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
    • 深層学習
  • プログラミング
    • Python(別の言語でも良い)
  • Linuxの基本操作
    • cdやls,cpなどができれば良い

(注意: 英語は必須ですが,それ以外はいくつかが得意である,または,得意になれれば良いです)

本研究室で研究をすすめる上で相性のいい人

  • 研究をしたい人
  • 創造的なエンジニア職に就きたい人
  • 知識と技術を身につけて自信をつけたい人
  • 賢いシステムを作ってみたい人
  • 検索に詳しくなりたい人
  • 英語が嫌いではなく,かつ,数学「か」プログラミングが嫌いではない人

本研究室で研究をすすめる上で相性の良くない人

  • 研究をしたくない人
  • エンジニア職以外に就職したい人
  • 英語が嫌いな人
  • 数学「も」プログラミングも嫌いな人

ページ先頭へ戻る