加藤 誠
2023年度 卒業研究指導方針
基本情報
2019年にできた研究室です.第四期生を募集しています.
Webサイト | https://kasys.slis.tsukuba.ac.jp/ |
@kasys_lab | |
kasys-contact-ml [at] klis.tsukuba.ac.jp | |
教員部屋 |
7D308 |
学生部屋 |
情報メディアユニオン2F共同研究会議室2 |
学生数 | 学類生(5名),博士前期課程(13名),博士後期課程(3名) |
説明が重複するところもありますが,こちらの学生募集のページも併せてご覧ください.
このページ,または,研究室Webサイトの右下に表示されているアイコン()をクリックするとチャットができます.お気軽に連絡ください.
オープンラボ
下記の時間帯にオープンラボ(ハイブリッド)を開催する予定です.下記の時間であれば,どのタイミングでもお越しいただけるのでお気軽に参加ください.すでに配属されている学生から自由な意見が聞ける場と加藤と雑談をする場の2つの会場があります.
オンライン参加の場合はZoomを使います: https://us02web.zoom.us/j/88422419204 ,パスコードは 354256 です.参加時には,念のため,表示名にはご自身の氏名を設定ください.オンラインの場合には参加後に学生・教員どちらと話すかを決められます.
オープンラボは面談ではなく,下記の時間帯には面談を行っておりませんのでご注意ください.
日 | 時間 | 場所(学生と話す) | 場所(教員と話す) | |
第1回 | 10月18日(火) | 11:30〜13:00 | 情報メディアユニオン 202 | 7D308 |
第2回 | 10月19日(水) | 11:30〜13:00 | 情報メディアユニオン 202 | 7D308 |
面談
下記の期間,面談を実施しています.配属希望の方は必ず面談を行ってください.予約にはGoogleカレンダーを利用しており,面談時間の24時間ほど前までに予約してもらえれば対応可能だと思います.
- 期間: 2022年10月18日(火)〜2022年10月25日(火)
- 場所(対面): 7D308
- 場所(オンライン): Zoom ( https://us02web.zoom.us/j/88422419204 パスコード: 354256 )
- 予約: 面談予約ページ
受け入れの条件
- 面談をすること
- 面談予約ページにて事前に予約を行ってください
- 希望するテーマが指導可能なものであること
選考方法
- 選考基準: 面談を行った上で,「本研究室で研究をすすめる上で相性のいい人」をより満たし,「本研究室で研究をすすめる上で相性の良くない人」をより満たさない人を優先します
指導可能な研究領域
主な研究分野
本研究室では「情報検索分野」の下記の研究分野を主な対象としています:
- 検索モデルとランキング
- ランキング学習
- 検索意図推定
- 知識ベース構築
- 知識ベース応用
- Webマイニング
- 情報抽出
- 検索ユーザ行動分析
- 検索ユーザモデリング
- 推薦システム
- オンライン評価
主な研究トピック
本研究室の主な研究トピックは「知識獲得システム」です:
- 多くのリソースから知識を自律的に獲得するシステムを構築する
- 構造化された知識を人が検索するためのシステムを構築する
重点テーマ(2022年現在)
本研究室の2022年現在の重点テーマは「汎用検索モデルと情報検索システム構築の自動化(AutoIR)」と「データセット検索」です.以下に研究テーマの例を挙げます:
- どのような検索サービスにも応用が可能な汎用ランキングモデルの構築
- 情報検索システムを評価するための検索ユーザシミュレーション
- AutoMLの情報検索(IR)版であるAutoIRの開発
- 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために統計データを検索し根拠を用意する
- 統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
- 統計データから自動的にその内容を要約するようなグラフを生成する
(注意: 基本的に上記のようなテーマを奨励しますが,適正・興味にあわせてテーマ設定も可能です)
研究指導・ゼミの概要
3・4年生の年間予定案
- 教科書輪講(75分/週)
- 情報検索の基礎(1月-2月)
- 言語処理のための機械学習入門(3月-4月)
- しくみがわかる深層学習(5月-6月)
- プログラミング輪講(75分/週)
- 言語処理100本ノック
- ゼミ(75分/週)
- 自分の近況や研究内容などを紹介
- チームミーティング(75分/週)
- 3チームに分かれてチームごとにミーティング
- 個別ミーティング(60分/1~2週)
- 基本的に1対1でのミーティング
- 論文議論会(75分/週)
- 1時間程度その場で論文を読んで残り時間で議論する会
- DEIM締切(4年生2月)
- 国内の学会DEIMの論文投稿締切が2月にあります.
基本的に全員に投稿してもらいます.
テーマの決め方
配属されたタイミングで,まずはプロジェクト研究に挑戦し,研究の方法や関連研究を学びながら,
自身に興味がありそうな研究テーマを選んでもらいます.
基本的には,いくつかあるテーマの中から好きなテーマを選んでもらうか,
ミーティングを通して好きそうテーマを提案していきます.
ただし,希望する研究テーマがあり,「情報検索分野」に関係するテーマであれば,
その研究テーマに取り組んでもらうこともできます.
研究をすすめる上で望ましい条件
必要知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となります:
- 英語
- 数学
- 確率・統計
- 線形代数
- プログラミング
- Python(別の言語でも良い)
(「数学」か「プログラミング」のどちらかが得意だとなお良い)
習得予定知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となりますので,配属されたばかりの人には勉強会にて基礎を学んでもらいます:
- 情報検索(参考: 情報検索の基礎(共立出版))
- 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
- Web検索(索引,クローリング,リンク解析)
- 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
- 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
- 上記の参考書で習得できる程度の基礎
- 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
- 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
- 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
- 深層学習
- プログラミング
- Python
- Linuxの基本操作
- cdやls,cpなどができれば良い
本研究室で研究をすすめる上で相性のいい人
- たくさん研究をしたい人
- 創造的なエンジニア職に就きたい人
- 知識と技術を身につけて自信をつけたい人
- 賢いシステムを作ってみたい人
- 検索に詳しくなりたい人
- 英語が読めて,かつ,数学「か」プログラミングが得意な人
本研究室で研究をすすめる上で相性の良くない人
- あまり研究をしたくない人
- エンジニア職以外に就職したい人
- 英語が苦手な人
- 数学「も」プログラミングも苦手な人