加藤 誠
2024年度 卒業研究指導方針
基本情報
2019年にできた研究室です.第五期生を募集しています.
Webサイト | https://kasys.slis.tsukuba.ac.jp/ |
@kasys_lab | |
kasys-contact-ml [at] klis.tsukuba.ac.jp | |
教員部屋 |
7D308 |
学生部屋 |
情報メディアユニオン2F 202 |
学生数 | 学類生(3名),博士前期課程(9名),博士後期課程(2名) |
説明が重複するところもありますが,こちらの学生募集のページも併せてご覧ください.
オープンラボ
10月16日(月)〜10月18日(水)にユニオン202(一部7D308)にてオープンラボを行っています.ご都合の良い時間にお越しください.
- カジュアル学生相談会: 研究室にいる先輩に研究室の話を聞いたり相談できたりします.
- 加藤先生相談会: 加藤から研究室の話を聞いたり相談できたりします(7D棟308号室で実施,「面談」ではないのでご注意ください).
- 公開ゼミ: 研究室の一風変わったゼミを体験できます.研究の話は聞けないかもしれません.
- 公開論文議論会: 週に1度行われている「論文議論会」を体験できます.担当者が論文を紹介してくれます.
- 4年生研究発表会: 研究室の4年生が中間発表会の内容を発表します.
- KASYS ENGLISH: 今年度から始まった学生主体の英会話勉強イベントを体験できます.
- 公開チームミーティング: 研究の進捗報告会を体験できます.研究の進め方などを知りたい場合には公開ゼミではなくこちらに参加ください.
面談
下記の期間,面談を実施しています.配属希望の方は必ず面談を行ってください.予約にはGoogleカレンダーを利用しており,面談時間の24時間ほど前までに予約してもらえれば対応可能だと思います.
なお,面談では英語,数学,プログラミング能力を問う質問をします.
- 期間: 2023年10月16日(月)〜2023年10月24日(火)
- 場所(オンライン): Zoom ( https://us02web.zoom.us/j/83131500589 パスコード: 894410 )
- 予約: 面談予約ページ
受け入れの条件
- 面談をすること
- 面談予約ページにて事前に予約を行ってください
選考方法
- 選考基準: 面談を行った上で,「本研究室で研究をすすめる上で相性のいい人」をより満たし,「本研究室で研究をすすめる上で相性の良くない人」をより満たさない人を優先します
指導可能な研究領域
主な研究分野
本研究室では「情報検索分野」の下記の研究分野を主な対象としています:
検索モデルとランキング,ランキング学習,検索意図推定,知識ベース構築,
知識ベース応用,Webマイニング,情報抽出,検索ユーザ行動分析,検索ユーザモデリング,
推薦システム,オンライン評価
主な研究トピック
本研究室の主な研究トピックは「知識獲得システム」です:
- 多くのリソースから知識を獲得するシステムを構築する
- 知識を人が検索するためのシステムを構築する
重点テーマ(2023年現在)
本研究室の2023年現在の重点テーマは「汎用検索モデルと情報検索システム構築の自動化(AutoIR)」と「ドメイン特化検索アルゴリズム」です.以下に研究テーマの例を挙げます:
- どのような検索サービスにも応用が可能な汎用ランキングモデルの構築
- AutoMLの情報検索(IR)版であるAutoIRの開発
- 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために統計データを検索し根拠を用意する
- 統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
- 情報格差をなくすための情報配信システムの構築
(注意: 基本的に上記のようなテーマを奨励しますが,適正・興味にあわせてテーマ設定も可能です)
研究指導・ゼミの概要
3・4年生の年間予定案
- 教科書輪講(75分/週)
- 情報検索の基礎(1月-2月)
- 言語処理のための機械学習入門(3月-4月)
- しくみがわかる深層学習(5月-6月)
- プログラミング輪講(75分/週)
- 言語処理100本ノック
- ゼミ(75分/週)
- 自分の近況や研究内容などを紹介
- チームミーティング(75分/週)
- 3チームに分かれてチームごとにミーティング
- 個別ミーティング(60分/1~2週)
- 基本的に1対1でのミーティング
- 論文議論会(75分/週)
- 担当者が30分程度で1本の論文を紹介して残り時間で質問・議論する会
- DEIM締切(4年生2月)
- 国内の学会DEIMの論文投稿締切が2月にあります.
基本的に全員に投稿してもらいます.
テーマの決め方
配属されたタイミングで,まずはプロジェクト研究に挑戦し,メンター(研究室の修士または博士)から研究の方法や関連研究を学びながら,
自身に興味がありそうな研究テーマを選んでもらいます.
基本的には,いくつかあるテーマの中から好きなテーマを選んでもらうか,
ミーティングを通して好きそうテーマをこちらから提案していきます.
ただし,希望する研究テーマがあり,「情報検索分野」に関係するテーマであれば,
その研究テーマに取り組んでもらうこともできます.
研究をすすめる上で望ましい条件
必要知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となります:
- 英語
- 数学
- 確率・統計
- 線形代数
- プログラミング
- Python(別の言語でも良い)
(「数学」か「プログラミング」のどちらかが得意だとなお良い)
習得予定知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となりますので,配属されたばかりの人には勉強会にて基礎を学んでもらいます:
- 情報検索(参考: 情報検索の基礎(共立出版))
- 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
- Web検索(索引,クローリング,リンク解析)
- 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
- 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
- 上記の参考書で習得できる程度の基礎
- 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
- 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
- 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
- 深層学習
- プログラミング
- Python
- Linuxの基本操作
- cdやls,cpなどができれば良い
本研究室で研究をすすめる上で相性のいい人
- たくさん研究をしたい人
- 創造的なエンジニア職に就きたい人
- 知識と技術を身につけて自信をつけたい人
- 検索アルゴリズムの専門家になりたい人
- 研究室のメンバーと協調して研究を進められる人
- 英語が読めて,数学とプログラミングが得意な人
本研究室で研究をすすめる上で相性の良くない人
- あまり研究をしたくない人
- エンジニア職以外に就職したい人
- 英語が苦手な人
- 数学「も」プログラミングも苦手な人