加藤 誠
2022年度 卒業研究指導方針
基本情報
2019年にできた新設気味の研究室です.第三期生を募集しています.
Webサイト | https://kasys.slis.tsukuba.ac.jp/ |
@kasys_lab | |
kasys-contact-ml [at] klis.tsukuba.ac.jp | |
教員部屋 |
7D308 |
学生部屋 |
情報メディアユニオン2F共同研究会議室2 |
学生数 | 学類生(5名),博士前期課程(9名),博士後期課程(3名) |
説明が重複するところもありますが,こちらの学生募集のページも併せてご覧ください.
このページ,または,研究室Webサイトの右下に表示されているアイコン()をクリックするとチャットができます.お気軽に連絡ください.
オープンラボ
下記の時間帯にオープンラボを開催する予定です.下記の時間であれば,どのタイミングでも,5分でも1時間でも好きな時間だけ,何名でもお越しいただけるので,お気軽に参加ください.
場所はZoom https://us02web.zoom.us/j/88422419204 ,パスコードは 354256 です.念のため,表示名にはご自身の氏名を設定ください.
すでに配属されている学生から自由な意見が聞ける場と加藤と雑談をする場の2つの機会を提供する予定です.
オープンラボは面談ではなく,下記の時間帯には面談を行っておりませんのでご注意ください.
日 | 時間 | 場所 | |
第1回 | 10月18日(月) | 11:25〜13:30 | Zoom |
第2回 | 10月19日(火) | 11:25〜13:30 | Zoom |
面談
下記の期間,面談を実施しています.配属希望の方は必ず面談を行ってください.予約にはGoogleカレンダーを利用しており,面談時間の24時間ほど前までに予約してもらえれば対応可能だと思います.
- 期間: 2021年10月18日(月)〜2021年10月25日(月)
- 場所: Zoom ( https://us02web.zoom.us/j/88422419204 パスコード: 354256 )
- 予約: 面談予約ページ
受け入れの条件
- 面談をすること
- 面談予約ページにて事前に予約を行ってください
- 希望するテーマが指導可能なものであること
- もし希望するテーマがある場合には,希望テーマについてA4 1ページ程度の文書を作成し面接時に提出ください
選考方法
- 選考基準
- 基準1: 面談を行った上で,「本研究室で研究をすすめる上で相性のいい人」をより満たし,「本研究室で研究をすすめる上で相性の良くない人」をより満たさない人を優先します
- 基準2: もし希望するテーマがある場合には,面接時に提出していただいた文書の内容を考慮します
- 総合基準:
- (希望するテーマが明確でない場合) 総合基準値=基準1による点数(100点満点)
- (希望するテーマが明確である場合) 総合基準値=0.4×基準1による点数(100点満点)+0.8×基準2による点数(100点満点)
- 上記は希望するテーマがある人を少し優先することを意味します
- 例: 基準1が80点の人の総合基準値=基準1が60点&基準2が70点の人の総合基準値
- 内定者には10月26日(火)までに連絡します
指導可能な研究領域
主な研究分野
本研究室では「情報検索分野」の下記の研究分野を主な対象としています:
- 検索モデルとランキング
- ランキング学習
- 検索意図推定
- 知識ベース構築
- 知識ベース応用
- Webマイニング
- 情報抽出
- 検索ユーザ行動分析
- 検索ユーザモデリング
- 推薦システム
- オンライン評価
主な研究トピック
本研究室の主な研究トピックは「知識獲得システム」です:
- 多くのリソースから知識を自律的に獲得するシステムを構築する
- 構造化された知識を人が検索するためのシステムを構築する
重点テーマ(2021年現在)
本研究室の2021年現在の重点テーマは「存在していない情報の検索」です.以下に研究テーマの例を挙げます:
- 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために,Webから客観的な統計データを検索し根拠を用意する
- グラフや統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
- グラフや統計データから自動的にその内容を要約するようなグラフを生成する
- TwitterやWeb検索エンジンのログなどから,明日の豆腐の消費量や筑波山の登山者数などを自動的に推定する
- 現実世界を徘徊して役に立つデータを自動的に集めてくるようなクローラを設計する
- 機械学習によって図書館の本の中身まで検索できるようにする
- 人間が潜在的に持っている情報を引き出して検索できるようにする
(注意: 基本的に上記のようなテーマを奨励しますが,適正・興味にあわせてテーマ設定も可能です)
研究指導・ゼミの概要
3・4年生の年間予定案
- 教科書輪講(75分/週)
- 情報検索の基礎(1月-2月)
- 言語処理のための機械学習入門(3月-4月)
- しくみがわかる深層学習(5月-6月)
- プログラミング輪講(75分/週)
- 言語処理100本ノック
- 実践的プログラミング(競技プログラミング・機械学習)
- ゼミ(75分/週)
- 自分の近況や研究内容などを紹介
- チームミーティング(75分/週)
- 3チームに分かれてチームごとにミーティング
- 個別ミーティング(60分/1~2週)
- 基本的に1対1でのミーティング
- 論文議論会(75分/週)
- 1時間程度その場で論文を読んで残り時間で議論する会
- DEIM締切(4年生2月)
- 国内の学会DEIMの論文投稿締切が2月にあります.
基本的に全員に投稿してもらいます.
テーマの決め方
配属されたタイミングで,まずはプロジェクト研究に挑戦し,研究の方法や関連研究を学びながら,
自身に興味がありそうな研究テーマを選んでもらいます.
基本的には,いくつかあるテーマの中から好きなテーマを選んでもらうか,
ミーティングを通して好きそうテーマを提案していきます.
ただし,希望する研究テーマがあり,「情報検索分野」に関係するテーマであれば,
その研究テーマに取り組んでもらうこともできます.
研究をすすめる上で望ましい条件
必要知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となります:
- 英語
- 数学
- 確率・統計
- 線形代数
- プログラミング
- Python(別の言語でも良い)
(「数学」か「プログラミング」のどちらかが得意だとなお良い)
習得予定知識
本研究室の研究テーマに取り組むに当たり下記の知識が必要となりますので,配属されたばかりの人には勉強会にて基礎を学んでもらいます:
- 情報検索(参考: 情報検索の基礎(共立出版))
- 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
- Web検索(索引,クローリング,リンク解析)
- 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
- 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
- 上記の参考書で習得できる程度の基礎
- 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
- 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
- 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
- 深層学習
- プログラミング
- Python
- Linuxの基本操作
- cdやls,cpなどができれば良い
本研究室で研究をすすめる上で相性のいい人
- たくさん研究をしたい人
- 創造的なエンジニア職に就きたい人
- 知識と技術を身につけて自信をつけたい人
- 賢いシステムを作ってみたい人
- 検索に詳しくなりたい人
- 英語が嫌いではなく,かつ,数学「か」プログラミングが嫌いではない人
本研究室で研究をすすめる上で相性の良くない人
- あまり研究をしたくない人
- エンジニア職以外に就職したい人
- 英語が嫌いな人
- 数学「も」プログラミングも嫌いな人