プログラム
チュートリアル
チュートリアル
「基盤モデル活用時代における研究の進め方」
8月28日(土) 13:00-16:00
TU1「だれもつまずかない AI を利用したプログラミング」
内山 英昭(奈良先端科学技術大学院大学)
抄録:
OpenAIのChatGPTやAnthropicのClaudeに代表される生成AIは,既にプログラミングの支援ツールとして広く活用されている.自然言語に基づく指示(プロンプト)を通じ,コードの生成,修正,デバッグ,リファクタリング等を行うことが可能である.こうした作業は人手による実装よりも桁違いに高速で,開発効率の大幅な向上を実現している.
本チュートリアルでは,生成AIを活用したプログラミングに関心をもつ初学者を対象に,プロンプトを用いたAIとのインタラクションに基づくプログラミングの枠組みを紹介する.生成されるコードは,使用するAIの種類やプロンプトによって異なるため,いくつかの具体的な事例を通じてその違いも示す.また,問題を段階的に分解しながら解決へと導くChain of Thought(思考の連鎖)の考え方に基づいて,AIからより安定的で意味のあるコードを引き出すプロンプトの工夫についても扱う.
TU2「基盤モデルの実践的な構築法と利用法」
小田 昌宏(名古屋大学情報基盤センター,名古屋大学大学院情報学研究科)
抄録:
画像処理及び自然言語処理のための深層学習モデル開発において,基盤モデルを利用するケースが増加している.基盤モデルとは,大量のデータを用いてSelf-supervised learning(SSL)により事前学習された深層学習モデルであり,様々な下流タスクへと応用可能な汎用的性能を持つ.目的のタスクのアノテーション付きデータを用いて,基盤モデルをFine-tuningすることで特定タスク向け深層学習モデルを構築することができる.Fine-tuningで使用するアノテーション付きデータが少ない場合でも高い性能の深層学習モデルを構築できる場合があり,大規模データセット入手が難しい医療支援において有用性が高い.
本講演では,画像基盤モデル構築に使用するSSLとして対象学習やMasked Image Modelingなどを紹介する.また,SSLの学習処理高速化のための複数GPU並列処理の方法,画像基盤モデルや言語基盤モデルのFine-tuningの方法,公開モデルについても言及する.
TU3「画像工学研究を理解した医師から見た基盤モデルやLLMの活用」
花岡 昇平(東京大学)
抄録:
基盤モデルやLLMが一般の医師にも使えるようになってきた.基盤モデルについては眼科,病理診断の例をできれば見せながら,これから医師がどのように働き方を変えてゆくのか議論する.またLLMについては,昨今のreasoningモデルの出現,multimedia LLMの性能向上について述べる.最後に,すでに工学を飛び越えて医師と基盤モデルとメーカーが手をつなごうとしている昨今に,工学者を含む各プレイヤーにとって最適の戦略はなにか,最悪の戦略はなにか,について考えようと思う.LLMはさまざまな技術を簡単に使えるようにした,そのことの意味に気づいている工学者が多くないように見えることに講演者は焦りを感じているからである.