リサーチサイエンティスト,北田俊輔_키타다 Details
トレーラー
リサーチサイエンティスト
北田俊輔
現在、生成型AIは世界的に
高い注目を集めています!

2022年8月にリリースされたStable Diffusionや、
2022年11月にリリースされた
ChatGPTを皮切りに
ジェネレーティブAI(生成系人工知能)が
世界中で急速に普及されています。
クラウドで動かす
「Midjouney」や「DALL・E2」のほか
特に「Stable Diffusion」が公開後、
入力されたテキストをもとに画像を生成する
画像生成AIのブームはさらに加速しました。
著しく進化し続ける画像生成AIの技術は
クリエイティブ産業、エンターテイメント、
広告、デザイン、医療など多くの分野で
益々需要が増えることが予想されます。
DALL・E2やStable Diffusionなど
画像生成AIのベースとなる技術とは?
答えは、
拡散モデル(Diffusion model)です。

現在注目されている
テキストから画像を生成するモデルは、
DDPM と呼ばれる、
ノイズ除去拡散確率モデルを
元にしています。
これまでとは異なる
新たな生成モデルとして
より高精度な画像の生成が可能で
従来の手法として主流であった
Generative Adversarial Network(GAN)を
超える性能を持っています。
複雑なデータ分布でも学習可能で
その分布を解析的に評価することができます。
この講座は、画像生成AIの主役となる
拡散モデルの理解と実践を通し
最新の画像生成技術について
学びたい方におすすめです!
本講座は違います。
需要が高まる画像生成AI分野での競争力を高め
将来のキャリアやビジネスチャンスを拡大してみませんか?

講座のおすすめ
こんな方におすすめです

AIや機械学習に興味があり、画像生成の分野に挑戦したい方

Pythonの基礎知識を持ち、画像生成AIの理論と実践的なスキルを身に付けたい方

クリエイティブ産業やデザイン、広告などで画像生成AIを活用したい方

AI関連のキャリアを追求し、競争力を高めたい方
全ての受講生に提供する
画像生成AI入門講座の特典

講義内容が分かりやすく
まとめられた講義資料PDF

講座内で使用する
Google Colab Notebook

講師が作成した
著作権フリーの高解像度の図表
自然言語処理や画像処理、
Vision&Languageの分野で研究を進めてきた
北田俊輔が教える段階的なカリキュラム


講座情報
本数:30本の映像
難易度:初級〜中級
無期限視聴

使用プログラム
Python 3
huggingface/diffusers
huggingface/transformers
huggingface/accelerator
※上記は、Google Colab上のノートブックを使用するため、別途端末へソフトウエアをインストールする必要はありません。
※詳細はページ内下段の使用プログラムについての案内をご確認ください。

動画情報
オンラインVOD
オーディオ:日本語

講座特典
講義資料
講座で使用したGoogle Colab Notebook
講師が作成した高解像度の図表
段階的な例題に沿って
拡散モデルの理論から
実践スキルまでを身に付けます
-
画像生成AIの概要
-
深層学習に欠かせない
Transformerモデルの理論と実装の理解 -
ノイズ除去拡散モデルの理論
-
画像生成AIを支える
最先端の各コンポーネントの導入 -
Stable Diffusionとその元となった
Latent Diffusionの説明と実習 -
Huggingface Diffusersを用いた
Stable Diffusionによる画像生成
この講座のポイント
画像生成AIの
基本的な概念を理解
本講座では、画像生成AIの基本的な概念や技術について徹底的に解説します。それらを通して、画像生成の基本原理や代表的な手法について学ぶことで、AIが画像を生成するメカニズムにおける、応用的なレベルまでの理解を深めます。

Pythonを用いた
拡散モデルの理論と実践
Pythonを活用して、拡散モデルの理論と実践に取り組みます。Pythonは、その使いやすさと豊富なライブラリのサポートにより、画像生成AIの実装に広く使用されています。Pythonを通じて拡散モデルを実装し、実際の画像生成タスクに取り組むことで、理論と実践を結び付けるスキルを身に付けます。

創造的なアイデアの発展と
表現力の向上
本講座を通して、生成AIとの協働による創造的なアイデアの発展と表現力の向上を目指します。AIモデルとのインタラクションを通じて、独自のアート作品やクリエイティブなコンテンツを生み出すことができます。AIをツールとして活用しながら、自身の表現力を引き出し、新たな視点やアイデアを開拓する能力を養います。

講座内容
下記のような内容を
学べます。
-
深層学習の基礎知識本講座を通して、深層学習の基礎知識をお教えします。これには、ニューラルネットワークの基本的な概念の理解や、バックプロパゲーションの仕組み、活性化関数、損失関数、最適化手法などが含まれます。深層学習の基礎知識を身に付けることで、講座後半のトピックで、より高度な理解を可能にします。
-
拡散モデルの基礎画像生成において、拡散モデルの基礎を学ぶことが重要です。拡散モデルとは、画像生成タスクにおいて、ノイズからリアルな画像を生成する手法です。まず、拡散モデルを含む生成モデルについて触れ、その後、昨今注目されている拡散モデルについて、基本的な概念や数学的背景を解説します。また、拡散モデルと非常に関連性が深いスコアベース生成モデルについてもお教えします。従来、画像生成の主流であった敵対的生成ネットワークを超える、生成性能を実現するまでに至る経緯について説明します。
-
非拡散モデルと拡散モデルにおける重要な研究の把握非拡散モデルと拡散モデルにおける重要な研究について取り上げます。まず、画像とテキストのペアを扱うCLIPを始めとした、重要なコンポーネントについて紹介します。その後、非拡散モデルとしてGenerative Adversarial Network(GAN)やVariational Auto-Encoder(VAE)といった生成モデルを紹介します。これらを通して、非拡散モデルの基本的な考え方や、代表的な手法について学び、拡散モデルとの比較や関連性を理解します。さらに、最新の研究トピックや拡散モデルの応用範囲も学ぶことで、その進展について最新の情報を把握することができます。
-
拡散モデルを元にした様々な画像生成技術の習得Stable Diffusionを始めとした拡散モデルは、現在広く公開されていますが、依然としてこれらを動かす「はじめの一歩」を踏み出すことは、難しいと思われます。そのため本講座では、Google Colabが提供するPython&GPU環境を基に、非常に簡単に画像生成AIを動かすことができることを体験します。更に、Stable Diffusionを応用して、アイデアに忠実な画像を生成できるようにする様々なテクニックを、実践を交えて紹介します。
(자동 구성) 가격이 인상됩니다.
カリキュラム
カリキュラム内容の
ご紹介
北田俊輔
リサーチサイエンティスト
はじめまして。
リサーチサイエンティストの北田俊輔です。
データサイエンスによる意思決定や
ディープラーニングを始めとした
人工知能技術の核心を
学びたいと思い大学に入りました。
自分の好きなことを好きなだけ
探求できる幸せを感じてしまい
博士号取得までの9年間を
自然言語処理やコンピュータビジョン、
またその融合領域である
Vision&Language分野の研究に捧げました。
世界をひっくり返してしまうような
生成AIのビックウェーブを
特に画像生成AIの観点から
みなさんに体験していただきたいと考え
本講座を作成しました。
もう既に使っているという方も
少し乗り遅れてしまったから
学んでみたいという方も、
基礎と実践の観点から画像生成AI技術を
楽しく学んでいただけるように
講座を構成しました。
生成AIは時代を変える技術として
これからも注目され続けると
私は信じています。
本講座を通じて、生成AI技術に対する
普遍的な知識を習得していただくとともに
さらにクリエイティブな活動ができる
お手伝いができればと願っています。


北田俊輔
現) LINE株式会社 Data Scienceセンター AI Dev室 リサーチサイエンティスト
前) 日本学術振興会特別研究員 DC2
前) 法政大学大学院 ティーチングアシスタント・リサーチアシスタント
前) 株式会社サイバーエージェント 協働研究員
前) 株式会社Gunosy リサーチインターン
【学歴】
2023年 法政大学大学院 理工学研究科 応用情報工学専攻 博士後期課程修了
2020年 法政大学大学院 理工学研究科 応用情報工学専攻 修士課程修了
2018年 法政大学 理工学部 応用情報工学科 卒業
【研究分野】
自然言語処理
- 文字形状を考慮した自然言語処理
- 摂動に頑健で解釈可能な自然言語処理
医療画像処理
- 皮膚がん認識のため自動診断システムの構築
計算機広告
- 配信効果の高いデジタル広告の作成支援
- 配信効果の低いデジタル広告の停止支援
インタビュー
リサーチサイエンティスト
北田俊輔が
お話ししたいこと

受講生が本講座を受講すべき、講師さまのみの強みについてお教えください。
私は、自然言語処理や画像処理、またこれらを融合したVision&Languageの分野で、基礎および応用研究を進めてきました。特に、私はこれまで日本学術振興会特別研究員という研究者の登竜門とも言うべき制度に採用された経験があり、関連する研究分野で博士号を取得しました。
それらの経験を活かし、画像生成AIや拡散モデルについての理論や実践的なアプローチに関して、幅広い知識と深い洞察を提供します。また、研究者として画像や言語を中心とした研究を進めており、所属している企業でも実際に画像生成AIや拡散モデルに関する研究を行っているので、研究の実践的な視点や最新のトレンドについての知見を持ち、受講生に実践的な洞察を提供することができると思います。そして、博士号取得の経験を活かし、研究成果や専門知識をわかりやすく説明し、受講生が理解しやすい形で情報をお伝えします。
本講座の受講が終わったら到達できる目標について具体的にお教えください。
本講座を修了すると、以下の目標を達成することが期待されます。
- 拡散モデルの理解:
拡散モデルの仕組みや特徴、その応用の可能性について理解し、画像生成における重要な手法としての位置付けを把握します。
- Pythonを使った拡散モデルの実装:
Pythonの基礎から始めながら、拡散モデルを用いた画像生成の手法を実践的に学び、Pythonによる拡散モデルの実装ができるようになります。
- 画像生成の応用力の向上:
拡散モデルを通じて、様々な画像生成タスクに取り組むことができます。例えば、テキストからの画像生成を中心に、生成したい画像を満たせるようなパーソナライズされた画像生成や、拡散モデルによる画像編集、操作性・制御性の高い画像生成など、実際の応用シナリオに対して手法を適用する能力を身に付けます。
- 学習への基盤の構築:
AIや画像生成の分野における基盤を構築します。これにより、今後の学習や応用においても一歩前進することができます。
受講生に向けてメッセージをお願いいたします。
この講座では、拡散モデルという重要な手法を通じて、画像生成の理論と実践を学びます。Pythonを使った実装により、実際の画像生成タスクに取り組みながら、AIの力を活用した創造的な表現を追求します。また、学術的な基礎から応用までカバーしており、拡散モデルの理論について深く掘り下げながらも、実践的なスキルの習得を重視しています。そして、私自身の経験や専門知識を踏まえ、丁寧かつ分かりやすく講義を進めていきます。
本講座を修了することで、拡散モデルの理解とPythonによる実践力が身に付きます。AIの応用領域が広がる現代において、画像生成のスキルは非常に価値があります。将来のキャリアにおいて競争力を高めるだけでなく、自己表現やクリエイティビティを拡大するためにも、本講座は有益なものとなるでしょう。
最後に、本講座を受講することで、新たな知識やスキルを獲得し、画像生成AIの世界に一歩踏み出すことをお約束します。一緒に学び、成長しましょう。
使用プログラムについて
ご案内します。
当講座は、以下のツールを使用します。
[メインツール]
Python 3
huggingface/diffusers
huggingface/transformers
huggingface/accelerator

【受講前にご確認ください】
※講座内で詳細に説明しますが、以下の知識があるとよりスムーズに受講することができます。
・深層学習の基礎知識
・Stable DiffusionやChatGPTを話で聞いたことがある程度
・PythonやPyTorchの基礎知識 (各演習でPythonを使用するため、Pythonに関する最低限の知識があると、よりスムーズに受講ができます。)
・高校数学、特に線形代数・微分積分・確率統計をある程度理解していることを前提としています。
おすすめの講座
この講座を見た方は
こちらもチェック!
ご注意事項
*本ページ上の情報は弊社の都合により事前の告知なく変更、終了することがございます。予めご了承ください。
*講座の返金規定はColosoの返金ポリシーに準じます。▶ 返金ポリシーはこちら
* 受講、例題使用範囲などの知的財産権、機器台数制限に関する情報はFAQ
欄でご確認ください。