【ゼロからのYOLO解説】1. はじめに

python

こんにちは、人です。

今回はYOLO(You Only Look Once)の解説をしていこうと思います。

このサイトを読むと何がわかるの?

このサイトを読むことでYOLOがアルゴリズム内でどのようなことをして物体認識を行っているか、またなぜ高速な物体認識を実現しているのかを理解することができます。

特に以下の画像の意味がわかるようになります。

「You Only Look Once: Unified, Real-Time Object Detection」より引用

対象読者

  • YOLOアルゴリズムの中身を知りたい人
  • 機械学習の知識が多少ある人
  • 画像処理の知識が多少ある人

知識が多少ある人と言われても困ると思いますので、具体的には以下のニューラルネットワークの図の意味がわかる人

「画像がRGBのピクセルで構成されている」と言われてピンとくる人

ぐらいの方を対象にしています!

ニューラルネットワークの図

まぁYOLOの中身はどうでも良いから、早く自分のパソコンで実行してみたいという方はこちらのサイトに方法を載せていますのでご覧くださいませ!

YOLOとは

YOLOとは物体認識アルゴリズムです。

画像での物体認識はもちろんのこと、リアルタイム動画での認識も可能です。

以下は画像における物体認識の例ですが、物体が何であるのか、また、それがどこにあるのかを色枠で検出してくれています。

YOLOの物体認識アルゴリズム

まずは、YOLOの論文を読んでみましょう!こちらに載せていますので一読願います!

さぁ、どうでしょうか?

ざっくりと出てきた画像に目を通すぐらいで構いませんよ!

さて、上の画像はYOLOアルゴリズムの流れを示しています。

ご覧の通り、YOLOアルゴリズムは「畳み込みニューラルネットワーク(CNN)」と「YOLOネットワーク」の2つから構成されていますので、

YOLOアルゴリズムを理解する = 畳み込みニューラルネットワークとYOLOネットワークを理解する

ということになります。

ですので、畳み込みニューラルネットワークとYOLOネットワークについてまとめていきます!

次は2ですね!頑張っていきましょう!

それでは!!

コメント

タイトルとURLをコピーしました