物体検出をわかりやすく解説!違い・活用範囲・手法までを詳しく紹介

物体検出をわかりやすく解説!違い・活用範囲・手法までを詳しく紹介

物体検出について詳しく知りたい、と調べている担当者もいらっしゃるかと思います。知りたい特定の情報を素早く判断できる物体検出は、多くの業界で利用されています。その活用範囲や手法について詳しく把握したいと考える方も多いようです。

そこで本記事では、物体検出の概要と活用されている範囲・手法を詳しく解説していきます。

物体検出とは

物体検出とは、撮影した画像や映像から、特定の物体の位置・種類・個数などの情報を検出して見つけ出すことです。

物体検出技術を用いれば、画像・映像をコンピュータで解析し、どのような物がどこにどれくらいの数映っているのかを素早く特定できます。物体検出は、製造業・医療分野・建設業など、幅広い分野で取り入れられている技術です。身近なところでは、カメラを使った人物の顔認識などに使われています。

画像分類と物体検出の違い

画像分類と物体検出の違いについて説明します。

画像分類は、画像全体に何が映っているか認識し分類するタスクのことです。例えば、画像に映っているものが、猫なのか犬なのかウサギなのかを分類することができます。従来は画像から特徴量を抽出し、その特徴量を元に画像を分類していましたが、深層学習を活用した手法が登場したことで飛躍的に精度が向上しました。

AIを使うと画像を建物・自転車・人・鞄など画像分類して物体検出をする事ができます

画像分類は、画像全体に何が映っているのか分類するタスクなのに対して、物体検出は、画像にどこに、何が、いくつ映っているか検出するタスクです。画像のどこに何がいくつ映っているかまで認識できるため、例えば、駐車場の画像から車が何台駐車されているか判定したり、街中の画像から歩行者が何人いるかカウントするといった用途に応用が可能です。

車と人を物体検出して交通量と通行量を計測調査する事ができます。その精度は目視と比較しても90%の精度と高い精度です。

物体検出の活用範囲

物体検出の活用範囲について、以下3点を挙げて説明します。

  • 製造業
  • 医療分野
  • 建設業

それでは、1つずつ見ていきましょう。

製造業

物体検出を活用している業種に、製造業があります。

製造業では部品を組み立て製品を完成させるという工程があり、中には不良部位が含まれていることもあります。従来は人の目で、製品の隅々までを確認し、不良部位を特定していました。しかし、熟練者と若手などで個人差が目立ち、担当者によっては不良部位を見落とす、という問題も指摘されていました。

そこで、不良部位の特定を物体検出アルゴリズムに代替することで、一定の品質を維持したチェックを行います。これまで人の目での確認で見落としていた箇所を防ぐことに役立っています。

医療分野

医療分野でも、物体検出を活用しています。

体の異常な部分や病気を特定するために、従来は放射線を使ったCT画像を医者が直接目で確認して、患者に説明していました。CT画像の確認作業に物体検出を活用することで、医者が細かく確認するよりも早く異常部位を正確に特定でき、品質向上に役立っています。医者は物体検出の結果を見た上で判断ができるため、精度の高い情報を従来よりも短時間で患者に伝えられます。そのため、医者は患者への説明やフォローに集中することができます。

建設業

建設業でも、物体検出が有効活用されています。

ビルなどの建物を建設する際に、現場の担当者がしっかりとヘルメットを被っているかを、物体検出の技術で行っている企業もあります。これにより、現場監督の手間を少なくできます。また、ヘルメットを被っていないことにすぐ気づけるため、安全性も向上します。現場監督が実施している確認作業を、物体検出で行うことで、これまで負荷がかかっていた現場監督の作業負担を減らすことが可能です。

物体検出の主な手法

物体検出の手法について、代表的な3つの手法を説明していきます。

  • R-CNN
  • SSD
  • YOLO

それでは、1つずつ見ていきましょう。

R-CNN

R-CNNとは、ディープラーニングで物体検出を行う先駆けとなった手法です。入力した画像から物体の領域候補となるエリアを抽出すると共に、抽出されたエリアの画像に何が映っているか画像分類する、Two-Stageと呼ばれるアプローチをとる手法です。

R-CNNは、高精度な物体検出ができるというメリットはあるものの、候補領域の抽出量が多く、処理時間が非常に遅い傾向にあること、メモリを大量に消費することが課題として挙げられています。これらの課題を解消するために、R-CNNからは「Fast R-CNN」「Faster R-CNN」「Cascade R-CNN」などの手法が派生しています。

SSD

SSDはSingle Shot MultiBox Detectorの略称で、対象画像におけるバウンディングボックスのサイズのずれをクラス(物体の種類)の予測情報を使って修正・深層学習をしていく手法です。R-CNNとは異なり、直接物体の位置を検出するOne-Stageと呼ばれる手法です。

SSDのメリットは、処理速度が早いこと、即時に物体検出ができること、画像内に物体が豊富にある場合でも検出可能なことです。

YOLO

YOLOは、You Only Look Onceの略称で、SSDと同じく物体検出とクラス分類を一度に行う手法です。画像全体を正方形のグリッド線で分割し、特定の人物や物体が含まれているかと何が映っているかのクラス確率を同時に出力します。現在は、更に改良された YOLOv4, YOLORといった手法も出てきています。

YOLOの特徴は、処理速度の速さにあります。高速でリアルタイムな物体検出ができるため動画の解析を行うような用途においてはデファクトスタンダードとなっています。

まとめ

本記事では、物体検出について解説しました。物体検出は画像や映像から、位置・種類・個数など、特定の物体情報を的確に判定でき、さまざまな業種で役立っています。記事内で紹介した物体検出の特徴や活用範囲・手法を参考にして、自社の業務効率化などに取り入れてみてはいかがでしょうか。

一覧ページへ戻る
 

映像解析AIで新しいこと、
はじめてみませんか?
まずはお気軽にご相談ください。

お問い合わせはこちらから 
SCORERが3分で分かる 資料ダウンロード

映像解析AIを使ったビジネスを始めたいパートナー企業を募集していますPARTNER PROGRAM

VARパートナー(付加価値再販)

VARパートナー(付加価値再販)

SCORER Ready等、弊社が用意しているパッケージに対して、導入コンサルティングやマーケティング企画など貴社の強みにあった付加価値をつけて再販いただくパートナー企業です。

integration_partner

インテーグレーションパートナー

貴社の技術力や開発力を活かし、SCORERを活用したサービスの開発や導入支援、導入後のサポート対応を行って頂くパートナー企業です。
※案件は弊社でご紹介いたします。

詳細を見る

一部パートナー企業