2026.03.20 オンプレAIカメラ - コトバモニター自社サービス紹介

IPカメラ映像をオンプレでAI解析。Jetson ThorとVLMで実現する次世代の現場映像処理

工場、物流倉庫、研究施設、商業施設、インフラ設備などでは、日々多くのIPカメラ映像が取得されています。

これまでカメラ映像は、主に「録画して、必要なときに人が確認する」ためのものでした。
しかし現場では、次のようなニーズが高まっています。

「人が危険エリアに入ったら検知したい」
「フォークリフトや作業者の動きを把握したい」
「荷物やパレットの状態をカメラで確認したい」
「映像を人が見続けるのではなく、AIに状況を判断させたい」
「ただし、映像データをクラウドには出したくない」

こうした課題に対して、株式会社ジーライブでは、NVIDIA Jetson Thorを活用したオンプレミスAI映像解析システムの開発に取り組んでいます。

本システムでは、Jetson Thor上でVLM(Vision Language Model)やSAM 3を動作させ、IPカメラから取得した映像をオンプレ環境内で処理します。クラウドに映像を送信せず、現場内・社内ネットワーク内でAI解析を行うことで、セキュリティに配慮しながら高度な映像活用を実現します。

NVIDIAはJetson Thorを、フィジカルAIやロボティクス向けのプラットフォームとして位置づけており、最大2,070 FP4 TFLOPSのAI演算性能、128GBメモリ、40W〜130Wの電力構成を特徴として紹介しています。従来のJetson AGX Orinと比較して、AI演算性能は最大7.5倍、エネルギー効率は3.5倍とされています。


なぜJetson Thorで映像AIを動かすのか

IPカメラ映像をAIで解析する場合、クラウドへ映像を送って処理する方法もあります。

しかし、現場によってはクラウド利用が難しいケースがあります。

たとえば、製造業では工場内の作業工程や設備配置が機密情報にあたる場合があります。研究施設では、実験環境や試作品が映像に含まれることがあります。物流倉庫では、荷主情報や出荷状況が映像に映り込む可能性があります。

そのため、映像をクラウドに送らず、現場側でAI処理を完結させる構成が求められます。

Jetson Thorは、こうしたエッジAI処理に適したハードウェアです。IPカメラ映像を現場で受け取り、AIで解析し、必要な結果だけを通知・保存・連携することで、映像データの外部送信を抑えながら、リアルタイム性の高いAI活用が可能になります。


VLMにより、映像の「意味」を理解するAIへ

従来の画像認識AIは、あらかじめ学習した対象を検知する使い方が中心でした。

たとえば、

  • 人を検知する
  • 車両を検知する
  • ヘルメットを検知する
  • 特定エリアへの侵入を検知する

といった用途です。

一方で、VLMを活用すると、画像や映像の内容を言語と結びつけて扱えるようになります。

たとえば、現場映像に対して次のような判断を行うことができます。

「通路に荷物が置かれているか」
「作業者が危険エリアに入っていないか」
「フォークリフトの近くに人がいるか」
「パレット上の荷物に変化があるか」
「通常と異なる状態が発生していないか」

つまり、単に物体を検出するだけでなく、映像の状況をAIが理解し、現場業務に使える情報へ変換することが重要になります。


SAM 3を活用した映像内オブジェクトの検出・分割・追跡

ジーライブでは、Jetson Thor上でSAM 3を活用し、IPカメラ映像内の対象物を検出・セグメンテーション・追跡する構成を想定しています。

SAM 3は、Metaが発表しているSegment Anything Modelの新しいモデルで、画像や動画に対して、テキスト、例示画像、視覚プロンプトを用いたセグメンテーションに対応するモデルとして紹介されています。また、画像・動画内の対象物を検出、分割、追跡する用途に対応するとされています。

これにより、IPカメラ映像に対して、次のような処理を行うことができます。

  • 映像内の人物を領域として抽出する
  • フォークリフトや車両を検出する
  • 荷物やパレットの領域を切り出す
  • 指定した対象物を追跡する
  • 危険エリア内に入った対象だけを判定する
  • 対象物の状態変化を確認する
  • 映像解析結果をログとして保存する

従来のAIカメラでは、検知対象ごとに個別モデルの調整が必要になる場合がありました。SAM 3やVLMを活用することで、より柔軟に対象物やシーンを指定し、現場ごとの用途に合わせた映像解析がしやすくなります。


システム構成イメージ

本システムでは、IPカメラから取得した映像を、オンプレ環境内のJetson Thorで処理します。

構成イメージは以下の通りです。

  1. IPカメラで現場映像を取得
  2. RTSP等でJetson Thorへ映像入力
  3. Jetson Thor上でVLM/SAM 3による映像解析
  4. 人・車両・荷物・危険エリアなどを検出
  5. 検知結果を画面表示、ログ保存、アラート通知
  6. 必要に応じて管理画面や既存システムと連携

重要なのは、映像そのものをクラウドへ送らず、現場側でAI処理を完結できる点です。

たとえば、アラートが必要なシーンだけを保存する、検知結果だけを社内システムに連携する、映像の要約情報だけを管理画面に表示する、といった運用が可能になります。


活用シーン

工場の安全管理

工場では、危険エリアへの侵入、フォークリフトと作業者の接近、保護具の着用状況などを確認する必要があります。

Jetson Thor上で映像を解析することで、現場内でAIが状況を判断し、危険な状態が発生した場合にアラートを出す仕組みを構築できます。

物流倉庫の状況把握

物流倉庫では、荷物の滞留、通路のふさがり、パレットの配置、フォークリフトの動線など、現場状況をリアルタイムに把握することが重要です。

IPカメラ映像をAIで解析することで、現場の混雑状況や作業状態を可視化し、管理者の確認負担を軽減できます。

施設管理・立入検知

施設管理では、夜間や無人時間帯の立ち入り、制限区域への侵入、設備周辺の異常などを確認する必要があります。

オンプレ環境でAI処理を行うことで、監視映像を外部に出さず、必要な検知結果だけを通知する構成が可能になります。

パレット・荷物・資材の状態確認

SAM 3によるセグメンテーションを活用することで、映像内の荷物やパレットを領域として把握し、配置や状態の変化を確認する用途にも展開できます。

将来的には、数量確認、積載状態確認、置き場管理、在庫状況の可視化などへの応用も考えられます。


Jetson Thorを使うことで目指す価値

Jetson Thorを活用したオンプレAI映像解析の価値は、単に「AIで映像を見られる」ことではありません。

重要なのは、現場で発生している状況を、AIが即時に把握し、業務に使える情報へ変換することです。

たとえば、

  • 人が映像を見続ける負担を減らす
  • 異常や危険状態に早く気づく
  • 映像確認の属人化を減らす
  • 必要なシーンだけを記録する
  • 現場状況をデータとして蓄積する
  • 既存の管理業務や報告業務と連携する

といった効果が期待できます。

また、クラウドに映像を出さない構成にすることで、セキュリティ要件の厳しい現場でもAI活用を進めやすくなります。


ジーライブの開発領域

ジーライブでは、Jetson Thorを活用したオンプレAI開発において、以下のような領域を支援します。

  • IPカメラ映像の取得・処理
  • Jetson Thor上でのVLM/SAM 3動作環境構築
  • 映像内オブジェクトの検出・セグメンテーション
  • 危険エリアや判定ルールの設定
  • アラート通知機能
  • 管理画面・ダッシュボード開発
  • 検知ログ保存
  • 既存システム連携
  • PoC設計・現場検証
  • 本導入に向けた運用設計

ハードウェアを導入するだけでは、現場で使える仕組みにはなりません。

ジーライブでは、IPカメラ、AIモデル、Jetson Thor、管理画面、通知、ログ、業務システム連携までを一体で設計し、現場業務に組み込めるAIソリューションとして提供していきます。


今後の展開

今後は、Jetson Thor上で動作するVLM/SAM 3を活用し、より高度な映像理解・映像検索・映像要約への展開を進めていきます。

具体的には、次のような機能を想定しています。

  • IPカメラ映像のリアルタイム解析
  • 指定対象物の検出・追跡
  • 危険行動や異常状態の検知
  • 映像内の状況説明
  • 検知結果の自動レポート化
  • 映像ログの検索
  • 現場別ルール設定
  • 複数カメラ映像の統合管理
  • オンプレLLMとの連携
  • 現場AIエージェントへの発展

Jetson Thorを活用することで、これまで録画中心だったIPカメラを、現場の状況を理解し、判断を支援するAIセンサーへ進化させることができます。


まとめ

IPカメラは、多くの現場ですでに導入されています。

しかし、その映像を人が確認するだけでは、現場の負担は大きく、リアルタイムな判断にも限界があります。

Jetson Thor上でVLMやSAM 3を動作させることで、IPカメラ映像をオンプレ環境内でAI解析し、人・車両・荷物・危険エリアなどを柔軟に検出・追跡できる仕組みを構築できます。

クラウドに映像を送らず、現場内でAI処理を完結できるため、セキュリティ要件の厳しい製造業、物流、研究施設、インフラ、施設管理などの現場にも適した構成です。

ジーライブは、Jetson Thorを活用したオンプレAI映像解析システムの開発を通じて、現場の安全管理、業務効率化、映像活用、データ化を支援してまいります。


お問い合わせ

Jetson Thorを活用したオンプレAI開発、IPカメラ映像解析、VLM/SAM 3を活用した現場AIシステムにご関心がございましたら、お気軽にお問い合わせください。

株式会社ジーライブ
E-mail:contact@geelive-inc.com
URL:https://geelive-inc.jp/

CATEGORY

Contactお問い合わせ

案件のご相談など、
お気軽にご連絡ください。