Azure AI ServicesのCustom Visionで画像識別モデルを構築
Custom Visionとは
Azure Custom Visionは、独自の画像を機械学習によって学習・分析し、画像の分類やオブジェクトの検出のためのモデルを構築するサービスです。このサービスは、特に小売業や製造業での用途に適しており、企業やブランドのロゴ識別、製品分類、監視カメラ映像分析などに利用されます。
Computer VisionとCustom Visionの違いは何ですか?
Computer VisionとCustom Visionは、画像認識に関するAzureのサービスですが、違いがあります。
Computer Visionは、Microsoftがあらかじめ教師データを学習させたAIモデルを利用するため、より簡単に利用できますが、独自AIモデルは作成できません。
Custom Visionは、AIの学習の元となるわずか数十枚の画像教師データのみで、手軽に画像認識・判定AIモデルを生成できます。また、AI知識のない方でも、さまざまな用途に対応した独自のAIモデルを構築できます。
つまり、Computer Visionは汎用的な画像認識に、Custom Visionはカスタマイズした画像認識に向いていると言えます。
Custom Visionの画像サイズ
Custom Visionは、Azure AIのサービスの一つで、独自の画像認識・判定AIモデルを生成できるツールです。
Custom Visionには、キーの層が2つあります。F0 (Free) と S0 (Standard) です。これらの層は、プロジェクト数、トレーニング画像数、予測数、タグ数、イテレーション数などの制限とクォータに違いがあります。
要素 | F0 (free) | S0 (standard) |
---|---|---|
プロジェクト | 2 | 100 |
プロジェクトあたりのトレーニング画像 | 5,000 | 100,000 |
予測/月 | 10,000 | 無制限 |
タグ/プロジェクト | 50 | 500 |
イテレーション | 20 | 20 |
タグあたりの最小ラベル付き画像、分類 (50+ 推奨) | 5 | 5 |
タグあたりの最小ラベル付き画像、物体検出 (50+ 推奨) | 15 | 15 |
予測画像の保存期間 | 30 日 | 30 日 |
予測 操作、ストレージあり (秒あたりトランザクション) | 2 | 10 |
予測 操作、ストレージなし (秒あたりトランザクション) | 2 | 20 |
TrainProject (秒あたり API 呼び出し) | 2 | 10 |
その他の API 呼び出し (秒あたりトランザクション) | 10 | 10 |
許容される画像の種類 | jpg、png、bmp、gif | jpg、png、bmp、gif |
画像の高さ/幅 (ピクセル単位) の最小値 | 256 (注を参照) | 256 (注を参照) |
画像の高さ/幅 (ピクセル単位) の最大値 | 10,240 | 10,240 |
最大画像サイズ (トレーニング画像アップロード) | 6 MB | 6 MB |
最大画像サイズ (予測) | 4 MB | 4 MB |
イメージあたりの最大領域数 (物体検出) | 300 | 300 |
イメージあたりの最大タグ数 (分類) | 100 | 100 |
注: 256 ピクセルより小さい画像は受け入れられますが、アップスケールされます。
主な機能
Azure Custom Visionは主に以下の2つの機能を提供します。
- 画像の分類: 画像を特定のカテゴリーに分類し、モデルをトレーニングします。
- オブジェクトの検出: 画像内の特定の物体を検出し、その座標を返します。
これらの機能により、動画や連続写真においても物体を追跡することが可能になります。
Custom Visionプロジェクトの作成
Custom Visionプロジェクトの作成は、Azureポータルから行います。プロジェクト作成には、サブスクリプション、リソースグループ、リージョンの選択、プロジェクト名の入力が必要です。無料プランの選択も可能です。
トレーニング画像のアップロードとタグ付け
トレーニングには、特定のタグを持つ画像をアップロードし、タグ付けを行います。例えば、植物の画像をアップロードし、それぞれ「桜」、「チューリップ」などのタグを付けることで、画像の分類モデルを構築します。
モデルのトレーニングとテスト
モデルのトレーニングは、「Quick Training」や「Advanced Training」の選択が可能です。トレーニング後、テストツールを使用してモデルの精度を確認します。
オブジェクト検出の実施
オブジェクト検出では、画像内の特定の物体を検出し、その範囲をタグ付けします。これにより、物体の動きを追跡することが可能になります。
まとめとコメント
Azure Custom Visionは、独自の画像識別モデルを構築するための強力なツールです。特に、小売業や製造業での応用が期待され、企業のロゴ識別や製品分類、監視カメラの映像分析など、多岐にわたる用途での活用が可能です。この技術は、ビジネスの効率化や新たな価値創出に大きく貢献するでしょう。また、機械学習を活用した画像分析の精度向上は、今後のテクノロジー発展において重要な役割を果たすと考えられます。
参照元: ゼロからはじめるAzure 第54回 Azure AI ServicesのCustom Visionを使って独自の画像識別モデルを構築しよう(2023年12月23日)|BIGLOBEニュース
コメント