Member-only story

YOLOv10 Mimarisi

Berika Varol Malkoçoğlu
5 min readOct 11, 2024

Nesne tespiti, dijital görüntü ve videolarda hedef nesnenin/nesnelerin tespitini sağlayan, insanın görsel algılama yeteneğinden esinlenen bir bilgisayarlı görüş tekniğidir.
Alanında en başarılı sonuçları üreten YOLO, yeni versiyonu YOLOv10 ile liderliğini sürdürmeye devam ediyor.

Bu yazımda YOLOv10'un teknik özelliklerinden, mimari yapısından, avantajlarından ve dezavantajlarından bahsedeceğim.

Mayıs 2024'te Tsinghua Üniversitesi'nde araştırmacı olan Wang ve arkadaşları (2024), yüksek performans ve verimliliğe sahip YOLOv10 algoritmasını tanıttı. Bu algoritma, hesaplama yükünü en aza indirmek ve performansı iyileştirmek için Çift Etiket Atama ve Verimlilik-Doğruluk stratejilerini takip eder. YOLOv10, çıkarım sırasında gereksiz tahminleri filtrelemek için kullanılan NMS'nin (Maksimum Olmayan Bastırma) zorluklarını ve tutarsızlıklarını aşmak için Tutarlı Çift Atama adı verilen yeni bir yaklaşım sunar. Bu şekilde, nesne tespiti sırasında NMS ihtiyacını ortadan kaldırır ve tespit gecikmesini önemli ölçüde azaltır. Bu amaçla, baş bölgesinde hem bire bir hem de bire çok eşleştirme yaklaşımlarını birleştirerek bir Çift Etiket Atama Stratejisi oluşturulur.

Bu strateji şu şekildedir:

  • Birebir eşleştirmede, her gerçek örneğe bir tahmin atanır, bu da bir NMS'ye olan ihtiyacı ortadan kaldırır ve uçtan uca dağıtıma olanak…

--

--

Berika Varol Malkoçoğlu
Berika Varol Malkoçoğlu

Written by Berika Varol Malkoçoğlu

PhD | Data Scientist | Lecturer | AI Researcher

No responses yet