Yandex.Metrika
تقرير تحليلي

النموذج المعماري «Cyclops-Hybrid»

تحسين عميق لـ SoC Rockchip RV1106 لمهام التوجيه الذاتي لطائرات FPV في ظل قيود أجهزة صارمة

مارس 2025
قسم البحث والتطوير، شركة "نيوروتيك"
تحسين الأجهزة، SoC، الشبكات العصبية، FPV

الإنجاز الرئيسي

تم تطوير بنية معالجة فيديو هجينة تسمح بتحقيق معدل 25 إطارًا في الثانية للكشف عن الكائنات على SoC Rockchip RV1106 بموارد حوسبة محدودة (0.5 TOPS NPU، 800 ميجاهرتز CPU). يوفر الحل كشف طائرات FPV بدون طيار بحجم 30×30 سم على مسافة تصل إلى 300 م باستهلاك طاقة أقل من 3 واط.

1. الإشكالية والتحديات

تتطلب مهام التوجيه الذاتي الحديثة لطائرات FPV معالجة تدفق الفيديو في الوقت الحقيقي بمعدل إطارات عالي وأقل تأخير ممكن. الأساليب التقليدية القائمة على نقل الفيديو إلى خادم بعيد للمعالجة لها كمية تأخير غير مقبولة لأنظمة الحماية النشطة.

ضرورة وضع قدرات الحوسبة مباشرة على البرج تفرض قيودًا صارمة:

  • استهلاك طاقة محدود (أقل من 5 واط)
  • أبعاد مصغرة لوحدة الحوسبة
  • العمل في نطاق درجة حرارة واسع (-40°C إلى +85°C)
  • التكلفة، المتوافقة مع الإنتاج التسلسلي

قيود أجهزة RV1106

NPU (معالج عصبي) 0.5 TOPS
CPU (المعالج) 2×Cortex-A7 @ 800 ميجاهرتز
الذاكرة 512 ميجابايت DDR3
استهلاك الطاقة 1.5-3 واط
التكلفة ~15 دولار (تسلسليًا)

للمقارنة: NVIDIA Jetson Nano (21 TOPS) يستهلك 5-10 واط وتبدأ تكلفته من 99 دولار

التحدي الرئيسي

ضمان تنفيذ خوارزميات الشبكات العصبية الحديثة للكشف عن الكائنات (YOLOv5-nano) على SoC بأداء NPU يبلغ 0.5 TOPS فقط مع الحفاظ على معدل معالجة لا يقل عن 25 إطارًا في الثانية لتتبع الأهداف عالية السرعة بشكل فعال.

2. النموذج المعماري «Cyclops-Hybrid»

يمثل نموذج «Cyclops-Hybrid» نهجًا مبتكرًا لتوزيع حمل الحوسبة بين وحدات SoC المختلفة. بدلاً من النهج التقليدي، حيث يتم تنفيذ الشبكة العصبية حصريًا على NPU، قمنا بتطوير نموذج هجين يقوم بما يلي:

تقسيم خط الأنابيب

تقسيم الشبكة العصبية إلى مهام فرعية يتم تنفيذها على وحدات حوسبة مختلفة

معالجة متوازية

الاستخدام المتزامن لـ NPU و CPU و DSP لمراحل معالجة مختلفة

ترشيح تكيفي

تقليل الحمل الحسابي ديناميكيًا بناءً على تحليل المشهد

مخطط بنية «Cyclops-Hybrid»

CPU Cortex-A7 800 ميجاهرتز ×2 NPU معالج عصبي 0.5 TOPS DSP Vision DSP عمليات المتجهات الإدخال 1080p@30fps الإخراج 25 إطار/ثانية المعالجة المسبقة تحجيم، تطبيع الكشف طبقات الالتفاف في YOLO المعالجة اللاحقة NMS، التتبع، الترشيح

المرحلة 1: CPU

تحضير إطار الفيديو: تحجيم إلى 640×640، تطبيع البكسلات، تحويل مساحة الألوان. يتم تنفيذها بكفاءة عالية على CPU بفضل المكتبات المحسنة.

المرحلة 2: NPU

تنفيذ طبقات الالتفاف للشبكة العصبية YOLOv5-nano. يوفر NPU المتخصص أقصى كفاءة لعمليات الضرب-الجمع (MAC) بأقل استهلاك للطاقة.

المرحلة 3: DSP + CPU

معالجة النتائج: Non-Maximum Suppression (NMS)، تتبع الكائنات، ترشيح الإيجابيات الخاطئة. يعالج DSP العمليات المتجهة بكفاءة، بينما يعالج CPU منطق اتخاذ القرار.

ابتكار النهج

بدلاً من محاولة تنفيذ الشبكة العصبية بالكامل على NPU (وهو أمر مستحيل بسبب قيود الذاكرة والأداء)، قمنا بتقسيم الشبكة إلى أجزاء، وتنفيذ الطبقات الأولية والنهائية على CPU و DSP. وهذا سمح بمعالجة نماذج تتجاوز قدرات NPU لـ RV1106 الاسمية بثلاثة أضعاف.

3. التنفيذ على SoC Rockchip RV1106

تكييف نموذج الشبكة العصبية

تم إجراء تحسين عميق لنموذج YOLOv5-nano للتنفيذ على RV1106:

  • تكميم INT8: تحويل الأوزان والتفعيلات إلى تنسيق عدد صحيح 8 بت مع الحفاظ على 95% من الدقة
  • تقسيم منشوري: عزل الطبقات الأولية والنهائية للتنفيذ على CPU/DSP
  • تحسين الذاكرة: تقليل استهلاك الذاكرة من 450 ميجابايت إلى 120 ميجابايت من خلال التحميل التدريجي للأوزان
  • خط الأنابيب: تداخل عمليات الإدخال/الإخراج مع الحسابات لتقليل فترات التوقف

مثال على تحسين خط الأنابيب

// كود زائف لخط أنابيب Cyclops-Hybrid
void cyclops_hybrid_pipeline(Frame input_frame) {
    // المرحلة 1: CPU - المعالجة المسبقة
    Frame preprocessed = cpu_preprocess(input_frame);
    
    // المرحلة 2: NPU - طبقات الالتفاف (بالتوازي مع تحضير الإطار التالي)
    Tensor features = npu_conv_layers(preprocessed);
    
    // المرحلة 3: DSP/CPU - المعالجة اللاحقة (بالتوازي مع NPU للإطار التالي)
    Detections detections = postprocess(features);
    
    // المرحلة 4: CPU - التتبع واتخاذ القرار
    TrackedObjects tracked = track_objects(detections);
    
    return tracked;
}

تسمح المعالجة ذات خط الأنابيب بتحقيق 25 إطارًا في الثانية بتأخير 40 مللي ثانية فقط من التقاط الإطار إلى الحصول على إحداثيات الهدف.

مقارنة أساليب التحسين

طريقة التحسين السرعة (إطار/ثانية) الذاكرة (ميجابايت) الدقة (mAP) القابلية للتطبيق
YOLOv5-nano الأساسي (FP32)
2-3 إطار/ثانية 450 ميجابايت 28.5% غير قابل للتطبيق
تكميم INT8 (كامل على NPU)
8-10 إطار/ثانية 220 ميجابايت 27.1% محدود
Cyclops-Hybrid (INT8)
25-28 إطار/ثانية 120 ميجابايت 26.8% مثالي

4. النتائج والكفاءة

25
إطار/ثانية

سرعة معالجة الفيديو

أسرع بـ 8 مرات من النهج الأساسي
2.7
واط

متوسط استهلاك الطاقة

أقل بـ 45% من TDP
26.8
% mAP

دقة الكشف

فقدان 1.7% فقط من FP32

الأداء في الظروف الحقيقية

خلال الاختبارات الميدانية، أظهر النظام القائم على RV1106 مع بنية «Cyclops-Hybrid» عملًا مستقرًا في ظروف مختلفة:

  • النهار

    كشف طائرات بدون طيار بحجم 30×30 سم على مسافة تصل إلى 300 م مع إضاءة جيدة

  • إضاءة منخفضة

    العمل في الشفق بمدى كشف يصل إلى 150 م

  • ظروف غير مواتية

    عمل مستقر في درجة حرارة من -20°C إلى +60°C ورطوبة تصل إلى 95%

مقارنة مع النظائر

Rockchip RV1106 (Cyclops-Hybrid) 25 إطار/ثانية
التكلفة: ~15 دولار | الاستهلاك: 2.7 واط
NVIDIA Jetson Nano 35 إطار/ثانية
التكلفة: ~99 دولار | الاستهلاك: 10 واط
Intel Movidius Myriad X 18 إطار/ثانية
التكلفة: ~75 دولار | الاستهلاك: 4 واط
Google Coral TPU 30 إطار/ثانية
التكلفة: ~60 دولار | الاستهلاك: 2 واط*

*يتطلب Coral TPU معالج مضيف منفصل، مما يزيد من استهلاك الطاقة الإجمالي وتكلفة النظام.

5. التكامل في نظام "الصياد"

أصبحت بنية «Cyclops-Hybrid» مكونًا رئيسيًا للأبراج المستقلة ضمن نظام "الصياد". يتم تجهيز كل برج بوحدة حوسبة قائمة على RV1106، مما يوفر:

استقلالية كاملة

يكتشف البرج الأهداف ويتتبعها بشكل مستقل دون الحاجة إلى اتصال دائم بالخادم المركزي، وهو أمر بالغ الأهمية عند العمل في ظل ظروف الحرب الإلكترونية.

كفاءة اقتصادية

تتيح تكلفة وحدة الحوسبة البالغة أقل من 50 دولارًا إنشاء أنظمة حماية جماعية دون زيادة كبيرة في ميزانية النشر.

بنية البرج القائم على Cyclops-Hybrid

المستوى 1: أجهزة الاستشعار

كاميرا فيديو 8 ميجابكسل
كاميرا تصوير حراري (قيد التطوير)
مستشعر الراديو

المستوى 2: المعالجة

RV1106

بنية Cyclops-Hybrid

25 إطار/ثانية معالجة الفيديو
كشف حتى 10 أهداف

المستوى 3: التنفيذ

محركات سيرفو للتوجيه
نظام ليزر
الأسلحة الحركية
التفاعل الشبكي

يمكن للبرج العمل بشكل مستقل لمدة تصل إلى 72 ساعة من بطارية 12 فولت/100 أمبير/ساعة بفضل استهلاك الطاقة المنخفض لـ RV1106

الأهمية الاستراتيجية

تطوير برج مستقل بالكامل على مكونات محلية له أهمية استراتيجية لضمان السيادة التكنولوجية في مجال أنظمة الأمن. تتيح بنية «Cyclops-Hybrid» إنشاء أنظمة حماية فعالة دون الاعتماد على منصات الحوسبة عالية الأداء المستوردة.

6. الاستنتاجات والآفاق

النتائج المحققة

  • تجاوز القيود الأجهزة

    تم تحقيق معدل معالجة 25 إطار/ثانية على SoC بأداء رسمي يبلغ 0.5 TOPS فقط

  • الكفاءة الطاقة

    يقل استهلاك الطاقة عن 3 واط، مما يجعل النظام مناسبًا للعمل المستقل من البطاريات

  • الجدوى الاقتصادية

    تكلفة وحدة الحوسبة تسمح بنشر أنظمة الحماية على نطاق واسع

  • السيادة التكنولوجية

    استخدام المكونات المحلية والمتاحة في السوق دون الاعتماد على المنصات الخاضعة للعقوبات

الاتجاهات الواعدة

توسيع نطاق البنية

تكييف نهج «Cyclops-Hybrid» لـ SoC الأكثر قوة (RK3588, Jetson Orin Nano) لحل مهام أكثر تعقيدًا، بما في ذلك تصنيف أنواع الطائرات بدون طيار والتنبؤ بالمسارات.

الكشف متعدد الوسائط

دمج معالجة البيانات من الكاميرات الحرارية ومستشعرات الراديو في خط أنابيب معالجة موحد لزيادة موثوقية الاكتشاف في الظروف الصعبة.

مشروع "سيرفيتور"

تطوير معالج مساعد متخصص قائم على FPGA لتسريع الحسابات العصبية، مما سيسمح بالتخلي الكامل عن الحلول المستوردة في نظام "الصياد".

الخلاصة

يظهر النموذج المعماري «Cyclops-Hybrid» أنه حتى في ظل وجود قيود أجهزة صارمة، من الممكن إنشاء أنظمة رؤية حاسوبية فعالة لحل المهام ذات الأهمية الحرجة.

الحل المطور لا يوفر فقط الخصائص المطلوبة لنظام التوجيه الذاتي لطائرات FPV ضمن نظام "الصياد"، بل يفتح أيضًا إمكانيات جديدة لإنشاء أنظمة أمنية جماعية وفعالة من حيث الطاقة واقتصادية على مكونات محلية.

المواد والروابط ذات الصلة

تاريخ النشر والحالة

تم إعداد التقرير اعتبارًا من مارس 2025. التطوير في مرحلة الاختبار النشط والتحضير للإنتاج التسلسلي. تم تأكيد جميع الخصائص التقنية من خلال الاختبارات المعملية والميدانية.