اقترح عالم رياضيات في جامعة جنوب الأورال الحكومية طريقة لتسريع خوارزميات رؤية الكمبيوتر

قام يفغيني مارتيوشيف، الأستاذ المشارك في معهد العلوم الطبيعية والدقيقة بجامعة جنوب الأورال الحكومية، والمحاضر في مركز فيرتوم للتعليم المتقدم في الذكاء الاصطناعي، والحاصل على درجة الدكتوراه في الفيزياء والرياضيات، بالتعاون مع زملاء من فنلندا وجمهورية التشيك، بتطوير طريقة لإنشاء حلول تلقائية لأنظمة المعادلات المكونة من كثيرات حدود لوران. وعلى عكس المعادلات المدرسية التقليدية، حيث لا يمكن أن تكون للمتغيرات إلا قوى موجبة، تسمح أنظمة لوران أيضًا بالقوى السالبة. وتظهر هذه الأنظمة في التطبيقات الهندسية، مثل تطوير وتحسين خوارزميات رؤية الآلة، وتوجيه المركبات الجوية غير المأهولة، بالإضافة إلى تطبيقاتها في مجالي الروبوتات والصوتيات.

ولحل أنظمة معادلات لوران بكفاءة، يتم إنشاء «نمط حذف» - وهو عبارة عن مصفوفة خاصة من المعاملات يمكن معالجتها باستخدام أساليب الجبر الخطي للحصول على حلول للنظام. وقد اعتمدت مولدات أنماط الحذف الأولى على أدوات قياسية في الهندسة الجبرية، مثل قواعد غروبنر والمحصلات. إلا أن الممارسة العملية أثبتت أن الأساليب التجريبية غالبًا ما تكون أكثر فعالية. تعتمد الطريقة التي اقترحها العلماء على مخطط تجريبي تكراري. وتكمن ميزتها الرئيسية في مرونتها، إذ تتيح إيجاد حلول حتى للأنظمة ذات مكونات الحل الموجبة الأبعاد، فضلاً عن الكشف التلقائي عن بعض تناظرات نظام لوران ومراعاتها. علاوة على ذلك، لا يحتاج المستخدم إلى معرفة رياضية متعمقة، إذ يكفي تحديد الدوال لحساب معاملات النظام. سيختار المولد تلقائيًا عدة خيارات للقوالب، ليتم من خلالها اختيار الأسرع والأكثر دقة.

«يكتب يفغيني مارتيوشيف وزملاؤه في ورقتهم البحثية: اختبرنا مولدنا على مهام و مسائل متنوعة، لا سيما في مجال رؤية الحاسوب الهندسية. على سبيل المثال، تشمل هذه المسائل التثليث الأمثل ثلاثي الأبعاد، والملاحة الهجينة، والمعايرة الذاتية بناءً على وقت وصول الإشارة. تُظهر التجارب أن حلولنا أكثر دقةً وسرعةً من الحلول المماثلة الموجودة».

دعونا نوضح المهام التطبيقية التي نتحدث عنها.

المهمة الأولى – هي التثليث الأمثل ثلاثي الأبعاد. تخيل ثلاث كاميرات تصور نفس الجسم (على سبيل المثال، معلم معماري أو موقع تصوير فيلم) من زوايا مختلفة. لإنشاء نموذج ثلاثي الأبعاد دقيق، يجب على الحاسوب إيجاد نقطة في الفضاء تتطابق إسقاطاتها بشكل أمثل مع الصور الثلاث. يتيح الحل الذي اقترحه العلماء إنجاز ذلك بسرعة ودقة أكبر. تتراوح التطبيقات من المؤثرات الخاصة في الأفلام إلى إنشاء توائم رقمية للمدن.

المهمة الثانية – هي الملاحة الهجينة (تقدير الوضع الهجين شبه المعمم). لنفترض أن لدينا كاميرا عادية في هاتف ذكي وكاميرا "معممة" معقدة (على سبيل المثال، نظام متعدد العدسات في سيارة ذاتية القيادة). المهمة هي دمج بياناتهما لتحديد موقع السيارة بالنسبة للهاتف الذكي.

يحلّ الحلّ المقترح من قِبل يفغيني مارتيوشيف وزملائه المشكلة أسرع بـ 20 إلى 30 مرة من الخوارزميات الحالية، وهو ما قد يكون حاسمًا في إنشاء بنية تحتية ذكية للمدن تراقب حركة المرور في الوقت الفعلي.

أما المهمة الثالثة – فهي المعايرة الذاتية لوقت الوصول. يوجد في الغرفة عدة مكبرات صوت وميكروفونات. وبمعرفة الوقت الذي يستغرقه الصوت للانتقال من مكبر الصوت إلى الميكروفون (وقت الوصول)، يجب على النظام حساب مواقع جميع الأجهزة تلقائيًا.

هذا ضروري لإنشاء غرف اجتماعات ذكية وأنظمة عزل الضوضاء. وقد أثبتت الطريقة الجديدة، في هذه الحالة، أنها أسرع بـ 1.5 إلى 1.8 مرة من أفضل الطرق العالمية المماثلة، وذلك في التكوينات التي تضم أربعة مكبرات صوت وستة ميكروفونات (وكذلك خمسة مكبرات صوت وخمسة ميكروفونات).

تجدر الإشارة أيضًا إلى أن هذه الطريقة الجديدة طُبقت بنجاح سابقًا في مجال الروبوتات لإنشاء حلّ فعّال لمسألة الحركة المباشرة للمُعالِجات المتوازية.

نُشر البحث في المجلة الدولية لرؤية الحاسوب، وهي من بين أفضل 100 مجلة في سكوبس و موقع العلوم (ويب أوف ساينس).

أُجري هذا البحث ضمن برنامج رفيع المستوى في مجال الذكاء الاصطناعي بدعم من المركز التحليلي لحكومة روسيا الاتحادية.

أوستاب دافيدوف
You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.