يبدأ تنفيذ المشاريع ذات التكنولوجيا الفائقة دائما بوضع خطة متعددة المستويات، والتي يجب أن تشمل التكلفة الإجمالية للملكية (التكلفة الإجمالية للملكية، أو بإختصار TCO) للبرنامج والبنية التحتية المرتبطة به. تكمن مشكلة العديد من شركات الدمج والمستخدمين النهائيين في أنه عندما يتعلق الأمر بأنظمة الأجهزة والبرمجيات بمشاركة مقدمي خدمة مختلفين، فهناك العديد من التكاليف الخفية التي يمكن أن تكون غير مرئية في مراحل التخطيط المبكرة.


كفريق يتمتع بخبرة كبيرة وغنية في تنفيذ الحلول القائمة على تقنية التعرف على الوجوه فقد قررنا مشاركة تجربتنا الخاصة وإخباركم بالمفاجآت الغير متوقعة التي قد تواجهكم عند إخراج مشروعكم إلي النور. سنقدم لكم بعض النصائح لاختيار البرامج للتعرف على الوجوه والتي ستتيح لكم الحصول على أفضل النتائج بأقل تكلفة إجمالية للملكية (TCO).


سعر الترخيص - وليس التكلفة الإجمالية للملكية (TCO)


يعتقد البعض أنه يكفي إختيار برامج التعرف من مقدم الخدمة الذي يقدم أقل سعر لملكية الترخيص. ومع ذلك، فإن هذا النهج خاطئ ويمكن أن يكلف عدة مرات أكثر من حل بتكلفة ترخيص أعلى. التكاليف غير المتوقعة يمكن أن تبدأ بالدعم الفني الغير مدرج في سعر الترخيص، وإنتهاء بالقيود الصارمة على النظام استنادًا إلى مثل هذه البرامج عند محاولة تغيير شيء ما أو إضافته أو إزالته.
من المهم أن نفهم أن نجاح المشروع يعتمد على إختيار الحل، وأي تفاصيل غير محسوبة يمكن أن تؤدي إلى إنهيار المشروع. لذلك، من الضروري اختيار برنامج عمل مرن ومستقر، والذي تم تصميمه في الأصل مع مراعاته لكل مجموعة المهام المنجزة والتغييرات المحتملة التي قد تطرأ في المستقبل.دائما تذكر “الأجهزة”


دائما تذكر “الأجهزة”

بالإضافة إلى ترخيص استخدام البرنامج، فإن أي نظام تعرف علي الوجوه يتضمن أيضًا الجزء الخاص بالأجهزة، والتي تشمل الكاميرات وآلاف المترات من الكابلات وأجهزة ربط الشبكات وخوادم معالجة الفيديو وتخزين البيانات. غالبًا ما تكون “الأجهزة” هي العنصر الرئيسي لكل من نفقات رأس المال والنفقات التشغيلية. لذلك، فإنه في مشروع كبير مقام على مساحة ضخمة، يمكن أن يكون عنصر النفقات الرئيسي بشكل عام هو كابل عالي الجودة، وليس الخوادم أو الكاميرات. في الوقت نفسه، عند حساب تكلفة المشروع، لا ينبغي أن نستبعد أهمية البرمجيات، لأن اختيار مزود حلول البرمجيات يؤثر بشكل مباشر على تكاليف توفير القوة الحاسوبية المطلوبة.


لا تشتري الأجهزة “بالحد الأدني من المتطلبات”، فأنتم بحاجة إلى هامش من القوة، لأنه في مرحلة التقييم والتصميم ليس من الممكن دائمًا إجراء تقييم كامل لمتطلبات الأجهزة. فإن الأعمال تتطور وتظهر مشكلة نقص الخوادم، كما أن البرمجيات تتلقي وظائف مفيدة جديدة وإن هذا قد يتطلب قوة حوسبة كبيرة. لذلك، من البداية، يجب ألا تحاول ضغط المشروع إلى أدنى حد من الخصائص الممكنة للإطلاق.
إن قيامكم بإختيار هذا البرنامج أو برنامج آخر، فإنكم إما تحصلون على أساس موثوق به لنظام التعرف علي الوجوه، ويمكن الإعتماد عليه على أي نطاق، أو تحصلون على حل غير ناجح يتطلب ضخ أموال لا نهاية لها. ما الذي يميز الحل الصحيح عن البرنامج الذي يخلق حوله العديد من “الثقوب السوداء” في الميزانية؟ كما تظهر ممارستنا وخبرتنا، فإن التفكير والتحسين هما عاملان أساسيان للتوفير في تنفيذ المشاريع المختلفة باستخدام تحليلات الفيديو.

من المهم الأخذ بعين الإعتبار كيفية استخدام البرنامج للموارد المخصصة. على سبيل المثال، يمكن استخدام كل من وحدة المعالجة المركزية (CPU) و وحدة معالجة الرسومات (GPU) لمعالجة تدفقات الفيديو. قد يبدو تنفيذ حل باستخدام وحدة المعالجة المركزية (CPU) أبسط (كما هو أكثر شيوعًا، لدى الكثير الخبرة في العمل معهم) وأرخص (لأن التكلفة الأدني لهذه المعدات أقل). ومع ذلك، عند الوصول إلى عدد معين من التدفقات المعالجة، يصبح هذا الحل أكثر وأكبر تكلفة.

على سبيل المثال، إذا كان الحديث يدور حول العمل مع كاميرا واحدة أو اثنتين، فيمكن حتى لوحدة NUC المدمجة المزودة بـمعالج intel core i5 التعامل بسهولة مع هذه المهمة، إلا أنه لمعالجة 20 كاميرا، ستحتاجون بالفعل إلى خادم به 24 نواة لوحدة المعالجة المركزية، ولاحقا سوف تنمو المتطلبات الأخرى.


إذا كنا نتحدث عن حل قائم على وحدة معالجة الرسومات (GPU)، فإن تكلفة “الدخول” في مثل هذا الحل أعلى بكثير، ولكن أداء هذه الحلول أعلى أيضًا. على سبيل المثال، بالنسبة لكاميرات الفيديو العشرين نفسها التي يمكنها تغطية التعرف على الوجوه في مركز تسوق صغير، فإن بطاقة رسومات واحدة “مخصصة للمستخدمين” بمستوى RTX 2080Ti ووحدة معالجة مركزية ذات 4 نواة ستكون كافية، والأهم من ذلك، أن التكلفة سوف تصبح أقل ولاحقا ستصبح في مزيد من النقصان.


عندما نتحدث عن حلول كبيرة للمئات من تدفقات الفيديو، فسوف يكون الاختلاف كبيرًا بالفعل. على سبيل المثال، دعنا نقارن الحلول الخاصة بـ 100 كاميرا فيديو في وضع TC بين وحدة معالجة الرسومات ووحدة المعالجة المركزية في صيغة التحكم في التدفق والعمل مع القوائم السوداء. عندما نتعرف على وجه لم يكتمل تعقبه بعد، فهذا يعني العمل في “الوقت الفعلي”. هذا السيناريو هو الأصعب بالنسبة للنظام ، لأنه يتطلب مطالب عالية على سرعة العمل ويحافظ على ثبات الحمل. في مثل هذه السيناريوهات ، يمكن للنظام القيام بعدد 1000000 تعرف يوميًا ، ويصل عدد الوجوه التي يتم التعرف عليها في نفس الوقت إلى 300 وجه.

من أجل نفس هذا السيناريو ، عند استخدام وحدة معالجة الرسومات ، نحصل على خادم واحد في 4U ، حيث سيتم تثبيت 8 وحدات معالجة رسومات Tesla T4 ، ووحدة معالجة مركزية غير مكلفة مع 8 نواة لخدمة الطلبات. سيكلف هذا الحل إبتداء من 3 ملايين روبل ، وهو أرخص بكثير من حيث السعر ومن حيث الصيانة واستهلاك الطاقة.
من الواضح أن الحل المصمم للعمل على وحدة المعالجة المركزية سيكلف أكثر ، نظرًا لأن كثافة المعالجات لكل خادم أقل بكثير من كثافة بطاقات الرسومات. يجعل التكوين القائم على وحدة معالجة الرسومات النظام أكثر إحكاما ومرونة وفعالية. لهذا السبب تم تصميم FindFace Security للتشغيل على وحدات معالجة الرسومات ، مما يسمح لكم بمعالجة المزيد من تدفقات الفيديو بتكلفة أقل.


يوجد عامل إقتصادي آخر في التكلفة هو قدرة البرنامج المحدد على الاندماج مع البنية التحتية الحالية والعمل مع مجموعة واسعة من المعدات. يرغب العديد من العملاء ، الذين لديهم بالفعل نظام مراقبة بالفيديو واسع النطاق ، في إضافة خاصية التعرف على الوجوه. لسوء الحظ ، ليس كل مورد لأنظمة التعرف علي الوجوه على استعداد لتقديم تنازلات ، لأن هذا سيؤدي إلى انخفاض ملحوظ في كفاءة التعرف علي الوجوه. غالبًا ما يعني إدخال التعرف على الوجوه تحديث كامل للمعدات ، والتي تكون أغلى بكثير من ضبط الأجهزة ذات القوة الحالية ، ولا يوجد هنا حديث عن التوفير.


يقوم فريق التطوير في NtechLab بإنشاء منتجات برمجية يمكنها العمل على نطاق واسع من المعدات. لا يوجد أي إلزام تجاه إختيارالشركة المصنعة لمعدات الخادم ، أو للكاميرات المتخصصة للتعرف على الوجوه. الشيء المهم هو أن تكون خصائص الأجهزة كافية لتشغيل البرنامج ، ويتم تثبيت الكاميرات مع مراعاة متطلبات التعرف على الوجوه. بفضل الخوارزميات التي يمكنها اكتشاف الوجوه البشرية بشكل فعال ، يكفي 30 بكسل فقط لالتقاط الوجه.

قم بإختيار برامج قابلة للتطوير بشكل متوقع


تعد قابلية التوسع والتطوير إحدى الخصائص الرئيسية لأنظمة التعرف بإستخدام القياسات الحيوية. يمكن للمشاريع التي تتضمن استخدام مثل هذه الأنظمة إلى كاميرا واحدة أو محطة طرفية واحدة ، أو على نطاق واسع ، بحيث تغطي مدنًا ضخمة بأكملها بشبكة من الكاميرات. علاوة على ذلك ، يجب أن يؤخذ في الاعتبار أنه في إطار أي مشروع ، يجب دائمًا توفير إمكانية التوسع ، الأمر الذي يتطلب درجة عالية من مرونة النظام.


مع نمو احتياجات العمل ، يعد توسيع نطاق نظام التعرف أمرًا لا مفر منه ، مما يضع بعض العملاء في موقف يتطلب فيه “تحديث”. وهنا يعتمد الكثير على المورد المحدد للبرنامج ، حيث يمكن أن تكون التكلفة مختلفة. العديد من الشركات المصنعة لأنظمة التعرف على الوجوه لديها قيود برمجية على التوسع والتطوير ، على سبيل المثال ، عندما لا يستطيع خادم واحد أن يخدم أكثر من عدد معين من تدفقات الفيديو أو يكون العدد الإجمالي لخوادم الكشف للنظام محدودًا. يؤدي هذا إلى زيادة كبيرة في تعقيد بنية الحل النهائي وتكلفة تركيبه وتشغيله ودعمه. تُظهر ممارستنا أن برنامج التعرف غير المُحسَّن أثناء التوسيع يمكن أن يكلف 2−3 مرات أكثر من حل بهندسة مدروسة جيدًا ودرجة عالية من التحسين.

بالنسبة لأنظمة التعرف علي الوجوه ، هناك أيضًا فارق بسيط إضافي في شكل سرعة البحث عن الصور ومقارنتها بالصور من قاعدة بيانات ، يمكن أن يختلف حجمها من عشرات الآلاف إلى مليار وجه. مع زيادة كمية البيانات ، تنخفض سرعة البحث عن الحلول غير المحسّنة ، بينما تظل عالية دائمًا في البرامج المتخصصة. على سبيل المثال ، فإن حل FindFace Security قادر على البحث عن الصور في 0.025 ثانية لكل 100000 سجل ، ويسمح القياس الأفقي الخطي (التجزئة) بالتوسع إلى أي حجم دون فقدان الأداء.


تأمل الخصائص البنائية للنظام المستقبلي


عادةً ما تتضمن المشاريع الكبيرة لتنفيذ التعرف على الوجوه عددًا كبيرًا من مواقع الأشياء البعيدة عن بعضها البعض. على سبيل المثال ، إذا كنا نتحدث عن الإنتاج الخاص بإستخراج الموارد الطبيعية ومعالجتها ، فيمكن تحديد المواقع على بعد كيلومترات من بعضها البعض ، وستكون هناك حاجة بطبيعة الحال إلى قنوات اتصال واسعة للغاية وموثوقة لإنشاء ووضع التعاون بين جميع عناصر الشبكة.


يتطلب نقل تدفقات الفيديو من الكاميرات إلى خادم المعالجة سرعة عالية ، لذا فإن هذه الرفاهية ليست رخيصة في المسافات الطويلة. هل من المجدي توفير نظام مكون من 30 كاميرا ، تتطلب كل واحدة منها عرض نطاق ترددي لا يقل عن 4 ميجابت في الثانية لكاميرا HD و 8 ميجابت في الثانية لكاميرا FullHD ، وأكثر من 120 ميجابت في الثانية و 240 ميجابت في الثانية إجمالاً؟ عادة لا يتم حساب هذه التكاليف في الاعتبار، مما قد يؤدي إلى زيادة التكلفة الإجمالية للملكية بشكل كبير في المستقبل. هذه المشكلة لا يتم النظر إليها بعين الإعتبار من قبل جميع مطوري البرامج، ولهذا السبب لا يمكن تغيير تكوين النظام ليناسب احتياجات العميل.


تتمثل إحدى طرق تقليل تكاليف قنوات الاتصال في نقل خوادم المعالجة المبدأية للفيديو مباشرةً إلى موقع تثبيت الكاميرا. يمكن للخادم المحلي تلقي تدفق الفيديو مباشرة وتحليله وإرسال الصور ذات الصلة فقط إلى الخادم الرئيسي. سيتطلب إرسال صورة نطاقًا تردديًا أقل بكثير ، ومع حركة مرور منخفضة ، يمكن حتى ل 2 إلي 4 كاميرات العمل على اتصال بقوة 1−2 ميجابايت في الثانية.


ولكن في بعض الأحيان حتي هذه السرعة يصعب توفيرها ، أو قد تظهر متطلبات لسرعة الاستجابة ، والتي لن تكون الأسرع عند الاتصال بسرعة 1−2 ميجابايت في الثانية ، أو أن الاتصال نفسه غير مستقر تمامًا. بالنسبة لمثل هذه الأنظمة ، من الممكن بناء شبكة من التركيبات المستقلة ، ذاتية تمامًا ، ولكن مع متزامنة قاعدة بيانات الملفات. وبالتالي سيكون للنظام قاعدة بيانات حديثة ومتزامنة للوجوه ، وسرعة استجابة عالية ، حيث أن جميع المكونات موجودة محليًا ، ولا يوجد اعتماد على استقرار اتصال الإنترنت.


من المهم اختيار حل لديه القدرة على العمل في أي تركيبة هجينة دون التضحية بالكفاءة.


كيفية حساب التكلفة الإجمالية للملكية؟


يعد حساب التكلفة الإجمالية للملكية لمشروع التعرف علي الوجوه مهمة معقدة لا يمكن تحقيقها إلا من قبل متخصصين لديهم سنوات عديدة من الخبرة في دمج أنظمة القياسات الحيوية. يمكنكم دائمًا الاتصال بخبراء شركتنا ، الذين سيختارون برنامج الدمج المناسب لكم ، مع مراعاة جميع التفاصيل والمفآجات الغير متوقعة المحتملة. تحتاجون فقط إلى ملء نموذج الاتصال مع وصف لمشروعكم وانتظار الرد.