Qsarpress

ما في ذلك السياسة والأعمال والتكنولوجيا والحياة والرأي والرياضة.

طور باحثون في جامعة ستانفورد نموذجًا للذكاء الاصطناعي (AI) ، EG3D ، يمكنه إنشاء صور عشوائية عالية الدقة للوجوه والأشياء الأخرى ذات الهياكل الهندسية الأساسية.

تطورت نماذج الذكاء الاصطناعي مؤخرًا ، وسيتمكن المستخدمون قريبًا من استخدام هذه النماذج لإنشاء وتحويل مشاهد ثلاثية الأبعاد شبه واقعية من أجهزة الكمبيوتر المحمولة المريحة الخاصة بهم. نظرًا لأن هذه التقنيات تجعل من السهل إنشاء تجسيدات واقعية للغاية ، فإنها ستحدث ثورة في طريقة عمل الفنانين في ألعاب الفيديو و CGI للأفلام. لبعض الوقت ، تمكنت AIs من إنشاء صور ثنائية الأبعاد واقعية. ومع ذلك ، فقد أثبتت التصورات ثلاثية الأبعاد أنها أكثر صعوبة بسبب قوة الحوسبة الهائلة المطلوبة. يستخدم نموذج EG3D ، وهو نموذج AI تم تطويره بواسطة فريق من الأكاديميين في جامعة ستانفورد ، لإنشاء صور عشوائية عالية الدقة للوجوه والأشياء الأخرى ذات البنية الهندسية الأساسية. هذا النموذج هو أحد النماذج ثلاثية الأبعاد الأولى المستخدمة حاليًا لتحقيق جودة عرض قريبة من الصورة الواقعية.

تستخدم EG3D وأسلافها طريقة شائعة جدًا للتعلم الآلي تسمى شبكة الخصومة التوليدية (Generative Adversarial Network) لتوليد الرسومات. باستخدام شبكة عصبية واحدة لتوليد الصور والأخرى لتقييم دقتها ، فإن هذه الأنظمة تضع شبكتين عصبيتين ضد بعضهما البعض. تتكرر هذه العملية عدة مرات حتى تصبح النتيجة ممكنة. طور الباحثون مكونًا يمكنه تحويل هذه الصور إلى مساحة ثلاثية الأبعاد من خلال الجمع بين ميزات شبكات GAN عالية الدقة الحالية ثنائية الأبعاد. يحقق هذا المبنى المكون من قطعتين هدفين في وقت واحد. بالإضافة إلى ذلك ، فهو سريع بما يكفي للتشغيل في الوقت الفعلي على جهاز كمبيوتر محمول ويمكن استخدامه لإنشاء تصميمات ثلاثية الأبعاد معقدة. إنه متوافق مع البنى الحالية وله أداء حوسبي فعال.

على الرغم من أنه من الممكن إنشاء صور ثلاثية الأبعاد تشبه الواقع تقريبًا باستخدام أدوات مثل EG3D ، لا تزال هناك مشكلة في مدى صعوبة تحويلها إلى برامج تصميم. هذا لأنه على الرغم من أن النتيجة هي صورة مرئية ، إلا أنه ليس من الواضح كيف أنتجتها شبكات GAN. يمكن أن يساعد نموذج التعلم الآلي المسمى GiraffeHD الذي طوره باحثون في جامعة ويسكونسن ماديسون في هذا الموقف. هذا النموذج مفيد في استخراج الميزات القابلة للتلاعب من الصور ثلاثية الأبعاد. يسمح للمستخدم باختيار العديد من العناصر بما في ذلك الشكل واللون وعرض الصورة أو الخلفية. يتم تدريب Giraffe HD باستخدام عدد لا يحصى من الصور. يبحث النموذج عن العوامل الكامنة في الصورة لإنشاء هذه الصور بحيث تعمل هذه الميزات المتعددة كمتغيرات يمكن التحكم فيها. من خلال تحرير هذه الميزات التي يمكن التحكم فيها في الصور المستقبلية ثلاثية الأبعاد ، سيتمكن المستخدمون من تغيير خصائص المشاهد المطلوبة بدقة. هناك اتجاه أكثر بروزًا وهو استخدام الذكاء الاصطناعي لإنشاء صور ثلاثية الأبعاد ، بما في ذلك EG3D و Giraffe HD. ومع ذلك ، لا يزال هناك الكثير من العمل الذي يتعين القيام به فيما يتعلق بانحياز الخوارزمية والتطبيق الواسع. لا يزال نوع بيانات تدريب التغذية يقيد هذه النماذج. يتم إجراء المزيد من الأبحاث لمعالجة هذه القضايا.

READ  التسرب: يتميز هاتف Honor 60 Pro بشاشة أكبر وكاميرا فائقة الاتساع تبلغ 50 ميجابكسل.

على الرغم من أنه لا يزال في مراحله الأولى ، إلا أن هذا البحث يفتح إمكانيات لصور ونماذج ثلاثية الأبعاد أكثر واقعية. سيكون من المثير للاهتمام معرفة إلى أين يذهب هذا البحث وكيف يمكن استخدامه في المستقبل. أود أن أسمع أفكاركم حول هذا النهج الجديد الذي نتبعه ML subreddit.

This Article is written as a summary article by Marktechpost Staff based on the paper 'Efficient Geometry-aware 3D Generative Adversarial Networks'. All Credit For This Research Goes To Researchers on This Project. Checkout the paper, github and reference article.

Please Don't Forget To Join Our ML Subreddit