عاجل

نائب الرئيس الفنزويلي: مرشح المعارضة في انتخابات الرئاسة غادر البلاد

logo
علوم وتقنية

يمكن استخدامها في التعليم.. تقنية جديدة لتوليد صور أكثر تعقيدا وإبداعا

يمكن استخدامها في التعليم.. تقنية جديدة لتوليد صور أكثر تعقيدا وإبداعا
26 سبتمبر 2022، 3:37 م

طور باحثون في الولايات المتحدة، تقنية جديدة تعتمد على تراكب نماذج حاسوبية متعددة لتوليد صور أكثر تعقيدا وإبداعا ودقة في فهم النصوص من نظام "دال-إي 2".

ويلتقط كل نموذج جزءا من النص الوصفي للصورة المطلوبة، لتوليد صورة مركبة من جزأين، يرتبط كل منهما بجملة وصفية مختلفة عن الأخرى.

وتعمل النماذج المولدة للنصوص من خلال سلسلة من الخطوات المتكررة لتحسين الصورة من نسخة سيئة حتى الوصول إلى النسخة المطلوبة في النص، وفقا لموقع "ساي تك ديلي".



وقد يساعد دمج النماذج مع بعضها في مضاعفة قدرة الذكاء الاصطناعي على تحسين جودة الصور في كل مرحلة تكرارية، ما يجعل الصورة النهائية أكثر إبداعا.

وانتشر استخدام برنامج الذكاء الاصطناعي "دال-إي" على الإنترنت في الفترة السابقة لتوليد صور ولوحات فنية من خلال كتابة وصف بسيط لما نريد توليده.

ويستخدم نظام "دال-إي 2" ما يطلق عليه اسم "نموذج التبعثر"، الذي يضغط النص الوصفي في جملة واحدة لزيادة دقة الصورة.

غير أن كثرة التفاصيل المطلوبة وتعقيدها تجعل من الصعب اختصارها في جملة واحدة.

وحسب الموقع فقد استخدم الباحثون في معهد "ماساتشوستس للتقنية" الأمريكي، نظاما مركبا من نماذج التبعثر لبناء علاقات بين الأشياء، من خلال وصف مكانها بالنسبة إلى بعضها ورسم كل شيء منها على حدة.

وتمتاز التقنية الجديدة بتفكيك النص إلى جوانب عدة، ومعالجة كل جزء على حدة؛ مثل توليد صورة فيها شاحنة حمراء وبيت أخضر.

ويعمل نموذج على رسم شاحنة حمراء، وآخر على رسم بيت أخضر، في حين إن نظام "دال-إي 2" قد يخلط بين اللونين.



وقال طالب الدكتوراه شوانغ لي، المشارك في تأليف الدراسة: "يتفوق النظام الجديد في التعامل مع أماكن الأشياء وعلاقاتها مع بعضها في النص الوصفي".

وأضاف: "يمكن استخدام التقنية الجديدة في مجال التعليم، من خلال تعليم الطفل معنى وضع مكعب في كرة من خلال توليد صورة تعرض له كيفية ذلك".

ودرب الباحثون النظام الجديد على مجموعة صغيرة من البيانات مقارنة بنظام "دال-إي2"، ما أضعف من قدرته على توليد بعض الأشياء.

ويعمل الباحثون على تطوير قدرات النظام على التعلم، دون نسيان المعلومات من تجارب توليد الصور السابقة، ليستطيع محاكاة قدرة البشر على رسم مشاهد من أشياء عديدة متراكبة.

logo
تابعونا على
جميع الحقوق محفوظة ©️ 2024 شركة إرم ميديا - Erem Media FZ LLC