Qsarpress

ما في ذلك السياسة والأعمال والتكنولوجيا والحياة والرأي والرياضة.

كشفت Microsoft بهدوء عن نوع جديد من الذكاء الاصطناعي (قد يخيفك بهدوء)

مبنى مايكروسوفت

صور جيدة

يا له من امتياز أن أكون واحدًا من آخر البشر بالكامل.

أيضا غير صحيح من الناحية الفنية

أعلم أنه في المستقبل المنظور ، سيكون الفنانون المعروفون سابقًا باسم البشر مزيجًا ملموسًا من اللحم والرقائق.

ربما لم يكن يجب أن أتفاجأ ، إذن ، عندما جاء باحثو Microsoft لتسريع الأمور قليلاً في المستقبل اليائس.

بدا الأمر كله ساذجًا وعلميًا. عنوان ورقة الباحث كانت مبهمة بشكل خلاق: “نماذج لغة الترميز العصبية لمركِّبات تحويل النص إلى كلام بدون طلقة.”

ما رأيك يعني هذا؟ هناك طريقة جديدة وأسرع آلة تقوم بنسخ الكلمات التي تتحدثها؟

إضافي: هل ChatGPT ثوري؟ يبدو أن لدى Microsoft خططًا كبيرة لروبوت الدردشة المدعوم بالذكاء الاصطناعي

يبدأ ملخص الباحثين بشكل جيد بما فيه الكفاية. يستخدم الكثير من الكلمات والعبارات والمختصرات. هذا ما يفسر سبب تسمية نموذج لغة الترميز العصبية VALL-E.

بالتأكيد هذا الاسم يجب أن يلينك. ما هو الشيء المخيف في التكنولوجيا الذي يبدو وكأنه روبوت صغير لطيف من فيلم يثلج الصدر؟

موافق، ربما يكون كذلك: “يعرض VALL-E إمكانات التعلم في السياق ويمكن استخدامه لتوليف كلام شخصي عالي الجودة مع تسجيل مدته 3 ثوانٍ لمتكلم غير مرئي كمحفز صوتي.”

كنت أرغب في كثير من الأحيان في إظهار مهارات التعلم. بدلاً من ذلك ، كان علي انتظار ظهورهم.

ما يخرج من الجملة الأخيرة للباحثين مهتز. تحتاج أدمغة Microsoft الكبيرة الآن إلى 3 ثوانٍ فقط لتزييف الجمل الطويلة والخطب الكبيرة التي ربما لا تتحدثها ، ولكن تبدو مثلك.

لن أتطرق إلى العلم كثيرًا ، لذا لن يستفيد أي منا.

أذكر أن VALL-E تستخدم مكتبة صوتية أعدتها شركة Meta ، إحدى أكثر الشركات إثارة للإعجاب والموثوقية في العالم. كان مدعوا ليبريليتإنه مستودع 7000 متحدث بإجمالي 60.000 ساعة.

بطبيعة الحال ، طلبت عمل VALL-E.

إضافي: رائد الذكاء الاصطناعي جيف هينتون يبحث في نوع جديد تمامًا من أجهزة الكمبيوتر

سمعت رجلاً يتحدث لمدة 3 ثوان. 8 ثوانٍ سمعت نسخته من VALL-E تقول: “ثم تحركوا بحذر بشأن البحث أمام الكوخ والعثور على شيء لإظهار أن Warrenton قد أنجز مهمته.”

إذا كان هناك فرق كبير ، فأنت ترفض ملاحظة ذلك.

صحيح أن العديد من الاستفزازات تبدو وكأنها أسوأ قطع أدب القرن الثامن عشر. عينة: “وهكذا ، قام هذا الأب الإنساني والعادل بمواساة ابنته غير السعيدة ، وعانقتها والدتها مرة أخرى ، وبذلت كل ما في وسعها لتهدئة مشاعرها.”

ولكن ما الذي يمكنني فعله سوى الاستماع إلى العديد من الأمثلة التي يقدمها الباحثون؟ كانت بعض إصدارات VALL-E مشبوهة أكثر من غيرها. الصياغة غير صحيحة. شعروا بالانقسام.

ومع ذلك ، فإن التأثير الكلي مخيف للغاية.

لقد تم بالفعل تحذيرك. عندما يتصل بك المحتالون ويسجلونك ، ويعيدون إنتاج كلامك ، ويستخدمون صوتك المجرد لطلب منتجات باهظة الثمن ، فأنت تعلم أنه لا يجب التحدث معهم.

إضافي: استخدم التخصيص المدعوم بالذكاء الاصطناعي لحظر المكالمات والنصوص غير المرغوب فيها

هذا ، على ما يبدو ، مستوى آخر من الدقة. ربما رأيت بالفعل حلقات كثيرة جدًا من Peacock.يمسك، “حيث يتم تقديم تقنية التزييف العميق كجزء طبيعي من الحكومة. تعد Microsoft شركة لطيفة وغير ضارة هذه الأيام لدرجة أنني لا داعي للقلق حقًا.

ومع ذلك ، لا أشعر بالارتياح من فكرة أنه يمكنني بسهولة خداع أي شخص ، أي شخص ، لقول شيء لم أقله. على وجه التحديد ، يمكن أن تعكس “السياق العاطفي والصوتي” لثواني الشخص الثلاث الأولى من الكلام ، كما يقول الباحثون.

ستشعر بالارتياح لأن الباحثين قد حددوا هذه الاحتمالية للانزعاج. يقدمون: “نظرًا لأن VALL-E يمكنه توليف الكلام الذي يحافظ على هوية المتحدث ، فقد يؤدي ذلك إلى مخاطر محتملة تتمثل في إساءة استخدام النموذج ، مثل انتحال هوية الصوت أو انتحال شخصية متحدث معين.”

الحل؟ تطوير نظام كشف ، كما يقول الباحثون.

قد يترك هذا شخصًا أو اثنين يتساءلون: “فلماذا فعلت هذا؟”

في كثير من الأحيان في التكنولوجيا ، الجواب هو: “لأننا نستطيع”.

READ  لقد سمعت: حرق QLED وmini-LED، HDR، Dolby Atmos مفقود