Speechmatics تتفوق على جوجل في التعرف على الصوت

01/11/2021
شارك هذا الموضوع:

قالت شركة بريطانية ناشئة للتعرف على الكلام إن تقنية التعرف على الصوت الخاص بها كانن أفضل من أداء شركات التكنولوجيا الكبرى مثل جوجل وأمازون في فهم أصوات الأشخاص السود. وأوضحت شركة Speechmatics أن نظامها يتمتع بمعدل دقة إجمالي يبلغ 83 في المئة للأصوات الأمريكية من أصل أفريقي.

وهذا أعلى من مايكروسوفت (73 في المئة) وأمازون (69 في المئة) وجوجل (69 في المئة) وآبل (55 في المئة)، وفقًا لبحث نشرته جامعة ستانفورد في عام 2020.

وقارن بحث جامعة ستانفورد نتائج شركات التكنولوجيا الكبرى في مدى دقة برامج التعرف على الكلام في فهم الأمريكيين الأفارقة.

علاوة على ذلك ارتكبت أنظمة أمازون وجوجل ومايكروسوفت وآبل ما يقرب من ضعف عدد الأخطاء عند تفسير الكلمات التي يتحدثها الأمريكيون من أصل أفريقي مقارنة بالبيض، وفقًا لباحثين في جامعة ستانفورد.

وتقول Speechmatics إن نظامها أخطأ في التعرف على الكلمات المأخوذة من أصوات السود بنسبة 17في المئة من الوقت، مقابل 31 في المئة لجوجل وأمازون.

وقال أليسون كوينيكي، المؤلف الرئيسي لدراسة ستانفورد: من الأهمية دراسة وتحسين الإنصاف في أنظمة تحويل الكلام إلى نص نظرًا لإمكانية حدوث أضرار متفاوتة للأفراد من خلال القطاعات النهائية التي تتراوح من الرعاية الصحية إلى العدالة الجنائية.

وأصبحت تقنية التعرف على الصوت جزء لا يتجزأ من الحياة اليومية، وذلك بفضل انتشار المساعدين الافتراضيين عبر الأجهزة الذكية مثل الهواتف ومكبرات الصوت.

وكانت شركة آبل رائدة في استخدام البرامج التي يتم تنشيطها صوتيًا عبر الأجهزة المحمولة من خلال مساعدها الرقمي سيري.

بينما كانت أمازون من أوائل الشركات التي جلبت التعرف على الكلام إلى المنزل من خلال مكبرات الصوت Echo ومساعد أليكسا.