إقناع الخوارزميات باستخدام AI Nudge

التحقق من الحقائق يمكن أن يقلل من انتشار الأخبار غير الموثوقة. يمكن أن تفعل أيضا العكس.

(ظهرت هذه المشاركة في الأصل على civilservant.io)

غالبًا ما يقوم قراء r / worldnews على reddit بإرسال أخبار التابلويد إلى المشرفين المتطوعين ، ويطلبون منهم حظر التابلويد لمقالاتهم المثيرة. هذه القصص المزخرفة تجذب انتباه الناس ، وتجذب الخلاف ، وتلاحظها خوارزمية تصنيف reddit ، والتي تزيد من انتشارها.

قد يؤدي حظر أخبار التابلويد إلى إنهاء حلقة التعليقات هذه ، ولكن يعارض المشرفون في المجتمع الحظر الشامل. لحل هذا اللغز ، احتاج المشرفون للإجابة على سؤال في قلب المناقشات حول ما يسمى "الأخبار المزيفة": كيف يمكننا الحفاظ على حرية المساهمين مع التأثير في السلوك المتبادل للأشخاص والخوارزميات لصالح المجتمع؟

هذا الشتاء ، عمل المشرفون مع CivilServant لاختبار فكرة: ما هي آثار تشجيع التحقق من الواقع على الاستجابة لأخبار غير موثوقة؟ أردنا أن نرى كيف سيستجيب مجتمع r / worldnews. لاحظنا أيضًا التأثير على تصنيفات reddit. إذا كانت خوارزميات reddit تفسر فحص الحقائق على أنه شائع ، فقد تنتشر المقالات غير الموثوق بها إلى أبعد من ذلك.

تمثل أخبار التابلويد 2.3٪ تقريبًا من جميع الطلبات المقدمة إلى مجتمع المشتركين البالغ عددهم 15 مليونًا والذي يناقش الأخبار خارج الولايات المتحدة. في r / worldnews ، يقوم 70 مشرفًا بمراجعة حوالي 450 مقالًا يوميًا والسماح لـ 68٪ من هذه المقالات بالبقاء. نظرًا لأنه روتين فرعي افتراضي ، يحصل معظم القراء على قراءة الأخبار العالمية من خلال هذا المجتمع. بينما يتضاءل مدى وصول المجتمع عبر Facebook ، قد تكون r / worldnews أكبر مجموعة منفردة لمناقشة أخبار العالم في أي مكان على الإنترنت الناطقة باللغة الإنجليزية. حتى التأثيرات الصغيرة في هذا المجتمع يمكن أن تحدث فرقًا كبيرًا في كيفية فهم ملايين الأشخاص لمعلومات غير موثوقة حول العالم.

في دراستنا من 27 نوفمبر إلى 20 يناير ، اختبرنا A / B الرسائل التي تشجع المجتمع على التحقق من الحقائق والتصويت على أخبار الصحف. إليك ما وجدناه:

تأثير تشجيع التحقق من الواقع على سلوك المجتمع

ضمن مناقشات التقديمات التابلويد على r / worldnews ، يزيد تشجيع التحقق من الوقائع من معدل حدوث التعليقات التي تحتوي على روابط بمقدار 2x في المتوسط ​​، كما أن تشجيع التحقق من الوقائع + التصويت له تأثير مماثل.

تأثير تشجيع التحقق من الحقائق على خوارزميات رديت

بعد ملاحظة أكثر من 24 ساعة ، وجدنا أيضًا أن التعليقات اللزجة التي تشجع التحقق من الوقائع في المتوسط ​​تسببت في انخفاض بمقدار 2x في درجة reddit من التقديمات التابلويدية ، وهو تأثير ذو دلالة إحصائية أثرت على الأرجح في التصنيفات في الروتين الفرعي. عندما شجعنا القراء أيضًا على التصويت ، اختفى هذا التأثير.

الذكاء الاصطناعي: إقناع الخوارزميات مع الحفاظ على الحرية

أضافت أسئلتنا حول أخبار التابلويد بعدًا حسابيًا إلى سؤال الإدارة الكلاسيكية: كيف يمكن للأشخاص ذوي القوة العمل نحو الصالح العام مع تقليل القيود المفروضة على الحرية الفردية؟

يمكننا إقناع الخوارزميات بالتصرف بشكل مختلف عن طريق إقناع الناس بالتصرف بشكل مختلف.

عبر الإنترنت ، يتعلم الناس العيش مع أنظمة الذكاء الاصطناعي التي لا يمكنهم التحكم فيها. على سبيل المثال ، يعدل سائقو Uber قيادتهم لتحسين دخلهم. يؤثر سلوكنا الجماعي بالفعل على أنظمة الذكاء الاصطناعي طوال الوقت ، لكن حتى الآن ، يفتقر الجمهور إلى معلومات حول ماهية هذا التأثير بالفعل. قد تكون هذه النتائج غير الشفافة مشكلة عندما تؤدي الخوارزميات أدوارًا رئيسية في المجتمع ، مثل الصحة والسلامة والإنصاف. لحل هذه المشكلة ، يقوم بعض الباحثين بتصميم أنظمة "مجتمع داخل الحلقة" [4]. البعض الآخر يطور طرقًا لتدقيق الخوارزميات [5] [6]. ومع ذلك ، لا يوفر أي من الطرق طريقة لإدارة السلوك اليومي للأنظمة التي لا يمكننا التحكم في الكود. تقدم دراستنا مع r / worldnews اتجاهًا ثالثًا ؛ يمكننا إقناع الخوارزميات بالتصرف بشكل مختلف عن طريق إقناع الناس بالتصرف بشكل مختلف.

قد يتساءل بعض الأشخاص عما إذا كانت هذه التجربة تشكل التلاعب بالأصوات ، وهو ما يتعارض مع سياسات reddit. ملاحظاتنا اللاصقة لا تنتهك أي من قواعد reddit لتحقيق مكاسب شخصية (لم نقم أيضًا بإنشاء حسابات مزيفة ، أو إخبار الأشخاص بكيفية التصويت ، أو تنظيم كتلة تصويت). لكننا أظهرنا أن تشجيع الناس على التحقق من الواقع كان له تأثير منهجي على خوارزميات رديت.

تعطينا فكرة "الذكاء الاصطناعي" طريقة للتفكير في الجهود المؤيدة للمجتمع للتأثير على السلوك البشري والآلي مع الحفاظ على الحرية الفردية. اقترح ريتشارد ثالر وكاس سونشتاين أولاً "دفعات" كطرق للمؤسسات لممارسة سلطتها مع الحفاظ على الحرية الفردية [7]. مقارنة بحظر الأخبار الشعبية ، فإن حفز الذكاء الاصطناعى لتشجيع التحقق من الحقائق هو أخف إجراء يمكن أن يتخذه المشرفون. لا يتم استبعاد قدرة أي شخص على مشاركة الأخبار أو التعليق أو التصويت ، ولكن لا تزال استجابة الذكاء الاصطناعى تضعف انتشار الأخبار غير الموثوقة.

كما يشير Sunstein و Thaler ، ليس من الواضح دائمًا ما إذا كانت هذه التدخلات التي تعمل باللمس الخفيف ستحقق النتيجة المرجوة. لهذا السبب يجب علينا اختبار آثارها بشكل منتظم ، خاصة وأن الأنظمة غير المختبرة يمكن أن يكون لها نتائج غير متوقعة.

حوكمة وأخلاقيات منظمة العفو الدولية

غالبًا ما تجذب انتقادات من الحكومات والتجارب الاجتماعية عبر منصات الإنترنت انتقادات مماثلة. أعتقد أن الناس على صواب في توقع المساءلة من أولئك الذين يمارسون قوة دفع. من خلال العمل مع المشرفين المتطوعين ، تمكنت من العمل بمستويات أعلى من الشفافية والمساءلة أكثر من المعتاد في الحوسبة الاجتماعية. تم تصميم جميع الدراسات CivilServant مع وفرق الاعتدال ، ويتم الكشف عن جميع النتائج أولا للمجتمع في استخلاص المعلومات subreddit. يتم سرد تصميمات دراستنا بشكل عام على Open Science Framework قبل أن نبدأ ، وكل قواعدنا مفتوحة المصدر. تفاصيل التحليل الكاملة علنية أيضًا ، بحيث يمكن لأي شخص التحقق من استنتاجاتنا. الشيء الوحيد الذي نحتفظ به هو البيانات الفعلية ، نظرًا لأننا نحترم خصوصية جميع المعنيين.

بشكل عام ، آمل أن تقدم الذكاء الاصطناعي ، وخاصة عندما تقوده المجتمعات المحلية نفسها ، اتجاهًا مثيرًا للجمهور لإدارة دور الخوارزميات في المجتمع ، مع الحفاظ على الحرية الفردية أيضًا.

كيف عملت الدراسة

بالنسبة لهذا الاختبار ، بدأ المشرفون بقائمة بمصادر الأخبار التي تتلقى الشكاوى بشكل متكرر. من 27 تشرين الثاني (نوفمبر) إلى 20 كانون الثاني (يناير) ، خصصنا بشكل عشوائي كل رابط جديد لصحيفة التابلويد لواحد من الشروط الثلاثة: (أ) لا يوجد تعليق لزج ، (ب) تعليق لزج يشجع الشكوك ، (ج) تعليق لزج يشجع الشكوك + التصويت (التفاصيل الكاملة هنا ).

نشرنا هذه الرسالة في الجزء العلوي من مناقشات الأخبار الشعبية

والثاني يشجع الناس على التحقق من حقيقة المقالة والنظر في تقليل الارتباط إذا لم يتمكنوا من العثور على أدلة داعمة لمزاعمها:

شجعت هذه الرسالة الثانية الناس على التفكير في التصويت

هل يمكن لسلوك التحقق من الواقع التأثير على كيفية رؤية خوارزميات reddit لأخبار غير موثوقة؟

بينما كنا واثقين من أن قراء r / worldnews سوف يساعدون إذا طلب المشرفون ، تساءلنا أيضًا: إذا قمنا بزيادة التعليق على أخبار التابلويد ، فهل من الممكن أن نتسبب بطريق الخطأ في جعل خوارزميات رديت تروج لتلك الروابط الشعبية؟

إذا زاد تقصي الحقائق من شعبية مصادر الأخبار غير الموثوقة ، فقد يحتاج المجتمع إلى إعادة التفكير في المكان الذي يبذل فيه جهدهم. لهذا السبب قام المشرفون باختبار تعليق لاصق ثانٍ ، وهو التعليق الذي يشجع القراء على التفكير في التصويت.

لاختبار تأثير التعليقات اللاصقة على خوارزميات reddit ، قام برنامج CivilServant بجمع بيانات عن نقاط المشاركات كل أربع دقائق. لا تنشر المنصة بالضبط ما يدخل في النتيجة أو بالضبط كيف تعمل تصنيفاتها (سألت). ومع ذلك ، تمكنا من التنبؤ بشكل موثوق بتصنيف صفحة subreddit HOT للنشرة من عمرها والنتيجة (التفاصيل الكاملة هنا). بشكل أساسي ، إذا كان لتقصي الحقائق تأثير كبير على درجة مقالة ما ، فمن المحتمل أن يكون لذلك تأثير على تصنيف مقالة بمرور الوقت على الصفحة الأولى للصفحات الفرعية. لقد اختبرت ذلك بطريقتين: عن طريق مقارنة الدرجات بعد 24 ساعة ، ونمذجة التغييرات في الدرجات بمرور الوقت.

لقد استخدمت نموذجًا ذو الحدين السلبي لاختبار التأثير على النتائج بعد 24 ساعة. نظرًا لأن خوارزميات reddit كانت موجودة أثناء تجربتنا ، فإن تشجيع التحقق من الوقائع تسبب في تلقي تقارير التابلويد 49.1٪ (أقل بنسبة 2.04x) لدرجة التقديمات دون تعليق لاصق ، بعد 24 ساعة ، في المتوسط ​​في r / worldnews. التأثير ذو دلالة إحصائية. في هذا النموذج ، فشلت في العثور على تأثير من التعليقات اللاصقة التي شجعت القراء على التفكير في التصويت.

لقد اختبرت أيضًا تأثير التحقق من الواقع على معدل نمو نقاط المنشور بمرور الوقت. لطرح هذا السؤال ، أقوم بتركيب نموذج الانحدار الخطي لاعتراض عشوائي على النتيجة التي تم تحويلها إلى سجل لأحد المنشورات كل أربع دقائق. لقد وجدت أن تشجيع التحقق من الحقائق يؤدي إلى انخفاض معدل نمو الدرجات. وهنا ، وجدت أن تشجيع التصويت له تأثير إيجابي بسيط على معدل النمو في النتيجة بمرور الوقت ، في المتوسط. نظرًا لأننا كنا نجري التجربة أثناء تغيير خوارزميات reddit في أوائل ديسمبر 2016 ، فقد وجدت أيضًا أن تأثير هذه التعليقات اللاصقة على خوارزميات reddit قد يكون قد تغير بعد أن قام reddit بتعديل خوارزمياته (التفاصيل).

من ساعد في التحقق من المقالات الإخبارية؟

من بين 930 تعليقًا غير بروت مع روابط سمح لها المشرفين بالبقاء ، ساهم 737 حساب مستخدم في روابط لمزيد من الأدلة. من بين هؤلاء ، قدم 133 حسابًا أكثر من تعليق واحد بروابط. قام العديد من الأشخاص بفحص تقاريرهم الخاصة ، حيث قام القائمون على إرسال 81 تعليقًا بمزيد من المعلومات.

ما الذي لا يمكن أن نعرفه من هذه الدراسة؟

يبحث هذا الاختبار في النتائج داخل المناقشات بدلاً من الحسابات الفردية ، لذلك لا يمكننا معرفة ما إذا كان الأفراد مقتنعين بأنهم أكثر تشككا ، أو ما إذا كانت التعليقات اللزجة تسببت في قيام الأشخاص المشككين بالفعل بالتحقيق والمشاركة. ليس لدي أي دليل على تأثير التحقق من الواقع على القراء ، على الرغم من أن الأبحاث الأخرى تشير إلى أن التحقق من الواقع يؤثر على معتقدات القارئ [2] [3].

لا يمكن أن تخبرنا هذه الدراسة كثيرًا عن سبب رؤيتنا لهذا التغيير الكبير في التأثيرات الحسابية عندما نقوم بتعديل الرسالة من خلال تشجيع القراء على التفكير في التصويت. قد يكون هذا الاختلاف مثالًا على ما يسميه علماء النفس "التفاعل" ، مقاومة لاقتراحات السلطة. أو إذا كان مقدمو الأخبار يشعرون بالقلق من أن روابطهم قد تنخفض ، فقد يطلبون المساعدة ، مما يوازن سلوك القراء.

هل سيعمل هذا مع أنواع أخرى من الارتباطات أو في subreddits أخرى أو على مواقع أخرى؟ تقتصر هذه الدراسة على مجتمع معين وقائمة المواقع. على الرغم من أنني أظن أن العديد من مجتمعات القراء الكبيرة على الإنترنت ستساعد في التحقق من الروابط إذا طلب المشرفون ، فإن نتائجنا حول خوارزمية reddit تقع أكثر من ذلك بكثير.

يمكننا الإجابة على هذه الأسئلة إذا قررت المزيد من النماذج الفرعية تجربة تجارب مماثلة. إذا كنت مهتمًا ، فاتصل بي على reddit لمناقشة إجراء تجربة مماثلة والاشتراك للحصول على تحديثات البريد الإلكتروني.

تعرف على المزيد حول هذه التجربة

تتضمن شهادة الدكتوراه الخاصة بي دعم المجتمعات لاختبار آثار ممارسات الاعتدال الخاصة بهم. لقد صممت هذه التجربة مع مديري r / worldnews ، وتمت الموافقة عليها من قبل لجنة معهد ماساتشوستس للتكنولوجيا بشأن استخدام البشر كمواضيع تجريبية. إذا كان لديك أي أسئلة أو مخاوف ، يرجى الاتصال natematias على redditmail.

تم إجراء هذه التجربة ، مثلها مثل كل بحثي حول reddit حتى الآن ، بشكل مستقل عن نظام reddit ، الذي لم يكن له دور في تخطيط التجربة أو تصميمها. لم تتم مراجعة التجربة بعد من قبل النظراء. يتم نشر جميع النتائج من CivilServant علانية مرة أخرى إلى المجتمعات المعنية بمجرد أن تكون النتائج جاهزة ، مع نشر المنشورات الأكاديمية في وقت لاحق.

تم نشر التفاصيل الكاملة للتجربة مسبقًا في خطة ما قبل التحليل على osf.io/hmq5m/. إذا كنت مهتمًا بالإحصاءات ، فقد نشرت التفاصيل الكاملة للتحليل.

المراجع

[1] Salganik، M. J.، & Watts، D. J. (2008). قيادة ضلال القطيع: دراسة تجريبية للنبوءات التي تحقق ذاتها في سوق ثقافي اصطناعي. علم النفس الاجتماعي الفصلي ، 71 (4) ، 338-355.

[2] ستيفان ليفاندوفسكي ، أولريش ك. إيكير ، كولين م. سيفرت ، نوربرت شوارز ، وجون كوك. المعلومات الخاطئة وتصحيحها استمرار النفوذ والتراجع الناجح. العلوم النفسية في المصلحة العامة ، 13 (3): 106–131 ، ديسمبر 2012.

[3] توماس وود وإيثان بورتر. تأثير معاكس بنتيجة عكسية: الالتزام الوقائي الثابت للمواقف الجماعية. SSRN Scholarly Paper ID 2819073، Network Research Science Network، Rochester، NY، August 2016.

[4] رضوان ، إياد (2016) المجتمع في الحلقة: برمجة العقد الاجتماعي الخوارزمي. متوسط

[5] كريستيان ساندفيج ، كيفن هاميلتون ، كاري كاريهوس ، وسيدريك لانجبورت. 2014. خوارزميات التدقيق: طرق البحث للكشف عن التمييز على منصات الإنترنت. البيانات والتمييز: تحويل المخاوف الحرجة إلى استفسار منتج ، الاجتماع السنوي لجمعية الاتصالات الدولية ، 2014

[6] دياكوبولوس ، ن. ، وكوليسكا ، م. (2016). الشفافية الحسابية في وسائل الإعلام. الصحافة الرقمية ، 1-20.

[7] Thaler، R. H.، & Sunstein، C. R. (2003). الأبوية التحررية. The American Economic Review، 93 (2)، 175–179.