Sosyal medya platformlarında sıklıkla karşılaşılan ve tüm çabalara rağmen tamamen ortadan kaldırılması yakın gelecekte mümkün görünmeyen saldırgan içeriklere karşı mücadelede yeni bir adım atılıyor.
Facebook, Twitter gibi sosyal medya platformları, nefret söylemi içeren paylaşımları arayıp bulma konusunda insan gücünün yanı sıra yapay zekadan da uzun bir süredir yararlanıyor. Bu tür içerikler tespit edilmelerinin ardından topluluk kurallarını ihlal ettikleri gerekçesiyle siliniyor. Yeni geliştirilen algoritma ise saldırgan iletileri kaldırmakla yetinmeyip, paylaşımı yapan kişiye “Kullanılan dil oldukça saldırgan. Tüm etnik ve sosyal gruplar hoşgörüyü hak ediyor” gibi yanıtlar verecek.
Bu müdahalenin özellikle forumlarda ya da sosyal medya gruplarında sıkça karşılaşılan nefret söylemiyle mücadeleyi kolaylaştırması umut ediliyor.
17 BİN SOHBETTEN YARARLANILDI
Intel’de veri bilimcisi olan Anna Bethke fikrin, Birleşmiş Milletler İnsan Hakları Yüksek Komiserinin önerdiği, “nefret söylemine karşı daha fazla konuşma” yaklaşımından hareketle ortaya çıktığını belirtti.
Bethke ve bir grup bilim insanı, forum sitesi Reddit’teki 5 binden fazla sohbete ve ağırlıklı olarak Twitter tarafından engellenen kişilerin kullandığı sosyal medya sitesi Gab’deki 12 bin içeriğe erişim elde etti. Araştırma grubuna dahil olan kişiler, bu sohbet gruplarında ayrımcı ve nefret içerikli söylemlere, oluşturdukları bazı kalıp cümlelerle yanıt vermeye başladılar.
Ardından doğal dil işleme algoritmaları, gerçek insan tepkilerini kullanarak eğitildi ve “Doğası gereği cinsiyetçi olan kelimeleri kullanmanın verimli bir sohbete katkıda bulunmadığını düşünüyorum” şeklinde benzer yanıtlar üretmesi sağlandı.
Bilim insanları geliştirilen algoritmanın henüz mükemmel olmadığını belirtiyor. Çalışmanın uzun soluklu amacı ise insanlar arasında daha ‘sivil’ bir tartışma ortamının sağlanması.