Suomenkielinen vihapuhe rehottaa Facebookissa eikä ihme: tietovuoto paljastaa, että moderoijia on vain muutama ja algoritmit toimivat huonosti

YLE

Facebookin kyky havaita alustalla rehottavaa vihapuhetta ei ole niin hyvä kuin yhtiö on antanut ymmärtää. Suomen kaltaisilla pienillä kielialueilla sisältöjen moderointi jää usein puolitiehen. Tämä ilmenee tuhansia sivuja Facebookin sisäisiä asiakirjoja sisältävästä vuotoaineistosta, jonka Yle on saanut haltuunsa.

Asiakirjojen perusteella Facebook ei ole kehittänyt automaattisia moderointityökaluja suomen kielelle. Nämä algoritmit tunnistavat muun muassa vihapuhetta, väkivaltaa tai alastomuutta sisältäviä sisältöjä.

Facebook on tähän asti pitänyt sisältöjen tarkastamiseen liittyvät asiat salassa. Yhtiö ei ole esimerkiksi kertonut eri kieliä seulovien työntekijöiden määriä. Se ei myöskään ole paljastanut, mille kielille automaattisia järjestelmiä on kehitetty.

Yle kysyi Facebookilta kahteen kertaan tarkempia tietoja suomen kielellä tehtävästä moderoinnista, mutta yhtiö ei vastannut kysymyksiin.

Se tiedetään, että maailmanlaajuisesti Facebookiin julkaistuja sisältöjä kahlaa läpi noin 15 000 sisällöntarkastajan joukko. Pääsääntöisesti alihankkijoiden työllistämät moderoijat tarkastavat Facebookin mukaan sisältöjä yli 70 eri kielellä.

Suomalaisista moderaattoreista tiedetään se, että heitä on kymmenkunta ja he työskentelevät Suomen ulkopuolella, ainakin Berliinissä.

Facebookin vihapuhe suodatetaan oikeusistuimissa

Facebookissa yhteisönormeiksi kutsutut säännöt määrittävät hyväksyttävän sisällön rajat. Sääntöjen mukaan muun muassa väkivalta ja vihapuhe ovat kyseenalaisia sisältöjä ja niihin moderoijien pitäisi aina puuttua.

Facebook määrittelee vihapuheen suoraksi hyökkäykseksi ihmisiä vastaan esimerkiksi rodun, etnisyyden, kansallisuuden tai seksuaalisen suuntautumisen perusteella. Hyökkäys voi olla ihmisryhmän väittäminen alempiarvoiseksi tai kehotus väkivaltaan.

Tämän kaltaisen puheen pitäisi kadota nopeasti Facebookista, mutta todellisuudessa näin ei tapahdu.

Heikosti hoidettu moderointi näkyy Suomessa oikeudessa. Viime vuosina käräjäoikeudet eri puolilla Suomea ovat antaneet kymmeniä tuomioita Facebookissa julkaistuista kirjoituksista.

Oikeudessa tullut tuomio ei tietenkään automaattisesti tarkoita, että moderointi olisi epäonnistunut. Kyseenalaisesta julkaisusta tehty syyttämättäjättämispäätös ei puolestaan osoita moderointiratkaisun olleen oikea.

Oikeustapausten määrä kuitenkin osoittaa, että Suomen lakia rikkovaa vihapuhetta pääsee Facebookissa läpi. Ja oikeussaleissa nähdään vain räikeimmät tapaukset.

- On selvästi nähtävissä, että Facebookissa on väkivaltaan yllyttämistä ja vähemmistöjä leimaavaa kirjoittelua, jolle ei tehdä mitään, sanoo poliittisen kulttuurin ja viestinnän tutkija Aleksi Knuutila.

Suomi ei ole prioriteetti

Facebookin entisen tuotepäällikön Frances Haugenin vuotamista sisäisistä tutkimuksista ja asiakirjoista paljastuu, ettei moderointi suju hyvin Facebookilta oikein millään kielellä. Tästä syystä yhtiön huomio on lähes täysin isoilla kielialueilla.

Facebook luo automaattisia järjestelmiä ensisijaisesti kielille, joilla tuotetaan eniten sisältöä. Priorisointiin vaikuttaa myös se, kuinka suuri väkivallan uhka vallitsee maissa, joissa kieltä puhutaan.

Riskimaista listan kärkeen nousevat väkivaltaisuuksista jo kärsivät valtiot. Toisaalta, jos kielialueelle on Facebookin mielestä vaikeaa luoda automaattisia järjestelmiä, se putoaa pois listalta.

Priorisointilistalle päätymisellä on hintansa. Yhdessä vuotoasiakirjassa huomautetaan, että algoritmin kouluttaminen vie resursseja ihmisten tekemältä valvonnalta. Kriisialueilla nämä työntekijät ovat jo nyt ylityöllistettyjä.

Algoritmit toimivat Suomessa, mutta eivät suomen kielellä

Facebook kouluttaa algoritmeja aiheesta riippuen muutamalle kymmenelle kielelle. Esimerkiksi koronavirusta käsitteleviä julkaisuja Facebookin tekoäly seuloo 17 eri kielellä, kun yhteiskunnallisia aiheita seuraava algoritmi on koulutettu toimimaan 31 kielellä.

Vaikka algoritmeja ei ole dokumenttien perusteella kehitetty suomen kielelle, ne käyvät läpi Suomessa julkaistuja sisältöjä muilla kielillä.

Facebookin sisäisen tutkimuksen mukaan yhteiskunnallisia aiheita tunnistava algoritmi havaitsee vajaan viidenneksen Suomessa käytävästä yhteiskunnallisesta keskustelusta.

Kyseinen algoritmi on koulutettu ymmärtämään englannin lisäksi ainakin ruotsia, venäjää ja arabiaa. Tästä voidaan päätellä, että noin viidennes Suomessa julkaistusta Facebook-sisällöstä on kirjoitettu näillä kielillä.

Se jättää paljon tarkastettavaa muutamalle suomalaismoderaattorille.

Toisaalta algoritmeistä ei välttämättä olisi niin paljon apua kuin Facebook on antanut ymmärtää.

Facebook tarjoaa valikoituja lukuja

Koronapandemian myötä Facebook joutui turvautumaan yhä enemmän automaattisiin työkaluihin. Arkaluontoisten sisältöjen moderointi ei ole työtä, jota voisi tehdä kotona, joten tehtävä annettiin tekoälylle.

Uuden työnjaon alussa Facebook myönsi, että sen algoritmeilla saattaa aluksi olla vaikeuksia määritellä alustalla hyväksytyn ja kielletyn puheen raja.

Muutoksen jälkeen Facebookin poistaman vihapuheen määrä nousi 9,6 miljoonasta julkaisusta 22,5 miljoonaan vuosineljänneksen aikana. Yhtiön mukaan kasvu johtui kehittyneistä algoritmeista ja siitä, että se oli ottanut automatiikan käyttöön espanjaksi, arabiaksi ja indonesiaksi.

Facebook kehui raportissaan, että sen algoritmit havaitsevat 95 prosenttia vihapuheesta ennen kuin yksikään käyttäjä ehtii tehdä ilmoitusta asiasta.

Tämä ei tarkoita, että yhtiön algoritmit havaitsevat 95 prosenttia kaikesta alustalla julkaistusta vihapuheesta. Sen sijaan Facebookin käyttämä "ennakoivan havainnoinnin mittari" tarkoittaa, että sen algoritmin tunnistama julkaisu on 95 prosentin tarkkuudella vihapuhetta.

Toisin sanoen, jokainen väärä tunnistus heikentää mallin tarkkuutta, kun taas havaitsematta jäänyt vihapuhe ei vaikuta ilmoitettuun tarkkuuteen mitenkään.

Tämän kaltainen seulonta ei ratkaise vihapuheeseen liittyviä ongelmia, kirjoittaa anonyymi datatieteilijä Facebookin sisäisellä alustalla.

Viime vuoden loppupuolella kirjoitetussa lähtöilmoituksessaan yhtiön jättävä työntekijä huomauttaa, että Facebookin omien lukujen perusteella yhtiön olisi pitänyt poistaa moninkertainen määrä vihapuhetta, jos se olisi halunnut tehdä edes lovea vihapuheen määrään.

Todellisuudessa sisäisten dokumenttien mukaan Facebook puuttuu vain muutamaan prosenttiin alustalla ilmenevästä vihapuheesta. Yhtiön nykyisellä strategialla tämän luvun nostaminen yli 20 prosentin on lyhyellä aikavälillä erittäin vaikeaa.

Lue lisää:

Youtube tarjosi salaliittoja ja Raamattua koronarokotteista tietoja hakeville suomalaisille - Ylen selvitys paljastaa somejätin virheen

YLE

samedi 18 décembre 2021 10:14:35 Categories: Facebook YLE

Article précédent << >> Article suivant

Suomi sisu kantaa

NorpaNet Beta 1.1.0.18818 - Firebird 5.0 LI-V6.3.2.1497

TetraSys Oy.