Europese Commissie accepteert hoge foutmarge bij controle chatberichten

Door Briolet: 10% fout positieven is niet veel en levert daarom niet veel meer werk op. 90% is dan namelijk terecht positief en de fout positieven die er dan bij komen geven slechts 11% extra belasting.

Je vergist je. Als die nauwkeurigheid van 90% beide kanten opwerkt, en in werkelijkheid bevat 1 op de 100.000 berichten kinderporno, dan heb je op 1.000.000 berichten:
10 met kinderporno;
999.990 zonder kinderporno;

De nauwkeurigheid is 90%. Voor die 10 met kinderporno levert dat op:
– 90% van 10 = 9 worden terecht als kinderporno aangemerkt;
– 10% van 10 = 1 wordt ten onrechte niet als kinderporno aangemerkt.

Voor de 999.990 zonder kinderporno betekent dit:
– 90% van 999.990 = 899.991 worden terecht niet als kinderporno aangemerkt;
– 10% van 999.990 = 99.999 worden ten onrechte als kinderporno aangemerkt.

Oeps, je hebt een stortvloed aan foutpositieven die maar liefst zo’n 10.000 keer zo groot is als het aantal terechte positieven.

De beoordelingsfout die je maakt is dat je denkt dat zo’n claim van (bijvoorbeeld) 90% nauwkeurigheid op het eindresultaat slaat, maar dat is niet zo, het slaat op de kans dat een beoordeling klopt of niet klopt, en die kans heeft op elke afzonderlijke beoordeling opnieuw zijn effect. Hoe zeldzamer wat je opspoort is op het geheel, hoe overweldigender het aantal foutpositieven zal zijn ten opzichte van het aantal kloppende positieven.

Je bent lang niet de enige die deze interpretatiefout maakt, de meeste mensen doen dat, inclusief helaas de meeste politici die beslissingen nemen op basis van dit soort cijfers.

Ik heb in mijn berekening heel exacte uitkomsten gegeven. Bij kansen hebben we het over toeval en kunnen uitkomsten fluctueren. De exactheid in de sommetjes is dus schijn, de werkelijkheid is variabeler.

Bron: Security.nl

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

12Privacy.nl