De Turing-test is gemaakt in de late jaren 40 van de vorige eeuw. De Engelse wiskundige Alan Matheson Turing probeerde te begrijpen of robots kunnen denken. Dit is wat hem ertoe aanzette om uit te vinden.
De geschiedenis van het ontstaan van de Turing-test
De Engelse wiskundige Alan Matheson Turing staat bekend als een unieke specialist op het gebied van informatica, informatica en cryptografie. Hij was het die het prototype van de moderne computer creëerde (Turing-computer). De wetenschapper had vele andere prestaties. Eind jaren 40 van de vorige eeuw begon een wiskundige zich af te vragen wat voor soort elektronische intelligentie als redelijk kan worden beschouwd en of een robot menselijk gedrag zo sterk kan benaderen dat de gesprekspartner niet zal begrijpen wie er eigenlijk voor hem staat.
Het idee om een deeg te maken ontstond nadat het Imitatiespel populair werd in Engeland. Dit leuke, modieuze voor die tijd, omvatte de deelname van 3 spelers - een man, een vrouw en een rechter, in de rol die een persoon van elk geslacht zou kunnen zijn. De man en vrouw gingen naar aparte kamers en overhandigden briefjes aan de rechter. Door de schrijfstijl en andere kenmerken zou de scheidsrechter moeten hebben begrepen welke biljetten aan een speler van het ene of het andere geslacht toebehoorden. Alan Turing besloot dat een van de deelnemers vervangen kon worden door een elektronische machine. Als de onderzoeker tijdens het proces van elektronische communicatie op afstand niet kan bepalen welke van de gesprekspartners een echte persoon is en wie een robot, kan de test als geslaagd worden beschouwd. En dit zou de reden moeten zijn voor de erkenning van de intelligentie van kunstmatige intelligentie.
De test doen
In 1950 formuleerde Alan Turing een systeem van vragen dat mensen ervan zou kunnen overtuigen dat machines kunnen denken.
In de loop van de tijd werd de test gemoderniseerd en niet machines, maar computerbots begonnen vaker als testobjecten te fungeren. Gedurende het hele bestaan van de test slaagden slechts enkele programma's erin om deze te doorstaan. Maar sommige experts twijfelden aan dit succes. Juiste antwoorden kunnen door toeval worden verklaard en zelfs in de beste gevallen konden de programma's niet meer dan 60% van de vragen beantwoorden. Het was niet mogelijk om een volledig toeval te bereiken.
Een van de programma's die de Turing-test met succes doorstond, was Eliza. De makers hebben kunstmatige intelligentie begiftigd met de mogelijkheid om trefwoorden uit iemands spraak te halen en tegenvragen op te stellen. In de helft van de gevallen konden mensen niet herkennen dat ze met een machine communiceerden, en niet met een live gesprekspartner. Sommige experts zetten vraagtekens bij het testresultaat omdat de organisatoren de proefpersonen vooraf hadden ingesteld voor live communicatie en de deelnemers aan het experiment niet eens door hadden dat de robot antwoorden kon geven en vragen kon stellen.
Succesvol kan het slagen voor de test worden genoemd door het programma samengesteld door de Odessa-burger Yevgeny Gustman en de Russische ingenieur Vladimir Veselov. Ze imiteerde de persoonlijkheid van een jongen op 13-jarige leeftijd. Op 7 juni 2014 werd het getest. Het werd bijgewoond door 5 bots en 30 echte mensen. Slechts 33 van de 100 jury's konden bepalen welke antwoorden door robots werden gegeven en welke echte mensen waren. Een dergelijk succes kan niet alleen worden verklaard door een goed opgezet programma, maar ook door het feit dat de intelligentie van een dertienjarige puber wat lager is dan die van een volwassene. Misschien is een deel van de jury door deze omstandigheid misleid.
Tegenstanders van de erkenning van het resultaat worden ook ondersteund door het feit dat Zhenya Gustman, die het programma heeft gemaakt, het in het Engels heeft geschreven. Tijdens het testen schreven veel rechters de vreemde reacties van de machine of het vermijden van antwoorden niet alleen toe aan de leeftijd van de beoogde gesprekspartner, maar ook aan de taalbarrière. Ze waren van mening dat de robot, die ze voor een mens hielden, de taal niet goed kende.
Sinds de oprichting van de Turing-test zijn de volgende programma's ook in de buurt gekomen om deze met succes te doorstaan:
- "Diepblauw";
- "Watson";
- "Pareren".
Loebner-prijs
Bij het maken van programma's en moderne robots beschouwen experts het halen van de Turing-test niet als een belangrijke taak. Dit is slechts een formaliteit. Het succes van een nieuwe ontwikkeling is niet afhankelijk van testresultaten. Het belangrijkste is dat het programma nuttig is, om bepaalde taken uit te voeren. Maar in 1991 werd de Lebner Prize ingesteld. Binnen dit kader concurreren kunstmatige intelligenties met elkaar om de test met succes te doorstaan. Er zijn 3 categorieën medailles:
- goud (communicatie met video- en audio-elementen);
- zilver (voor tekstcorrespondentie);
- brons (toegekend aan de auto die dit jaar het beste resultaat behaalde).
Er zijn nog aan niemand gouden en zilveren medailles uitgereikt. Er worden regelmatig bronzen prijzen uitgereikt. De laatste tijd komen er steeds meer aanmeldingen voor deelname aan de wedstrijd, doordat er nieuwe messengers en chatbots ontstaan. De concurrentie heeft veel critici. Een snelle blik op de deelnemersprotocollen van de afgelopen decennia laat zien dat een machine gemakkelijk kan worden gedetecteerd met minder geavanceerde vragen. De meest succesvolle spelers noemen ook de moeilijkheid van de Lebner-competitie vanwege het ontbreken van een computerprogramma dat vijf minuten lang een fatsoenlijk gesprek kon voeren. Het is algemeen aanvaard dat de wedstrijdapplicaties uitsluitend zijn ontwikkeld om een kleine prijs te ontvangen voor de beste deelnemer van het jaar, en niet voor meer.
Momenteel heeft de Turing-test verschillende moderne aanpassingen ondergaan:
- omgekeerde Turing-test (u moet een beveiligingscode invoeren om te bevestigen dat de gebruiker een mens is, geen robot);
- minimale intellectuele test (gaat uit van alleen de opties "ja" en "nee" als antwoorden);
- Turing-meta-test.
Nadelen van de test
Een van de belangrijkste nadelen van de test is dat het programma de taak heeft om een persoon te misleiden, hem te verwarren om hem te laten geloven in communicatie met een echte gesprekspartner. Het blijkt dat iemand die weet hoe te manipuleren als denkend kan worden herkend, en dit kan in twijfel worden getrokken. In het leven gebeurt alles een beetje anders. In theorie zou een goede robot menselijke handelingen zo nauwkeurig mogelijk moeten nabootsen en de gesprekspartner niet in verwarring brengen. Programma's die speciaal zijn ontworpen om de test te doorstaan, ontwijken antwoorden op de juiste plaatsen, citeren onwetendheid. De machines zijn zo geprogrammeerd dat de correspondentie er zo natuurlijk mogelijk uitziet.
Veel wetenschappers geloven dat de Turing-test in feite de gelijkenis van spraakgedrag tussen mensen en robots beoordeelt, maar niet het vermogen van kunstmatige intelligentie om te denken, zoals de maker stelt. Sceptici beweren dat de oriëntatie op dergelijke tests de voortgang vertraagt en de wetenschap verhindert vooruitgang te boeken. In de vorige eeuw was het halen van de test een geweldige prestatie en zelfs iets fantastisch, maar tegenwoordig kan het vermogen van een computer om "te corresponderen als een persoon" niet bovennatuurlijk worden genoemd.