V raziskavi, ki so jo nedavno izvedli na Univerzi v Arkansasu, se je 151 udeležencev pomerilo s ChatGPT-4 v treh testih, zasnovanih za merjenje divergentnega razmišljanja, ki služi kot indikator kreativnega mišljenja.
Umetna inteligenca je na standardiziranem testu ustvarjalnosti prekosila ljudi
Divergentno mišljenje je povezano z zmožnostjo tvorjenja edinstvenega odgovora na vprašanje, ki nima ene pričakovane rešitve. Primer takega vprašanja je: »Kako se izogniti pogovoru o politiki s starši?« V raziskavi je GPT-4 podal bolj izvirne in izčrpne odgovore od človeških udeležencev.
Študija z naslovom Trenutno stanje generativnih jezikovnih modelov umetne inteligence je bolj ustvarjalno od ljudi pri nalogah divergentnega mišljenja je bila objavljena v Scientific Reports. Avtorja sta doktorska študenta psihološke znanosti na Univerzi v Arkansasu, Kent F. Hubert in Kim N. Awa, skupaj s profesorico Daryo L. Zabelina, asistentko na oddelku in vodjo laboratorija za Mehanizme kreativne kognicije in pozornost.
Ustvarjalni potencial so pri udeležencih ocenili s tremi testi
V sklopu prvega testa so iskali alternativne načine uporabe vsakdanjih predmetov, kot je vrv ali vilica. Drugi test se je osredotočal na posledice. Udeleženci so morali podati možne izide hipotetičnih situacij, na primer: »Kaj, če ljudje več ne bi potrebovali spanca?« Pri tretjem testu so se morali udeleženci spomniti desetih samostalnikov, ki so med seboj čim bolj semantično oddaljeni – pri besedah mačka in pes je ta distanca manjša kot pri besedah mačka in ontologija.
Teste so ocenjevali glede na število besed, dolžino odgovorov in semantično različnost med besedami. Avtorji so prišli do spoznanja, da je GPT-4 v primerjavi z ljudmi pri posameznih nalogah odgovarjal bolj izvirno in izčrpno. Bolje se je izkazal tudi, ko so preverjali spretnost pri oblikovanju odgovora. »Z drugimi besedami, GPT-4 je demonstriral večji ustvarjalni potencial pri kopici testov iz divergentnega mišljenja.«
Avtorji ugotovitvam dodajajo opomin
»Pomembno je, da spomnimo, da so metode v raziskavi resda namenjene merjenju kreativnega potenciala, a udejstvovanje v ustvarjalnih aktivnostih (ali ustvarjalni dosežki) predstavlja drug aspekt preučevanja ustvarjalnosti osebe.« Namen študije je bil preučiti človeški kreativni potencial, a ne nujno pri ljudeh, ki imajo na ustvarjalnem področju že kakšne zasluge ali relevantne izkušnje.
Raziskovalci prav tako niso pretehtali primernosti oziroma izvedljivosti odgovorov GPT-4. Čeprav je AI podal več izvirnih odgovorov, je možno, da so imeli človeški udeleženci občutek, da so odgovori bolj omejeni, in so odgovore izbirali z ozirom na realnost.
Ne vemo, kako motivirani so bili človeški udeleženci pri podajanju odgovorov
Awa dodaja, da ljudje morda niso bili dovolj motivirani pri pisanju izčrpnih odgovorov. »Vprašati se je potrebno še, kako operacionalizirati ustvarjalnost. Lahko uporabnost teh testov res posplošimo na vse ljudi? A z njimi preučujemo širok spekter ustvarjalnega mišljenja? Mislim, da zaradi tega kritično pregledujemo najvažnejše kazalce ustvarjalnega mišljenja.«
Ali so testi popolno merilo človeškega kreativnega potenciala, ni res bistveno. Bistveno je, da veliki jezikovni modeli hitro napredujejo in prekašajo ljudi, kot jih prej še niso. Ali grozi, da bodo nadomestili človeško ustvarjalnost, bomo še videli. Za zdaj se bodo avtorji osredotočili na načine, kako bi AI lahko deloval kot orodje za navdih, pomočnik pri kreativnem procesu posameznika ali pri preseganju fiksnosti.
Novinar