Prelomový výskum o tom, čo povedala

Prekvapujúca účinnosť a životnosť teraz už legendárneho to je to čo povedala vtip, nedávno znovu popularizovaný pomocou Kancelária , urobil viac než len miliónom ľudí, ktorí odpovedali na bežné rozhovory. Inštitúciou seriózneho lingvistického výskumu teraz dosiahla novú úroveň spoločenského významu. Prichádza vo forme výskumného príspevku s názvom To je to, čo povedala: Identifikácia dvojitého účastníka , ktorej autormi sú dvaja študenti informatiky, Chloe Kiddon a Jurij Brun .

Vo svojich prácach dvojica načrtla svoju tvorbu súboru Double Entender via Noun Transfer alebo DEviaNT prístup, ktorý automaticky identifikuje vtipy, ktoré povedala (TWSS). Svoj prístup nazývajú metaforická analýza, ktorá má dvojaký význam a je založená na vážení určitých slov ako sexuálnejších ako ostatných. Tím zvážil niekoľko sexy podstatných mien a slovies a potom spustil svoj algoritmus.

Vo svojom výskume dvojica tiež odhalila niekoľko zaujímavých pravidiel pre vtipy TWSS. Napríklad riziko nesprávneho vyvolania vtipu TWSS. Z ich štúdie:

Napríklad v sociálnom prostredí sú náklady na to, čo povedala nevhodne, vysoké, zatiaľ čo náklady na to, že to nepovedia, keď to bude možno vhodné, sú zanedbateľné.

Na riešenie tohto problému a na dosiahnutie lepších výsledkov použil tím výučbový algoritmus. Toto okrem iného nastavilo vytváranie falošných pozitívov stokrát viac ako falošných negatívov.

Po spustení programu DEviaNT prostredníctvom série vopred identifikovaných vtipných materiálov TWSS a náhodnej ponuky. Pri teste použili 1,5 erotickej vety a 57 000 neerotických viet. Tím hovorí, že dosiahli úspešnosť viac ako 71,4%. Aj keď sa to nemusí zdať veľa, tím tvrdí, že pri väčšom množstve dát by očakávali výsledky bližšie k 99,5%. Okrem toho program DEviaNT vrátil niekoľko zaujímavých výsledkov. Opäť zo štúdie:

DEviaNT vrátil 28 takýchto trestov (všetky sú spojené s najväčšou pravdepodobnosťou TWSS), z ktorých 20 je skutočných pozitív. Avšak 2 z 8 falošných pozitívov sú v skutočnosti TWSS (napriek tomu, že pochádzajú z negatívnych údajov z testovania): Áno, dajte mi všetku smotanu a je preč. a jo, ale jeho diera niekedy naozaj vonia.

Niektorí môžu tento výskum odvrátiť a nazvať ho jednoducho škovránkom a málo hodnotným. Išlo by o slabý útok, pretože aj vedci popisujú svoju prácu ako tvrdý problém s porozumením prirodzeného jazyka. (To je to čo povedala.)

( Nový vedec cez The Escapist )