Bahnbrechende Forschung zu dem, was sie sagte

Die überraschende Wirksamkeit und Langlebigkeit des mittlerweile legendären Das hat sie gesagt Witz, kürzlich wieder populär gemacht mit Hilfe von Das Büro , hat mehr getan, als Millionen mit einer reflexartigen Reaktion auf beiläufige Gespräche zu versorgen. Es hat jetzt eine neue Ebene der gesellschaftlichen Bedeutung erreicht, indem es ernsthafte linguistische Forschung inspiriert hat. Es kommt in Form eines Forschungspapiers namens Das hat sie gesagt: Doppelte Entender-Identifikation , verfasst von zwei Informatikstudenten, Chloe Kiddon und Yuriy Brun .

In ihrer Arbeit skizzieren die beiden ihre Kreation der Double Entender über Substantivübertragung oder DEviaNT Ansatz, der automatisch erkennt, was sie sagte (TWSS) Witze. Sie nennen ihren Ansatz metaphorische Analyse, die eine ganz eigene Doppeldeutigkeit trägt und darauf basiert, bestimmte Wörter als sexier als andere zu gewichten. Das Team gewichtete mehrere sexy Substantive und Verben und ließ dann ihren Algorithmus laufen.

Bei ihren Recherchen entdeckten die beiden auch einige interessante Regeln für TWSS-Witze. Zum Beispiel das Risiko, einen TWSS-Witz falsch zu beschwören. Aus ihrer Studie:

In einem sozialen Umfeld sind die Kosten beispielsweise hoch, wenn sie unangemessen sagt, was sie gesagt hat, während die Kosten, es nicht zu sagen, wenn es angebracht gewesen wäre, vernachlässigbar sind.

Um dies anzugehen und bessere Ergebnisse zu erzielen, setzte das Team einen Lernalgorithmus ein. Dadurch wurde unter anderem die Erzeugung von falsch-positiven 100-mal höher eingestellt als falsch-negative.

Nachdem Sie DEviaNT durch eine Reihe von vorab identifiziertem TWSS-Witzmaterial und zufälligen Zitaten geführt haben. In ihrem Test verwendeten sie 1,5 erotische Sätze und 57.000 nicht-erotische Sätze. Das Team sagt, dass sie eine Erfolgsquote von über 71,4% erreicht haben. Auch wenn dies nicht viel erscheinen mag, sagt das Team, dass es bei einem größeren Datensatz Ergebnisse in der Nähe von 99,5 % erwarten würde. Außerdem lieferte DEviaNT einige interessante Ergebnisse. Nochmals aus der Studie:

DEviANT gab 28 solcher Sätze zurück (alle sind mit hoher Wahrscheinlichkeit ein TWSS), von denen 20 richtig positiv sind. Allerdings sind 2 der 8 falsch positiven Ergebnisse tatsächlich TWSSs (trotz negativer Testdaten): Ja gib mir die Sahne und er ist weg. und Ja, aber sein Loch stinkt manchmal wirklich.

Einige mögen von dieser Forschung ablenken und nennen sie einfach eine Lerche und von geringem Wert. Dies wäre ein Low-Blow-Angriff, da selbst die Forscher ihre Arbeit als schweres Problem beim Verständnis natürlicher Sprache beschreiben. (Das hat sie gesagt.)

( Neuer Wissenschaftler über Der Austeiger )