AIが書いたレポートを見破る方法

AIが書いたレポート課題の回答をどうやって見破るか、という話で、対策を考えた論文が出たそうです。

A watermark for chatbots can spot text written by an AI


本論文(査読前のプレプリント)は下記です。面白い論文です。疑似プログラミング言語でアルゴリズムが説明してあります。
https://arxiv.org/abs/2301.10226
エントロピーが高い文書だけに適用できる方法と断ってあります。
組にして使う単語の組み合わせを多数作っておいて、AIはその使い方でAIであることを示すというものです(守るべきリストgreen listと破るべきリスト red list を作っておく)。人間はそのリストを知らないので破ったり破らなかったりするので区別できるとのことです。しかし単語のリストが出まわったら人間らしく改変するプログラムが作れてしまいますね。昔のスパイ小説には、海外向け放送の定時ニュースでアナウンサーがトチったら作戦決行の合図、など面白い仕組みがあったのを連想しました。特定のつづりを間違える、米英でつづりが違うものの選び方なども候補になりえますね。

さらに、OpenAI社自身も先週、AIが書いた文書を見分けるツールを公開したそうです。
https://gptzero.me/
https://www.technologyreview.com/2023/02/07/1067928/why-detecting-ai-generated-text-is-so-difficult-and-what-to-do-about-it/
(こっちはMIT technology review英語版)によると、単語の選び方が単調なのをAIとみなす、とのことで、我々non-nativeはAIと認定されて不利益を被るかもしれません。恐怖ですね。
どうでもいいおふざけに、こういうのもあります↓。同誌が紹介しているので大丈夫でしょう。
https://catgpt.wvd.io/

英語は、上記記事と論文から拾います。
watermark 透かし (例えばお札にある本物の印。すかして見ると見えるので透かしといいます)
“Get a holistic score for how much fo the document is written by AI”
holistic ホウ「り」スティック 全体論の、全身の level 12
“The watermark is detectable from only a contiguous portion of the generated text.”
contiguous  コンティンギュアス 接触した、隣接した、切れ目のない level 16
contingent 偶発的な、~に左右されて、不定の level 10
a fee/renumeration contingent upon success 成功報酬, contingent expenses 臨時費、 a contingent event 不測の事態
His success is contingent on his efforts. 彼の成功は努力次第だ
contageous コンテイジアス 伝染性の level 9
“One of the biggest changes ushered in by ChatGPT might be the shift in how we evaluate written text.”
usher  「ア」シャ 案内係、(動詞)先導する level 6 語源はラテン語で「ドア係」だそうです。
セリフをとちる fluff one’s line, falter in one’s speech, make an error, make a slip
fluff 綿毛、 綿ごみ、失敗、とちり、若い娘  擬態語でしょう。いろいろな意味があります。 level 11
falter 「フォ」ーるター つまづく、よろめく、どもる、口ごもる level 9 

Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA