91精品国产91久久久久久蜜臀,99精品视频国产,天天操人人爽,精品久久久久久亚洲综合网站,欧美日韩在线二区,久久久久久99精品,精品欧美一区二区三区久久久

精準(zhǔn)識(shí)別AI生成內(nèi)容:讓AI“識(shí)破”AI

  • 中國(guó)青年報(bào)
  • 2025-08-18 14:53:16
近日,OpenAI發(fā)布新一代人工智能模型GPT-5,再次引發(fā)全球關(guān)注。隨著DeepSeek、ChatGPT、通義千問(wèn)、豆包等AIGC國(guó)產(chǎn)大模型逐漸變成人們學(xué)習(xí)、工作中的“生產(chǎn)力工具”,其伴生問(wèn)題也日益凸顯:AI經(jīng)常會(huì)“一本正經(jīng)地胡說(shuō)八道”,生成看似合理的虛假信息,即“AI幻覺(jué)”;依賴(lài)AI工具代寫(xiě)作業(yè)甚至畢業(yè)論文,沖擊著學(xué)術(shù)誠(chéng)信和規(guī)范;論文AI率檢測(cè)系統(tǒng)有待完善,論文被誤判的問(wèn)題時(shí)有發(fā)生……如何精準(zhǔn)識(shí)別AI生成內(nèi)容,成為亟待解決的熱點(diǎn)問(wèn)題。

近日,南開(kāi)大學(xué)計(jì)算機(jī)學(xué)院媒體計(jì)算實(shí)驗(yàn)室取得最新研究成果,不僅從評(píng)估的角度揭示了現(xiàn)有AI檢測(cè)方法的性能不足,還創(chuàng)新性地提出了“直接差異學(xué)習(xí)”優(yōu)化策略,教會(huì)AI用“火眼金睛”辨別人機(jī)不同,實(shí)現(xiàn)AI檢測(cè)性能的突破。相關(guān)成果論文已被計(jì)算機(jī)多媒體領(lǐng)域國(guó)際頂級(jí)會(huì)議ACM MM2025接收。

目前AI生成內(nèi)容檢測(cè)主要有兩種路線(xiàn):一種是“基于訓(xùn)練的檢測(cè)方法”,使用特定數(shù)據(jù)訓(xùn)練一個(gè)專(zhuān)用的分類(lèi)模型;另一種是“零樣本檢測(cè)方法”,直接使用一個(gè)預(yù)訓(xùn)練的語(yǔ)言模型并設(shè)計(jì)某種標(biāo)準(zhǔn)進(jìn)行分類(lèi)。

多項(xiàng)研究表明,現(xiàn)有檢測(cè)方法在應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)場(chǎng)景時(shí)常顯不足。此前曾有媒體報(bào)道,《荷塘月色》《流浪地球》等作品被某常用論文AI率檢測(cè)系統(tǒng)檢出高AI率。

為何現(xiàn)有的AI檢測(cè)工具會(huì)“誤判”?論文第一作者、南開(kāi)大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)科學(xué)卓越班2023級(jí)本科生付嘉晨解釋?zhuān)?ldquo;如果把AI文本檢測(cè)比作一場(chǎng)考試,檢測(cè)器的訓(xùn)練數(shù)據(jù)等同于日常練習(xí)題,現(xiàn)有檢測(cè)方法是機(jī)械刷題、死記硬背答題的固定套路,難以學(xué)會(huì)答題邏輯,一旦遇到全新難題,準(zhǔn)確率就會(huì)顯著下降。”

“要想實(shí)現(xiàn)通用檢測(cè),理論上需收集所有大模型的數(shù)據(jù)進(jìn)行訓(xùn)練,但在大模型迭代飛速的今天幾乎不可能。”付嘉晨說(shuō),讓檢測(cè)器真正學(xué)會(huì)舉一反三,即提升檢測(cè)器的泛化性能,是提升AI文本檢測(cè)性能的關(guān)鍵。

為此,研究團(tuán)隊(duì)另辟蹊徑,通過(guò)直接優(yōu)化模型預(yù)測(cè)的文本條件概率差異與人為設(shè)定的目標(biāo)值之間的差距,幫助模型學(xué)習(xí)AI文本檢測(cè)的內(nèi)在知識(shí),可以精準(zhǔn)捕捉人機(jī)文本間的深層語(yǔ)義差異,從而大幅提升檢測(cè)器的泛化能力與魯棒性。

“我們的檢測(cè)器如同有了‘火眼金睛’,即便只‘學(xué)習(xí)’過(guò)DeepSeek-R1的文本,也能精準(zhǔn)識(shí)別像GPT-5這樣最新大模型生成的內(nèi)容。”付嘉晨說(shuō)。

團(tuán)隊(duì)還提出了一個(gè)全面的測(cè)試基準(zhǔn)數(shù)據(jù)集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進(jìn)的開(kāi)源大模型(如Qwen等),從AI生成、潤(rùn)色、重寫(xiě)三個(gè)角度構(gòu)造了接近10萬(wàn)條人類(lèi)-AI文本對(duì)。

“MIRAGE是目前唯一聚焦于對(duì)商用大語(yǔ)言模型檢測(cè)的基準(zhǔn)數(shù)據(jù)集。直觀(guān)地說(shuō),之前的基準(zhǔn)數(shù)據(jù)集是由少而且能力簡(jiǎn)單的大模型命題出卷,而MIRAGE是17個(gè)能力強(qiáng)大的大模型聯(lián)合命題,形成一套高難度又有代表性的檢測(cè)試卷。”論文通訊作者、南開(kāi)大學(xué)計(jì)算機(jī)學(xué)院副教授郭春樂(lè)說(shuō)。

MIRAGE的測(cè)試結(jié)果顯示,現(xiàn)有檢測(cè)器的準(zhǔn)確率從在簡(jiǎn)單數(shù)據(jù)集上的90%驟降至約60%;而使用團(tuán)隊(duì)的檢測(cè)器仍保持85%以上的準(zhǔn)確率。與斯坦福大學(xué)提出的DetectGPT相比,性能相對(duì)提升71.62%;與馬里蘭大學(xué)、卡內(nèi)基梅隆大學(xué)等共同提出的Binoculars方法相比,性能相對(duì)提升68.03%。

“AIGC發(fā)展日新月異,我們將持續(xù)迭代升級(jí)評(píng)估基準(zhǔn)和技術(shù),致力于實(shí)現(xiàn)更快、更準(zhǔn)、更低成本的AI生成文本檢測(cè),以AI之力,讓每一篇成果更出彩。”研究團(tuán)隊(duì)負(fù)責(zé)人、南開(kāi)大學(xué)計(jì)算機(jī)學(xué)院教授李重儀說(shuō)。

關(guān)鍵詞:

分享到:
?
  • 至少輸入5個(gè)字符
  • 表情

熱門(mén)資訊

 

聯(lián)系郵箱:317 493 128 @qq.com 法律支持:廣東海新律師事務(wù)所 劉海濤 律師

粵ICP備2022077823號(hào)未經(jīng)授權(quán)不得鏡像、轉(zhuǎn)載、摘抄本站內(nèi)容,違者必究!Copyright 2016 IGDZC. All Rights Reserved

廣東之窗 版權(quán)所有