V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
meetalpha
V2EX  ›  OpenAI

如何检测一段文本是否是 ChatGPT 等 AI 生成的?

  •  1
     
  •   meetalpha · 2022-12-06 10:01:15 +08:00 · 9443 次点击
    这是一个创建于 723 天前的主题,其中的信息可能已经有所发展或是发生改变。

    必要性

    1. AI 可以瞬间生成答案,答案又可以大量复制粘贴,挤占了论坛的回答位置。
    2. AI 很多是胡说八道,但是一本正经的回答,容易让人产生是正确答案的错觉。

    思路

    • AI 的回答,通常:1.语体过于一本正经 2.全篇围绕提问的几个关键字回答 3.不带感情色彩

    • 真人的回答,1.或多或少带有自己的感情色彩和主观评价 2.即使回答得比较正式,大多也不会像 AI 那样过于一本正经 3.可能存在错别字和标点符号使用不恰当。

    人能看出来这些区别很容易,但是按照现有的技术,机器能不能检测?

    64 条回复    2022-12-08 16:56:44 +08:00
    cwcc
        1
    cwcc  
       2022-12-06 10:06:30 +08:00   ❤️ 4
    我能想到的就是用 AI 来对抗 AI 。
    ixcode
        2
    ixcode  
       2022-12-06 10:07:04 +08:00   ❤️ 1
    用同样的问题用 ChatGPT 生成答案,与原文去对比,大概率有很多内容是一样的
    Maboroshii
        3
    Maboroshii  
       2022-12-06 10:08:40 +08:00
    你问问 ai ,这句话是你说的吗? “xxxxxx” 他会说啥啊
    icyalala
        4
    icyalala  
       2022-12-06 10:09:15 +08:00   ❤️ 1
    ChatGPT 是有人设的,"采用了先进的、注重道德水平的训练方式",所以现在大概能一眼看出来。
    等以后换个人设,就不那么好分辨了。。
    Exdui
        5
    Exdui  
       2022-12-06 10:29:06 +08:00
    检测一段文本是否是 AI 生成的有以下几种方法:
    1.查看文本的内容:如果文本内容极其生硬、不连贯或者结构极其复杂,那么很可能是 AI 生成的。
    2.对比不同源的文本:如果能够比较两段不同源的文本,发现它们的语言结构、表达方式或者语义都非常相似,那么更可能是 AI 生成的。
    zhouyg
        6
    zhouyg  
       2022-12-06 11:24:13 +08:00   ❤️ 10
    我看第 5 楼这种风格就像 AI 回答的
    amirobotics
        7
    amirobotics  
       2022-12-06 11:27:23 +08:00
    我觉得目前的 AI 没法像人那样使用特殊的语言,

    比如:
    1. 你说啥 = 你说什么
    2. 今晚要 oxox ?=今晚开房吗?

    还有就是节奏,ai 会一直绕一大圈才给你答案,看的好像是答案那样。

    其次就是人类容易犯错,比如错别字,标点符号等等。。。
    yiikZero
        8
    yiikZero  
       2022-12-06 11:28:47 +08:00
    检测一段文本是否是 AI 生成的有以下几种方法:
    1.查看文本的语法和语言结构。机器生成的文本通常没有人类写作的流畅性和自然。
    2.比较文本与其他已知机器生成的文本的相似度。如果这段文本与其他机器生成的文本相似,那么它很可能是由机器生成的。
    3.检查文本中的语义和逻辑。机器生成的文本通常难以理解,而且常常包含逻辑错误或混淆的语义。
    4.对文本进行人工评估。如果一段文本让人感到困惑或难以理解,那么它很可能是由机器生成的。

    总的来说,要确定一段文本是否是由 AI 生成的,需要综合考虑多种因素。
    milukun
        9
    milukun  
       2022-12-06 11:34:19 +08:00   ❤️ 8
    开头重复一遍问题,结尾带有「总的来说」
    MossFox
        10
    MossFox  
       2022-12-06 12:00:38 +08:00
    呃,要我来辨别的话,可以先看看排版。

    1. 标点符号的使用:
    ChatGPT 在标点符号的使用上,会按照标准来。如果你发现一个人的回复里面, 中文语段存在中英文标点混用, 错用,那么一定是真人;

    2. 列表序号与文字直接的空格:
    --^ 标准排版下,这个空格肯定存在。如果没有这个空格,一定是真人;

    3. 段落分行:
    可以观察每个段落之间有没有多余的换行。
    没有的话,一定是真人 (? 这个倒不确定)。

    4. 中英混排的表现:
    如果中文和西文之间没有有意留出的 space ,那一定是真人。

    嗯,总的来说,我至少不是机器人。
    MossFox
        11
    MossFox  
       2022-12-06 12:02:20 +08:00
    等下,我才反应过来中英混排的表现是 V2EX 自动修正的,上一层那边我很确定我有意没加空格……
    VZMZZZ
        12
    VZMZZZ  
       2022-12-06 12:05:16 +08:00
    那么,请找出这个主题偶下面所有的 AI 回复
    yyf1234
        13
    yyf1234  
       2022-12-06 12:05:17 +08:00 via iPhone
    很容易辨认吧,跟[注意看,这个男人叫小帅差不多]
    swulling
        14
    swulling  
       2022-12-06 12:07:55 +08:00
    @yiikZero 这个就是 AI 的回答吧。。
    swulling
        15
    swulling  
       2022-12-06 12:09:22 +08:00
    Q: 如何检测一段文本是否是 ChatGPT 等 AI 生成的,不要加”总之“和”总的来说“,语言更通俗一些。
    A:要检测一段文本是否是 AI 生成的,可以看看它是否说得通,是否搞错了事实,或是否有类似于已知 AI 文本的模式。如果文本中有语法错误、事实错误、或与已知 AI 文本相似的模式,那很可能是 AI 生成的文本。
    swulling
        16
    swulling  
       2022-12-06 12:09:35 +08:00
    @milukun 可以很容易规避掉~
    DOLLOR
        17
    DOLLOR  
       2022-12-06 12:13:14 +08:00   ❤️ 1
    看到长篇大论没有重点的车咕噜废话,直接跳过即可。
    无论是人类写的还是 AI 写的。
    zooo
        18
    zooo  
       2022-12-06 12:25:20 +08:00
    完了,我已经分辨不出来下面的回答是不是 ai 回复的了。。。
    ahu
        19
    ahu  
       2022-12-06 12:30:51 +08:00   ❤️ 4
    MeteorCat
        20
    MeteorCat  
       2022-12-06 12:31:23 +08:00 via Android   ❤️ 2
    问他宫廷玉液酒
    MiketsuSmasher
        21
    MiketsuSmasher  
       2022-12-06 12:52:51 +08:00
    根据我昨天晚上玩出来的经验,给你要问的问题里面埋几个坑,如果是真人回答问题的话,是不会踩进去的。而 ChatGPT 会踩进去,或者拙裂地忽略掉。

    比如说 ChatGPT 对“意大利面拌 42 号混凝土怎么做好吃?”的回答,可以看到它明显没有避开大坑:

    意大利面拌 42 号混凝土可以搭配不同的酱汁来做,比如番茄酱、芝士酱、蛤蜊酱等,还可以加入蔬菜、肉类、蘑菇等来搭配,可以根据自己的口味来调整,做出美味可口的意大利面拌 42 号混凝土。
    MiketsuSmasher
        22
    MiketsuSmasher  
       2022-12-06 12:56:04 +08:00
    再比如说,如果 ChatGPT 对问题里模糊不清的地方猜得不对,就会:

    Q:世界杯买德国还是买日本
    A:这取决于你的偏好。如果你喜欢德国的风格,那么买德国的球衣可能更好;如果你喜欢日本的风格,那么买日本的球衣可能更好。

    显然,提问者要问的不是买哪国的球衣。
    ShinichiYao
        23
    ShinichiYao  
       2022-12-06 12:59:34 +08:00
    当 AI 知道要故意犯点错的时候人类就真完了
    pennai
        24
    pennai  
       2022-12-06 13:02:23 +08:00
    楼里的辨识方法,经过训练 AI 也同样会具有这些特征。。。
    WinkeyLin
        25
    WinkeyLin  
       2022-12-06 13:04:57 +08:00 via Android
    三段式结构,很好认
    Jenny12
        26
    Jenny12  
       2022-12-06 13:06:13 +08:00
    用魔法打败魔法
    yolee599
        27
    yolee599  
       2022-12-06 13:09:37 +08:00 via Android
    @yiikZero 我看这个回复好像 AI 回复
    d3vil
        28
    d3vil  
       2022-12-06 13:10:35 +08:00
    楼里说的这些特征,AI 都可以进行学习改善,能不能说点学习不了的?
    bravecarrot
        29
    bravecarrot  
       2022-12-06 13:17:56 +08:00 via iPhone
    生成对抗学习啊
    很早就有人研究了
    Cabana
        30
    Cabana  
       2022-12-06 13:39:16 +08:00
    @MiketsuSmasher #21 现在再问这个问题,他已经会回复说这是一道虚构的菜肴了 😧
    cosette
        31
    cosette  
       2022-12-06 13:41:28 +08:00   ❤️ 2
    为了让生成的文本看起来有意义,目前 chatGPT 采用了非常正式的行文风格。但总的来说,AI 的好与坏还是在于是否表达出了特定的意义,因为 AI 不具备人的需求和欲望,所以只有两种结果,一种是 AI 通过学习互联网上的文本,找到可能的匹配文本,让对话看起来好像是有意义的(说得通的),第二种就是 AI 基于语言学模型纯粹的脑补,胡说八道。

    从行文格式上来讲,基于语法句法的东西 AI 最终都可以学会,包括互联网语言的一些使用习惯,甚至可以表现出某种“道德倾向”、“政治倾向”,因为这些本身就是基于符号的,再者就是基于语段和语篇的分析,也可以把一些套话、常识学习的很好,变成一个非常“聪明”的鹦鹉,总而言之,任何基于“符号”的甄别方法对不断进步的 AI 来说,最终都是很难奏效的。
    milukun
        32
    milukun  
       2022-12-06 14:00:35 +08:00
    @swulling 哈哈哈 但是你还是忘了开通重复问题。「要检测一段文本是否是 AI 生成的」,AI 味太浓了。
    weixiangzhe
        33
    weixiangzhe  
       2022-12-06 14:10:59 +08:00
    这贴子里就有好多 AI,我都魔振了
    mlhadoop
        34
    mlhadoop  
       2022-12-06 14:47:25 +08:00
    如果答案正确,是不是 ai 回答的这个问题 还值得探讨吗? 毕竟找到答案就好了?
    ershierdu
        35
    ershierdu  
       2022-12-06 14:59:16 +08:00
    @mlhadoop #34

    StackOverflow 的 ban 掉 chatgpt 的原因:The primary problem is that while the answers which ChatGPT produces have a high rate of being incorrect, they typically look like they might be good and the answers are very easy to produce. There are also many people trying out ChatGPT to create answers, without the expertise or willingness to verify that the answer is correct prior to posting.

    https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
    lusfold
        36
    lusfold  
       2022-12-06 15:04:02 +08:00
    对于判断一段文本是否是 AI 生成的,一个常用的方法是人工阅读该文本并根据其内容、语言使用情况、语言流畅程度、内容的逻辑性等因素进行判断。如果文本内容较为简单、语言使用不够自然、内容缺乏逻辑性,那么这段文本很可能是 AI 生成的。

    如果您想进一步确定一段文本是否是 AI 生成的,您可以尝试使用一些 AI 文本检测工具,这些工具通常会使用一些算法来分析文本内容和语言使用情况,并给出一个可信度分数,指示这段文本是否可能是 AI 生成的。这些工具并不能百分之百地准确判断一段文本是否是 AI 生成的,但是它们可以作为一种参考,帮助您更准确地判断文本的真实性。
    douniwan5788
        37
    douniwan5788  
       2022-12-06 15:26:35 +08:00
    检测是否是 AI 生成的其实是本末倒置,真正应该检测的是大量胡说八道的垃圾回复,单纯检测 AI 只是取巧的方式,而且会越来越难了
    yiikZero
        38
    yiikZero  
       2022-12-06 15:46:35 +08:00
    @yolee599
    @swulling
    是的。
    CL007
        39
    CL007  
       2022-12-06 16:12:51 +08:00
    用 AI 对抗 AI ,成了生成式对抗网络 gan ,最终 AI 的输出越来越像人类
    izzy27
        40
    izzy27  
       2022-12-06 16:18:34 +08:00
    好问题,CV 里面有检测图片是否有 AI 生成的研究方向吗? 如果有的话,这感觉也是一个研究方向
    MegrezZhu
        41
    MegrezZhu  
       2022-12-06 16:39:28 +08:00
    LZ 的问题基本等价于图灵测试
    Suonna
        42
    Suonna  
       2022-12-06 17:00:36 +08:00
    @lusfold 您这个是 ai 输出的吧
    zjvbqla
        43
    zjvbqla  
       2022-12-06 17:08:14 +08:00 via iPhone
    @milukun 老胡觉得,此处省略若干。总的来说,此处省略
    ufan0
        44
    ufan0  
       2022-12-06 17:15:54 +08:00
    这让我想到了图灵测试,可怕。
    SaltyMouse
        45
    SaltyMouse  
       2022-12-06 17:43:57 +08:00
    @MiketsuSmasher 我试了下,得到的回答是:“我不具备烹饪能力,所以无法为您提供关于如何让意大利面拌 42 号混凝土变得更美味的建议。不过,我可以告诉您一些基本的原则,例如选择新鲜的高质量的食材、注意烹饪温度和时间、尝试不同的调料和调味料等。如果您想要了解更多具体的信息,我建议您尝试搜索互联网或与专业人士讨论。”
    SaltyMouse
        46
    SaltyMouse  
       2022-12-06 17:46:29 +08:00
    测试对于音乐、食品、电影等事物,都会回复没有鉴赏的能力:“由于我是一个计算机程序,我没有听过《夏日晚风》这首歌曲,所以无法为您提供任何评价。我只能根据给定的信息回答问题,而我并不具备听觉能力,也无法进行浏览操作。如果您想要了解更多关于这首歌曲的信息,我建议您尝试搜索互联网或与其他人讨论。”
    g001
        47
    g001  
       2022-12-06 17:48:09 +08:00
    如果您想要检测一段文本是否由 AI 生成,您可以采用以下方法:

    检查文本的语言质量。AI 生成的文本通常没有人类语言的流畅和灵活性,常常存在语法错误和表意不清的情况。如果一段文本语言质量较差,那么它很可能是由 AI 生成的。

    检查文本的主题和内容。AI 生成的文本通常是基于某些规则或模板生成的,内容和主题会比较单一和有限。如果一段文本内容重复或毫无意义,那么它很可能是由 AI 生成的。
    FG4084
        48
    FG4084  
       2022-12-06 18:02:12 +08:00
    @yiikZero 看着像 AI 生成的
    ariza
        49
    ariza  
       2022-12-06 18:16:51 +08:00
    GAN
    kb666
        50
    kb666  
       2022-12-06 18:45:41 +08:00
    当前没有绝对可靠的方法可以完全准确地检测一段文本是否是 AI 生成的。这类 AI 生成的文本常常很难区分出来,因为它们可能包含经过深度学习模型训练的语言特征和语法结构,看起来和人类写的文本非常相似。

    虽然如此,但是我们可以根据一些特征来判断一段文本是否可能是 AI 生成的:

    在句子结构上,AI 生成的文本通常会更加规范和符合语法规则。
    在表达内容上,AI 生成的文本通常会更加清晰明了,不会出现语义模糊或不连贯的情况。
    在语言风格上,AI 生成的文本通常会更加平淡无奇,不会有太多的修辞手法或个人风格。

    当然,这些都只是可能性,并不能作为严格的检测标准。如果你想确定一段文本是否是 AI 生成的,最好的方法是直接询问生成该文本的 AI 系统。
    Citronl
        51
    Citronl  
       2022-12-06 18:46:47 +08:00
    通常来说,通过以下方法可以检测一段文本是否是 AI 生成的:

    检查文本的语法是否正确。AI 生成的文本通常会有一些语法错误,而人类写的文本通常语法较为正确。

    检查文本的表达是否通顺。AI 生成的文本通常会有一些表达不通顺的地方,而人类写的文本通常表达较为流畅。

    检查文本的内容是否真实可信。AI 生成的文本通常会有一些内容不真实的地方,而人类写的文本通常内容较为可信。

    当然,这些方法并不万能,并不能保证 100% 准确地检测出所有 AI 生成的文本。但通常来说,通过这些方法可以大致判断出一段文本是否是 AI 生成的。
    Citronl
        52
    Citronl  
       2022-12-06 18:50:17 +08:00
    我和楼上都是 AI 生成的😂
    imdong
        53
    imdong  
       2022-12-06 19:09:52 +08:00 via iPhone
    字多就是 AI
    missqso
        54
    missqso  
       2022-12-06 20:03:26 +08:00
    AI 技术正快速发展,新生代 AI 代表 ChatGPT 已在行业中大放异彩。在社交媒体上,越来越多的用户利用 ChatGPT 生成机器人来发表文字,但如何确定一段文本是不是 AI 生成的?本文将简要介绍如何检测一段文本是否是 ChatGPT 等 AI 生成的。

    首先,要想判断文本是否是 AI 生成的,最直观的方法是简单地看一下语言风格是否正常。一般来说,AI 生成的文本句子结构会较为僵硬,语意也很难把握,而人类写出的文本常常会更加通顺流畅。此外,可以搜索关键字,AI 生成的文本中常常会出现比较生硬的重复词组,这也可以成为判断 AI 生成文本的一个参考。
    autoxbc
        55
    autoxbc  
       2022-12-06 21:32:49 +08:00
    建议不要进行猎巫运动,不然搞得人人自危,最终会毁掉论坛氛围
    HulkLee
        56
    HulkLee  
       2022-12-06 22:13:13 +08:00
    StackOverflow 已经开始禁止 chatGPT 的答案了,但是好奇,他们怎么识别的。嘿嘿
    darknoll
        57
    darknoll  
       2022-12-06 22:21:47 +08:00
    目前还没有一种完全可靠的方法能够准确地检测一段文本是否是 AI 生成的。但是,一般来说,机器生成的文本通常会有一些特征,比如语法不正确、表述不通顺、内容缺乏真实性等。如果一段文本存在这些特征,那么它很可能是 AI 生成的。

    此外,也可以通过对比不同模型生成的文本的差异来判断一段文本是否是 AI 生成的。因为不同的 AI 模型,包括 ChatGPT 等,在生成文本时会有一些明显的差异,比如语言风格、主题和内容等。因此,如果一段文本与已知模型生成的文本存在明显差异,那么它很可能是另外一个模型生成的。

    当然,无论采用哪种方法,都不能保证 100% 准确地检测到所有 AI 生成的文本。因为 AI 模型会不断演进,并且能够生成更加逼真的文本,所以检测 AI 生成文本的方法也会不断发展和改进。
    xujinkai
        58
    xujinkai  
       2022-12-06 23:04:21 +08:00 via Android
    🤣这楼里的长回答搞得我怀疑人生了
    resol341
        59
    resol341  
       2022-12-07 00:16:43 +08:00
    说您的都是 ai
    vinsa
        60
    vinsa  
       2022-12-07 08:15:40 +08:00
    我们可以通过高级的技术手段来检测一段文本是否是由 AI 生成的。我们可以利用人工智能和机器学习的技术,对文本进行深入的分析,以确定它是否符合人类的写作方式。我们还可以利用大数据和云计算技术,来检测文本中是否有明显的模板化和重复的语句,这些都是 AI 生成文本的特征。

    当然,这只是我模仿马斯克的口吻来回答这个问题,实际情况可能会有所不同。
    Baoni
        61
    Baoni  
       2022-12-07 08:42:30 +08:00
    把这楼里的长回答都 b 掉就可以了?
    zw1one
        62
    zw1one  
       2022-12-07 09:32:04 +08:00
    越来越像狗屁不通生成器了
    zu0322
        63
    zu0322  
       2022-12-07 10:58:24 +08:00
    我问了,它是这么说:
    一种方法是检测文本中的语言特征,例如词频和语法等。如果文本中出现了一些不太常见的词汇或者语法结构,或者在相对较短的文本中包含了大量的信息,那么这很可能是 AI 生成的。

    但是,目前的 AI 模型已经非常强大,所以很难完全准确地区分 AI 生成的文本和人类写的文本。有时候,即使是人类也无法完全准确地判断一段文本是否是 AI 生成的。因此,检测 AI 生成的文本可能并不是一件容易的事情。
    kknd22
        64
    kknd22  
       2022-12-08 16:56:44 +08:00
    要求他输出的时候带上注释:此段文字由 AI 生成,不得删除本注释
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1710 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 16:46 · PVG 00:46 · LAX 08:46 · JFK 11:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.