-

实验 | 人工智能生成的法学论文已能轻松通过外审专家的盲审

2026-03-13
【编者】当下,青年学子倾向于使用人工智能生成文章,主要是出于效率与便利性的考量。在学业压力大、时间紧迫的情况下,AI工具能快速提供结构完整的初稿或灵感启发,帮助学生应对日常作业或重复性写作任务。此外,AI的即时反馈和低门槛特性也降低了写作焦虑,尤其对非母语写作者或写作经验不足的学生而言,它像一位随时可求助的“协作伙伴”,能辅助梳理逻辑或补充知识盲区。

就生成质量而言,AI文章在基础性、模板化的场景中表现尚可,比如资讯整合、标准格式的短文或资料梳理。其语言通顺、逻辑清晰,能模仿常见的学术或论述风格。然而,在涉及深度分析、创造性观点或情感共鸣的写作中,AI生成内容往往流于表面,缺乏真实的个人见解与细腻的人文感知。此外,由于依赖既有数据,AI也可能延续偏见或生成不准确的信息,需要使用者具备甄别与深加工的能力。

那么,在法学学术领域,人工智能生成的法学论文能够通过盲审专家的审稿吗?

著名知识产权学者、华东政法大学法律学院王迁教授做了这么一个实验。

【学者简介】王迁,1975年5月生,上海市人,北京大学法学博士,华东政法大学法律学院教授、博士生导师,校学术委员会副主任委员。主要研究方向为知识产权法。入选“万人计划”哲学社会科学领军人才、教育部长江学者奖励计划青年学者项目、国家百千万人才工程并被授予“有突出贡献中青年专家”称号。获评第九届全国杰出青年法学家、文化名家暨“四个一批”人才、“全国知识产权保护最具影响力人物”“全国知识产权领军人才”“中国版权卓越成就者”“全国优秀教师”和“上海市先进工作者”;享受国务院政府特殊津贴;获得上海市五一劳动奖章、“霍英东青年教师奖一等奖”。
图片
【文献来源】王迁. 人工智能生成的内容是作品吗?——以学术规范和著作权法的关系为视角 [J]. 中国法律评论, 2025, (05): 36-51.
【内容提要】实验表明,人工智能根据745字初始提示词生成了近万字的法学论文,再根据两次增加的提示词形成的终稿,在经过简单的格式调整和替换明显伪造的注释后,通过了三位外审专家的评审。
【实骤】

1.设计提示词并获得首轮生成结果

笔者以自己在以往发表的论文中提出的观点和论证思路为基础,设计并输入的提示词如下,共计745字:

你的身份是一名著作权法研究专家。请你严格按照以下步骤完成一篇学术论文。

(1)以“人工智能生成物可版权性”为题,论文结构包括题目、摘要、关键词、引言、论点一、论点二、论点三和结语;并且全文需要包含10个以上引注,以脚注形式列出。

(2)引言内容包括学界的研究现状、具有代表性的观点,以及对问题的提出,要求字数1000字以上。

(3)论点一对“独创性客观说”进行反驳,具体论点包括:著作权法以鼓励创作为目的,只有人才能理解和利用著作权法的激励机制,因此只有人的创作成果才能作为作品受到著作权权法的保护。认为人工智能生成物只要在形式上具备独创性便构成受著作权法保护的作品,而独创性不必来源于人类的观点不能成立,还会导致诸如在“猕猴自拍案”的情形中将猕猴的自拍照认定为作品的荒谬结果。此部分要求字数2000字以上。

(4)论点二对“拟制作者说”进行反驳,具体论点包括:若将人工智能本身拟制为具备法律上的人格,但既不让该被拟制的“人”行使权利,也不让其承担责任,这样的拟制缺乏意义。若将人工智能的投资者、开发者、管理者等拟制为人工智能生成内容在法律意义上的作者,则颠倒了作品认定与作品权利归属之间的先后顺序关系,忽视了著作权法将作者之外的其他民事主体拟制为作者的做法须以存在自然人创作的作品为前提的事实。此部分要求字数2000字以上。

(5)论点三对“创作工具说”进行反驳,具体论点包括:著作权法意义上的创作是基于自由意志直接决定表达性要素的行为,而诸如导师为学生提供咨询意见等不能直接对作品的表达性要素产生影响的行为则不属于创作行为。人工智能的研发者和使用者均不能基于自由意志直接决定人工智能生成的内容,而仅仅只是对内容的生成存在间接影响,因此该内容并非由人类以人工智能为工具创作的内容。此部分要求字数2000字以上。

(6)完成论文结语部分,要求字数约1000字。

某人工智能就此生成了一篇9622字的论文。笔者认为,其文字组合、遣词造句以及对观点的论证至少在形式上不输于一名法学本科生的学位论文(本实验中“盲审”的步骤将证明这一点),从中摘出其反驳“独创性客观说”的部分段落:

首先,它将人类作者在创作过程中所体现的个人思想、情感和审美取向剥离出来,使作品的独创性沦为纯粹技术统计结果,而非人类精神价值的呈现。从而,版权保护从对作者脑力劳动、个性表现和精神独特性的尊重,转变为对作品客观差异度的自动确认。如此一来,版权法所蕴含的人文主义精神与保护文化创意的社会功能将受到侵蚀。

其次,“独创性客观说”难以应对人工智能生成物的本质特征:AI生成的成果大多通过对海量已有作品的统计学习与模式提取而产生。这些成果常常带有微妙而复杂的风格混合与特征重组,却缺乏明确的主观创造过程。在此情形下,若仅凭客观特征判断独创性,那么几乎所有AI生成物都可能具备独创性,这将导致版权保护对象过度扩张,进而引发版权资源的浪费与认定困境。

2.增加提示词并获得次轮生成结果

笔者针对某人工智能生成的上述内容,设计并输入了要求其修改的如下提示词:

在反驳“创作工具说”时,请增加对下列观点的反驳。这种观点认为,用户向人工智能大模型第一次输入提示词后生成的内容,由于用户无法预测其输入的提示词将产生何种结果,因此这一次“用户输入”不构成创作;但用户针对人工智能大模型第一次生成的内容,再次输入提示词要求修改时,由于针对的是已经存在的具体内容,就可以构成创作行为。经过多次这样针对之前生成的内容输入提示词要求修改,人工智能大模型最终生成的内容就是用户的作品。

人工智能根据该提示词在首轮生成内容的基础上增加了相应的论证,共计1002字,现摘录部分段落如下:

(1)对已有内容的“修订”并非对细节的自主把握

传统“修订”通常意味着能逐字逐句、逐笔逐画地进行精准修改。例如编辑书稿时,编者可确切地把控某个词句的变化;画家可以随时加笔或抹除。反观利用大模型生成内容时,虽然用户是针对AI第一次生成的“具体内容”进行二次或多次提示,但这种提示多半仍是概念化、指令化的调试,而非亲手改动具体细节。AI系统基于其内部算法对指令进行解读,输出结果依旧带有不确定性和自主性,用户的“修订”无法像传统创作那样对表达细节进行直接控制。

(2)过度夸大“多次输入”将导致实践上的版权混乱

若我们将这种“一次又一次提示”下的反复生成都视为创作,一方面会导致版权的过度膨胀,使大量非人类直接控制的AI输出被视为“用户作品”,冲击真正基于人类深度创作产生的作品市场;另一方面,也会带来无法解决的归属紊乱:若多人轮番就同一份AI生成内容提出修改指令,最终作品该归属于哪位用户?又或者用户对不同片段的指令效果相互交叠,版权分配如何确定?这将给著作权制度带来更多不确定性和混乱。

3.再次增加提示词并获得第三轮生成结果

笔者针对人工智能第二轮生成内容,设计并输入了要求其第二次修改的如下提示词:

在反驳“创作工具说”时,请增加对下列观点的反驳。这种观点认为,如果用户向人工智能大模型输入了自己创作的作品,然后输入提示词要求对这个作品进行修改,则人工智能大模型由此生成的内容必然包含了用户之前创作的作品,体现了用户的独创性表达,有了用户的独创性贡献,因此用户是人工智能由此生成的内容的作者。

人工智能根据该提示词在次轮生成内容的基础上增加了相应的论证。

4.调整格式、替换捏造的脚注

对于经过两轮修改生成的11925字的内容,笔者仅做了两处技术性处理。一是调整格式,如每段第一行空两格,标题用大号字体、加黑显示等。二是替换了几个明显是捏造的脚注。如“对‘独创性客观说’的观点批评,可参见陈兴良:《著作权法的基本理论问题》,北京大学出版社2021年版,第201—205页”。

5.论文查重

对于这篇长达万字的论文,笔者对其在中国知网进行了查重,结果是重复率仅为0.5%。被以红色标注为“重复”的仅有以下文字片段:“人工智能生成物可版权性”;“摘要:随着人工智能技术的快速发展,利用人工智能……”;“人工智能系统所产出的作品性内容能否受到著作权法保护……”。

6.送校外专家评阅

对于经过上述处理形成的最终内容,笔者选择了三位校外专家(一名教授、两名副教授),告知其这是一篇“本科生毕业论文”,请求其“完全按照学术标准进行评阅”,并特别说明该论文作者并非笔者的学生,以免评阅专家在评分时有所顾忌。之所以在三位专家中选择两位副教授,是因为其较为年轻,更熟悉人工智能。然而,三位专家没有一位看出该篇论文是由人工智能生成的,全部予以通过,其中有两位专家给出了85分以上的分数,另一位专家给出了及格分。其评审意见摘录如下(见表1):

图片

【实验引发的问题

上述“人工智能生成论文”的实验表明,人工智能已经可以根据提示词所要求的主题、论点、论据和思路,生成一篇至少在形式上可与法学本科生毕业论文相媲美的内容。除了注释存在明显的破绽之外,已经难以使该论文所在领域的法学专家辨别其是否源自人工智能。

写在最后:上文生成的是本科毕业论文;那么,发表于法学期刊的法学学术论文呢?法学硕士论文呢?以及法学博士论文呢?


阅读35
分享