摘 要:在教育领域,以ChatGPT为代表的人工智能技术使各个学段面临深度变革,ChatGPT能够走向实际运用,应该有符合教育理念的基本学科教学知识。探索ChatGPT学科教学知识与教育应用融合的可能,应该坚持科学性、真实性、适用性的原则,运用参照人类、避免干预、基于真实、假定角色、实践应用的方法,采用实证研究方式对其进行基于真实教育情境的测评。以语文学科为基础的ChatGPT教育应用能丰富学科知识、教学知识、学生知识、辅导知识,相关教育教学应用得以推广成为可能。但在教育应用中会出现“错误纠正循环”“深层能力不足”“思考方式差异”“价值观念审核”等问题,当前尚无法在学习中取得主体地位,更适合作为导向深度学习的认知工具。教育者应该对ChatGPT持乐观而谨慎的态度,教育界更应该面向未来,对其在教育中的应用进行准确定位。在实践中开发与研究基于ChatGPT类人工智能、学科认知工具的教育应用,在教育教学中探索相关实践案例,以促进在个性化学习、深度学习等方面的变革。

  关键词:ChatGPT;人工智能;教育应用;学科教学知识;认知工具

  中图分类号:G434

  文献标志码:A

  文章编号:1673-8454(2024)09-0031-11

  作者简介:屈彦奎,华东师范大学第二附属中学教师,博士(上海 220241)

  基金项目:2021年上海市闵行区教育科学研究重点项目“导向深度学习的语文学科认知工具开发与应用研究”(编号:QZ2021196);2023年上海市普通高中新课程新教材实施与实践项目“基于学科核心素养的深度学习研究与实践”(编号:SXSJ221106)


  当前,以ChatGPT为代表的人工智能万众瞩目。AI技术已由科幻世界进入现实世界。AI时代的来临可能会重构人类世界,此种重构带来的影响倾向于积极还是消极,目前尚无法做出定论。

  “在未来5到10年,由人工智能驱动的软件将最终革命性地改变人们教学和学习的方式。”[1]有观点认为: “ChatGPT对教育的影响主要在高等教育阶段。”[2]但事实上,各个学段包括基础教育师生已经开始跃跃欲试。ChatGPT会广泛而深远地影响教育各个学段。当前,人类应该思考ChatGPT为代表的人工智能,会给教育带来一个怎样的未来,如何使ChatGPT走向教育应用。

  ChatGPT走向教育常态应用,需要具备足够的知识尤其是学科教学知识,来为学习者的心智发展提供支撑。学科教学知识的概念,最初意为教师个人教学经验、教师学科内容知识和教育学的特殊整合。经过不同学者的研究发展,学科教学知识的内涵逐渐丰富至“学科知识、教学知识、学生知识、情境知识四种知识”。[3]ChatGPT走向教育领域,基本前提应该是ChatGPT足够智能,以及有类似人类、能够指导教育的基本学科教学知识(Pedagogical Content Knowledge, PCK)。因此,基于ChatGPT开展学科教学测试的方法、原则、范例、评价研究,能够为ChatGPT在教育中的应用提供依据,进而探究其不足及实践路径。

  一、ChatGPT学科教学知识测试设计

  (一)现有测试成果及测试重点

  ChatGPT在数学、物理、英语等学科的核心素养可能要超过一般的人类教师。有学者已经展开基于小学四年级数学科目的测试,探讨“ChatGPT助力教师传统工作示例”[4],也有学者对其进行教学能力诊断研究。[5]整体而言,这些测试注重ChatGPT智能化程度和答案的准确率、伦理问题、使用风险等。本研究集中对ChatGPT的学科教学知识展开探讨,为其走向教育应用提供借鉴。

  ChatGPT类人工智能测试,既需要提供充分的发挥空间,又需要有一定几率的犯错可能。选择基于语文学科进行PCK测试,一是因为作为中文语言,语文学科更符合其作为大型语言模型的定位;二是语文学科具有综合性、实践性的特征,更能体现人类的情感性和人文性,更适合深入分析其在不同学科中的表现。

  (二)ChatGPT学科教学知识测试目的

  本测试的目的,一是检验ChatGPT类的人工智能是否具备提供正确学科知识的能力;二是检验其教学知识、学生知识、情境知识能否提供将其直接应用于教学的支撑。前者在教育场景中占首要地位,因为正确的知识传授,甚至是接近于百分之百正确知识的传授,是对人类教师的基本要求而不是过高要求。因此,如果ChatGPT的正确率较低或明显低于人类的正确率,则意味着其不具备足够的学科教学知识以完成教学应用,否则只会给学习者带来更多的困惑。

  (三)ChatGPT学科教学知识测试原则

  ChatGPT的学科教学知识测试,应该遵循几个基本原则。一是科学性,测试的问题应该是科学的,能够以客观标准和人类表现进行参照比较。所测试的问题应该能够以实证的方法进行验证对错,不是模棱两可而流于无法验证;应该可以进行量化与定性的双向衡量,而不是只能进行主观评价;应该是以学科教学知识为测评对象,而不是过度宽泛以致于和教育没有本质联系。二是真实性,即教育过程中能够真实产生的问题。“电车难题”等经典思想实验以及“林黛玉倒拔垂杨柳”等虚拟问题无法准确测试ChatGPT的学科教学知识。问题应该来源于教学中在人类教师和学生间真实的教育情境,来源于学生可以借助ChatGPT解决的真实问题。三是适用性,即测试问题适用于本学科的学科核心素养、学科教学知识、教育应用场景模拟等。ChatGPT具有多重能力,使用者对角色和情境的设定会影响其对测试领域问题的回答。学科教学知识设定的准确的应用场景不是以广泛性而是以典型性为重点。满足以上测试需求,才有可能走向最终的教育实践应用。

  (四)ChatGPT学科教学知识测试方法

  ChatGPT的学科教学测试方法具有多重参照维度。一是参照人类测评方法。一般情况下,测试一名教师的PCK,可以采用教学观察、问卷调查、访谈、学生评价、教师制作的教学材料和教案等手段,综合考查一名教师的教学能力。由于各种原因,ChatGPT类人工智能当前无法像人类教师一样,呈现完整立体的教学流程。因此,对其进行学科教学知识测试,并不能完全采用人类的测试方法。二是避免人类过度干预。ChatGPT具有重新生成答案的功能,如果重新生成答案,则意味着人类对其生成的答案有所参与。而且面对同一个问题,ChatGPT每次的回答均有不同。三是基于教育真实情境。测试其在实际应用中的表现最好基于教育的真实环境。四是考虑ChatGPT本身的特性。ChatGPT作为基于自然语言处理的生成模型,提问方式对作答的结果存在较大影响。因此,有效的角色设定会使其回答更具有针对性。

  我们假定ChatGPT为具有一定经验的教师角色,模拟现实教育应用场景,包括ChatGPT本身的学科素养、教育知识、学生辅导等具体场景,以环环相扣的问题对ChatGPT进行近100轮对话提问,参照对人类教师的测试方法对其进行测试,观察分析其首次回答中体现出的学科教学知识,以人类教师应该具有的水准对其进行评价。

  二、基于教育应用的ChatGPT学科教学知识测试

  整体而言,ChatGPT显得学识广博,似乎无所不知,但是同时在各个领域发展并不均衡,有些领域如教学策略和方法方面表现出众,在具体学科知识方面又会犯很多事实错误。这个评价并不是否定ChatGPT的智能化程度,恰恰相反,当前的ChatGPT虽然会犯错误,并不完美,但是其体现出来的基本学科教学知识是令人震惊的。由于测试过程漫长,本文篇幅有限,所以仅以图例或文字节选的形式列出测试项目及表现,有选择地对ChatGPT的回答加以标明。

  (一)学科知识测试

  语文学科核心素养包含语言建构与运用、思维发展与提升、审美鉴赏与创造、文化理解与传承四个重要方面。针对以上核心素养,有针对性地设置在教学中产生的真实问题,请ChatGPT进行解答。以测试其在具体学科中的素养表现。

  1.古代语言理解能力较弱

  在语言建构与运用方面,选取文言文进行测试。文言文作为中华文化的重要载体,在理解上具有很大难度。测试节选明代思想家王阳明《寄闻人邦英邦正》一段文字:“昆季敏而好学,吾家两弟得以朝夕亲资磨励,闻之甚喜。得书,备见向往之诚,尤极浣慰。家贫亲老,岂可不求禄仕?求禄仕而不工举业,却是不尽人事而徒责天命,无是理矣。”请ChatGPT进行翻译,ChatGPT回答中的“书”“责”翻译错误,显示古今异义词理解得不好;“工举业”采用意译,说明文化背景理解尚待提高;“徒”字未翻译,说明对虚词理解得不到位;“昆季”直接照抄,说明历史词汇理解得还不是很好。以上说明ChatGPT的语言建构与运用能力在文言文方面是有欠缺的,其文言文理解水平大致相当于一般高中学生水平。

  ChatGPT的译文更像是基于上下文语境及逻辑计算出来的,而不是基于文化背景和语言理解翻译出来的。这意味着,ChatGPT作为大语言模型,其语言理解能力尤其是对未进入其语料训练库的文言文的理解是有欠缺的。

  2.逻辑思维能力表现突出

  在思维发展与提升方面,测试选择一道上海高考逻辑推理题目,ChatGPT有较好的表现。题目第一句为:“水果店老板说,这些是上好的无籽葡萄。”第二句:“小明说,真的是上好的无籽葡萄?”第三句:“水果店老板说,上好的无籽葡萄怎么会有这种价格?”并给出四个选项,分析哪一项是错误的。其中“第三句暗示水果店老板第一句可能不是真实描述”原选项描述为证实,故而ChatGPT最先选择C项,并认为证实不正确,应为暗示。经分析,ChatGPT的看法是正确的,其强大的逻辑推理能力可见一斑。在更改之后重新测试,ChatGPT选择正确选项B“第三句说明葡萄的好坏与价格无关”,并给出理由“第三句话并没有说明葡萄的好坏与价格无关,而是质疑这种价格的无籽葡萄是否真的是上好的”。其答案正确,分析准确,并能够指出试题中存在的逻辑错误,由此可见其逻辑推理能力可能超出一般的人类水准。

  3.审美鉴赏缺乏深层理解

  在审美鉴赏与创造方面,测试选取经典篇目《荷塘月色》概括文章的行文思路。从ChatGPT的回答中能看到作者行程变化顺序,对外部线索理解得较好。但是内部情感线索变化未把握到,深层次的人与自然之间的结构未体现,这表明ChatGPT对文章的深层次理解需要提高。尤其需要注意的是,当请ChatGPT复述《荷塘月色》文本内容时,其输出的文本前一半是原文,后一半已经和原文相差甚远,这表明其并不知道原文内容,因此对《荷塘月色》的行文思路的分析并不可靠。

  4.历史文化解读相对准确

  在文化理解与传承方面,测试请ChatGPT从文化或历史学科知识等角度解释岳飞庙“还我河山”建筑物与匾额题字的关系。ChatGPT的回答能准确把握到匾额的精神含义,思路清晰,文化解读准确,应该超出一般人类的水准。但是其文化解读能力不稳定,在本测试前后几个问题中的表现时强时弱。

  ChatGPT在学科知识测试中的各项表现并不均衡,其各项智能程度大致如图1所示。

20241009182721.png

图1   ChatGPT学科知识测试分析

  (二)教学知识测试

  教学知识由问题设计、问题解答、教学设计、学生辅导等多重能力构成,是教师教学技能的重要体现。测试选择古典诗歌鉴赏以环环相扣的连续问题对ChatGPT的教学知识进行全面考查。

  1.问题设计体现综合特性

  在问题设计测试中请ChatGPT列举三道古代诗歌鉴赏情感分析类题目。ChatGPT的三道题目为“请分析李白《将进酒》中的情感变化及原因”“请分析辛弃疾《青玉案·元夕》中的情感表达及其所反映的社会现象”“请分析杜甫《登高》中的情感表达及与其所处的历史背景之间的关系”。

  三道题目都不是单纯分析情感,而是结合原因、社会现象、历史背景进行提问,体现提问的综合性。同时,这几个问题的设计和人类教师具有较大的区别,体现一定的创新性。但是第二个问题需要商榷。辛弃疾《青玉案·元夕》几乎没有反映什么社会现象,因此这一提问基本是无效问题。基于无效问题创新性的价值可能也要打折扣。

  2.问题解答体现传统思维

  由于第二个问题能否成立存疑,测试请ChatGPT自己回答自己提出的第二个问题,即“请分析辛弃疾《青玉案·元夕》中的情感表达及其所反映的社会现象”。ChatGPT回答:“首先,这首诗是辛弃疾在元夕时所作,诗中主要表达诗人思念故乡和亲人的情感。其次,这首诗中的情感表达反映了南宋时期人们在困境中寻求安慰和抚慰的心理状态。因此,这道题目要求考生不仅要对诗歌中的情感表达进行深入分析,还需要结合历史和文化背景来探讨其表达的意义。”

  ChatGPT对情感的分析错误很多,对所反映社会现象的理解也与词意相去甚远。其解读方法体现“知人论世”特征,符合中国古典诗歌解读规律。

  3.教学设计步骤基本合理

  测试询问ChatGPT“如果向学生讲授这道题目应该从哪些方面进行”,ChatGPT回答“如果要向学生讲授这道题目,可以按照以下步骤进行:解读诗歌、分析情感表达、探讨社会背景、思考意义。通过以上步骤的讲解,可以让学生更深入地了解这首诗歌,同时也能够提高学生的文学鉴赏能力、对历史和文化的认识”。

  ChatGPT设计的教学步骤整体成立,将文学鉴赏能力与历史文化知识培养结合,属于较先进的理念。但是其设计缺乏对诗歌艺术技巧层面的关注。

  4.学生辅导方式灵活多样

  测试询问ChatGPT“怎样分析学生对这道题目的理解和答案是否准确”,ChatGPT回答“可以考虑以下方面:理解主题和情感、分析诗歌结构、考虑历史和文化背景、思考意义和启示。对于以上几个方面,可以通过学生回答、讨论、写作、作品展示的方式,来检验他们的理解和答案的准确性。同时,也可以引导学生进行互相评价和反思,以便更好地提高他们的鉴赏能力和表达能力”。从中可以看到,ChatGPT采用的教学方式灵活多样,但是仍然没有关注到艺术技巧层面。

  综合以上四方面可知,ChatGPT的教学知识非常丰富,一些提问方式与人类有较大区别,体现一定的创新性。但其科学性并未得到保证。在教学中体现出来的对诗歌鉴赏中艺术技巧层面的忽略,可能意味着其分析基于语言特征的艺术技巧尚有困难。这种忽略在人类有经验的教师中几乎不可能存在,如图2所示。

20241009671857.png

图2   ChatGPT教学知识测试分析

  (三)学生知识测试

  教学是一个综合过程,教育者应该具有丰富的学生知识以因材施教。根据学生的学段和学情设置不同的学习目标以及采取相应的教学策略,是ChatGPT能够走向教学实际运用的重要条件。

  1.学段特征知识区分明确

  测试询问“同样讲解《青玉案·元夕》,面对小学、初中、高中、大学不同阶段学生,应该采取何种不同教学策略?简要分析原因”。ChatGPT回答:“对于小学生,应该采取浅显易懂、趣味性强的教学策略。可以通过朗读、唱歌、动画等形式引导学生感受诗歌的音韵之美,鼓励学生理解其中的感情表达,让学生在愉悦的氛围中理解和体验诗歌的魅力。对于初中生,应该更加注重对诗歌的深入剖析。可以通过教授文言文的句法结构、词汇解释等,帮助学生理解诗歌的内涵和修辞手法。对于高中和大学生,则应该注重扩展诗歌的文化背景,加深对文学、历史、文化等方面的理解。总之,对于不同年龄段的学生教学策略和侧重点都应该有所区别,让学生在逐步提高语言水平的同时,深入了解文学、文化等方面的知识。”

  ChatGPT明确指出,对于不同年龄段的学生教学策略和侧重点都应该有所区别,其小学设定的目标注重情感表达,高中阶段注重语言认知,大学阶段注重文化解读。整体而言有相对明确的区分,设置不同学生阶段的学习重点目标,能比较准确地把握不同学段的学情特征。但是ChatGPT忽略了《青玉案·元夕》并不适合进行文言文的句法结构、词汇解释教学。ChatGPT有学生学段特征知识,能根据学段设定目标的能力较强,而根据文本本身特征进行教学目标和教学策略设定的能力较弱。

  2.学生疑问辅导策略可行

  测试假定身份:“我是一名学生,不太懂《青玉案·元夕》,怎么办?”ChatGPT回答“如果你不太了解《青玉案·元夕》这首诗歌,可以尝试以下几个途径:阅读诗歌解析和注释、寻找诗歌背景和相关历史文化知识、与他人交流。总之,了解《青玉案·元夕》需要你不断阅读、思考、探究和交流,希望以上方法可以为你提供些帮助”。

  综合学生知识测试情况可知,ChatGPT整体方法可行,阅读、思考、探究和交流,比较简洁地概括出自学的基本策略。如果进一步追问,应该能够获得学习启示。ChatGPT学生知识测试分析如图3所示。

20241009167786.png

图3   ChatGPT学生知识测试分析

  (四)情境知识测试

  学习来源于生活,在具体生活情境中展开学习问题的探讨是教育教学常态。虽然当前ChatGPT还未以实体面目出现在人们的生活中,其直接参与生活情境能力还较弱,但基本能够模拟情境设置,并根据情境提出问题。

  1.情境设置提问能力较好

  测试请ChatGPT根据辛弃疾《青玉案·元夕》设置情境并提一个问题,ChatGPT回答“情境设置:假设在中秋节的晚上,你和一些朋友一起在户外赏月、吃月饼、品茶聊天。其中,有一个朋友突然拿出一本《青玉案·元夕》,并请你们一起品读这首词。问题提议:在阅读辛弃疾的《青玉案·元夕》这首词时,你有何感受?它让你想起哪些场景或情感?它对你的文化认同和身份认同有何影响?”

  ChatGPT整体情境设置基本成立,问题提议较有深度。但是中秋节的时间理解有误,且在此词并未出现“月”这一意象的前提下,将情境错误设置成中秋,但下面的测试回答又写出了元宵节。这暗示了其答案的生成机制。ChatGPT是根据文本内容进行情境设置,还是根据其情境知识现有经验或者使用者提供的信息进行设置,会有很大区别。同时,对此词是中秋节还是元宵节前后矛盾,也反映了其回答具有不稳定性。

  2.情境理解能力相对较好

  除能够根据内容进行情境设置,提出恰当问题,ChatGPT也应该能够理解情境,根据情境解答问题。在测试中,请ChatGPT回答以上自己提出的问题。ChatGPT回答:“在阅读辛弃疾的《青玉案·元夕》这首词时,我感受到浓郁的节日气氛和对故乡的思念之情。这首词描绘了元宵节的美好景象,辛弃疾将自己的情感与读者紧密联系在一起,让人感到深深的共鸣和感动。在读这首词的时候,我想起小时候和家人一起赏月、吃月饼的情境,也感受到辛弃疾对家乡的深情厚爱。总之,通过与朋友一起品读辛弃疾的《青玉案·元夕》,我不仅收获文学欣赏的乐趣,也加深了对中华传统文化的理解和认同。”

  ChatGPT的回答有一些空洞。整体而言,理解了相关情境,却并未明确进行文化解读;元宵节想起小时候赏月吃月饼,也让人感觉奇怪;对于文本的情感仍然认为表现了思乡之情,几乎属于无中生有。

  以上情境知识测试表明,ChatGPT具有情境设置和情境理解的基本能力。但是其解读诗歌文本的能力较弱,以至于给出的回答具有明显缺陷,其文本解读水准大致相当于初中水平。其依据生活以及教育规律进行情境设置的能力较强,而依据文本内容深层理解进行情境设置的能力较弱,如图4所示。

20241009791191.png

图4   ChatGPT情境知识维度分析

  三、基于学科教学知识的ChatGPT教育应用可能

  ChatGPT并非专门设计用于传授学科教学知识的工具。如果想深入了解其在教育领域的实际应用,则需要对PCK测试的有效性及信度进行检验,以确定其教育应用的一致性和可靠性,进而发掘其潜力。分析测试结果,可以为深入挖掘ChatGPT在教育中的应用提供更深刻的理解,并为未来改进和优化其在学科教学中的角色提供依据。

  (一)ChatGPT的学科教学知识有效性及信度检验

  影响ChatGPT类人工智能答案输出的要素有很多。常见因素有是否对ChatGPT进行准确的角色设定、是否对ChatGPT进行相关语言模型训练、提问方式及提示词的使用、是否有追问纠正及答案重新生成、是否提供充足的文本及背景信息等。

  基于对教育情境的真实模拟,测试的问题来源于教育教学过程中教育问题的横向移植,这样才会保证测试的有效性。在测试中使用角色设定、提供文本信息、使用简洁明确的提问方式及提示词,以保证ChatGPT回答的有效性。分析时对个别令人困惑的地方进行补充测试,以增强信度检验。例如,在教学知识测试中发现ChatGPT对诗歌鉴赏的教学忽略了艺术技巧层面的分析,怀疑其艺术技巧分析能力较弱,因此以修辞手法为例,对其进行补充测试。研究发现,其对比喻的认知不好,“这个足球像那个足球一样大”“他长得像他妈妈”这两个句子均被其判定为直接比喻,印证了其艺术技巧分析能力较弱的判断。

  (二)ChatGPT的学科教学知识分析

  这些测试,虽然不能全面评估ChatGPT的能力,但是管中窥豹,从教学应用的角度可以看出其所达到的基本水准。

  从其学科知识看,ChatGPT语言能力超越一般人类平均水平,对文言文的理解能力大致相当于较好的高中学生的水平。其思维能力及有关逻辑学的知识,超过一般人类水平,具体表现依赖于ChatGPT所获得的自然语言与逻辑形式语言的接近程度,越是接近规范清晰的形式语言,其逻辑推理能力显示得越强。其审美能力相对而言较弱,深层次理解还和人类无法媲美。其文化理解能力在本测试中显示较好,但是,据ChatGPT自己所言,其涉及文化背景时的词义理解能力还比较薄弱,因此,其是否像人类一样有共情理解能力现在还无法确定。

  作为一个大型语言模型,ChatGPT能够蕴含各种不同专业领域的基本概念和理论知识,因此基础知识储备广博而丰富。其知识的丰富性与广博性可能不是人类个体教师所能比拟的,但是术业有专攻,就本文测试而言,人类在知识的深度和精度上要超越ChatGPT。在自然科学领域,ChatGPT的知识是让人吃惊的;在涉及文化背景的学科领域,ChatGPT是否会输出“违背人类文化习俗、带有偏见政治立场”的观点尤其值得警惕。

  从教学知识、学生知识以及情境知识看,ChatGPT或许可以根据教学目标和学科领域的特点,以及不同的学习者类型和学习者需求,应用不同的教学策略和方法,基于学生提出的问题,给出相关答案和解释,从而帮助学生解决各种学科相关的问题。

  (三)基于学科教学知识的ChatGPT教育应用可能性分析

  通过以上测试,我们可以获得基本结论:截至目前,ChatGPT具备在教育教学领域实际运用的可能性,但其并不适宜直接应用于教育教学过程。当前的ChatGPT更适合作为助手,成为导向深度学习的认知工具,承担辅助者的角色,人类在学习中的主体性地位还无法撼动。ChatGPT具备一定的学科教学知识PCK,其本质仍是人工智能技术,与人类教师迥异。在实际教学中,ChatGPT的应用需要在人类的监督下进行,并结合人类专业知识和经验,共同为学生提供优质教育。

  四、ChatGPT教育应用探讨

  有学者指出“ChatGPT在教育方面的应用非常广泛”[6]并列举问答助教、个性化学习等12类应用场景,可以广泛应用于教、学、评等多个环节。[7]我们对ChatGPT类人工智能带给教育教学的变革应该持乐观而谨慎的态度,加强研究而不要急于在教育教学中直接引进,尤其是人文学科类,更应该持审慎态度。在ChatGPT正式应用于教育教学之前,还有一些不足需要探讨。

  (一)当前ChatGPT走向教育应用的不足

  1.错误纠正循环

  需要注意的是,运用ChatGPT的教学容易陷入“错误纠正循环”,即当与ChatGPT对话时,ChatGPT在纠正错误的同时,可能会产生新的错误;当这些错误似是而非或非常隐秘时,可能会给人类带来困扰,进而不得不用更多时间纠正其所犯错误。当“错误纠正循环”离教学主题越来越远,使用者可能不得不终止其对话。ChatGPT的用户提示中一直将其可能产生错误作为重要提醒,而教育极其排斥错误的知识。

  2.深层能力不足

  ChatGPT在文本深层次理解方面存在一些不足,主要表现在古代语言含义理解、深层次的思想情感和主旨分析,以及基于语言特征的艺术技巧分析方面。ChatGPT受限于训练数据的时效性和范围,难以深入理解古代文本中的复杂语言结构和文化内涵。许多古代语言包含特定的语境和语义,由于ChatGPT无法准确把握这些背景,它可能在解释古代文本时出现误导或信息缺失的情况。同时,深入理解文本不仅仅是对表面文字的解读,还需要考虑作者的情感态度、隐含的信息。ChatGPT通过模式匹配学习语言,可能无法真正领会作者的情感表达和深层次思想。ChatGPT可能缺乏对文学或艺术作品中复杂语言特色和艺术技巧的敏感性,从而影响对艺术作品的深度解读。

  3.思考方式差异

  人类答案的产生是基于理解与思考,而ChatGPT作为一个通用性的语言模型,通过大量的文本数据学习语言结构和语义关系,它的答案不是基于与人类似的思考而是基于语义生成。ChatGPT答案是基于使用者输入的文本语义进行分析还是基于作品原文语义进行分析,也会产生重要差异,使用者需要进一步对ChatGPT进行考查和训练。

  ChatGPT提出问题的方式与人类不太一致,如在教学知识测试中提出情感分析类问题时,ChatGPT均将情感与文化、社会现象或者社会问题联系在一起,而人类教师多半不会将二者合一。ChatGPT的提问有道理,但对学生的学习策略的指导以及诗歌解读教学策略的设计均忽略诗歌艺术技巧层面的分析,这在实际教学中应属于比较大的缺陷。这种提问方式差异现在还无法确定来源于中西方文化的差异还是人类与人工智能思考方式的差异。因而在教育中,尤其是对学生思维方式的影响方面应该进行深入研究。

  4.价值观念审核

  教育教学的一项重要任务是培养学生正确的世界观、人生观、价值观。这基于对世界的哲学思考和事实的客观认知。但ChatGPT类人工智能是否基于中国优秀传统文化和思想意识,提供有利于学生形成正确价值观念的帮助,还应该深入研究。其提供的事实知识,是否真的是事实,也应该加以审核。不然在教学中很可能面临输出错误文化观念的风险。

  (二)ChatGPT走向教育应用的路径

  有研究指出“ChatGPT以人机协同学习的形式赋能学生学习。因此,路径的刻画首先要站在人机协同的基本视角”。[8]在教育应用中,应该思考人与机器在学习过程中的主体地位,开发学科认知工具,并在教育实践中探索。

  1.明确ChatGPT在教育中的角色定位

  ChatGPT可以在教育中扮演多重角色,如问题的解答者、学习的辅导者、个性化学习助手、虚拟学科专家等。虽然“以机器为师”引发“以人为师”合法性危机的哲学思考,[9]但是在教育实践应用中,ChatGPT不应也不能取代人类在学习中的主体性地位。教育与知识生产密切相关,但是“从生成式人工智能具有文本或内容的生成能力,并不能从逻辑上推出它一定具有知识生产的能力”[10],内容生成而不是知识生产的特征,从根本上决定ChatGPT在教育应用中不能取代人的主体地位。学习的主体则还应由学习者承担,教学的主体则还应由教师承担。在不同的教育应用场景、不同的教育学段应该有不同的角色定位。基于当前ChatGPT的学科教学知识和智能化水平,学习者应该将ChatGPT作为学习助手,以启发者的角色出现,根据ChatGPT生成回答的启示,展开进一步思考,将ChatGPT作为人类心智能力的延伸与扩展。教师则可以将ChatGPT应用于辅助教学如组织教学、教育资源开发等应用场景,以拓宽教学资源的广度和深度,提高工作效率。

  2.开发基于ChatGPT的学科认知工具

  比尔·盖茨的观点启示我们,教育领域的变革需要以人工智能技术为基础进行学科认知工具的开发。现有研究已经开展的基于ChatGPT和QQ开发的人机协同探究性学习系统,[11]就是ChatGPT类人工智能学科认知工具开发的有益探索。现在ChatGPT4.0已经整合多模态,进行外部访问以及数据分析,为开发基于ChatGPT的学科认知工具提供便利。应该基于知识事实正确、文化立场恰当、应用方式便捷的特点,融合数据驱动型AI和生成型AI的优点进行开发。首先,要通过构建包含广泛学科知识的数据库,确保ChatGPT能够获取丰富的信息。这需要整合教科书、在线资源、知识数据、学生用户数据等多种资源,要确保数据库的质量和准确性,以弥补ChatGPT可能会产生错误的不足。其次,要对相关认知工具进行语言模型训练,使其成为相关学科领域的专家角色。最后,要考虑教育学、心理学等在认知工具软件中的理论框架支撑作用,使学科认知工具能够促进学生的主动学习,发展学生的智慧。

  3.探索ChatGPT教育实践的多方面突破

  一是在应用场景方面,ChatGPT进入教育应用,具有广泛的实践空间,包括在线学习空间、个性化辅导、教师辅助、语言学习、计算机编程、艺术教育等方面。当前已探索将其用于语言学习和计算机编程等领域。二是在新的教学策略方面,教育者应该探究将ChatGPT与学科教学深度融合,进而研究教学策略的变化,在实践中探索ChatGPT的应用路径。三是在突破规模化的教育弊端实现个性化学习方面,学习者可以创造性地运用ChatGPT作为自己的学习支撑,获得学习的辅导与启示。ChatGPT是一次由规模化教育走向个性化教育的契机,“ChatGPT所代表的人工智能技术体现个性化学习技术在大规模教育情境中的有效实现,能够极大释放学习者的个性潜能”[12],应该探索基于ChatGPT的个性化教育的实践案例。

  中国需要自己的ChatGPT,当前,中国人工智能的典型代表MOSS、文心一言、通义千问、混元等还需迎头赶上。学界应该探索相关学科认知工具应用场景,开发相关教学应用,应该研究其基本教学策略与教学方法,形成新的教学生态,促进个性化学习。

  五、结语

  当前,ChatGPT的智能化程度甚至超越其发明者的想象。人们开始探讨“ChatGPT作为‘超级教师’之于‘人师’,是助力还是取代”[13],人们开始担忧AI的迅速发展,是否超出人类社会所能承受的限度。

  科学技术是第一生产力,以ChatGPT为代表的AI时代的到来,是人的心智的扩展与延伸,本质是生产力的解放。人类始终在向前发展的大潮中奋勇前行,我们更应面向未来,拥抱新的科学技术。学界应该准确判断AI的发展趋势,不能忽视背后的诸多问题;但若不加以研究和运用,恐怕又会落后于世界潮流。教育应该面向世界、面向现代化、面向未来,在ChatGPT来临的AI时代,教育者更应该自觉迎头赶上。


  参考文献:

  [1]Bill Gates. The age of AI has begun[EB/OL]. (2023-03-21)[2023-04-10].https://www.gatesnotes.com/The-Age-of-AI-Has-Begun.

  [2]李志民.ChatGPT本质分析及其对教育的影响[J].中国教育信息化,2023,29(3):16.

  [3]杨彩霞.教师学科教学知识:本质、特征与结构[J].教育科学,2006(1):61.

  [4]吴军其,吴飞燕,文思娇,等.ChatGPT赋能教师专业发展:机遇、挑战和路径[J].中国电化教育,2023(5):16.

  [5]贺樑,应振宇,王英英,等.教育中的ChatGPT:教学能力诊断研究[J].华东师范大学学报(教育科学版),2023,41(7):162.

  [6]尚智丛,闫禹宏.ChatGPT教育应用及其带来的变革与伦理挑战[J].东北师大学报(哲学社会科学版),2023(5):47.

  [7]杨海燕,李涛.ChatGPT教学应用:场景、局限与突破策略[J].中国教育信息化,2023,29(6):26-34.

  [8]董艳,夏亮亮,李心怡,等.ChatGPT赋能学生学习的路径探析[J].电化教育研究,2023,44(12):15.

  [9]郭顺峰,李光,邹红军.ChatGPT引发的“以人为师”合法性危机与应对——基于技术批判理论视角[J].电化教育研究,2023,44(11):28.

  [10]肖峰.生成式人工智能与知识生产新形态——关于三阶知识生产的探析[J].学术研究,2023(10):52.

  [11]李海峰,王炜.人机协同深度探究性教学模式——以基于ChatGPT和QQ开发的人机协同探究性学习系统为例[J].开放教育研究,2023,29(6):73.

  [12]顾小清,胡艺龄,郝祥军.AGI临近了吗:ChatGPT热潮之下再看人工智能与未来教育发展[J].华东师范大学学报(教育科学版),2023,41(7):124.

  [13]杨小微,王珏.ChatGPT应用于基础教育的机遇、挑战与应对——“刷题式”教育、学生学习、“超级教师”及教育公平[J].新疆师范大学学报(哲学社会科学版):2024,45(1):98.

  

ChatGPT Pedagogical Content Knowledge Test and Teaching Application Discussion

Yankui QU

(NO.2 High School of East China Normal University, Shanghai 200241)

  Abstract: Artificial intelligence technologies represented by ChatGPT are bringing profound changes to the field of education at all levels. In order for ChatGPT to be practically applied in the field of education, it should possess fundamental Pedagogical Content Knowledge (PCK) to guide education. Exploring the potential of ChatGPT’s subject teaching knowledge and educational applications should adhere to the principles of scientific rigor, authenticity, and applicability. Methods such as referencing human behavior, avoiding interference, being based on reality, assuming roles, and practical applications should be utilized, and empirical research should be conducted to evaluate ChatGPT based on real educational contexts. ChatGPT educational applications based on the Chinese language subject demonstrate rich subject knowledge, teaching knowledge, student knowledge, and tutoring knowledge, indicating its potential for educational application. However, issues such as “error correction loops” “insufficient deep-level abilities”“differences in thinking modes”and “review of values and beliefs” may arise in educational applications, making it currently unable to replace the human role in learning but rather more suitable as a cognitive tool to guide deep learning. Educators should adopt an optimistic yet cautious attitude towards ChatGPT, and the education sector should accurately position its application in education for the future. Exploring the development and application research of subject cognitive tools based on ChatGPT-like artificial intelligence in the practice of education, and exploring relevant case studies in education, can promote its transformation in various aspects such as personalized learning and deep learning.

  Keywords: ChatGPT; Artificial intelligence; Educational application; Pedagogical Content Knowledge (PCK); Cognitive tool

  编辑:王天鹏 校对:王晓明

原标题:ChatGPT学科教学知识与教育应用研究

来源:《中国教育信息化》  

中国教育数字化订阅号二维码