News Center

新闻中心

迈向通用人工智能时代:从ChatGPT谈起

发布人: 发布时间: 2023-06-25 12:13:43 阅读数:

(注:本文转载自深圳大学城图书馆,原文链接: https://www.utszlib.edu.cn/activity/view/9628.html?locale=zh_CN )

讲座题目:迈向通用人工智能时代:从ChatGPT谈起

主讲嘉宾:陈清财,哈尔滨工业大学(深圳)教授

讲座时间:2023/06/10 14:30-16:30

讲座地点:深圳大学城图书馆四楼413报告厅

       2023610日下午,哈尔滨工业大学(深圳)教授,哈尔滨工业大学(深圳)智能计算研究中心主任陈清财教授做客大学城新论·名家讲座,为听众们带来自然语言处理大模型技术进展及通用人工智能技术的前沿分享。陈清财教授及其团队从事深度学习、自然语言处理、医学文本处理、人机交互等领域的研究工作多年。经过上亿用户的测试,ChatGPT已经事实上通过了图灵测试,这也宣告了一个崭新的、迈向通用人工智能的时代已经开启。围绕如何应对ChatGPT所带来的技术变革,陈教授从自然语言处理技术的发展说起,通过对ChatGPT等一系列新出现的大语言模型的发展过程、能力来源与边界、迈向通用人工智能仍然需要完成的任务等进行探讨,以更加理性地思考新一代智能技术所带来的挑战与机遇。                                              

人工智能与自然语言处理

20221130日发布以来,ChatGPT5天内实现用户数过百万,2个月内实现用户数过亿,以非封装应用的形式带来了人工智能领域颠覆性的革新。对此,比尔·盖茨表示“人工智能时代已经开始”,同时埃隆·马斯克则对人工智能技术的发展提出担忧“我们离强大到危险的AI只有一步之遥”。为了了解“ChatGPT到底是什么、它是如何产生以及ChatGPT之后我们将进入什么时代”,陈教授从人工智能诞生开始,逐步追溯人工智能技术的发展历程与人工智能的目标。

人类第一台电子计算机ENIAC1946年诞生,其功能专用于军方炮弹弹道轨迹计算,ENIAC所包含的冯诺依曼计算机体系结构实现了计算机硬件结构通用化。1937年,艾伦·图灵在《论数字计算在决断难题中的应用》论文中提出“图灵机”概念,将人的计算行为抽象化为数字逻辑机,成为通用计算机的理论基石。1950年,图灵发表论文《机器能思考吗》,其中提出“图灵测试”,将计算机推向智能高度,使得“人工智能”的概念首次成型,图灵也因而被誉为“人工智能之父”。

图灵测试中,判断机器是否具有智能的标准在于让机器人冒充人和裁判对话,如果10个裁判中有3个误以为在和自己说话的是人而非计算机,则可认为该计算机具有“智能”。陈清财教授认为,语言是真实世界的映射,若计算机能够通过图灵测试,则表明计算机对真实世界的知识的理解水平至少达到了人类,因此,自然语言与机器智能具有紧密关联。自然语言处理(Natural Language ProcessingNLP)的核心问题在于,让机器和人能够用人类的语言(自然语言)进行交互。

1956年达特茅斯暑期研讨会中,“人工智能”概念被首次正式确立,人工智能的目标在于让机器能像人那样认知、思考和学习,即用计算机模拟人的智能。自此之后,人工智能历经了数个周期性发展阶段,包括人工智能诞生初始的起步发展期、由算力与理论匮乏导致的反思发展期、专家系统蓬勃发展的应用发展期、研究进展缓慢的低速发展期、互联网推动人工智能不断创新和实用的稳步发展期及深度学习与大数据兴起带来的人工智能蓬勃发展期。

空间技术、能源技术、人工智能成为二十世纪七十年代以来世界三大尖端技术;基因工程、纳米科学与人工智能成为二十一世纪世界三大尖端技术。陈清财教授将人工智能技术的长盛不衰归因于人工智能研究问题的复杂性与广泛应用性。从系统的视角,人工智能系统可分为四种类型:基于任务和结果导向的理性思考系统与理性行动系统,以及基于拟人和通用化的像人一样思考的系统和像人一样行动的系统。理性系统基于功能分解与最优化结果,导致人工智能系统功能的碎片化并阻碍人工智能服务于人类的能力。因此,拟人化与通用化成为未来人工智能发展的重要方向。

自然语言表示与ChatGPT

为进一步厘清ChatGPT的能力来源与能力边界,陈教授从自然语言处理技术的发展沿革,介绍一系列新型大语言模型的发展过程。自然语言处理任务可分为基础型任务与应用型任务。其中,基础任务主要包含语义分析、句法分析、自然语言生成、语篇语用学等,针对如何表示与理解字词句等文本内容;应用任务则主要包含信息抽取、问答系统、情感分析、对话交互系统等。

由语言表示驱动的NLP技术发展,可主要分为符号主义、概率主义与深度学习三个阶段。符号主义阶段中,自然语言处理停留在经验主义思潮阶段,以基于规则的方法为代表,虽然解决了一些简单的问题,但是无法从根本上将自然语言理解实用化。概率主义阶段中,NLP利用带标注的数据,基于人工定义的特征建立机器学习系统,并利用数据经过学习确定机器学习系统的参数,其标志的n-gram等模型,在机器翻译、搜索引擎等领域都获得了成功。进入深度学习阶段,算力和语料库的大量发展使得基于神经网络的文本NN表示方法成为可能,LSTM的时序结构使得模型具有基于上文结构推断下文结构的语言生成能力。

在此基础上,2017年由谷歌提出的Transformer结构引入多头和自注意力训练机制,实现高训练效率的神经网络,并成为大模型时代的核心组件。而使用Transformer结构的大规模语言模型LLM,如谷歌的BERT模型与OpenAIGPT模型, 通过模型规模的增大与在大规模语料库上的预训练,可大大降低面向任务的NLP模型的领域语料需求,并在文本分类、阅读理解、文本匹配、文本生成等多个下游任务中取得优良表现。

OpenAI是一家以“实现安全的通用人工智能(AGI)”为核心宗旨的人工智能研究公司,依托微软的投资,通过对基础GPT模型自监督训练、基于示例和指令的GPT训练和InstructGPT训练,最终实现了基于生成式大规模预训练语言模型的对话模型ChatGPTChatGPT可实现模仿人类大脑的多项学习能力,如自主学习能力、反馈学习能力、小样本学习能力、复杂推理能力等,陈教授利用文字、图片、视频等方式展示并详细介绍了与ChatGPT的交互过程与现实应用场景。讨论到ChatGPT的能力边界,陈教授认为,ChatGPT所表现出的非线性性能的“涌现”实际上是由评价指标所导致的。然而,文本意义的递归定义反映文字本身对语义表示上的欠缺,ChatGPT的语言能力无法规避这个问题,多模态融合将成为解决语义表示问题的有效途径。同时,ChatGPT的语言能力尚难以发现和纠正事实的错误,也难以理解什么是“事实”。

迈向通用人工智能

ChatGPT开启了迈向通用人工智能的新时代。通用人工智能可由完全图灵测试所定义,认为机器人除了在语言能力上通过图灵测试,还需要在视觉、听觉、触觉、味觉等感知维度,在各种行动维度上的能力都达到人的标准,才能够达到通用人工智能的要求。能像人一样思考和行动,成为通用人工智能的必要要求,而ChatGPT迈出了像人一样思考的关键步伐,并助推通用人工智能应用“逆元宇宙”发展,将数码世界的能力融入显示,服务于真实世界的人。

从生成式大模型向通用人工智能的演进,陈清财认为,需要借助多模态大语言模型,进而迈上模型自主学习的路径。从通用对话能力到通用人工智能,则需要借助知识的显性化表达,构建深度领域智能的基石。通用人工智能技术的未来发展趋势将包含:安全可靠的人工智能、知识深度融合人工智能决策、具有情感的人工智能、多模态与多感知融合的局甚至能、人工智能与人类大脑的深度整合、AI4Science以及AI的伦理问题。

针对AI商业价值、人类与人工智能的关系、AI教育等话题,现场听众们向陈教授提出相关问题。陈教授根据在自然语言处理与人工智能领域的研究基础,结合当下时事热点与自身理解,深入浅出地进行解答与讨论,本次讲座就此顺利落下帷幕。(特约通讯员:王雨润)(审核:陈清财)


Return Top

© 2019 哈尔滨工业大学(深圳)·智能计算研究中心 All rights reserved.