ChatGPT指南
探索人工智能交互的奥秘。

ChatGPT 是什么

ChatGPT 是由 OpenAI 开发的一款先进的对话人工智能产品。OPENAI 官网

“ChatGPT”结合了“Chat”(聊天)和“GPT”(Generative Pre-trained Transformer)两个词汇。它是基于生成式预训练语言模型的人工智能,使用先进的 Transformer 架构处理自然语言处理(NLP)任务。这项技术的核心在于利用深度学习算法生成人类般的自然语言响应,特别在生成连贯、上下文相关的对话方面表现卓越。

❓ 为什么多次提问相同问题 ChatGPT 会回复不同答案?这是因为神经网络的发散性。
ChatGPT 的独特之处在于其深度神经网络结构,其中包含数百亿甚至上千亿的参数。为了增加发散性,每次处理同一问题时,可能会激活不同的神经网络路径,从而产生不同的答案。这种特性使得 ChatGPT 在回答问题时既有创造性,又富有人性化,有时甚至会显得有些“胡说八道”,使其看起来更像一个真实的人类。

ChatGPT 的优势与挑战

✅【优势】

  • 大尺寸模型:经过大量数据训练,ChatGPT 能够生成高度准确和流畅的响应。
  • 类人响应:生成的响应与人类的知识水平和理解能力相似,适用于各种文本生成任务。
  • 适应性:能够根据不同情况和上下文生成适当的回答。
  • 多功能性:适用于各种自然语言处理任务,可应用于广泛领域。

☔【挑战】

  • 对训练数据的依赖:响应质量取决于训练数据的质量和多样性。
  • 有限的理解能力:尽管响应准确流畅,但 ChatGPT 并不具备深刻的世界理解或类似人类的推理能力。
  • 潜在偏见问题:训练数据的偏见可能会导致模型响应中出现偏见。

ChatGPT 发展史

里程碑

从 2015 年 OpenAI 的成立到现在,ChatGPT 的背后是一系列突破性的里程碑:
2015 年:OpenAI 在美国成立,由 Sam Altman 和 Elon Musk 联合创立。
2016 年:推出了 OpenAI Gym 和 Universe,致力于学习强化算法。
2018 年:发布了 GPT,这是第一代拥有 1.17 亿参数的通用 NLP 模型。
2019 年:微软投资 10 亿美元,发布了含 15 亿参数的 GPT-2。
2020 年:发布 GPT-3,含 1750 亿参数,微软获得独家授权。
2021 年:推出了 CLIP 和 DALL·E,分别用于匹配图像和文本、文字生成图像。
2022 年:发布 DALL·E 2,推出基于 GPT-3.5 的 ChatGPT。
2023 年:ChatGPT 全面普及,微软宣布对 OpenAI 的进一步投资。

ChatGPT 持续创造历史记录:

  • 上线仅 5 天,ChatGPT 已经拥有超过 100 万用户

  • 推出仅两个月,截至 2023 年 1 月末,月活用户已经突破了 1 亿

  • 以其他的非常受欢迎的消费级应用数据参考:TikTok 达到 1 亿用户用了 9 个月,Instagram 则花了 2 年半的时间。ChatGPT 也成为了史上用户增长速度最快的消费级应用程序。

img

商业模式

现阶段 AI 应用主要分三类:

  1. 感知与交互:包括计算机视觉(如图像识别、面部识别)、语音识别与处理(如语音到文本、语音助手)等。这一类别涉及 AI 对人类感官信息的理解和模拟,包括看、听等。
  2. 数据分析与决策支持:涵盖数据分析、机器学习、自然语言处理(NLP)、推荐系统等。这类应用主要围绕从大量数据中提取有价值信息,支持决策制定,如预测分析、个性化推荐等。
  3. 自动化与智能控制:包括自动化与机器人技术(如工业自动化、无人驾驶汽车)、智能家居控制等。这一类别关注于使用 AI 来实现任务的自动化执行和智能控制,减少人工干预。

截至 2023 年底,OpenAI 的主要产品包括:

  1. GPT 系列(Generative Pre-trained Transformer):包括 GPT-3 和 GPT-4 等,用于自然语言处理,生成文本、回答问题等。
  2. DALL-E:一个能够根据文本描述生成图像的 AI 模型。
  3. Codex:专门用于编程的 AI 模型,支持编写和理解代码,是 GitHub Copilot 的核心技术。
  4. ChatGPT:基于 GPT-3 和 GPT-4 的对话系统,用于生成连贯、有意义的对话。
  5. OpenAI API:提供对 GPT-3、Codex 等模型的编程接口,允许开发者将这些模型集成到自己的应用程序中。
  6. CLIP:一个多模态 AI 模型,能够理解图像和相关的文本描述。
  7. GPT-4 Turbo:提供截至 2023 年 4 月的上下文信息的最新 AI 模型。
  8. Assistants API:新推出的 API,可能是为了更好地支持开发者使用 OpenAI 的技术。
  9. GPT-4 Turbo with Vision:结合了视觉处理能力的产品,提供更加丰富的多模态 AI 体验。

ChatGPT 的原理

解释几个小概念

  1. NLP: Natural Language Processing
  • 自然语言处理:计算机科学、人工智能和语言学的交叉领域,旨在使计算机能够理解和处理人类语言。
  • NLP 是 ChatGPT 的基础,提供了理解和生成自然语言的能力。
  • NLP 技术使 ChatGPT 能够解析用户输入的文本,理解其语义和情感,并生成合适的回应。
  1. RLHF: Reinforcement Learning from Human Feedback
  • 强化学习自人类反馈:一种结合了强化学习和人类反馈的训练方法,用于优化模型的性能。
  • RLHF 是 ChatGPT 训练过程中的一个关键步骤。
  • 通过 RLHF,ChatGPT 接收到人类评估者对其回答的反馈,这些反馈用于指导模型的学习过程,优化其回答质量。
  1. RL: Reinforcement Learning
  • 强化学习:一种机器学习方法,模型通过与环境的交互来学习如何达成目标。
  • RL 是 RLHF 的一部分,用于优化 ChatGPT 的性能。
  • 在 RL 过程中,ChatGPT 通过试错学习,根据从人类反馈中获得的奖励来调整其行为。
  1. BERT: Bidirectional Encoder Representations from Transformers
  • 双向编码器表示变换器:一种预训练的深度学习模型,用于 NLP 的各种任务,特别擅长理解语言的上下文。
  • BERT 是 NLP 领域的一个重要模型,虽然 ChatGPT 基于 GPT-3,但 BERT 的技术(如双向语境理解)对 NLP 领域有广泛影响。
  • BERT 通过预训练和微调来理解语言的上下文,这种技术对于提高语言模型的理解能力很有价值。
  1. GPT-3: Generative Pre-trained Transformer 3
  • 第三代生成预训练变换器:一个大规模的语言处理模型,用于生成文本和理解复杂的语言任务。
  • ChatGPT 直接基于 GPT-3 模型。
  • GPT-3 是一个大规模的语言生成模型,通过预训练和可能的微调,它能够生成连贯、相关且通常情境合适的文本。
  1. Transformer 架构
    • 这是一种专门为处理序列数据(如文本)设计的神经网络结构。
    • GPT-3 使用了 Transformer 架构,这是一种专门为处理序列数据(如文本)设计的神经网络结构。
    • 将 Transformer 想象为一个高效的工厂流水线,它能够同时处理文本中的每个部分(单词或字符),并通过“自注意力机制”(Self-Attention Mechanism)理解这些部分之间的关系。

ChatGPT 技术原理

img

ChatGPT 结合了 GPT-3 的强大语言模型、Transformer 的高效处理能力、以及 RLHF 的优化策略,形成了一个能够理解和生成自然语言的复杂系统。这个系统通过不断学习和适应,能够在各种对话场景中提供高质量的交互体验。

  1. 基于 GPT-3 的架构:ChatGPT 基于 OpenAI 的 GPT-3 模型,这是一个大规模的自然语言处理模型。想象一个巨大的神经网络,由数以亿计的参数构成。这个网络通过吸收大量的文本数据(如书籍、文章、网站内容)来学习语言的模式。

  2. Transformer 架构:GPT-3 使用了 Transformer 架构,这是一种专门为处理序列数据(如文本)设计的神经网络结构。将 Transformer 想象为一个高效的工厂流水线,它能够同时处理文本中的每个部分(单词或字符),并通过“自注意力机制”理解这些部分之间的关系。

  3. 预训练和微调:GPT-3 在大量文本上进行预训练,学习语言的基本规则和结构。为特定任务(如聊天)对模型进行微调,使其更适应该任务的需求。

  4. 强化学习自人类反馈(RLHF):ChatGPT 通过 RLHF 方法进一步优化。这涉及到从人类评估者那里获取反馈,并用这些反馈来指导模型的学习。想象一个场景,其中 ChatGPT 产生的回答被人类评估,并根据其质量给予奖励或惩罚。这些反馈帮助模型调整其回答策略,以生成更准确、更自然的回答。

  5. 自然语言理解和生成:ChatGPT 能够理解用户的查询和语境。基于理解的内容,模型生成连贯、相关且通常情境合适的回答。

简单说 ChatGPT 就是通过人类的反馈和奖励,不断修正自身的错误信息,使得生成的结果越来越准确。

Prompt 是什么

Prompt 和 Prompt Engineering

  • Prompt 是给 AI 模型的指令,它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。AI 模型会基于 prompt 所提供的信息,生成对应的文本,亦或者图片。
  • 比如,我们在 ChatGPT 里输入”什么是 chatgpt”?,这个问题就是 prompt。
  • 目前的 AI 产品还比较早期,因为各种原因,产品设置了很多限制,如果你想要绕过一些限制,或者更好地发挥 AI 的能力,也需要用到 Prompt Engineering 技术。

Prompt 基本原则

Prompt 没有固定且标准的公式,但如果想充分利用人工智能,可以按照四个维度调教优化。

🏳️‍🌈调教模板:角色扮演(Role)+ 背景(Context) +指令/任务(Instruction)+ 要求(Demand)

案例 1:健康饮食计划

  • 角色扮演(Role):你是一名营养师
  • 背景(Context):客户希望改善饮食习惯,减轻体重
  • 任务(Instruction):制定一周的饮食计划
  • 要求(Demand):考虑到低热量、高蛋白的饮食需求

案例 2:旅游规划

  • 角色扮演(Role):你是一名旅行顾问
  • 背景(Context):客户计划前往日本旅游,对历史和文化感兴趣
  • 任务(Instruction):访问京都的传统神社和寺庙,提供为期一周的日本旅游行程建议
  • 要求(Demand):包括文化体验、住宿和交通安排

案例 3:英语翻译

  • 角色扮演(Role):你是英语翻译,拼写校对和润色改进翻译的角色。
  • 背景(Context):我会用任何语言和你交流,你会识别我的语言,将其翻译且用更为优美和精炼的英语回答我。
  • 任务(Instruction):将我简单的词汇和句子替换成更为优美和高雅的表达方式,确保意思不变,但使其更具文学性。
  • 要求(Demand):仅回答更正和改进的部分,不要写解释。我的第一句话是“how are you ?”,请翻译它。

如果希望系统性地学习 ChatGPT 所有相关的知识,请关注阅读下一节.


© 2024 Sumorio 使用 Stellar 创建
共发表 21 篇Blog · 总计 46.7k 字