跨境互联网 跨境互联网
首页
  • AI 工具

    • 绘图提示词工具 (opens new window)
    • ChatGPT 指令 (opens new window)
  • ChatGPT

    • ChatGP T介绍
    • ChatGPT API 中文开发手册
    • ChatGPT 中文调教指南
    • ChatGPT 开源项目
  • Midjourney

    • Midjourney 文档
  • Stable Diffusion

    • Stable Diffusion 文档
  • 其他

    • AIGC 热门文章
    • 账号合租 (opens new window)
    • 有趣的网站
  • Vue

    • Vue3前置
  • JAVA基础

    • Stream
    • Git
    • Maven
    • 常用第三方类库
    • 性能调优工具
    • UML系统建模
    • 领域驱动设计
    • 敏捷开发
    • Java 测试
    • 代码规范及工具
    • Groovy 编程
  • 并发编程&多线程

    • 并发编程
    • 高性能队列 Disruptor
    • 多线程并发在电商系统下的应用
  • 其他

    • 面试题
  • 消息中间中间件

    • Kafka
    • RabbitMQ
    • RocketMQ
  • 任务调度

    • Quartz
    • XXL-Job
    • Elastic-Job
  • 源码解析

    • Mybatis 高级使用
    • Mybatis 源码剖析
    • Mybatis-Plus
    • Spring Data JPA
    • Spring 高级使用
    • Spring 源码剖析
    • SpringBoot 高级使用
    • SpringBoot 源码剖析
    • Jdk 解析
    • Tomcat 架构设计&源码剖析
    • Tomcat Web应用服务器
    • Zookeeper 高级
    • Netty
  • 微服务框架

    • 分布式原理
    • 分布式集群架构场景化解决方案
    • Dubbo 高级使用
    • Dubbo 核心源码剖析
    • Spring Cloud Gateway
    • Nacos 实战应用
    • Sentinel 实战应用
    • Seata 分布式事务
  • 数据结构和算法的深入应用
  • 存储

    • 图和Neo4j
    • MongoDB
    • TiDB
    • MySQL 优化
    • MySQL 平滑扩容实战
    • MySQL 海量数据存储与优化
    • Elasticsearch
  • 缓存

    • Redis
    • Aerospike
    • Guava Cache
    • Tair
  • 文件存储

    • 阿里云 OSS 云存储
    • FastDF 文件存储
  • 基础

    • Linux 使用
    • Nginx 使用与配置
    • OpenResty 使用
    • LVS+Keepalived 高可用部署
    • Jekins
  • 容器技术

    • Docker
    • K8S
    • K8S
  • 01.全链路(APM)
  • 02.电商终极搜索解决方案
  • 03.电商亿级数据库设计
  • 04.大屏实时计算
  • 05.分库分表的深入实战
  • 06.多维系统下单点登录
  • 07.多服务之间分布式事务
  • 08.业务幂等性技术架构体系
  • 09.高并发下的12306优化
  • 10.每秒100W请求的秒杀架构体系
  • 11.集中化日志管理平台的应用
  • 12.数据中台配置中心
  • 13.每天千万级订单的生成背后痛点及技术突破
  • 14.红包雨的架构设计及源码实现
  • 人工智能

    • Python 笔记
    • Python 工具库
    • 人工智能(AI) 笔记
    • 人工智能(AI) 项目笔记
  • 大数据

    • Flink流处理框架
  • 加密区

    • 机器学习(ML) (opens new window)
    • 深度学习(DL) (opens new window)
    • 自然语言处理(NLP) (opens new window)
AI 导航 (opens new window)

Revin

首页
  • AI 工具

    • 绘图提示词工具 (opens new window)
    • ChatGPT 指令 (opens new window)
  • ChatGPT

    • ChatGP T介绍
    • ChatGPT API 中文开发手册
    • ChatGPT 中文调教指南
    • ChatGPT 开源项目
  • Midjourney

    • Midjourney 文档
  • Stable Diffusion

    • Stable Diffusion 文档
  • 其他

    • AIGC 热门文章
    • 账号合租 (opens new window)
    • 有趣的网站
  • Vue

    • Vue3前置
  • JAVA基础

    • Stream
    • Git
    • Maven
    • 常用第三方类库
    • 性能调优工具
    • UML系统建模
    • 领域驱动设计
    • 敏捷开发
    • Java 测试
    • 代码规范及工具
    • Groovy 编程
  • 并发编程&多线程

    • 并发编程
    • 高性能队列 Disruptor
    • 多线程并发在电商系统下的应用
  • 其他

    • 面试题
  • 消息中间中间件

    • Kafka
    • RabbitMQ
    • RocketMQ
  • 任务调度

    • Quartz
    • XXL-Job
    • Elastic-Job
  • 源码解析

    • Mybatis 高级使用
    • Mybatis 源码剖析
    • Mybatis-Plus
    • Spring Data JPA
    • Spring 高级使用
    • Spring 源码剖析
    • SpringBoot 高级使用
    • SpringBoot 源码剖析
    • Jdk 解析
    • Tomcat 架构设计&源码剖析
    • Tomcat Web应用服务器
    • Zookeeper 高级
    • Netty
  • 微服务框架

    • 分布式原理
    • 分布式集群架构场景化解决方案
    • Dubbo 高级使用
    • Dubbo 核心源码剖析
    • Spring Cloud Gateway
    • Nacos 实战应用
    • Sentinel 实战应用
    • Seata 分布式事务
  • 数据结构和算法的深入应用
  • 存储

    • 图和Neo4j
    • MongoDB
    • TiDB
    • MySQL 优化
    • MySQL 平滑扩容实战
    • MySQL 海量数据存储与优化
    • Elasticsearch
  • 缓存

    • Redis
    • Aerospike
    • Guava Cache
    • Tair
  • 文件存储

    • 阿里云 OSS 云存储
    • FastDF 文件存储
  • 基础

    • Linux 使用
    • Nginx 使用与配置
    • OpenResty 使用
    • LVS+Keepalived 高可用部署
    • Jekins
  • 容器技术

    • Docker
    • K8S
    • K8S
  • 01.全链路(APM)
  • 02.电商终极搜索解决方案
  • 03.电商亿级数据库设计
  • 04.大屏实时计算
  • 05.分库分表的深入实战
  • 06.多维系统下单点登录
  • 07.多服务之间分布式事务
  • 08.业务幂等性技术架构体系
  • 09.高并发下的12306优化
  • 10.每秒100W请求的秒杀架构体系
  • 11.集中化日志管理平台的应用
  • 12.数据中台配置中心
  • 13.每天千万级订单的生成背后痛点及技术突破
  • 14.红包雨的架构设计及源码实现
  • 人工智能

    • Python 笔记
    • Python 工具库
    • 人工智能(AI) 笔记
    • 人工智能(AI) 项目笔记
  • 大数据

    • Flink流处理框架
  • 加密区

    • 机器学习(ML) (opens new window)
    • 深度学习(DL) (opens new window)
    • 自然语言处理(NLP) (opens new window)
AI 导航 (opens new window)
  • ChatGPT

    • 入门

    • 进阶

      • ChatGPT API keys 秘钥获取
      • ChatGPT API 中文开发手册
      • 各种开发语言OpenAI类库
      • 如何使用大型语言模型
        • 大型语言模型的工作原理
        • 如何控制大型语言模型
          • 指令提示
          • 完成提示示例
          • 演示提示示例 (小样本学习)
          • 微调提示示例
        • 代码能力
          • 更及时的建议
      • OpenAI的价格
    • ChatGPT指令

    • 其他

    • 提示
  • Stable Diffusion

  • Midjourney

  • whisper
  • PaddleSpeech
  • AIGC
  • ChatGPT
  • 进阶
Revin
2023-04-16
目录

如何使用大型语言模型

👉 原文链接 (opens new window)

# 大型语言模型的工作原理

大型语言模型 (opens new window)是将文本映射到文本的函数。给定一个输入文本字符串,大型语言模型会预测接下来应该出现的文本。

大型语言模型的神奇之处在于,通过训练以最大限度地减少对大量文本的预测误差,模型最终学习到对这些预测有用的概念。例如,他们学习:

  • 怎么拼
  • 语法是如何运作的
  • 如何释义
  • 如何回答问题
  • 如何进行对话
  • 如何用多种语言写作
  • 如何编码
  • 等等。

这些能力都没有明确编入程序——它们都是训练的结果。

GPT-3 (opens new window) 为数百种软件产品 (opens new window)提供支持,包括生产力应用程序、教育应用程序、游戏等。

# 如何控制大型语言模型

在大型语言模型的所有输入中,迄今为止影响最大的是文本提示。

可以通过以下几种方式提示大型语言模型生成输出:

  • 说明:告诉模型你想要什么

  • 完成:诱导模型完成你想要的开始

  • 演示

    • 向模型显示您想要的内容,可以使用:
    • 提示中的几个例子
    • 微调训练数据集中有数百或数千个示例

下面显示了每个示例。

# 指令提示

指令跟随模型(例如,text-davinci-003或任何以text-开头的模型)专门设计用于遵循指令。在提示的顶部(或底部,或两者)写下您的指令,模型将尽最大努力遵循指令,然后停止。说明可以很详细,所以不要害怕写一段明确详细说明您想要的输出。

示例指令提示:

从下面的引文中提取作者姓名。

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation
1
2
3
4

输出:

Ted Chiang
1

# 完成提示示例

完成式提示利用大型语言模型如何尝试编写他们认为最有可能出现的文本。要引导模型,请尝试从一个模式或句子开始,该模式或句子将由您想要查看的输出完成。相对于直接指令,这种转向大型语言模型的方式可以更加小心和实验。此外,模型不一定知道在哪里停止,因此您通常需要停止序列或后处理来切断超出所需输出的生成文本。

示例完成提示:

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation

The author of this quote is
1
2
3
4

输出:

Ted Chiang
1

# 演示提示示例 (小样本学习 (opens new window))

与完成式提示类似,演示可以向模型展示您希望它做什么。这种方法有时称为小样本学习,因为模型从提示中提供的几个示例中学习。

示例演示提示:

Quote:
“When the reasoning mind is forced to confront the impossible again and again, it has no choice but to adapt.”
― N.K. Jemisin, The Fifth Season
Author: N.K. Jemisin

Quote:
“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation
Author:
1
2
3
4
5
6
7
8
9

输出:

Ted Chiang
1

# 微调提示示例

通过足够的训练示例,您可以微调 (opens new window)自定义模型。在这种情况下,指令变得不必要,因为模型可以从提供的训练数据中学习任务。但是,包含分隔符序列(例如,->或###或任何通常不出现在输入中的字符串)来告诉模型提示何时结束,输出何时开始,这可能会很有帮助。如果没有分隔符序列,则存在模型继续详细说明输入文本而不是从您想要看到的答案开始的风险。

微调提示示例(对于在类似的提示完成对上经过自定义训练的模型)

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation

###
1
2
3
4

输出:

Ted Chiang
1

# 代码能力

大型语言模型不仅擅长文本——它们也擅长代码。OpenAI 的专用代码模型称为Codex (opens new window)。

  • Codex 支持70 多种产品,包括:

    • GitHub Copilot (opens new window)(在 VS Code 和其他 IDE 中自动完成代码)
    • Pygma (opens new window)(将 Figma 设计转化为代码)
    • Replit (opens new window)(有一个“解释代码”按钮和其他功能)
    • Warp (opens new window)(带AI命令搜索的智能终端)
    • Machinet (opens new window)(编写 Java 单元测试模板)

请注意,与指令遵循文本模型(例如,text-davinci-002)不同,Codex未经过训练以遵循指令。因此,设计好的提示可以更加小心。

# 更及时的建议

有关更多提示示例,请访问OpenAI 示例 (opens new window)。

通常,输入提示是改进模型输出的最佳杠杆。您可以尝试以下技巧:

  • 给予更明确的指示。例如,如果您希望输出是一个逗号分隔的列表,请要求它返回一个逗号分隔的列表。如果您希望它在不知道答案时说“我不知道”,请告诉它“如果您不知道答案,请说“我不知道”。”
  • 提供更好的例子。如果您在提示中演示示例,请确保您的示例多样化且质量高。
  • 让模型像专家一样回答。明确要求模型产生高质量的输出或输出,就好像它是由专家写的一样,可以诱导模型给出它认为专家会写的更高质量的答案。例如,“以下答案是正确的、高质量的,而且是专家写的。”
  • 提示模型写下解释其推理的一系列步骤。例如,在您的答案前加上“让我们逐步思考 (opens new window)”之类的内容。提示模型在其最终答案之前给出其推理的解释可以增加其最终答案一致和正确的可能性。
上次更新: 2025/04/03, 11:07:08
各种开发语言OpenAI类库
OpenAI的价格

← 各种开发语言OpenAI类库 OpenAI的价格→

最近更新
01
tailwindcss
03-26
02
PaddleSpeech
02-18
03
whisper
02-18
更多文章>
Theme by Vdoing | Copyright © 2019-2025 跨境互联网 | 豫ICP备14016603号-5 | 豫公网安备41090002410995号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式