从这节课开始,就正式进入课程的第一个篇章——GPT 大模型。在这一章节,主要介绍 OpenAI 相关模型的使用方法。在后面的项目中,也是先基于  GPT 模型把流程跑通,之后再介绍其他模型。整体学完之后,大家就可以灵活选择,比如想换个模型,改个配置项就可以了。

什么是大模型

在正式介绍具体模型之前,要先了解一下大模型这个概念。所谓的大模型,当下指的是大型语言模型(large language model,LLM)。

大型:规模和复杂性更大,GPT-3模型拥有1750亿(175B)个参数。更重要的是,更加通用化,可以跨学科、跨领域。

语言:自然语言,人跟人交流的语言,用像和人交流的方式,和机器进行对话。

虽然,模型可以生成信息丰富、结构严谨的文本,但他们并不能进行创新性的思考,或生成没有训练数据的新信息,所有的回答都基于训练数据,并通过统计模式进行预测生成。本质上就是根据已知信息,进行文本补全的过程。

常用大模型:GPT、LLaMA、ChatGLM、QWen、BaiChuan、ERNIE

在线体验

文心一言:https://yiyan.baidu.com/

ChatGPT:https://chat.openai.com/

课前准备

注册 OpenAI 账号,并获取 API Key。参考文档,随课程源码一起提供。

1、先科学上网,IP 切到美国。

2、用国外手机号注册账号,最好绑定信用卡,否则会有调用次数限制。

https://platform.openai.com/docs/guides/rate-limits

虽然注册流程会比较麻烦,但是后面实践课程的基础。开源模型的下载和部署,以及其他有接口的模型,都会在后面课程中讲到。

本文链接:http://ichenhua.cn/edu/note/682

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!