大模型实战 P3 大语言模型通识和课前准备
从这节课开始,就正式进入课程的第一个篇章——GPT 大模型。在这一章节,主要介绍 OpenAI 相关模型的使用方法。在后面的项目中,也是先基于 GPT 模型把流程跑通,之后再介绍其他模型。整体学完之后,大家就可以灵活选择,比如想换个模型,改个配置项就可以了。
什么是大模型
在正式介绍具体模型之前,要先了解一下大模型这个概念。所谓的大模型,当下指的是大型语言模型(large language model,LLM)。
大型:规模和复杂性更大,GPT-3模型拥有1750亿(175B)个参数。更重要的是,更加通用化,可以跨学科、跨领域。
语言:自然语言,人跟人交流的语言,用像和人交流的方式,和机器进行对话。
虽然,模型可以生成信息丰富、结构严谨的文本,但他们并不能进行创新性的思考,或生成没有训练数据的新信息,所有的回答都基于训练数据,并通过统计模式进行预测生成。本质上就是根据已知信息,进行文本补全的过程。
常用大模型:GPT、LLaMA、ChatGLM、QWen、BaiChuan、ERNIE
在线体验
文心一言:https://yiyan.baidu.com/
ChatGPT:https://chat.openai.com/
课前准备
注册 OpenAI 账号,并获取 API Key。参考文档,随课程源码一起提供。
1、先科学上网,IP 切到美国。
2、用国外手机号注册账号,最好绑定信用卡,否则会有调用次数限制。
https://platform.openai.com/docs/guides/rate-limits
虽然注册流程会比较麻烦,但是后面实践课程的基础。开源模型的下载和部署,以及其他有接口的模型,都会在后面课程中讲到。
本文链接:http://ichenhua.cn/edu/note/682
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!