【AI入门课程】认识大模型

ListenAI · 发表于 3 天前

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区

您需要登录才可以下载或查看，没有账号？立即注册

×

【AI入门课程】认识大模型 前言

前面讲了语音识别和机器视觉，大家是不是发现功能用起来都很单一？当但我们生活学习中还接触了讯飞星火、DeepSeek等大模型，不仅能语音识别，还能听懂你模糊的提问，又能看懂图片讲出故事，甚至能模仿老师的语气给你讲题。这背后的 “大功臣”，就是 AI 界的 “超级学霸”—— 大模型！今天咱们就来聊聊，这个 “学霸” 到底有多厉害，它又是怎么和语音、视觉 “搭档” 干活的？然后使用CSK6大模型开发板体验大模型+AI语音+AI视觉组合的多模态应用，并实操配置人设提示词打造一个个人专属AI助理。

一、先搞懂：大模型是啥？为啥叫 “大” 模型？

前面文章讲过 AI 语音和机器视觉，那些就像 “偏科的同学”—— 有的只会认人脸，有的只会听声音。而大模型，就像 “门门功课都拔尖的超级学霸”，它能同时学很多知识，还能灵活解决各种问题。

为啥叫 “大” 模型呢？有两个关键原因：

● “读” 的书特别多：工程师会给大模型 “喂” 海量数据 —— 比如几百万本书、几千万张图片、几亿条对话，就像让它把图书馆、博物馆甚至互联网上的知识都 “读” 了个遍。

● “脑回路” 特别复杂：大模型的算法结构像一张超级复杂的 “知识网”，每个知识点都能和其他知识点连起来。比如它看到 “苹果”，不仅知道 “这是水果”，还能联想到 “红色的”“甜甜的”“可以做苹果派”“牛顿被苹果砸到发现万有引力”。

简单说，大模型就是 “读万卷书、通百门课” 的 AI 学霸，能把语音、视觉等技能 “串起来”，干更复杂的事！

二、大模型 + AI 语音：让 AI 从 “听懂话” 到 “会聊天”

之前咱们讲过，AI 语音能把 “你说的话” 变成文字（语音识别）。可光听懂还不够 —— 你问 “下雨天能干啥”，AI 得给你出主意；你说 “我心情不好”，AI 得安慰你。这就需要大模型来帮忙了！

组合原理：语音 “传话筒”+ 大模型 “军师”

AI 语音像 “传话筒”，负责把你的声音变成文字；大模型像 “军师”，负责理解文字意思、想出回答，再让语音模块把回答 “说” 出来。整个过程就像：

1. 你问：“明天要下雨吗？适合去公园吗？”（语音输入）

2. 语音模块：把你的话变成文字（语音识别）。

3. 大模型：① 查 “明天的天气数据”（调用知识）；② 分析 “下雨” 和 “去公园” 的关系（下雨不适合户外）；③ 想出回答 “明天有小雨，不太适合去公园哦，可以去图书馆看书～”（逻辑思考）。

4. 语音模块：把文字回答变成声音（语音合成），AI “说” 给你听。

生活中的示例：会 “唠嗑” 的智能助手

● 学习小帮手：你对着智能音箱说 “用英语讲个龟兔赛跑的故事，再解释里面的生词”。语音模块先把话转成文字，大模型就会：① 回忆龟兔赛跑的剧情；② 用简单的英语组织故事；③ 找出 “tortoise（乌龟）”“hare（兔子）” 等生词并解释；最后让音箱 “说” 出来，比普通语音助手只 “念故事” 厉害多了！

● 出行小管家：你说 “我周末要去动物园，帮我规划路线，再推荐好吃的”。大模型会结合你的位置（语音模块能关联定位）、动物园开放时间、周边餐厅评价，给出 “坐 3 号线转 5 号线，出口有卖网红冰淇淋” 这样的具体回答，而不是只报 “动物园在 XX 路”。

三、大模型 + AI 视觉：让 AI 从 “认东西” 到 “讲故事”

机器视觉能让 AI “认出” 图片里是猫还是狗，可要是你问 “这张猫的图片里，它在做什么？开心吗？”，就需要大模型来 “解读” 了。这对组合就像 “眼睛 + 大脑”，既能 “看见”，又能 “思考”。

组合原理：视觉 “照相机”+ 大模型 “解读员”

AI 视觉像 “照相机”，负责 “拍” 下图片里的特征（比如 “猫”“毛线球”“尾巴翘起来”）；大模型像 “解读员”，负责把这些特征串成有逻辑的内容，甚至分析背后的含义。过程就像：

1. 你上传一张 “猫追毛线球” 的图片，问 “它在干嘛？”（视觉输入）

2. 视觉模块：识别出图片里的特征 ——“橘猫”“毛线球”“猫的爪子伸向毛线球”“尾巴上扬”。

3. 大模型：① 联想 “猫喜欢玩毛线球” 的常识；② 分析 “爪子伸出去”“尾巴上扬” 是开心的表现；③ 组织语言 “这只橘猫正在追毛线球玩，看起来很开心呢”。

4. 输出回答：可以是文字，也能让语音模块 “说” 出来。

生活中的示例：会 “看图说话” 的 AI 工具

● 作业辅导神器：你拍一张 “小鸟站在树枝上” 的语文看图写话作业，问 “怎么写得更生动？”。视觉模块先认出 “小鸟”“树枝”“蓝天背景”，大模型会结合这些特征，给出 “‘一只圆滚滚的小鸟站在嫩绿的树枝上，扑扇着翅膀，好像在唱春天的歌’—— 可以加颜色和动作哦” 这样的建议，还能帮你修改句子。

● AI 绘画 “搭档”：你说 “画一只戴着帽子的猫，在雪地里堆雪人”，并上传一张你画的简笔画。视觉模块认出你画的 “猫”“帽子”“雪人” 轮廓，大模型会：① 优化细节（给猫加毛茸茸的毛发、给雪人加围巾）；② 搭配场景（雪地里加脚印、天上加雪花）；③ 调整颜色（猫是灰色、帽子是红色），最后生成一张精美的图片，比普通绘画 AI 更懂你的 “想法”。

● 旧照片 “讲故事”：你上传一张爷爷的老照片（里面有爷爷、老自行车、老房子），问 “这张照片可能是哪年拍的？”。视觉模块认出 “老式二八大杠自行车”“青砖老房子”，大模型会联想 “二八大杠在 80 年代很流行”“青砖房是那个年代的常见民居”，回答 “这张照片可能是 80 年代拍的，那时候二八大杠自行车是很多人的代步工具呢”。

四、和大模型 “对话” 的密码：提示词与人设提示词

大模型这么聪明，可它 “听不懂” 模糊的要求 —— 你说 “写篇作文”，它不知道写什么主题；你说 “画个动物”，它不知道画哪种。这时候就需要 “提示词” 来给它 “指方向”，而 “人设提示词” 能让它变成你想要的 “角色”！

什么是提示词？—— 给大模型的 “任务说明书”

提示词就是你告诉大模型 “要做什么、怎么做” 的话，得说清楚主题、要求、细节。就像你让同学帮你带文具，得说 “帮我带一支黑色、0.5 毫米的中性笔”，而不是只说 “带支笔”。

比如：

● 差的提示词：“写个故事”（模糊不清，大模型不知道写什么）。

● 好的提示词：“写一个关于小猫和小狗成为朋友的故事，主角叫‘花花’（猫）和‘大黄’（狗），发生在秋天的公园，要有温暖的对话”（主题、主角、场景、风格都讲清了）。

什么是人设提示词？—— 给大模型 “定角色”

人设提示词就是让大模型 “扮演某个角色”，用这个角色的语气、知识来回答。就像玩角色扮演游戏，你让同学 “扮演老师”，他就会用老师的语气说话。

人设提示词示例讲解：让大模型变 “专属老师”

比如你想让大模型扮演 “小学科学老师”，帮你讲 “蝴蝶的生命周期”，可以这样写提示词：

“请你扮演一位温柔有耐心的小学科学老师，用小朋友能听懂的话，讲一讲蝴蝶的生命周期。要分步骤说，每个步骤举个小例子，最后加一个互动问题，比如‘你在公园见过蝴蝶的哪个阶段呀？’”

咱们拆一拆这个提示词：

● 角色：温柔有耐心的小学科学老师（定 “人设”，决定语气和难度）。

● 任务：讲蝴蝶的生命周期（定 “做什么”）。

● 要求：用小朋友能懂的话、分步骤、举例子、加互动问题（定 “怎么做”）。

大模型看到后，就会用老师的语气回答：

“小朋友们，蝴蝶的一生要经过四个神奇的阶段哦～第一个阶段是‘卵’，就像蝴蝶妈妈在叶子上埋下的‘小种子’，圆圆的、小小的；第二个阶段是‘幼虫’，也就是毛毛虫，它会使劲吃叶子，慢慢长大；第三个阶段是‘蛹’，毛毛虫会变成一个硬硬的‘小房子’，在里面悄悄变身；第四个阶段是‘成虫’，美丽的蝴蝶就从蛹里飞出来啦！你在公园见过蝴蝶的哪个阶段呀？”

再比如，你想让大模型扮演 “漫画师”，帮你设计 “猫咪宇航员”：

“请你扮演一位擅长可爱风格的漫画师，帮我设计一只猫咪宇航员。要求：猫咪是白色的，戴着蓝色头盔，头盔上有小星星图案，穿着粉色宇航服，手里拿着一面小旗子，背景是紫色的太空（有月亮和行星）。”

大模型就会按照 “可爱漫画师” 的人设，给出符合要求的设计描述，甚至能生成对应的图片草稿～

五、大模型不是 “魔法”，是 “学习的成果”

其实大模型的 “聪明”，都是靠 “读万卷书”（学海量数据）和 “听指挥”（看提示词）来的。它就像一个愿意帮你解决问题的 “超级学霸”，你说得越清楚，它帮得越到位。可以参考小聆AI配置文档（https://docs2.listenai.com/x/S_TEd8h7C）给CSK6大模型开发板设计专属的提示词和人设，让它变成你的 “专属小帮手”～说不定以后你还能自己训练大模型，让它更懂你的想法呢！

六、其他资料

以上图片内容仅作参考，可以根据实际讲解场景进行更换。后续会继续推出相关内容。

有自己设计课程的朋友可以先参考这份课程设计参考：https://docs2.listenai.com/x/xNA3G4J8h

演示硬件详细资料：https://docs2.listenai.com/x/nTn9kMMCU

		自动登录	找回密码
密码			立即注册

[IT/数码] 【AI入门课程】认识大模型

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区