马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
【AI入门课程】认识大模型 前言前面讲了语音识别和机器视觉,大家是不是发现功能用起来都很单一?当但我们生活学习中还接触了讯飞星火、DeepSeek等大模型,不仅能语音识别,还能听懂你模糊的提问,又能看懂图片讲出故事,甚至能模仿老师的语气给你讲题。这背后的 “大功臣”,就是 AI 界的 “超级学霸”—— 大模型!今天咱们就来聊聊,这个 “学霸” 到底有多厉害,它又是怎么和语音、视觉 “搭档” 干活的? 然后使用CSK6大模型开发板体验大模型+AI语音+AI视觉组合的多模态应用,并实操配置人设提示词打造一个个人专属AI助理。 一、先搞懂:大模型是啥?为啥叫 “大” 模型? 前面文章讲过 AI 语音和机器视觉,那些就像 “偏科的同学”—— 有的只会认人脸,有的只会听声音。而大模型,就像 “门门功课都拔尖的超级学霸”,它能同时学很多知识,还能灵活解决各种问题。 为啥叫 “大” 模型呢?有两个关键原因: ● “读” 的书特别多:工程师会给大模型 “喂” 海量数据 —— 比如几百万本书、几千万张图片、几亿条对话,就像让它把图书馆、博物馆甚至互联网上的知识都 “读” 了个遍。 ● “脑回路” 特别复杂:大模型的算法结构像一张超级复杂的 “知识网”,每个知识点都能和其他知识点连起来。比如它看到 “苹果”,不仅知道 “这是水果”,还能联想到 “红色的”“甜甜的”“可以做苹果派”“牛顿被苹果砸到发现万有引力”。 简单说,大模型就是 “读万卷书、通百门课” 的 AI 学霸,能把语音、视觉等技能 “串起来”,干更复杂的事! 二、大模型 + AI 语音:让 AI 从 “听懂话” 到 “会聊天” 之前咱们讲过,AI 语音能把 “你说的话” 变成文字(语音识别)。可光听懂还不够 —— 你问 “下雨天能干啥”,AI 得给你出主意;你说 “我心情不好”,AI 得安慰你。这就需要大模型来帮忙了! 组合原理:语音 “传话筒”+ 大模型 “军师” AI 语音像 “传话筒”,负责把你的声音变成文字;大模型像 “军师”,负责理解文字意思、想出回答,再让语音模块把回答 “说” 出来。整个过程就像: 1. 你问:“明天要下雨吗?适合去公园吗?”(语音输入) 2. 语音模块:把你的话变成文字(语音识别)。 3. 大模型:① 查 “明天的天气数据”(调用知识);② 分析 “下雨” 和 “去公园” 的关系(下雨不适合户外);③ 想出回答 “明天有小雨,不太适合去公园哦,可以去图书馆看书~”(逻辑思考)。 4. 语音模块:把文字回答变成声音(语音合成),AI “说” 给你听。 生活中的示例:会 “唠嗑” 的智能助手 ● 学习小帮手:你对着智能音箱说 “用英语讲个龟兔赛跑的故事,再解释里面的生词”。语音模块先把话转成文字,大模型就会:① 回忆龟兔赛跑的剧情;② 用简单的英语组织故事;③ 找出 “tortoise(乌龟)”“hare(兔子)” 等生词并解释;最后让音箱 “说” 出来,比普通语音助手只 “念故事” 厉害多了! ● 出行小管家:你说 “我周末要去动物园,帮我规划路线,再推荐好吃的”。大模型会结合你的位置(语音模块能关联定位)、动物园开放时间、周边餐厅评价,给出 “坐 3 号线转 5 号线,出口有卖网红冰淇淋” 这样的具体回答,而不是只报 “动物园在 XX 路”。 三、大模型 + AI 视觉:让 AI 从 “认东西” 到 “讲故事” 机器视觉能让 AI “认出” 图片里是猫还是狗,可要是你问 “这张猫的图片里,它在做什么?开心吗?”,就需要大模型来 “解读” 了。这对组合就像 “眼睛 + 大脑”,既能 “看见”,又能 “思考”。 组合原理:视觉 “照相机”+ 大模型 “解读员” AI 视觉像 “照相机”,负责 “拍” 下图片里的特征(比如 “猫”“毛线球”“尾巴翘起来”);大模型像 “解读员”,负责把这些特征串成有逻辑的内容,甚至分析背后的含义。过程就像: 1. 你上传一张 “猫追毛线球” 的图片,问 “它在干嘛?”(视觉输入) 2. 视觉模块:识别出图片里的特征 ——“橘猫”“毛线球”“猫的爪子伸向毛线球”“尾巴上扬”。 3. 大模型:① 联想 “猫喜欢玩毛线球” 的常识;② 分析 “爪子伸出去”“尾巴上扬” 是开心的表现;③ 组织语言 “这只橘猫正在追毛线球玩,看起来很开心呢”。 4. 输出回答:可以是文字,也能让语音模块 “说” 出来。 生活中的示例:会 “看图说话” 的 AI 工具 ● 作业辅导神器:你拍一张 “小鸟站在树枝上” 的语文看图写话作业,问 “怎么写得更生动?”。视觉模块先认出 “小鸟”“树枝”“蓝天背景”,大模型会结合这些特征,给出 “‘一只圆滚滚的小鸟站在嫩绿的树枝上,扑扇着翅膀,好像在唱春天的歌’—— 可以加颜色和动作哦” 这样的建议,还能帮你修改句子。 ● AI 绘画 “搭档”:你说 “画一只戴着帽子的猫,在雪地里堆雪人”,并上传一张你画的简笔画。视觉模块认出你画的 “猫”“帽子”“雪人” 轮廓,大模型会:① 优化细节(给猫加毛茸茸的毛发、给雪人加围巾);② 搭配场景(雪地里加脚印、天上加雪花);③ 调整颜色(猫是灰色、帽子是红色),最后生成一张精美的图片,比普通绘画 AI 更懂你的 “想法”。 ● 旧照片 “讲故事”:你上传一张爷爷的老照片(里面有爷爷、老自行车、老房子),问 “这张照片可能是哪年拍的?”。视觉模块认出 “老式二八大杠自行车”“青砖老房子”,大模型会联想 “二八大杠在 80 年代很流行”“青砖房是那个年代的常见民居”,回答 “这张照片可能是 80 年代拍的,那时候二八大杠自行车是很多人的代步工具呢”。 四、和大模型 “对话” 的密码:提示词与人设提示词 大模型这么聪明,可它 “听不懂” 模糊的要求 —— 你说 “写篇作文”,它不知道写什么主题;你说 “画个动物”,它不知道画哪种。这时候就需要 “提示词” 来给它 “指方向”,而 “人设提示词” 能让它变成你想要的 “角色”! 什么是提示词?—— 给大模型的 “任务说明书” 提示词就是你告诉大模型 “要做什么、怎么做” 的话,得说清楚主题、要求、细节。就像你让同学帮你带文具,得说 “帮我带一支黑色、0.5 毫米的中性笔”,而不是只说 “带支笔”。 比如: ● 差的提示词:“写个故事”(模糊不清,大模型不知道写什么)。 ● 好的提示词:“写一个关于小猫和小狗成为朋友的故事,主角叫‘花花’(猫)和‘大黄’(狗),发生在秋天的公园,要有温暖的对话”(主题、主角、场景、风格都讲清了)。 什么是人设提示词?—— 给大模型 “定角色” 人设提示词就是让大模型 “扮演某个角色”,用这个角色的语气、知识来回答。就像玩角色扮演游戏,你让同学 “扮演老师”,他就会用老师的语气说话。 人设提示词示例讲解:让大模型变 “专属老师” 比如你想让大模型扮演 “小学科学老师”,帮你讲 “蝴蝶的生命周期”,可以这样写提示词: “请你扮演一位温柔有耐心的小学科学老师,用小朋友能听懂的话,讲一讲蝴蝶的生命周期。要分步骤说,每个步骤举个小例子,最后加一个互动问题,比如‘你在公园见过蝴蝶的哪个阶段呀?’” 咱们拆一拆这个提示词: ● 角色:温柔有耐心的小学科学老师(定 “人设”,决定语气和难度)。 ● 任务:讲蝴蝶的生命周期(定 “做什么”)。 ● 要求:用小朋友能懂的话、分步骤、举例子、加互动问题(定 “怎么做”)。 大模型看到后,就会用老师的语气回答: “小朋友们,蝴蝶的一生要经过四个神奇的阶段哦~第一个阶段是‘卵’,就像蝴蝶妈妈在叶子上埋下的‘小种子’,圆圆的、小小的;第二个阶段是‘幼虫’,也就是毛毛虫,它会使劲吃叶子,慢慢长大;第三个阶段是‘蛹’,毛毛虫会变成一个硬硬的‘小房子’,在里面悄悄变身;第四个阶段是‘成虫’,美丽的蝴蝶就从蛹里飞出来啦!你在公园见过蝴蝶的哪个阶段呀?” 再比如,你想让大模型扮演 “漫画师”,帮你设计 “猫咪宇航员”: “请你扮演一位擅长可爱风格的漫画师,帮我设计一只猫咪宇航员。要求:猫咪是白色的,戴着蓝色头盔,头盔上有小星星图案,穿着粉色宇航服,手里拿着一面小旗子,背景是紫色的太空(有月亮和行星)。” 大模型就会按照 “可爱漫画师” 的人设,给出符合要求的设计描述,甚至能生成对应的图片草稿~ 五、大模型不是 “魔法”,是 “学习的成果” 其实大模型的 “聪明”,都是靠 “读万卷书”(学海量数据)和 “听指挥”(看提示词)来的。它就像一个愿意帮你解决问题的 “超级学霸”,你说得越清楚,它帮得越到位。可以参考小聆AI配置文档( https://docs2.listenai.com/x/S_TEd8h7C)给CSK6大模型开发板设计专属的提示词和人设,让它变成你的 “专属小帮手”~ 说不定以后你还能自己训练大模型,让它更懂你的想法呢! 六、其他资料以上图片内容仅作参考,可以根据实际讲解场景进行更换。后续会继续推出相关内容。
|