我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 23|回复: 1

[IT/数码] 【AI入门课程】打造自己的大模型桌面AI助理

[复制链接]

该用户从未签到

42

主题

0

回帖

141

积分

二级逆天

积分
141
发表于 前天 11:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×

                                                                                       
【AI入门课程】打造自己的大模型桌面AI助理AI任务设定讲解
有没有试过让智能音箱 “用妈妈的语气催我写作业”,或者 “用卡通人物的声音讲笑话”?这其实是给大模型设置了 “语音人设”—— 就像让 AI 扮演一个特定的角色,既要说符合角色的话,还要有角色专属的声音。可 AI 没有真的 “嗓子” 和 “性格”,它是怎么 “装” 出不同人设的呢?今天咱们就拆一拆这背后的小秘密!
一、先搞懂:语音人设 =“说什么”+“怎么说”
其实语音人设和你玩角色扮演游戏一模一样!比如你扮演 “小公主”,不仅要说 “请帮我拿一下水杯哦”(说话内容),还要用轻柔的语气、甜甜的声音(说话方式)。AI 的语音人设也分两部分:
                ● 内容人设:AI 说的话要符合角色身份,比如 “小学老师” 会说 “咱们一起算这道题”,“卡通小熊” 会说 “小熊觉得这个问题超简单!”;
                ● 声音人设:AI 的声音要匹配角色,比如 “老爷爷” 是低沉慢语速,“小松鼠” 是尖细快语速。
这两部分合起来,就是完整的语音人设 —— 而背后的原理,其实是大模型和 “发声小主播”(语音合成模块)在按 “角色手册” 干活!
二、语音人设的 3 步魔法:给 AI 写 “角色说明书”
给大模型设置语音人设,本质是给它递一份详细的 “角色说明书”,AI 会照着说明书一步步 “进入角色”。咱们以 “温柔的小学英语老师” 人设为例,看看这 3 步魔法是怎么实现的:
第一步:翻译人设要求 —— 把 “感觉” 变成 “规则清单”
当你说 “让 AI 当温柔的小学英语老师” 时,这句话太模糊了 ——“温柔” 到底是怎么说话?“英语老师” 要讲哪些话?这时候大模型会先当 “翻译官”,把模糊的感觉变成一条条清晰的 “角色规则”,就像给演员写的 “角色卡”:
                ● 语气规则:说话要轻柔,结尾带一点点上扬的调子(比如 “这个单词读对啦~”),不能用严厉的词(比如不说 “你又错了!”);
                ● 用词规则:要带 “小朋友”“咱们”“一起” 等亲切的词,多加鼓励的话(比如 “真棒”“再试试就好”);
                ● 知识规则:回答英语问题时要讲简单的语法,比如教 “apple” 时要加 “这是名词,复数是 apples”,不能讲太复杂的术语;
                ● 声音规则:要用 25-30 岁的女声,语速比正常说话慢 10%(方便小朋友听清楚)。
这些规则就像 “说明书”,让 AI 知道 “角色的底线和风格”。
第二步:定制回答内容 —— 按 “角色卡” 写 “台词”
有了 “角色规则”,大模型就开始 “写台词” 了 —— 不管你问什么问题,它都会先想 “这个角色会怎么说”,再生成回答。比如你问 “apple 怎么读?”:
                ● 要是没有人设,AI 会直接答:“apple 读作 /ˈæpl/,名词,意为苹果。”(干巴巴的);
                ● 按 “温柔英语老师” 人设,AI 会对照规则写:“小朋友,apple 的读音是 /ˈæpl / 哦~咱们一起读一遍:a-p-ple,对啦!它是表示水果的名词,比如‘I have an apple’(我有一个苹果),是不是很简单呀?”(符合语气、用词、知识规则)。
这一步的关键是:大模型 “读” 过成千上万种人的说话方式(就像看过无数个老师、卡通角色的对话),能快速匹配 “角色卡” 里的风格,生成对应的 “台词”。
第三步:匹配专属声线 —— 给 “台词” 配 “演员声”
“台词” 写好了,就轮到 AI 的 “发声小主播”(语音合成模块)登场 —— 它要给台词配上符合人设的声音,就像给剧本找合适的演员。
“发声小主播” 的 “声线库” 里藏着好多 “声音模板”,比如:
                ● 女声模板:有温柔型、活泼型、严肃型;
                ● 男声模板:有低沉型、阳光型、卡通型;
                ● 语速模板:有慢速(适合老师)、中速(适合普通人)、快速(适合卡通角色)。
按 “温柔英语老师” 的声音规则,“发声小主播” 会挑 “25 岁温柔女声 + 慢 10% 语速” 的模板,把 “小朋友,apple 的读音是 /ˈæpl / 哦~” 变成对应的声音。甚至能加 “语气细节”,比如 “哦~” 字拖一点点长音,听起来更亲切。
下面可以用CSK6大模型开发板试试设置不同人设:让 “严格的数学老师” 检查作业,让 “温柔的大姐姐” 讲睡前故事,甚至让 “卡通皮卡丘” 教你背单词。
实现步骤
实操+详细讲解篇幅较长,会按以下流程步骤分享:
步骤一:在聆思平台自建应用,实现小聆AI大模型语音自有应用链路接入;
步骤二:设置个性化AI机器人的人设;
            1、     直接使用系统模板或通过提示词文字描述自定义名称、性格、爱好、回复风格;
            2、     设置发音人音色,可以直接选择系统提供的20多个发音人,也可以使用【声音克隆】功能克隆真人声音;
            3、     给AI机器人增加专属知识,可以使用【角色知识库】功能,上传文档即可生效。
步骤三:大模型语音开发板绑定自建应用
另外小聆AI还支持【长期记忆】、【声纹识别】、【联网搜索】、【文字生产图片】、【图片内容理解】,也可以通过【MCP服务】接入高德地图、航班信息等公开的互联网服务和自建的MCP服务,有研发基础的同学可以在掌握基础方案后继续探索。
一、通过聆思平台自建小聆AI大模型语音应用
1、点击应用模板中心,在简易配置标签下选择大模型语音交互模板点击添加应用按钮。给应用命名后点击确认创建应用。
            2、     输入名称,其他保持默认点击确定,就完成自己的小聆AI应用创建了
二、设置个性化AI机器人的人设和功能
点击进入小聆AI的应用配置页,我们可以在本配置页对大模型功能进行配置。
1、自定义名称、性格、爱好、回复风格
                ● 我们可以通过修改角色描述调整大模型的人设,如:约定AI助手的名称、性格、爱好
                ● 约定AI助手回复风格,这里可以自由配置更多个性化的人物设定
            2、     设置发音人
做完【角色设定】就可以进行机器人的音色设定,如下图所示,点击选择想使用的系统发音人。
如果不想用系统提供的声音,也可以参考下图使用【声音复刻】功能录制克隆真人音色作为回复的音色。
克隆完成后,就可以在发音人选择栏选择克隆的真人声音
            3、     给机器人增加专属知识库
如果想让AI机器人具备自己的经历认知范围或专业知识,我们可以通过在应用中增加知识库,让大模型优先根据专属知识库的人设背景内容进行回答。
3.1 创建知识库
点击知识库,在知识库页面中点击右上角+创建知识库按钮
创建完成后,上传知识库文件,等待系统自动处理,片刻后可看到文件处于启用状态。
3.2 完善知识库信息
要提升知识库匹配准确性,我们操作的时候要注意以下几点:
1.明确知识库名称:名称需要准确反映知识库主题,避免使用“测试、文件1”等模糊词。
2.补充知识库描述:摘要必须覆盖所有文档的核心内容,不能只描述其中一部分,可使用系统提供的【智能摘要】功能辅助总结。
3.3 关联知识库
完成知识库创建后在应用配置中,点击关联知识库按钮,在弹出的窗口中,选中刚才创建的知识库,最后点击保存。
三、大模型开发板接入自建小聆AI链路
云端配置成功后,接下来需要把配置好人设的云端大模型应用链路跟指定开发板绑定。
1、云端应用设备列表加入硬件设备ID1.1 读取设备id
设备ID是一个产品下的唯一设备标识,我们需要获取当前设备ID方便后续在云端配置,才能让设备鉴权通过实现端云交互,读取方式:
1.打开cskburn desktop,点击串口下拉框;
2.选择连接开发套件后识别到的串口编号,点击获取信息;
            3.     得到设备ID  (
            4.     这里需要安装cskburn desktop,这是是一款聆思推出的桌面工具,下载地址:https://docs2.listenai.com/x/oo2_KzYFd
1.2、加入设备列表
a、在【我的应用】的【智能硬件】栏选择自建的【应用名】,按序号依次打开后,选择【导入设备ID】
b、在弹出的界面选择【文本导入】,写入开发板的设备ID,然后点击【导入】即可。
注:开发板ID信息参考下一步读取设备ID部分内容获得
2、CSK6开发板设备端写入云端产品服务配置
云端配置设备id后,还需将产品ID写入开发板固件中,才能让设备在运行时找到正确的云端产品服务完进行鉴权,鉴权完成就可以进行大模型语音交互了。
配置方式如下:
2.1、先在聆思平台打开已经配置好的产品,展示出右侧的接入二维码:
2.2、然后在开发板的首页下滑调出菜单,点击设置图标 →再点击应用,切换到应用信息查看页:2.3、点击右下角扫码接入按钮调出相机,将 LSPlatform 待接入的产品二维码置于屏幕绿色扫描框内,完成扫描后,请在应用配置信息处检查product_id和secret_id是否已更新:
注:屏幕亮度和反光会影响扫码识别,可以把二维码的网页放大200%以上再扫码。
四、语音交互验证
用小聆小聆唤醒,并提问你是谁,语音回复预先设置的人设和知识库信息即验证成功。至此,可以确认自定义AI人设配置接入成功。
五、其他资料
以上图片内容仅作参考,可以根据实际讲解场景进行更换。后续会继续推出相关内容。
有自己设计课程的朋友可以先参考这份课程设计参考:https://docs2.listenai.com/x/xNA3G4J8h
演示硬件详细资料:https://docs2.listenai.com/x/nTn9kMMCU




回复

使用道具 举报

  • TA的每日心情
    开心
    昨天 10:01
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    9

    主题

    28

    回帖

    85

    积分

    一级逆天

    积分
    85
    发表于 昨天 10:09 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    每日签到,有金币领取。


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉|网站地图

    ( 闽ICP备2024076463号-1 ) 论坛技术支持QQ群171867948 ,论坛问题,充值问题请联系QQ1308068381

    平平安安
    TOP
    快速回复 返回顶部 返回列表