马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
【AI入门课程】打造自己的大模型桌面AI助理AI任务设定讲解有没有试过让智能音箱 “用妈妈的语气催我写作业”,或者 “用卡通人物的声音讲笑话”?这其实是给大模型设置了 “语音人设”—— 就像让 AI 扮演一个特定的角色,既要说符合角色的话,还要有角色专属的声音。可 AI 没有真的 “嗓子” 和 “性格”,它是怎么 “装” 出不同人设的呢?今天咱们就拆一拆这背后的小秘密! 一、先搞懂:语音人设 =“说什么”+“怎么说” 其实语音人设和你玩角色扮演游戏一模一样!比如你扮演 “小公主”,不仅要说 “请帮我拿一下水杯哦”(说话内容),还要用轻柔的语气、甜甜的声音(说话方式)。AI 的语音人设也分两部分: ● 内容人设:AI 说的话要符合角色身份,比如 “小学老师” 会说 “咱们一起算这道题”,“卡通小熊” 会说 “小熊觉得这个问题超简单!”; ● 声音人设:AI 的声音要匹配角色,比如 “老爷爷” 是低沉慢语速,“小松鼠” 是尖细快语速。 这两部分合起来,就是完整的语音人设 —— 而背后的原理,其实是大模型和 “发声小主播”(语音合成模块)在按 “角色手册” 干活! 二、语音人设的 3 步魔法:给 AI 写 “角色说明书” 给大模型设置语音人设,本质是给它递一份详细的 “角色说明书”,AI 会照着说明书一步步 “进入角色”。咱们以 “温柔的小学英语老师” 人设为例,看看这 3 步魔法是怎么实现的: 第一步:翻译人设要求 —— 把 “感觉” 变成 “规则清单” 当你说 “让 AI 当温柔的小学英语老师” 时,这句话太模糊了 ——“温柔” 到底是怎么说话?“英语老师” 要讲哪些话?这时候大模型会先当 “翻译官”,把模糊的感觉变成一条条清晰的 “角色规则”,就像给演员写的 “角色卡”: ● 语气规则:说话要轻柔,结尾带一点点上扬的调子(比如 “这个单词读对啦~”),不能用严厉的词(比如不说 “你又错了!”); ● 用词规则:要带 “小朋友”“咱们”“一起” 等亲切的词,多加鼓励的话(比如 “真棒”“再试试就好”); ● 知识规则:回答英语问题时要讲简单的语法,比如教 “apple” 时要加 “这是名词,复数是 apples”,不能讲太复杂的术语; ● 声音规则:要用 25-30 岁的女声,语速比正常说话慢 10%(方便小朋友听清楚)。 这些规则就像 “说明书”,让 AI 知道 “角色的底线和风格”。 第二步:定制回答内容 —— 按 “角色卡” 写 “台词” 有了 “角色规则”,大模型就开始 “写台词” 了 —— 不管你问什么问题,它都会先想 “这个角色会怎么说”,再生成回答。比如你问 “apple 怎么读?”: ● 要是没有人设,AI 会直接答:“apple 读作 /ˈæpl/,名词,意为苹果。”(干巴巴的); ● 按 “温柔英语老师” 人设,AI 会对照规则写:“小朋友,apple 的读音是 /ˈæpl / 哦~咱们一起读一遍:a-p-ple,对啦!它是表示水果的名词,比如‘I have an apple’(我有一个苹果),是不是很简单呀?”(符合语气、用词、知识规则)。 这一步的关键是:大模型 “读” 过成千上万种人的说话方式(就像看过无数个老师、卡通角色的对话),能快速匹配 “角色卡” 里的风格,生成对应的 “台词”。 第三步:匹配专属声线 —— 给 “台词” 配 “演员声” “台词” 写好了,就轮到 AI 的 “发声小主播”(语音合成模块)登场 —— 它要给台词配上符合人设的声音,就像给剧本找合适的演员。 “发声小主播” 的 “声线库” 里藏着好多 “声音模板”,比如: ● 女声模板:有温柔型、活泼型、严肃型; ● 男声模板:有低沉型、阳光型、卡通型; ● 语速模板:有慢速(适合老师)、中速(适合普通人)、快速(适合卡通角色)。 按 “温柔英语老师” 的声音规则,“发声小主播” 会挑 “25 岁温柔女声 + 慢 10% 语速” 的模板,把 “小朋友,apple 的读音是 /ˈæpl / 哦~” 变成对应的声音。甚至能加 “语气细节”,比如 “哦~” 字拖一点点长音,听起来更亲切。 下面可以用CSK6大模型开发板试试设置不同人设:让 “严格的数学老师” 检查作业,让 “温柔的大姐姐” 讲睡前故事,甚至让 “卡通皮卡丘” 教你背单词。 实现步骤实操+详细讲解篇幅较长,会按以下流程步骤分享: 步骤一:在聆思平台自建应用,实现小聆AI大模型语音自有应用链路接入; 步骤二:设置个性化AI机器人的人设; 1、 直接使用系统模板或通过提示词文字描述自定义名称、性格、爱好、回复风格; 2、 设置发音人音色,可以直接选择系统提供的20多个发音人,也可以使用【声音克隆】功能克隆真人声音; 3、 给AI机器人增加专属知识,可以使用【角色知识库】功能,上传文档即可生效。 步骤三:大模型语音开发板绑定自建应用 另外小聆AI还支持【长期记忆】、【声纹识别】、【联网搜索】、【文字生产图片】、【图片内容理解】,也可以通过【MCP服务】接入高德地图、航班信息等公开的互联网服务和自建的MCP服务,有研发基础的同学可以在掌握基础方案后继续探索。 一、通过聆思平台自建小聆AI大模型语音应用1、点击应用模板中心,在简易配置标签下选择大模型语音交互模板点击添加应用按钮。给应用命名后点击确认创建应用。 2、 输入名称,其他保持默认点击确定,就完成自己的小聆AI应用创建了 二、设置个性化AI机器人的人设和功能点击进入小聆AI的应用配置页,我们可以在本配置页对大模型功能进行配置。 1、自定义名称、性格、爱好、回复风格 ● 我们可以通过修改角色描述调整大模型的人设,如:约定AI助手的名称、性格、爱好 ● 约定AI助手回复风格,这里可以自由配置更多个性化的人物设定 2、 设置发音人做完【角色设定】就可以进行机器人的音色设定,如下图所示,点击选择想使用的系统发音人。 如果不想用系统提供的声音,也可以参考下图使用【声音复刻】功能录制克隆真人音色作为回复的音色。 克隆完成后,就可以在发音人选择栏选择克隆的真人声音 3、 给机器人增加专属知识库如果想让AI机器人具备自己的经历认知范围或专业知识,我们可以通过在应用中增加知识库,让大模型优先根据专属知识库的人设背景内容进行回答。 3.1 创建知识库点击知识库,在知识库页面中点击右上角+创建知识库按钮 创建完成后,上传知识库文件,等待系统自动处理,片刻后可看到文件处于启用状态。 3.2 完善知识库信息要提升知识库匹配准确性,我们操作的时候要注意以下几点: 1.明确知识库名称:名称需要准确反映知识库主题,避免使用“测试、文件1”等模糊词。 2.补充知识库描述:摘要必须覆盖所有文档的核心内容,不能只描述其中一部分,可使用系统提供的【智能摘要】功能辅助总结。 3.3 关联知识库完成知识库创建后在应用配置中,点击关联知识库按钮,在弹出的窗口中,选中刚才创建的知识库,最后点击保存。 三、大模型开发板接入自建小聆AI链路云端配置成功后,接下来需要把配置好人设的云端大模型应用链路跟指定开发板绑定。 1、云端应用设备列表加入硬件设备ID1.1 读取设备id设备ID是一个产品下的唯一设备标识,我们需要获取当前设备ID方便后续在云端配置,才能让设备鉴权通过实现端云交互,读取方式: 1.打开cskburn desktop,点击串口下拉框; 2.选择连接开发套件后识别到的串口编号,点击获取信息; 3. 得到设备ID ( 1.2、加入设备列表a、在【我的应用】的【智能硬件】栏选择自建的【应用名】,按序号依次打开后,选择【导入设备ID】 b、在弹出的界面选择【文本导入】,写入开发板的设备ID,然后点击【导入】即可。 注:开发板ID信息参考下一步读取设备ID部分内容获得 2、CSK6开发板设备端写入云端产品服务配置云端配置设备id后,还需将产品ID写入开发板固件中,才能让设备在运行时找到正确的云端产品服务完进行鉴权,鉴权完成就可以进行大模型语音交互了。 配置方式如下: 2.1、先在聆思平台打开已经配置好的产品,展示出右侧的接入二维码: 2.2、然后在开发板的首页下滑调出菜单,点击设置图标 →再点击应用,切换到应用信息查看页:2.3、点击右下角扫码接入按钮调出相机,将 LSPlatform 待接入的产品二维码置于屏幕绿色扫描框内,完成扫描后,请在应用配置信息处检查product_id和secret_id是否已更新: 注:屏幕亮度和反光会影响扫码识别,可以把二维码的网页放大200%以上再扫码。 四、语音交互验证用小聆小聆唤醒,并提问你是谁,语音回复预先设置的人设和知识库信息即验证成功。至此,可以确认自定义AI人设配置接入成功。 五、其他资料以上图片内容仅作参考,可以根据实际讲解场景进行更换。后续会继续推出相关内容。
|