方言守护者:基于启英泰伦CI-F162GS02J芯片的“能听懂乡音”的智能夜灯DIY全攻略
在我国广袤的土地上,从东北的豪迈到岭南的温婉,从吴侬软语到川渝方言,语言的多样性构成了中华文化最动人的篇章。然而,在智能家居普及的今天,标准的普通话识别系统却无形中竖起了一道技术屏障——多少老人对着智能设备用方言反复呼唤却得不到回应,多少家庭因为语音控制“听不懂”方言而让科技产品成了摆设。 我翻遍了市场上几乎所有成熟的离线语音识别方案,发现了一个叫“自学习”的成熟方言识别方案。 ☞先看方案视频【自学习方案演示】 今天,我们将用一块小巧的启英泰伦【CI-F162GS02J 智能语音识别模块】语音识别模块,亲手打造一盏“能听懂乡音”的智能小夜灯——它不仅能在黑暗中为你点亮一束光,更能听懂天南海北的方言指令,成为真正融入每个家庭的“方言守护者”。 第一章:核心组件深度解析——启英泰伦CI-F162GS02J模块 1.1 硬件规格: 我们手中的CI-F162GS02J离线语音识别模块,尺寸仅为30mm×40mm,却集成了智能语音识别的完整解决方案: 核心芯片:该模块搭载CI13162芯片,专为离线语音识别优化的低成本AI芯片; 工作电压:3.6V-5.5V宽电压设计,兼容多种供电方案; 音频接口:板载功放,集成一路麦克风输入和一路喇叭输出; 通信接口:支持UART串口通信,当该模块作为从设备‌(Slave)时,可与主控板(Master)无缝对接; 物理设计:预留3.5mm螺丝孔,便于安装固定。 1.2 技术特点:离线语音识别的优势 与需要联网的语音助手不同,CI-F162GS02J所搭载的语音识别芯片最大优势在于完全离线工作: 隐私保护:所有语音处理在本地完成,对话内容不会上传云端 即时响应:无需网络连接,识别响应时间[removed]99%(安静环境),>95%(嘈杂环境) 识别准确率:基础命令>95%,复杂命令>90% 响应时间:[removed]40% 6.2 常见问题与解决方案 **问题1:**如何进入学习模式? **解决方法1:**唤醒后(标准demo的唤醒词为“智能管家”),念命令词“学习唤醒词”或者“学习命令词”就可以进入学习模式。 **问题2:**如何退出学习模式? **解决方法2:**退出方式有两种,第一种用户主动退出,唤醒后,进入学习模式后,通过念命令词”退出学习“可以退出注册模式。第二种:每次学习成功后,系统自动退出学习模式,进入识别模式。 **问题3:**如果进入学习模式,念语音无任何反馈,怎么处理? **解决方法3:**原因一:可能是声音太小了,学习时提高了VAD的阈值,解决方式:保持和设备的距离在0.5米内,声音洪亮进行学习。原因二:系统退出唤醒状态了,解决方式:唤醒后重新进入学习模式就可解决。 6.3 DIY成本分析与量产建议 物料成本(DIY): CI-F162GS02J带插口单麦离线语音识别模块:¥17.5-29元 LED灯珠与灯罩:¥8-12元 电源与其他:¥5-8元 总成本:¥30.5-49元 量产优化建议: 定制一体化PCBA,降低组装成本 批量采购芯片,享受规模优惠 自动化测试流程,提高生产效率 模块化设计,支持功能快速迭代 结语:技术有温度,乡音永流传 夜幕降临,当你用家乡话说出“怀鸭胲仔(huai ya gai zai)”四个字,那盏为你点亮的小夜灯,温暖的不仅是房间,更是游子心中那份对乡音的眷恋。启英泰伦CI-F162GS02J芯片虽小,却承载着让科技理解每一个人、尊重每一种语言的大梦想。 在这个标准化、统一化趋势愈发明显的时代,我们选择用技术守护多样性,用创新保留独特性。这盏能听懂方言的小夜灯,只是一个起点。未来,会有更多“能听懂乡音”的智能设备走进千家万户,让科技成为温暖包容的伙伴。 从今天开始,让我们用代码写诗,用电路作画,用科技的力量,守护每一处乡音,温暖每一个夜晚。 附录 启英泰伦语音AI平台地址、启英泰伦文档中心、启英泰伦官网、嘉立创 致谢 感谢启英泰伦提供的优秀芯片和开发平台,感谢开源社区提供的各种工具和库。技术之路,因分享而精彩,因包容而进步。
启友玩AI
0 4 硬创社
受够了复杂的OSD菜单?手把手教你为显示器嵌入“听懂人话”的离线语音识别能力
面对显示器上密密麻麻的OSD按键和复杂的多级菜单,我作为一家显示器厂商选择用一块不足掌心大小的语音识别模块,让传统显示器听懂人话,开启了人机交互的新篇章。 想象一下,你不需要在显示器侧面摸索那些难以区分的物理按键,也不用在复杂的屏幕菜单中逐级寻找亮度调节选项,只需说出“调亮一点”或“切换到HDMI输入”,显示器便能瞬间响应——这不再是科幻电影的场景。 基于启英泰伦CI-D03GS01J离线语音识别模块,我们可以将任何一台普通显示器升级为智能语音交互设备,彻底解决传统显示器操作繁琐的痛点。 01 痛点起源:现代显示器的交互困境 现代显示器的功能日益丰富,从基础的亮度、对比度调节到色温、游戏模式等专业设置,OSD菜单变得越来越复杂。大多数显示器仅配备4-6个物理按键,却要控制数十项功能,用户不得不记住特定的按键组合和菜单导航路径。 更令人沮丧的是,当我们需要快速调节时——比如在玩游戏时觉得屏幕太暗,或在看视频时希望增加对比度——必须暂停当前活动,摸索显示器背面的按键,进入层层菜单才能完成调整。这种中断式交互严重影响了用户体验的流畅性。 02 技术选型:为何选择CI-D03GS01J模块 在众多离线语音解决方案中,启英泰伦CI-D03GS01J模块以其高度集成和即插即用的特性脱颖而出。 这款模块尺寸仅为30mm×40mm,搭载CI1303芯片,配备4MB FLASH存储,支持最多500条离线命令词识别。模块板载功放,集成了1路麦克风输入、1路喇叭输出和1路5V电源及UART接口,实现了最小外部元件需求。 与需要网络连接的云端语音方案相比,离线方案具有零延迟、高隐私保护和不受网络环境影响等优势。而相比于其他离线方案,CI-D03GS01J的独特之处在于其支持离线NLP算法和方言命令词自学习功能。 下表展示了CI-D03GS01J模块的核心参数: 参数类别 具体规格 应用意义 物理尺寸 30mm×40mm 易于集成到各种设备中 主芯片 CI1303 专为语音处理优化的神经网络处理器 存储容量 4MB FLASH 可存储语言模型和大量的命令词条指令 命令词支持 最多500条 满足复杂控制需求 音频接口 1路麦克风+1路喇叭 完整的语音输入输出能力 数据接口 UART(5V电平) 与主控设备简单连接 工作温度 -40℃~85℃ 适应各种环境条件 特殊功能 方言自学习、离线NLP、高抗噪 提升识别率和用户体验 这款模块所搭载的芯片属于启英泰伦CI13XX系列,该系列模块采用BNPU V3架构,支持DNN、TDNN、RNN、CNN等神经网络及并行矢量运算,可实现语音识别、声纹识别、命令词自学习等多种功能。 03 系统设计:语音模块与显示器的集成方案 将CI-D03GS01J模块集成到显示器系统中,需要构建一个完整的硬件生态系统。系统主要由三部分组成:语音识别模块、主控板和显示器本身。 最直接的方法是利用显示器的MCU作为主控制器,通过UART接口与语音模块通信。当语音模块识别到有效命令后,会将对应的指令代码通过串口发送给显示器MCU,MCU再执行相应的显示控制功能。 硬件连接主要包括三个部分:电源连接、音频连接和数据连接。CI-D03GS01J模块需要5V供电,可以直接从显示器内部电源获取;麦克风和喇叭连接模块对应的接口(显示器有交互界面可无需使用喇叭,可节约成本);UART接口则连接到主控板的串口引脚。 系统的软件架构同样重要。语音模块固件需要包含唤醒词检测、命令词识别和结果输出三个核心部分。启英泰伦提供了完整的开发工具链,开发者可以通过其官方开发平台☞语音AI平台简单高效的自定义唤醒词和命令词,选择适合特定环境和不同国家语种的语言模型。 04 实战操作:从零构建语音控制显示器 开始实际构建前,需要准备以下材料:CI-D03GS01J模块、兼容的麦克风、UART及5V电源连接线、主控板(如STM32或ESP32系列)以及目标显示器。 ①第一步是硬件组装。将麦克风正确连接到CI-D03GS01J模块的对应接口(在背板上注意设计一个开孔结构供麦克风拾音)。然后将语音模块的UART接口连接到主控板,建立主控板与显示器之间的控制链路(显示器主控板设计时预留UART接口)。 ②电源管理至关重要。确保主控板给语音模块提供的是稳定纯净的5V电源,以达到稳定的语言识别效果。 ③固件生成配置是项目的核心环节。首先需要通过启英泰伦的语音AI平台创建项目,定义唤醒词和命令词集。官网文档中心提供了视频教程,跟着做简直是小白的福音。 视频教程地址:☞软件篇06:平台5分钟完成单麦离线固件(第一讲:制作定制协议的固件) - 启英泰伦文档中心 #嘉立创PCB# 对于显示器控制,典型的命令词可能包括: 基础控制:“开机”、“关机”、“菜单” 显示调节:“调亮一点”、“降低亮度”、“增加对比度” 输入源切换:“切换到HDMI”、“切换到DP口” 预设模式:“游戏模式”、“电影模式”、“阅读模式” 每个命令词都输入AI平台后,会生成一个可用的固件,根据步骤烧录到CI-D03GS01J模块中即可安装到显示器上进行与主控板的联合调试了。 ④代码联调阶段,主控板需要实现串口通信协议解析。CI-D03GS01J模块识别到有效命令后,会通过UART发送预设的指令代码。主控板收到代码后,需要将其转换为显示器能够理解的控制信号。 例如,当用户说“亮度增加”时,语音模块识别成功,通过串口发送指令码“0x01”;主控板收到“0x01”后,去控制显示器亮度增加,并通过显示屏显示“增加亮度”的百分比。 05 命令词设计:符合直觉的语音交互逻辑 精心设计的语音命令词集是项目成功的关键。命令词需要简洁、易记且符合用户直觉。研究表明,自然语言式的命令比简化的代码式命令更容易被用户接受和记住。 对于显示器控制,可以将命令词分为几个逻辑组: 基础控制命令:这是最常用的命令集,包括“打开显示器”、“关闭屏幕”、“显示菜单”、“退出菜单”、“确认选择”等。这些命令应当设计得尽可能简短,避免过长短语增加识别难度。 参数调节命令:显示器的可调参数众多,如亮度、对比度、色温、锐度等。可以设计两种调节方式:一是精确数值调节,如“亮度调到70”;二是相对调节,如“亮一点”、“再暗些”。后者更符合自然对话习惯。 场景模式命令:现代显示器通常预设了多种场景模式,如“游戏模式”、“电影模式”、“阅读模式”、“省电模式”。语音命令可以直接调用这些模式,比通过菜单层层选择高效得多。 输入源管理命令:多输入接口是现代显示器的标配,语音命令可以快速切换输入源,如“切换到HDMI一号”、“切换到笔记本电脑”。 为了提高识别准确率,需要为同一功能设置多个同义词命令。例如,“调亮一点”、“增加亮度”、“亮一些”都可以映射到亮度增加功能。CI-D03GS01J模块支持500条命令词,这为丰富的同义词设计提供了充足空间。 06 优化调试:提升识别率与用户体验 离线语音识别在复杂环境下面临诸多挑战,但通过系统性优化可以显著提升实用性和用户满意度。 环境噪声处理是首要问题。显示器可能被放置在办公室或客厅等不同噪声环境。CI-D03GS01J模块本身具备高抗噪能力,支持远场语音识别。在实际部署中,抗噪性能优异。 识别准确率优化需要多管齐下。各个词条可以单独进行参数调节(需在SDK软件开发包中进行开发)。参考文档:☞语音识别效果优化 - 启英泰伦文档中心。 07 应用扩展:语音控制显示器的广阔前景 基础功能实现后,这一系统可以扩展为更加智能和全面的解决方案。 在智能办公环境中,语音控制的显示器可以与会议室系统集成。演讲者无需助手,通过语音命令即可切换输入源、调整音量、控制灯光和窗帘,打造无缝的演示体验。 对于无障碍辅助应用,语音控制为行动不便的用户提供了独立操作显示器的可能。结合眼动追踪或头部追踪技术,可以构建多模态的无障碍交互系统。 在工业控制场景,操作员在双手忙碌时,可以通过语音命令调出不同的监控界面、调整参数显示或切换数据源。CI-D03GS01J模块的工业级设计支持-40℃至85℃的工作温度范围,适合各种工业环境。 多设备协同是另一个有前景的方向。单个语音模块可以控制多个显示器,实现“同步所有屏幕亮度”或“会议室屏幕全部关机”等批量操作。 未来的增强功能可能包括个性化用户识别,系统识别不同用户的声音,自动加载其偏好的显示设置;上下文感知,系统根据当前显示内容智能推荐相关调节选项;与智能家居系统集成,通过显示器控制整个房间的环境。 类似项目已经验证了语音控制在特定场景中的价值。例如,使用启英泰伦芯片构建的语音激活番茄钟计时器,通过简单的语音命令帮助用户管理时间,无需触摸设备。 结语:让“听懂人话”成为显示器的标准能力 从繁复的物理按键到直觉式的语音对话,我们为显示器交互带来的不仅是一项新功能,更是一种根本性的体验革新。通过集成启英泰伦CI-D03GS01J这样的离线语音识别模块,传统显示器得以突破硬件交互的局限,以一种更自然、更高效的方式融入用户的工作与生活。 回顾整个方案,其核心价值在于三个层面的突破:在技术上,它证明了离线、低功耗、高精度的语音交互完全可以在成本可控的前提下,集成于成熟电子产品中;在体验上,它将用户从 memorizing 按键组合和 menu-diving 中解放出来,实现了“所想即所得”的即时控制;在行业上,它为显示设备乃至更多人机交互界面,指明了一条通往“无感智能”的可行路径。 技术的终点始终是服务于人。当深夜加班的工程师、追求高效的游戏玩家、或是需要无障碍辅助的用户,都能通过最本能的“说话”方式与设备沟通时,科技便真正回归了它的工具本质。这块不足掌心大小的模块,其意义远不止于替代几个按键,它开启的是一扇门——让机器更好地理解人的意图,而非让人去适应机器的逻辑。 未来,随着语音识别、自然语言处理与设备生态的进一步融合,语音交互必将从一种“增强功能”进化为“基础能力”。而我们今天所探索的,正是这条演进道路上坚实的一步。让每一台显示器都能“听懂人话”,这不仅仅是一个技术项目的终点,更是下一代智能终端交互体验的起点。
启友玩AI
9 16 硬创社
从“听不清”到“听得清”:我让普通对讲机拥有了AI降噪黑科技
近期因使用需要,准备购买一套对讲机,在网上看了许久后,感觉都差不多,几乎没有什么亮点;然而市面上的降噪对讲机动辄上千,又让人望而却步。最近,我偶然发现启英泰伦的一款AI降噪模块,萌生了一个大胆的想法:能不能花小钱,亲手给普通对讲机装上‘AI降噪’的黑科技? 答案是肯定的!下面就来分享这次从‘听不清’到‘听得清’的硬核改装全过程。 一、准备工作 1. 播报音模块板购买 ①在启英泰伦官方商城购买一套CI-F322GS01S单麦语音降噪贴片模块,网址如下:启英商城。 ②可以先把模块数据手册下载下来,连接对讲机的时候会用到。 ③看模块的基本参数,3.3V供电,支持麦克风接口,输出也是模拟输出。模块的尺寸也很小,只有16*11mm ,比硬币还小,所以接到对讲机上面是很方便的。只需要供个电,把对讲机上面MIC与后端断开,再把模块串上去就好。做了个框图,方便理解,不理解也没事,按下面操作也可以完成。 ④下面是收到的启英泰语音通话降噪模块图 2. 对讲机购买 ①根据降噪模块的参数,常用对讲机都可以的,我买的是BM-X6这的一款:https://item.jd.com/100071908967.html 3. 其它材料购买 ①后面需要用到烙铁、万用表、螺丝刀、镊子、连接线等,可在网上进行购买。 二、硬件连接 1. 对讲机拆卸 ①先把电池抓下来,然后把对讲机天线与两个旋纽拆下,再把里面固定的贴片通过旋转拆下来。 ②把底部两个螺丝拆掉, 然后延塑胶外壳与银色屏蔽壳之间的缝隙,把银色屏蔽壳翘起来。注意里面有喇叭线,拆的时候要慢慢拆,不要把喇叭线扯断。 2. 对讲机连接线路查找 根据降噪模块规格书,知道需要连接供电(3.3V)、地、麦克风线路,我们分别在对讲机上查找这些网络。把一些地铜皮刮开,麦克风的连接线割断。 ①以下为我买的对讲机,对应的连接点: 3. 模块与对讲机连接图 4. 检查线路 连接好后,可以用万用表测试一下降噪模块的供电脚看是否有短路,然后再把整机装上去,接上电池。 三、效果测试 1. 主观听感测试 改装好后接上电池进行对讲,在接听方分别对加了降噪模块与没加降噪模块的人声声音音色对比,音色没什么变化,还原度高;分别对着对讲机吹气,接收端也没有吹气声、两个对讲机靠近了也没有啸叫声了。拿到马路上测试,接收端也听不到公路上面的车子鸣笛声、工地的电转声。 2. 实验室数据佐证 以下是通过模块规格书查到的,对不同噪声降噪的效果,可看看。 四、结语 通过这次DIY改装,这台普通的对讲机成功实现了“鸟枪换炮”的升级。核心的AI降噪模块有效过滤了环境噪音、啸叫和气流声,让通话质量从“听不清”的级别,提升到了“听得清”的实用水准。 这次实践充分证明,利用启英泰伦CI-F322GS01S这类成熟的语音降噪模块,我们完全可以用较低的成本和一定的动手能力,为普通硬件赋予先进的AI降噪功能。这不仅是一次硬件改造,更是一次对语音技术应用的有趣探索。 最后必须再次强调:改装虽有趣,但风险需自担。 本文仅为技术分享,操作涉及电路改动,请务必确保您具备相应的专业知识,并谨慎行事。 希望本次分享能给大家带来启发,欢迎一起交流探讨更多的硬件DIY可能性!你在DIY过程中遇到过哪些有趣的问题?或者你对这种硬件改装有什么更好的想法?欢迎在评论区留言交流。感谢启英泰伦官网与启英泰伦语音AI平台以及嘉立创的大力支持。 【免责声明】 *本文档为个人DIY技术分享,纯属个人兴趣爱好,非任何官方教程; #小智AI# #ai#* 改装存在风险,可能导致设备损坏、失去保修甚至引发安全隐患。请确保具备相应的硬件知识,改装行为及后果由您自行承担。作者不承担任何责任。
启友玩AI
6 7 硬创社
一篇看完:晶振方案选择不再纠结 - 深度解析内外置晶振及其应用注意事项
最近小编客户研发的一款产品在调试语音与上位机通讯总是出现个别产品功能异常,请启英泰伦协助分析解决。小编分析发现异常原因为语音芯片和上位机芯片均存在频偏,两者频偏相加后导致串口通讯波特率偏差较大,串口通讯失败。小编根据启英泰伦AI平台提供的方法在语音芯片加上了串口波特率自适应后解决了客户的问题。因此小编希望通过本篇文章帮助用户提前规划好晶振方案、规避后期调试问题。小编就由浅入深来和大家一起探讨一下启英泰伦语音识别芯片的晶振方案选型和应用注意事项。 1. 内置晶振和外置晶振介绍 内部晶振集成于芯片内,成本低、功耗小、节省空间(比如启英泰伦CI13082V、CI13162),适合对时钟精度要求不高的场景(如简单控制、消费电子)。外部晶振基于石英晶体(比如启英泰伦CI1302、CI13242),精度高(±1~50ppm)、温漂小,为高速通信(USB、Wi-Fi)、工业控制及汽车电子提供稳定时序基准,是复杂环境和可靠性系统的核心。二者互补,平衡成本与性能,共同保障电子系统的高效运行,两者特点如下 1.1 内部晶振: 实现方式:通过芯片内部集成的RC(电阻-电容)振荡电路或LC振荡电路生成时钟信号。 典型频率范围:通常为低频(如1MHz~48MHz),部分高端芯片可达100MHz。 依赖因素:精度受工艺、温度、电压影响显著,需依赖芯片内置校准功能。 1.2 外部晶振: 1. 实现方式: 无源晶体(Crystal):需依赖外部负载电容和芯片内部的振荡电路驱动。 有源晶振(Oscillator):独立封装,内置振荡电路,直接输出方波信号。 典型频率范围:覆盖更广(kHz~GHz级),适合高频需求。 稳定性:基于石英晶体的压电效应,物理特性稳定。 1.3 关键参数对比 参数 内部晶振(RC/LC) 外部无源晶体 外部有源晶振 精度 ±1%~±5%(未校准) ±10~±100ppm(受温度影响) ±1~±50ppm(含温补型) 温度稳定性 差(随温度漂移明显) 较好(-40°C~85°C) 极佳(部分支持-55°C~125°C) 启动时间 短(μs级) 较长(ms级,依赖负载电容) 短(直接输出稳定信号) 功耗 低(无需驱动外部负载) 中等(需芯片驱动) 较高(独立供电) 成本 免费(集成在芯片内) 低(晶体+电容成本) 高(集成振荡器) 抗干扰能力 强(芯片内部路径短) 弱(易受PCB布局和噪声影响) 中等(需屏蔽设计) 占板面积 无需外部元件 需晶体+2个负载电容 需晶振+电源滤波电容 2. RC振荡器原理 2.1 核心结构与类型 RC振荡器由放大电路、RC选频网络、正反馈回路及稳幅环节四部分组成。其本质是利用电阻(R)和电容(C)的充放电特性构建选频网络,替代传统LC振荡器中的电感元件,适用于1Hz--20MHz低频范围的信号生成。 文氏桥振荡器:采用RC串并联结构,振荡频率公式为:f0=1/2πRC 通过调节R或C值可精确调频,文氏桥振荡器结构如下图: 相移振荡器:通过多级RC网络(如3级)实现90°相移,总相移达360°以满足相位条件,但调频灵活性较差,结构原理如下图: 双T网络振荡器:基于双T型RC滤波,选频特性尖锐,适合固定频率场景 工作原理与振荡条件: 起振阶段:电源接通瞬间,电路噪声包含宽频谱信号,经RC选频网络过滤后,特定频率分量(满足相位条件)被放大并反馈至输入端,形成正反馈循环,信号幅值逐步增大。 稳幅机制:当振幅增长至临界点,非线性元件(如热敏电阻、反向并联二极管)自动降低环路增益,使振幅稳定。例如文氏桥振荡器通过负反馈支路(Rf与R1)实现增益控制。 振荡的数学条件 幅度条件:环路增益 ≥ 1(即∣Aβ∣≥1,A为放大倍数,β为反馈系数)。 相位条件:总相移为360°的整数倍(即正反馈)。 示例:文氏桥在f0=1/2πRC时,相移为0°且反馈系数β=1/3,需放大倍数A≥3方可起振。 2.2 关键性能参数与影响因素 1、频率稳定性差 核心原因:RC 选频网络的参数(R、C)受温度、湿度、振动等环境因素影响较大(如电阻的温度系数、电容的老化或温漂),导致振荡频率容易漂移。 表现:长期工作或环境变化时,输出频率偏差可能超过 1%(甚至更大),难以满足高精度设备(如通信系统、精密测量仪器)的要求。 2、频率调节精度有限 传统 RC 振荡器通过手动调节可变电阻或电容改变频率,但机械调节方式精度低(尤其是微调时),且调节过程中频率易产生跳变,难以实现连续、精确的频率控制。 3、输出波形失真可能较大 部分 RC 振荡器(如文氏桥振荡器)依赖放大电路的非线性特性稳幅,若稳幅电路设计不当(如反馈量控制不佳),易导致输出波形(如正弦波)出现失真(如削波、畸变)。 4、高频性能受限 当需要高频输出时,需减小 R 或 C 的数值。但过小的 R 会增加电路功耗,过小的 C 则易受分布电容(如线路间寄生电容)影响,导致频率不稳定,因此 RC 振荡器通常适用于 1MHz 以下的中低频场景,高频性能不如 LC 振荡器或晶体振荡器。 2.3 针对性解决方案 提升频率稳定性 采用高精度元件:选用低温漂电阻(如金属膜电阻,温度系数≤50ppm/℃)和稳定性好的电容(如聚丙烯电容、云母电容,温漂小且老化率低),减少环境因素对 R、C 参数的影响。 加入温度补偿电路:在电路中串联或并联具有负温度系数的元件(如热敏电阻),当环境温度变化导致 R、C 参数偏移时,补偿电路可反向调节,抵消频率漂移。 引入锁相环(PLL)技术:将 RC 振荡器的输出频率与高精度参考源(如晶体振荡器)通过锁相环同步,利用 PLL 的反馈调节能力,将 RC 振荡器的频率稳定在参考源的精度水平(可达 ppm 级甚至 ppb 级)。 提高频率调节精度,采用数字电位器或数字电容:通过单片机控制数字电位器(如 X9C103)或可编程电容阵列,实现电阻、电容的电子调节,调节精度可达 1% 甚至 0.1%,且支持连续微调,避免机械调节的误差。 分段调节 + 细调结合:将频率范围划分为多个频段,通过切换固定电阻 / 电容实现粗调,再用数字微调元件进行精细调节,兼顾宽范围调节和高精度控制。 改善输出波形失真,优化稳幅电路:文氏桥振荡器中,采用具有负温度系数的热敏电阻(如在正反馈支路串联)或场效应管(FET)构成自动增益控制(AGC)电路,实时调节放大电路增益,使输出幅度稳定在非线性失真最小的范围内。 增加滤波网络:在振荡器输出端加入 RC 低通滤波或 LC 带通滤波电路,滤除高频谐波分量,改善波形的正弦度。 拓展高频应用范围,采用高频 RC 结构:选用高频特性好的运算放大器(如带宽≥10MHz 的高速运放)作为放大核心,减小分布电容影响(如缩短布线、使用屏蔽外壳),使 RC 振荡器可工作在 1-10MHz 范围。 与其他振荡器结合:在高频场景下,可采用 "RC 振荡器 + 倍频电路" 方案,先用 RC 振荡器产生中低频信号,再通过锁相环倍频至高频,兼顾 RC 的宽调节范围和高频输出需求。 3. 应用场景与选型建议 1. 使用内部晶振的场景 • 低成本的消费类电子(玩具、遥控器、电子秤)。 • 启英泰伦语音芯片作为主控且无需通讯的产品应用(灯具、风扇) • 对时钟精度不敏感的功能、简单逻辑控制(如LED闪烁、电机启停)。 • 低速通信(UART、I2C在短距离且无严格同步要求时)。 2. 必须使用外部晶振的场景 • 高速通信接口(USB 2.0/3.0、Ethernet、CAN FD)。 • 无线协议(Wi-Fi、蓝牙、LoRa需精确的射频载波)。 • 音频处理(I2S接口的48kHz/96kHz采样率)。 • 工业自动化(PLC、伺服电机控制)。 • 汽车电子(ECU需通过AEC-Q100认证)。 • 宽温环境(-40°C~125°C的工控场景)。 • 分布式系统(多MCU、FPGA需共享同一时钟源)。 在必须使用外部晶振的场景下错误的选择了内部晶振可能导致的问题有:通讯时好时无,无线通讯频繁掉线,高温环境功能异常,因此一点要根据产品的功能和使用环境综合选择。更多产品和方案请登录【启英泰伦官网】: https://www.chipintelli.com。启英泰伦平台通过灵活的时钟架构和智能软件方案,为客户提供了从低成本到高可靠性的全系列选择。 4. 设计注意事项 4.1. 内部晶振的注意事项: 1、芯片内置的RC振荡器会随环境温度变化产生一定的温漂。该时钟温漂可能对需要高精度时钟的应用,或者与上位机串口通信的准确率带来影响。芯片在环境温度为-10 to 70°C时,RC的最大频偏可以达到±2.5%,这时如果与之通讯的上位机MCU也采用内部RC,则双方时钟偏差叠加可能导致通信失败。建议在这种情况下,使用上位机MCU的外部晶振以提高时钟精度,或选择启英泰伦支持外部晶振输入的芯片型号。此外,在设计PCB布局时应注意将RC振荡器相关的电路远离发热元件,以减少温度变化对频率稳定性的影响。 2、芯片在回流焊接过程会产生频偏,因为回流焊接温度可达260度,这个温度对芯片的RC元件有一定影响,因此对于需要串口通讯的芯片需要加上串口波特率自适应算法保障通讯良好。 3、应用方案采用内部RC振荡器作为时钟源,串口通信波特率必须小于或等于115200bps,推荐工作环境温度为-10到70℃,同时与上位机串口波特率之间总偏差不得超过4%,以保证良好通信。工作环境温度为-10到70℃的,配合的上位机串口波特率偏差在该温区须不超过±1.5%。 当上位机为免晶振设计时,需要尽量减小通讯误差。启英泰伦可提供串口波特率自适应方案,该方案需要在串口协议中增加一个握手指令,并且上位机保证在收到该握手指令的50ms内会按照协议要求回复。增加该自适应方案后,产品可以用于工作环境温度为-20到85℃的场景。具体应用方法可以登录启【英泰伦语音AI平台】:https://aiplatform.chipintelli.com,AI平台在开发固件时可以选择是启用内部晶振还是外部晶振,启用内部晶振的时候会提醒是否打开波特率自适应。 4.2. 外部晶振的注意事项: 1. 晶体尽量靠近芯片引脚,走线对称且避免平行高速信号线。参考如下图: 2. 负载电容(CL)需根据晶体规格书计算、通用一般为22pf。 3. EMI抑制:外部晶体下方禁止走线,必要时铺地屏蔽。有源晶振的电源需添加π型滤波器。 4. 故障排查:若外部晶振不起振,检查负载电容值、PCB虚焊或ESD损坏。 使用示波器测量时需注意探头电容对振荡的影响(建议使用1:1探头)。 5. 结语 在精度与成本之间,寻求设计的平衡点 每一次产品故障的背后,都隐藏着对基础原理的深刻考验。本文从一次常见的通信故障入手,层层剖析,揭示了**“时钟精度”** 这一在设计中容易被忽视,却又举足轻重的关键要素。 无论是集成在片内的RC振荡,还是外置的石英晶体,其本质都是在性能、成本与可靠性之间做出的智慧取舍。没有绝对的“最优解”,只有最适合特定应用场景的“平衡点”。启英泰伦平台提供的,正是这种从芯片到算法的全方位灵活性,让您既能利用内部晶振实现极致的成本控制,也能借助外部晶振和智能算法(如波特率自适应)满足严苛的性能要求。 希望本文能成为您产品设计路上的一份实用指南,帮助您在项目伊始就构筑起对时钟风险的“免疫力”。让稳定可靠的通信,成为您产品值得信赖的底色。
启友玩AI
1 9 硬创社
告别复杂设计:利用 CI 230X 轻松打造你的智能音箱产品
告别复杂设计:利用 CI 230X 轻松打造你的智能音箱产品 1. 芯片介绍 CI230X系列芯片是启英泰伦研发的新一代高性能神经网络智能语音芯片,集成了启英泰伦自研的脑神经网络处理器BNPU V3和CPU内核,以及Wi-Fi和BLE的Combo功能。系统主频可达220MHz,内置大容量SRAM,集成PMU电源管理单元、双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、SPI等外围控制接口。 芯片支持2.4 GHz 802.11 b/g/n Wi-Fi及 BLE 5.1 无线通信协议,仅需少量电阻电容等外围器件就可以实现各类智能语音离在线产品硬件方案,性价比极高。 芯片引脚定义如下: 2. 模组介绍 针对不同的应用需求,启英泰伦基于CI230X芯片推出了2款公版模组,型号分别是:CI-E0XGT02S和CI-E0XGT03S。主要参数说明下: CI-E0XGT02S管脚分布如下: CI-E0XGT03S管脚分布如下: 3. 小智音箱设计 本文已经介绍了CI230X单芯片以及模组的规格,可根据实际情况选择芯片或模组用于产品设计。相比之下,使用单芯片设计灵活度更高,但需要更加专业的设计能力;使用CI-E0XGT02S模组设计,GPIO相对稍少,可用于不带LCD屏幕的产品;使用CI-E0XGT03S模组设计,GPIO接口丰富,并且可选外置天线,可用于带LCD屏幕的产品。 本文以单芯片设计为例,详细介绍如何设计一款小智音箱,当然,若用模组设计也可以参考。 CI230X芯片,参考文档:芯片概述 - 启英泰伦文档中心 CI-E0XGT02S模组,参考文档:CI-E0XGT02S模组数据手册 - 启英泰伦文档中心 CI-E0XGT03S模组,参考文档:CI-E0XGT03S模组数据手册 - 启英泰伦文档中心 SDK:请从启英泰伦 语音AI开发平台 获取。链接:资料库 4. 硬件设计 4.1 系统框图 CI230X芯片集成度高,特别是集成了WiFi和音频codec等功能,因此仅需少许的外围器件就能实现WiFi通信和音频播放的功能,小智音箱框图如下: 如上图所示,以CI230X为主芯片设计的小智音箱,电路结构简单,仅需少量外围器件,如充电管理芯片、升降压芯片、音频功放芯片即可组成。无需外部音频codec就可实现音频数据的播放。 4.2 原理图设计 4.2.1 主芯片 如上图所示,主芯片外围电路简单,仅需少许电源滤波电容、射频匹配、晶振,复位等器件即构成了最小系统。 需要注意的是,VIN5V为语音部分供电,VDDA33为WiFi部分供电,两者完全独立,有效降低了相互干扰的风险。因此芯片需要供3.3V和5V两路电源。 射频匹配在靠近芯片处预留T型或Π型匹配电路,用于芯片传导匹配;在靠近天线处预留T型或Π型匹配电路,用于天线匹配。参数可先参考上图,后续根据单板情况微调。 晶体需预留2个小电容,用于调试收敛频偏。同时,芯片内部也集成了可调电容,在产测校准时可以通过调整寄存器参数调整频偏。 4.2.2 麦克风 麦克风支持差分或者单端接法;本设计如上图,采用差分的方式,能有效避免干扰。 4.2.3 音频功放 功放电路尤为重要,处理不好容易导致异响或其他杂音。本设计使用AB类功放FM8002A,推荐将主芯片AGND和HPOUT信号以差分的形式接至功放,同时功放的Bypass电容接AGND。可有效避免系统干扰导致的杂音。同时,也可选用能防RF干扰的功放芯片。 4.2.4 AEC AEC电路主要作用是将喇叭输出的信号分压回采至芯片。本设计中回采信号可以接喇叭输出SPK+或者SPK-,然后再输入至芯片麦克风右声道的正极。 若方案中采用双麦设计,AEC可以采用外部ADC芯片,如ES7243E,将喇叭信号回采后,通过IIS接口输入芯片处理。此方案详细信息可参考启英泰伦文档中心:硬件设计参考 - 启英泰伦文档中心 若方案中采用的是D类功放,回采信号需增加低通滤波后再回传主芯片或者外部ADC。此方案详细信息可参考启英泰伦文档中心:硬件设计参考 - 启英泰伦文档中心 4.2.5 供电 供电主要为电池充电管理部分和升压部分。可以采用分离的充电芯片和升压芯片。本设计采用了IP5303芯片,可进行电池充电且输出5V为系统供电。如上图。 DC-DC主要将升压后的5V降压至3.3V为芯片WiFi部分供电,要求纹波低,电流大于1A。本设计采用的是RY3408芯片。如上图。 4.3 PCB设计 PCB设计图与实物图如上所示。需要特别注意的是: 主芯片电源滤波电容靠近芯片放置。 WiFi部分的VDD33供电采用星型走线,从电源入口处分别走线至芯片给各个管脚。 晶体四周顶层铜皮挖空,GND脚打过孔至GND层,减少引入寄生电容。 RFIO走线需要做50Ω阻抗匹配,不可穿层,要远离其他走线,尽量保证参考平面的完整,保持阻抗的连续性。传导匹配网络靠近主芯片放置,天线匹配网络靠近天线放置。 音频功放尽量远离天线放置,AGND和Hpout走差分线,严格包地。避免RF信号对音频的干扰。 4.4 天线选型与设计 一般常规的WiFi天线有FPC天线、PCB板载天线、陶瓷天线、金属冲压天线、柱状天线等。需要重点关注天线的频率、带宽、增益、阻抗、驻波比等指标。可根据产品的具体形态和指标要求综合考虑选择合适的天线。 本设计选择的是带IPEX扣的FPC天线,方便组装,如下图: PCB板载天线指标受天线尺寸、参考地面积、净空空间、板厚等因素影响较大,可参考CI-E0XGT02S或CI-E0XGT03S上板载天线为原型,根据不同的PCB,经仿真、打板测试、匹配调试后使用。 PCB板载天线仿真结果如下: CI-E0XGT02S板载天线及layout参考如下: 不论是PCB板载天线还是FPC天线,或者其他类型的天线,在放置时都应该尽量避开金属件或其他干扰信号。避免影响天线的性能。 5. 小智音箱实物图 至此,PCBA调试完成后,将外壳、PCBA、喇叭、电池、天线组装在一起,一个小智音箱就此诞生啦,当然小智音箱的灵魂:固件,请参考:启英泰伦文档中心相关文档开发:SDK概述 - 启英泰伦文档中心 最终实物图如下:
启友玩AI
6 8 硬创社
为智能语音设备点亮“视界”:我在启英泰伦CI230X上成功驱动LCD屏
为智能语音设备点亮“视界”:我在启英泰伦CI230X上成功驱动LCD屏 1. 芯片介绍 CI230X系列芯片是启英泰伦研发的新一代高性能神经网络智能语音芯片,集成了启英泰伦自研的脑神经网络处理器BNPU V3和CPU内核,以及Wi-Fi和BLE的Combo功能。系统主频可达220MHz,内置大容量SRAM,集成PMU电源管理单元、双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、SPI等外围控制接口。 芯片支持2.4 GHz 802.11 b/g/n Wi-Fi及 BLE 5.1 无线通信协议,仅需少量电阻电容等外围器件就可以实现各类智能语音离在线产品硬件方案,性价比极高。 2. 准备工作 CI-E0XGT03S_MB开发板,参考文档:CI-E0XGT03S_MB开发板套件说明 - 启英泰伦文档中心 显示屏:2.4寸,SPI接口,分辨率320*240。链接:2.4寸触摸显示屏LCD液晶屏SPI接口MCU8080接口带电容TP触摸 SDK:请从启英泰伦 语音AI开发平台 获取。链接:资料库 3. 硬件介绍 LCD屏幕介绍 本文采用的是一款4-SPI接口IPS屏,分辨率为320*240。规格定义如下: 开发板屏接口 开发板GPIO与 屏幕接口对应关系如下: 开发板GPIO 屏接口 PF3 BLK PF4 DC PF5 MOSI PF6 SCLK PF7 CS PF8 RES GND GND 3V3 3V3 PE1 TP_RES PE4 TP_INT PE6 TP_SCL PE7 TP_SDA 4. 软件配置 GPIO及SPI配置 根据开发板GPIO与屏幕接口对应关系修改ln_drv_spi_lcd.c文件中的GPIO及SPI配置。如下: 修改屏幕初始化代码 屏幕厂家一般会提供如下初始化代码: 将此初始化代码放到ln_drv_spi_lcd.c中spi_lcd_init函数中,并修改RES、Delayms、Writecom、Writedat为SDK中相应接口,如下: 自此,屏幕的驱动移植完成。 图片取模 若需要验证在屏幕上显示图片,可以通过图片取模软件将图片转换为数组的方式。 本文使用的图片取模工具为 STC-ISP 软件中的图片取模组件,设置如下: 扫描顺序:水平扫描,从左到右,从上到下 存储顺序:高位在前 数据格式:C表格格式 宽度:320 高度:240 输出格式:16位彩色-565 配置好后,导入提前准备好的320*240的图片,点击 开始转换,如下: 点击 复制数据,并将数据粘贴至ln_spi_lcd_pic.h中,并删除 #defineIMG_WIDTH320#define IMG_HEIGHT 240 #define IMG_DEPTH 16 然后将数组名改为:gImage_pic 最后在main.c中增加图片显示函数,如下: spi_lcd_show_picture(0, 0, 320, 240, gImage_pic); 至此软件配置完毕。 固件的编译可参考启英泰伦文档中心:开发环境搭建与使用 - 启英泰伦文档中心 固件的烧录可参考启英泰伦文档中心:CI-E0XGT03S_MB开发板套件说明 - 启英泰伦文档中心 5. 显示效果 6. 结语 通过本次实践,我们成功为启英泰伦CI230X语音芯片开发板驱动了SPI接口的LCD显示屏,让原本专注于语音交互的设备具备了视觉展示能力。这个过程不仅验证了CI230X芯片丰富的外设控制能力,也展示了其作为边缘计算平台的扩展潜力。 从硬件连接到软件配置,从GPIO初始化到SPI通信建立,再到屏幕初始化和图片取模显示,每一个步骤都是嵌入式开发中典型的硬件驱动开发流程。这种将不同硬件模块有效整合的能力,正是开发现代智能硬件产品的核心技能。 值得一提的是,本文提供的驱动代码和配置方法具有很好的通用性,稍作修改即可适配其他SPI接口的显示设备,为开发者提供了有价值的参考。显示功能的加入,为智能语音设备开辟了更丰富的交互可能性——无论是显示语音识别结果、设备状态信息,还是简单的用户界面,都能显著提升产品的用户体验。 未来,我们可以在此基础上进一步探索LVGL等轻量级图形库的集成,开发更复杂的用户界面,或者结合CI230X的语音处理能力,打造真正的多模态交互设备。期待各位开发者能够以此为基础,创造出更多创新的应用! 让设备既能"听"又能"看",人机交互的边界正在我们手中不断拓展。
启友玩AI
3 6 硬创社
夏日黑科技:对着挂脖风扇说"我好热",它就会转更快——基于CI1302的语音控制开源方案
夏日黑科技:对着挂脖风扇说"我好热",它就会转更快——基于CI1302的语音控制开源方案 1、痛点场景及解决方案 夏日户外出行,挂脖风扇本是降温神器,却常因操作方式陷入尴尬:骑行时想调风速,腾出手就可能失衡;运动后手心出汗,触碰按键不仅费力,还容易误触切换模式。市面上的解决方案似乎总差一口气 —— 蓝牙控制需要掏出手机解锁、点开 APP,多步操作反而打断节奏;而传统语音控制又依赖网络,在信号不佳的公园或郊外常常失灵。 这正是 CI1302 芯片的用武之地。这款主打离线语音识别的低成本芯片,无需连接 WiFi 或蓝牙,只需对着风扇说出指令,就能即时响应。想象一下:跑步时喊一声 “小风扇加速”,风速立刻提升;骑行中说 “关闭风扇”,叶片应声停转 —— 整个过程无需抬手,真正实现了 “动口不动手” 的无感交互。 2、硬件拆解与改造原理 要实现语音控制,首先得摸清原风扇的 “脾气”。拆解后可见,普通挂脖风扇的核心电路由电机驱动模块、锂电池供电单元和主控 MCU 组成; 其中MCU 的串口引脚(通常标注为 TX、RX) 是关键 —— 这是后续与语音芯片通信的 “桥梁”。供电方面,风扇内置的 3.7V 锂电池通过稳压电路输出 5V 电压,为电机和控制板供电。 改造的核心在于让 CI1302 芯片与风扇 MCU “对话”。这里我们选用搭载了CI1302芯片的小模块“CI-D02GS02S单麦离线语音识别贴片模块”,原理图如下: 第一步:是串口协议对接:CI1302 支持 UART串口通信,需将其 TX 引脚连接至风扇 MCU 的 RX 引脚,RX 引脚连接至 MCU 的 TX 引脚,波特率统一设置为 9600(具体参数需参考风扇 MCU datasheet)。 ①. CI-D02GS02S的TX1引脚 → 设备风扇主控板的RX引脚; ②. CI-D02GS02S的RX1引脚 → 设备风扇主控板的TX引脚; 第二步:是供电方案优化:CI1302 的工作电压为5V,可以直接接入风扇的 5V 电路。 ①. CI-D02GS02S的5V 引脚 → 设备风扇主控板的5V引脚; ②. CI-D02GS02S的GND引脚 → 设备风扇主控板的GND引脚; 第三部:给CI1302 模块焊接上麦克风和喇叭;在官方买样品也可以,自己按照启英泰伦文档中心的外围器件兼容列表够买也可以。 注意:为了方便开发,我们可以直接购买CI1302开发板套件,CI1302开发板套件可用于CI1302芯片的开发调试。通过配备的底板,可实现所配套语音模块的外接和扩展应用,以及用户开发固件的设计验证。 接线参考图如下: 3、语音固件开发(启英泰伦语音AI平台实操) 借助启英泰伦的语音 AI 开发平台,即使是新手也能快速完成固件开发。 步骤 1:登录平台后在"功能开发"页点击“离线语音识别大模型应用”; 步骤 2:点击“语音识别固件及SDK开发” 步骤 3:点击新建项目后,填入和选择项目的产品信息,然后点击“创建”; 步骤 4:填入基本信息,点击“继续”; 步骤 5:填入固件参数,我这里选择默认,然后点击“继续”; 步骤 6:选择一个好听的声音(网页上可以播放试听); 步骤 7:这一步就很关键,编辑我们让风扇识别的语音指令和通行协议(协议取决于风扇的电控对每个功能的定义),然后勾选“SDK选项”并点击“提交”; 步骤 8:等待几分钟后,点击下载文件,将生成的SDK和固件压缩包下载到本地电脑上; 4、固件烧录与协议对接 固件开发完成后,生成的.bin 文件需烧录到 CI1302 芯片中,参考固件打包升级流程,整个过程耗时不超过 1 分钟。 接下来是串口协议解析的关键环节。风扇 MCU 的控制指令通常遵循固定格式,例如某品牌风扇采用0xFA+风扇模式+0xAF的帧结构(0xFA 和 0xAF 为帧头帧尾,模式2-3 对应开机、高风速和低风速)。此时需要编写转换逻辑:当 CI1302 识别到 “我好热” 指令时,通过串口输出协议帧0xFA 0x03 0xAF(假设当前风速为 低速 档,加速后为 高速 档);识别到 “打开风扇” 指令时,则输出0xFA 0x01 0xAF(0x01 代表开机)。 调试时建议用串口监视器实时抓取数据,观察 CI1302 输出的指令字符串是否正确,以及转换后的协议帧是否符合风扇 MCU 的要求。若出现指令无响应,可先检查波特率是否匹配,再用万用表测量引脚电压,排除接线松动问题。 5、组装与性能测试 硬件改造和程序调试完成后,进入组装阶段。为避免语音模块遮挡风扇出风口,可设计一个弧形 3D 打印支架,将 CI1302 芯片和麦克风固定在风扇挂脖处的内侧,再用热熔胶加固(注意避开散热孔)。组装完成后需进行多场景测试: 在安静环境(如室内)中,识别准确率可达 98% 以上,唤醒响应时间小于 0.5 秒;在嘈杂环境(如商场、街道)中,准确率仍能保持在 94% 左右,误触发率低于 3 次 / 小时。 针对骑行时的风噪干扰,可通过两个方案优化:一是在麦克风外部套上防风海绵套,减少气流冲击;二是在固件中增加 “风噪模式”,当识别到持续高频噪声时,自动提高指令识别的置信度阈值,确保有效指令不被忽略。 6、开源与扩展玩法 为方便更多爱好者复刻,本次改造的所有资料均可在启英泰伦官网的开发资料中进行下载,包含完整的电路图 PDF。 在此基础上,还可尝试这些进阶玩法:增加 LED 语音反馈,在风扇侧面嵌入一颗 RGB 灯珠,“已加速” 时亮绿灯,“已开机” 时亮红灯,让操作结果更直观。 7、结语 回顾整个改造过程,却彻底颠覆了传统挂脖风扇的交互方式 —— 这正是开源硬件和离线语音技术的魅力所在:不依赖昂贵的商业方案,普通人也能通过技术创新提升生活品质。当然能自己画PCB的开发者可以直接购买语音识别单芯片进行开发,批量价格更低。 从增加几元芯片后,摇身一变溢价到几十元智能设备的体验跃升,背后是技术民主化的浪潮。那么问题来了:你还想语音控制什么小家电? 是厨房的榨汁机,还是卧室的加湿器?欢迎在评论区留下你的想法,或许下一个改造方案就源于你的创意。
启友玩AI
5 7 硬创社
启英泰伦三代芯片(CI13XX系列)与方案选型深度解析 - 从架构到量产落地的全
一、启英泰伦三代芯片技术演进与市场定位 最近离线自然说(离线NLP)很火,即使不联网也能实现出色的识别效果,支持的说法很丰富,和在线识别支持的说法差不多,今天就和大家聊一下启英泰伦第三代离线语音识别芯片CI13XX如何选型和开发。 启英泰伦第三代离线语音识别芯片CI13XX系列,是一款高性能神经网络智能语音芯片,集成了启英泰伦自研的脑神经网络处理器BNPU V3,系统主频可达240MHz,内置高达640KB的SRAM,集成PMU电源管理单元和RC振荡器,集成双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外围控制接口。芯片仅需少量电阻电容等外围器件就可以实现各类智能语音产品硬件方案,性价比极高。CI13XX系列采用了启英泰伦的3代BNPU技术,该技术支持DNN\TDNN\RNN\CNN等神经网络及并行矢量运算,可实现语音识别、声纹识别、命令词自学习、语音检测及深度学习降噪等功能,具备强劲的回声消除和环境噪声抑制能力。该芯片方案还支持汉语、英语、日语等多种全球语言,可广泛应用于家电、照明、玩具、可穿戴设备、工业、汽车等产品领域,实现语音交互及控制和各类智能语音方案应用。相较于前代产品,CI13XX在算力密度、主频比及开发易用性上实现显著突破。由此可见,三代芯片还是有很多亮点的。 1. 技术迭代对比 代际 典型型号 核心架构 FLASH CPU主频 应用场景 第二代 CI110X RISC-V单核+BNPU V2 外置 168Mhz 离线指令识别 第三代 CI13XX RISC-V双核+BNPU V3 内置 240Mhz 自然语言识别 二、CI13XX系列芯片架构深度解析 1. 核心架构组成 神经网络处理器BNPU V3 采用3代硬件BNPU技术,支持DNN\TDNN\RNN\CNN等神经网络及并行矢量运算,可实现语音识别、声纹识别、离线自然说、命令词自学习、语音检测及深度学习降噪等功能 CPU 32位高性能CPU,运行频率最高支持240MHz 32-bit单周期乘法器,支持DSP扩展加速 存储器 内置640KB SRAM 内置512bit eFuse 内置1~4MB Flash 音频接口 内置高性能低功耗Audio Codec模块,支持双路ADC采样和单路DAC播放 支持Automatic Level Control (ALC)功能 支持8kHz/16kHz/24kHz/32kHz/44.1kHz/48kHz采样率 支持一路IIS音频扩展通路 支持一路PDM接口,可对接单个或两个数字MEMS麦克风 电源管理单元PMU 内置3个高性能LDO,无需外加电源芯片,外围仅需少量阻容器件 支持5V供电直接输入,供电范围最小支持3.6V输入,最大支持5.5V输入 时钟 内置RC振荡器,也支持外接晶体振荡器;开发者可根据不同应用方案选择采用内置RC或者外接晶体作为芯片时钟源 SAR ADC 4路12bit SAR ADC输入通道,采样频率可达1MHz ADC IO可与数字GPIO进行功能复用 外设和定时器 3路UART接口,最高可支持3M波特率 1路IIC接口,可以外接IIC器件进行扩展 6路PWM接口,灯控和电机类应用可直接驱动 内置4组32-bit timer 内置1组独立看门狗(IWDG) 内置1组窗口看门狗(WWDG) GPIO 支持26个GPIO口,可以作为主控IC使用 除PD对应的4个GPIO口外,其它GPIO口可配置中断功能,全部GPIO口支持上下拉可配置 部分GPIO支持宽压5V电平信号直接通信,无需外接电平转换但需要外接上拉到5V的电阻 图2-1:CI1306应用框图 三、芯片选型策略与型号对比 了解了三代芯片整体的参数、我们再来看看具体怎么选芯片型号,以下是几个常用型号的对比表。 1. 主流型号参数对比 型号 Flash RAM 封装 适用场景 CI1301 1MB 256KB SSOP24(8.6mm*6mm) 离线指令识别,需要较多IO口的场景 CI1302 2MB 256KB SSOP24(8.6mm*6mm) 自然语言识别,需要较多IO口的场景 CI1306 4MB 256KB QFN32(4mmx4mm) 双麦降噪(AEC+深度分离+降混响)双麦+DOA+AEC CI1312 2MB 256KB SOP16(9.9mm*6.0mm) 自然语言识别且需要单面贴片的场景 CI13XX型号多种,客户可以根据具体产品选择型号,如果客户需要较多词条,支持自然说法,建议选择CI1302\CI1312,若客户为单面板,工厂贴装水平不足以贴SSOP24封装,可以选择SOP16封装的CI1312。若客户算法需求较多,要支持双麦降噪、AEC 、DOA等,可以选择CI1306,其拥有4MB的flash空间,支持更多算法。 四、硬件设计关键要点 CI13XX系统集成度高、因此硬件设计比较简单、也有以下几点注意事项。 1. 电源管理设计 供电管理及防护: 内置3个高性能LDO,无需外加电源芯片,LDO输出需要一颗4.7uF的电容用于稳定输出电压,且电容需靠近芯片管脚。 为了增强电源端的防浪涌特性,建议在电源输入端增加一颗4.7R的电阻和一颗TVS。 2. 音频输入输出设计 麦克风电路: 麦克风输入VCM和MICBIAS管脚各需一颗4.7uF电容,且靠近芯片管脚 走线规则:差分对长度匹配<50mil,远离高频信号 抗干扰措施:麦克风地线单独铺铜,通过单点连接至系统GND 音频输出噪声抑制:hpout线路尽量短切需要参考模拟地。 功放的POP音抑制:采用功放使能脚控制功能在上电时候mute功放,后续播音再打开 3. 可靠性设计 整机产品都有较多的可靠性要求,包括高低温运行、高温高湿工作、浪涌测试、ESD等级测试、群脉冲测试等。CI13XX使用工业级设计标准,具有较高的环境可靠性,芯片工作温度范围在-40°C到 +85°C之间,符合MSL3级湿敏等级,符合IEC 61000-4-2 的4K接触放电试验标准,符合FCC电磁兼容标准,符合ROHS和REACH环保标准。为了满足更高的的可靠性要求,需注意以下几点: 对有高精度PWM输出(如红外发射),对系统主频精度有要求的应用,需要外置晶体 串口输入输出需要串接电阻和增加ESD器件,防止生产制造导致静电损坏。 在麦克风输入电路串入一颗10欧电阻,麦克风对地增加一颗ESD器件。 五、量产烧录测试支持 1. 量产烧录方案 产品方案开发完成后还需要考虑怎么量产烧录和测试。量产烧录采用启英泰伦标准烧录器、该烧录器由烧录器及以下配件组成。以下简单介绍一下烧录器的功能、更多信息可以上启英泰伦官网了解。 1.1 烧录器设备 名称 数量 说明 烧录器 1 烧录主机,可以烧录CI13XX芯片固件 XH2.54-4P屏蔽线 1 用于外接通讯供电,随烧录器给出 电源适配器 1 烧录器主板供电,12V/1A,随烧录器给出 SD卡 1 用于存储需要烧录的固件,随烧录器给出 SD读卡器 1 用于读取修改SD卡内容,自备 公对公DB9通讯线 1 用于烧录机台控制,随烧录器给出 SOCKET转接板 1 定制用于升级启英泰伦芯片的SOCKET转接板,可以用于烧录芯片和测试功能。需单独购买 1.2 烧录原理 烧录器通过串口将固件烧录到芯片flash中,默认使用芯片串口0烧录。 1.3 启英泰伦三代芯片的SD卡内容 将技术人员提供的升级固件通过SD读卡器拷贝到SD中如下图所示:(共4项,SD卡里面最好不要放其它不相关文件) 1.4 硬件说明 编号 说明 1 接socket转接板的4PIN排线 2 拨码开关 3 液晶显示 4 机台控制通讯口 5 喇叭接口(如有需要可接入喇叭) 6 12V电源适配器接口 7 TYPE C供电接口 8 电源开关 9 SD卡插槽 10 升级按键(点按开始手动升级) 11 校验按键(点按校验对比已升级的固件是否正确) 12 CI13XX SOCKET 2. 量产测试方案 芯片烧录好后贴片到风扇板,为了检验贴片的质量需要对风扇板进行功能测试,这个时候就需要用到测试治具,启英泰伦测试治具介绍如下: 治具由测试主板、操作板、转接板等电子部件构成、测试主板可以实现自动烧录及测试的功能。操作板实现整体测试功能的指令输入输出、转接板用于对接被测板。 2.1 产测治具组成 序号 名称 说明 1 压杆 和压板一起提供下压机械力 2 压板 和压杆一起提供下压机械力 3 载板 固定被测模块板 4 电源开关 控制产测治具电源通断 5 开始按键 开始烧录或测试按键 6 模式选择开关 用于选择测试模式(烧录、测试、I/O测试) 7 模式选择指示灯 对应模式选择后会亮灯 8 自检绿灯1个 自检中闪烁,自检完成常亮 9 自检红灯4个 自检失败会常亮,最左为自检红灯1# 10 模块指示灯 一个模块对应一组红绿灯,灯的旁边标明了模块编号 11 电源线 电源适配器的连接 表5-1 产测治具外部组件表 图5-1 产测治具外部组件图(对应表5-1) 序号 名称 说明 1 10pin排线 连接操作板与转接板 2 操作板 用于人工操作和状态显示 3 测试主板插槽 用于安装测试主板 4 测试主板 用于测试对应的被测模块 5 转接板 用于安装探针、承载测试主板 6 TF卡槽 用于固定TF卡 表5-2 产测治具内部组件表 图5-2 产测治具内部组件图(对应表5-2) 2.2 模块和指示灯匹配说明 如下图所示,被测模块的位置编号和转接板上的位置依次相对应,指示灯和被测模块的编号均按照从左到右、从下到上的顺序递增,左下角第一块为1#号模块,对应的指示灯也为左下角1#。(图1-3中相同颜色的状态指示灯与相同颜色被测模块对应)。 烧录模式、测试模式的操作通过拨码开关选择,当选择对应模式开启,对应的状态指示灯点亮。 图5-3 模块编号 在转接板背面有被测模块的位置编号,也有对应的测试主板编号,每个测试主板都有一个板载的红色电源灯(测试主板通电后常亮)和一个蓝色状态灯(正常工作状态下会闪烁),如下图1-4所示: 以上对启英泰伦产测治具做了初步介绍,欲了解更多信息可以上启英泰伦官网文档中心了解完整资料。
启友玩AI
1 5 硬创社
当代扁鹊:"望、闻、问、切"法医治硬件隐疾!启英泰伦语音芯片硬件功能故障排查方法论
当代扁鹊:"望、闻、问、切"法医治硬件隐疾!启英泰伦语音芯片硬件功能故障排查方法论 启英泰伦(Chipintelli)专注于语音 AI 芯片、AI 算法研发及高效服务,构建了全栈技术体系,其CI13LC系列芯片凭借高性能、低成本优势,广泛应用于智能家居、消费电子等领域。其外围物料简洁、应用方案简单。然而,硬件设计和功能故障仍困扰着开发者和用户。本文结合启英泰伦官方技术文档与行业实践经验,系统梳理硬件功能故障的排查逻辑与方法。 古代神医扁鹊采用"望、闻、问、切"四方医治病人,现在电子产品也可以借鉴其思想,采用"望"先检查PCBA外观,判断是否有异常的烧毁痕迹,是否有虚焊和短路 采用"闻" 判断是否有异味,采用"问"判断语音是否能识别,采用"切"的方法测试电信号判断"脉搏"是否正常。 一、供电系统排查:稳定性的根基 1、电压与电流检测 标准电压验证:CI13LC系列VIN5V 管脚的典型输入电压为5V、输入范围为3.6V~5.5V。也可以从AVDD管脚输入3.3V电源。 建议使用示波器监测电源纹波,确保瞬时电流波动不超过300mA。测量选择AC档并调节幅度于合适窗口。以下是测试的参数设置截图。 图1:纹波测量窗口 电源干扰抑制:若语音输出伴随"滋滋"电流声,需检查电源线路是否引入高频噪声。在芯片电源端增加RC滤波电路(如105电容与4.7Ω电阻并联),或采用磁珠隔离高频干扰源。 2、电容布局优化 关键电容配置:根据CI13LC系列参考设计,105/106电容需紧邻芯片电源引脚(如CI13162的1脚、2脚),且走线宽度不小于0.5mm以降低阻抗。若电容远离电源脚或使用劣质电容,可能导致电压跌落引发复位故障。可以参考下图。 图2:布局参考图 时钟系统检查 使用示波器测量芯片的时钟输入脚(XIN\XOUT)检查是否是12.288Mhz,测量lrclk管脚检查是否为 16khz,测量位置如下图: 图3: (XIN\XOUT)测量点 检查CODEC电源 检查VCM管脚电压是否为1.65v,检查micbias管脚电压是否为2.8v 二、信号干扰溯源:从物理隔离到布线规范 高频设备干扰隔离 空间隔离:WiFi模块、显示屏等高频设备应与语音芯片保持至少5cm间距,并避免共用地线。例如,在智能风扇应用中,需将CI13LC芯片与电机驱动电路分置于PCB板两侧。 屏蔽措施:对于无法物理隔离的场景(如紧凑型智能灯具),可在语音信号线上包裹铜箔屏蔽层,并确保屏蔽层单点接地。 信号走线规范 差分信号处理:麦克风差分输入需严格遵循差分走线规则,线宽一致且长度匹配误差控制在5%以内,以减少串扰。 关键信号保护:PA0/PA1等控制引脚易受外部噪声影响,建议包地处理,抑制瞬态脉冲干扰。 三、音频输入输出故障诊断: CI13LC芯片无识别 检查输入麦克风是否插好、麦克风是否插反,测量CI13LC的VCM\MICBIAS电压是否正常,检查麦克风电路是否有漏焊和虚焊,麦克风红色为正极,黑色为负极。麦克风线路如下: CI13LC芯片无播音 检查扬声器是否接好、接口是否松动、检查hpout接口电路是否有漏焊和虚焊,位置如下图 扬声器与功放匹配 阻抗匹配检测:若语音输出存在破音或音量不足,需检查扬声器阻抗是否与芯片驱动能力匹配(如CI13242支持4-8Ω负载)。可使用万用表测量扬声器直流电阻,偏差超过20%则需更换。 功放电路优化:对于需要外接功放的场景(如智能音箱),需确保功放输入阻抗大于10kΩ以避免信号衰减,并添加反馈网络稳定增益。 四、硬件损坏的预防与应急处理 静电防护(ESD) 焊接或调试时需佩戴防静电手环,工作台铺设导电垫。芯片存储时应使用金属屏蔽袋,湿度控制在40%-60%。 过热保护机制 连续播放场景下(如智能空调语音模块),需监测芯片温度。若超过85℃(以CI13162规格书为准),建议增加散热片或降低主频至180MHz 应急修复方案 若芯片彻底无响应,可尝试断电重启。若仍无效,需更换芯片并检查外围电路是否存在短路 。 五、总结 启英泰伦语音芯片的硬件故障排查需遵循系统性、分模块验证的原则,从供电稳定性、信号完整性、音频输出匹配性、硬件损坏预防四个方面着手处理。开发者应充分利用官方提供的参考设计(如CI13LC系列应用框图)与调试工具,结合示波器、逻辑分析仪等设备进行量化分析。对于复杂场景(如多设备协同的智能家居系统),建议采用"最小系统法"逐步排除干扰因素。通过上述方法,可显著提升故障定位效率,保障产品可靠性与用户体验。
启友玩AI
6 10 硬创社
智能语音开发不求人!启英泰伦AI平台教你打造会 "自然说" 的语音风扇
智能语音开发不求人!启英泰伦AI平台教你打造会 "自然说" 的语音风扇 在智能家居日益普及的今天,语音控制设备已成为一种时尚且便捷的生活方式。本文将详细介绍如何使用启英泰伦开发平台制作风扇自然说固件,让你轻松实现对风扇的语音控制,为炎炎夏日带来一丝清凉。以下将从准备工作、硬件连接、软件设计与开发、装机与测试等几个方面进行详细阐述。 一、准备工作 (一)芯片选型 进入启英泰伦官方文档中心(https://document.chipintelli.com/)选型指南,综合考虑存储容量以及封装形式等因素,我选择的是 CI1302 芯片。该芯片具有2MB FLASH,主频220MHz,离线语音识别率超 97%,拾音距离可达 10 米,能够满足风扇语音控制的需求。 (二)硬件准备 在启英泰伦官方商城(https://document.chipintelli.com/)选购搭载 CI1302 芯片的 CI-D02GS01J 模块,同时在配件里选择1个麦克风和1个喇叭。准备好杜邦线和USB转TTL烧录测试工具等外设。(用户还可以直接购买芯片根据官方原理图在嘉立创(https://www.jlc.com/)进行开发板PCB制作) (三)软件准备 注册登录启英泰伦语音 AI 平台(https://aiplatform.chipintelli.com/auth/login),该平台支持无代码开发,可直接生成产品固件。还可安装 SDK 开发编译环境,方便后续进行代码微改和二次开发。 参考文档链接:编译软件安装与使用 - 启英泰伦文档中心 二、硬件连接 (一)整体组装 收到模块套件后,按照"硬件准备"图示进行组装,插上麦克风和喇叭,注意正负极,端子有防呆设计。 (二)连接电脑 使用杜邦线和USB转TTL烧录测试工具将开发板套件与电脑连接,为后续的固件下载烧录做准备(需要提前根据烧录测试工具芯片类型安装好驱动,网上搜索即可)。 三、软件设计与开发 (一)语音 AI 平台无代码开发 新建项目 :登录启英泰伦语音 AI 平台,进入 "功能开发" 界面,点击 "产品固件及 SDK 深度开发",然后点击 "+ 新建项目",填写产品信息并创建项目。 填写基本信息 :包括产品名称、型号等,填完后点击 "继续"。 固件参数配置 :CI-D02GS01J 模块自带晶振,可选择 "外部晶振",后续与风扇控制MCU进行串口通讯时更加稳定;CI-D02GS01J 模块烧录程序与通讯都使用串口0,因此通讯串口选择"UART0"。 编辑播报音 :根据个人偏好选择音色和语速即可。 编辑命令词 :在"最小功能词推荐"中选择需要的功能类型,后台已经将对应的自然指令说法都打包好,"播报语句"、"播报模式"、"发送协议"、"接收协议"都可以根据需要进行个别修改。"播报语句"是指识别到指令功能后进行声音反馈;"播报模式"是指是否需要与风扇控制的MCU通讯后接受到对应协议再进行播报;"发送协议"、"接收协议"是指与MCU通讯的数据内容。"SDK下载"建议勾选,后续可以自行修改程序控制。 点击 "立即提交",等待流程完成,通常只需几分钟。 (二)本地环境搭建与固件下载烧录 下载文件并解压 :流程完成后,点击 "下载文件",将文件保存到新创建的本地工作目录中,并解压得到包含有产品固件和 SDK 开发包的文件夹。 固件烧录 :打开 "PACK_UPDATE_TOOL.exe" 固件下载工具,选择开发板套件搭载的 CI1302 芯片,点击 "确定";点击 "固件升级",选择解压后的固件文件,点击 "打开";确保开发板套件处于断电状态且数据线连接良好,勾选电脑分配的端口号,按下电源键,开发板电源指示灯亮起后,固件开始下载,当显示 "device:update success(...)" 时,表示固件下载完毕。 四、装机与测试 将开发板套件连接控制MCU,接上电机,放入风扇外壳中,为风扇外壳开一个小孔,用于拾音。然后进行测试,通过语音指令控制风扇的开关以及风速的调节。例如,先用唤醒词唤醒,然后说 "开一下风扇",风扇启动;"关掉",风扇关闭;"调高风速",风速增大;"调低点风速",风速减小。观察风扇的运行情况以及播报声音,验证语音控制功能的准确性和稳定性。如果发现风扇不响应指令或响应不准确,可检查硬件连接是否正确以及固件的配置等,进行相应的调整和优化。 五、成品展示与总结 (一)成品展示 成功实现语音控制风扇的开启、关闭以及风速调节等功能,通过简单的语音指令即可方便地操作风扇,为生活带来便捷。风扇在语音控制下运行平稳,指示灯能够准确反映风扇的工作状态,且在不同环境噪声下仍能保持较高的语音识别准确率,保证了良好的用户体验。 (二)总结 使用启英泰伦语音AI平台制作风扇自然说的过程,虽然在芯片选型、硬件连接、软件开发等环节需要仔细操作和调试,但整体流程较为清晰,并不复杂。启英泰伦语音 AI 平台的无代码开发功能,降低了开发门槛,使得即使没有丰富编程经验的初学者也能够快速上手,实现语音控制风扇的想法。在制作过程中,从了解芯片特性、硬件组装,到运用平台进行软件配置和调试,不仅加深了对智能语音控制技术的认识和理解,还培养了解决问题的能力和耐心。看到通过自己的努力和探索完成的风扇自然说成品,不仅满足了个人对智能家居生活的追求,也激发了进一步探索和开发更多智能语音产品的兴趣和信心。相信随着对启英泰伦平台的不断深入学习和实践,以及对相关技术的持续研究和创新,未来能够开发出更多具有创意和实用价值的智能语音控制产品,为我们的生活带来更多便利和乐趣。 以上内容详细阐述了如何使用启英泰伦平台制作风扇自然说的全过程,希望对大家有所帮助,激发更多人投身于智能语音开发的领域,共同探索智能科技的无限可能。在实际操作过程中,如果遇到任何问题或困难,可以参考启英泰伦官方文档、教程以及相关的技术支持资源,不断学习和进步,打造出更加出色的智能语音产品。
启友玩AI
11 19 硬创社
玩音频 DIY 的开发者看过来!用 line in 无损采集特色的播报音,调试更丝滑
我一直对音频技术充满浓厚兴趣,热衷于收集各类特色语音素材用于个人鉴赏和DIY调试。最近入手了一款带有独特播报音的模块板,其声音极具辨识度,瞬间吸引了我。出于个人学习与技术探索目的,希望在自己DIY的语音识别作品中融入类似的声音效果,以优化交互体验。若通过手机录制,不仅对周边环境安静程度要求极高,而且喇叭容易产生失真,严重影响音质。经过思考,决定将该产品的音频输出脚通过 line in(线路输入,是一种将外部音频设备(如 CD 机、录音机等)的音频信号输入到电脑或其他音频处理设备的接口方式,能实现高质量的音频信号传输)的方式连接到电脑上进行无损采集,这样既能确保音质清晰,又能满足个人对音频素材的高品质需求。以下是具体操作步骤。 PS:需要特别说明的是,此方法仅适用于个人学习、鉴赏和DIY调试,严禁用于任何商业产品设计或侵权用途,我们应当始终尊重并维护音频版权。 一、准备工作 播报音模块板购买 在启网上购买一套CI-D01GS01J单麦离线语音识别端子模块(动手能力强的开发者也可以直接购买芯片,然后根据原理图在嘉立创制作PCB进行后续操作): 注意还要买一个麦克风与喇叭,麦克风是为了通过指令让喇叭播报相关播报音,喇叭是方便与采集后的播报音做对比。启英泰伦官方商城上就有,可直接购买,很方便。 模块收到后,先给语音模块接上麦克风与喇叭,然后供上5V电压,先测试下语音模块是否工作正常。正常上电后会有播报音。注意5V供电电流要大于500mA。 音频线购买 接电脑麦的音频线一般分为三段(台式机)或者四段(笔记本电脑)规格,可根据电脑接口图标确认接三段还是四段的音频接口。 ①三段接口常用标识与台式机上标注对应连接 购买参考链接:某东、某宝(买耳麦二合一的) ②四段音频线连接电路 四段接口常用标识与笔记本上标注接口对应连接 注意:四段接口国标和美标的定义不一样,买的时候最好与商家沟通确认。主要是地线与麦克风两个定义不一样,到时候如果采出来有问题,可把两条线对换一个。 其它材料 ①在某宝上可买些面包板、杜邦线用于电路搭建与连接。 ②需要用到一颗10uF/16V的贴片电容与2.2KΩ、22KΩ的电阻,用于电路搭建,可在某宝上面购买个电阻与电容样本,最好0805封装的,便于焊接。 二、硬件连接 连接电路原理说明 ①把连接喇叭播放的声音进行分压,至少降低到0.5V以内(不同电脑对幅值要求不一样,后面可根据采出的音频再调节分压电阻),之后作为麦克风信号将声音输入到PC或者笔记本电脑上,电脑将播放的所有声音录制下来,然后再使用音频编辑工具,对声音进行设置标签及批处理存为新的文件 ②接功放后端搭建电路:需要用面包板搭建电路,适用于AB类功放。 ③接功放前端搭建电路:不需要用面包板搭建电路,适用于D类功放,此电路需要把语音板上功放拆下来。 具体连接 买的语音模块是AB类功放,所以按AB类功放连接方式来进行操作。 ①把音频线剪断,用万用表测试下哪条线为地线(一般红色为地线),哪一条为麦克风线,然后再连接到刚搭建好的电路 三段与四段接头定义说明 音频线与搭建电路板连接图 ②语音板、搭建的电路、音频线这三处连接要尽量短,避免干扰到,地线的连接靠近功放电路放置, ③给语音板供电5V电压,音频线插入电脑。 三、电脑采音设置 电脑设置 ①音频线插入电脑麦克风口后,打开录音看电脑是否有显示设备连接 ②点击麦克风右键属性,确认参数规格是多少(推荐选择2通道,16位,44100HZ)。 四、音频采集 软件设置 ①打开Cool Edit pro(可网上下载) ②点击录音,选择采样率、声道、采样精度(注意要与麦克风设置属性一样) ③给语音板上电(注意语音板供电建议用一个好一些的适配器供电,避免电源干扰) 采音数据确认 ①给语音板上电后就会在Cool Edit pro看到采集的音频,先看语音板没播报时的音频,看底噪是否小,播放出来是否有杂音。有杂音可参考以下常见问题进行排查。 ②底噪正常就可进行播报音的采集,采集出的音频注意不能削顶也不能太小,一般建议在2000-20000之间。主要听下看是否有杂音。 ③采集的音频进行播报看是否清晰无杂音,如果正常,就可进行全部的音频录制采集,如果有杂音或者音频不清晰,可参考以下常见问题进行排查。 五、常见问题 采集的音频播放出来有杂音 ①语音板断电后还是有杂音:请确认语音板、搭建的电路、音频线这三处连接是否过长,连接线路再短一些,音频线也再短一些;另外可以把音频线再剪短一些试一下;或者打开录音设置,把麦克风增益改为小(建议改为0DB),麦克风音量改小(建议改为40)。 如果还是不行,建议换一台电脑试一下。 ②语音板断电后无杂音:确认电源是否纹波大,最好不要用采音的电脑来供电,改用单独的电源;也可能是音频线的地线接太远;接后端注意地最好接到功放的地脚;如果是D类功放,但是从功放后端采音,可能播放出来会有杂音,需要改为接前端(拆功放方法);如果是把功放拆掉接的前端,注意音频线的地要接AGND或者靠近语音芯片连接。 采集的音频幅值过大或过小 ①幅值过大:对语音板说减少音量,看是否可满足要求;如果还是不行,可把刚搭建的电路中对地电阻(2.2K)改小些或者把串的电阻(22K)改大些,直到改来幅值正常。 ②幅值过小:说增大音量,再看采集的音频是否满足要求;如果还是不行,可把刚搭建的电路中对地电阻(2.2K)改大些或者把串的电阻(22K)改小些,直到改来幅值正常。 ③可适当调节下电脑麦克风的属性,来达到底噪最小,音质最好的效果。
启友玩AI
5 11 硬创社
0基础逆袭!用CI 1302语音开发板4步打造超智能床头小夜灯,手残党也能玩转开发
0基础逆袭!用CI 1302语音开发板4步打造超智能床头小夜灯,手残党也能玩转开发 最近一直在琢磨,怎么给家里的小夜灯加点 "黑科技",让它不再只是个普通的照明工具。直到发现了启英泰伦的CI13XX系列AI语音芯片,看到它 220MHz 的主频、超 97% 的离线语音识别率,还有那 10 米超远距离拾音能力,我瞬间就被吸引住了。这简直就是为打造智能小夜灯量身定制的! 想象一下,深夜躺在床上,不用摸黑找开关,一句 "打开小夜灯",柔和的光线就会亮起;想调整亮度,只要说声 "调暗一点",灯光就能随声而变。而这一切即将在我手中,通过 CI13XX系列AI语音芯片变成现实。看着启英泰伦语音 AI 平台上丰富的开发资源和详细教程,我已经迫不及待要开启这次语音控制小夜灯的开发之旅,把脑海中的创意一点点落地! 一、准备工作 1、芯片选型 进入启英泰伦官方☞文档中心-选型指南,做小夜灯我主要关心的是PWM数量,然后选了这颗CI1302芯片,PWM数量有6个,FLASH有2MB(做小夜灯的语音控制指令绰绰有余了),封装是SSOP24的方便量产贴片。 2、硬件准备 逛了各大电商平台,为了靠谱我还是在官方☞启英商城选购了这个搭载了CI1302芯片的CI-D02GS02S模块(考虑到量产时,邮票孔的设计可以焊接排针直插底板,也可以直接焊接到底板)。 在☞启英商城中发现直接购买开发板套装还自带一块CI-D02GS02S模块,CI-D02GS02S模块配合专用底板CI-B02-MB(以下简称底板)就是开发板套件。 开发板套件除了AI语音模块和底板之外,还有配套麦克风和喇叭;发现,开发套件底板已经配备了一颗"RGB三色LED灯珠",简直太棒了( ̄▽ ̄),灯珠我都不用再买了!果断来一套,已经迫不及待了。 趁开发板套件还没到货,赶紧准备好小夜灯外壳(淘宝或拼夕夕买个能放下开发板套件的便宜夜灯,选放得下的,开发板尺寸是7.3CM*6CM)、跳线帽和杜邦线(用于连通底板上要用到的外设)、Type-C手机充电数据线(用于下载程序固件到芯片中)等。 软件准备 ☞启英泰伦语音AI平台支持直接在平台上生成产品固件,实现真正的无代码开发。 当然,同时我们也可以在电脑上把SDK开发编译环境安装好,以便后续对有可能调整的代码进行微改和二次开发。编译环境的安装和配置可以参考这篇文章的第二至第四节内容《【学习&开发之路】放弃Keil吧!VSCode搭建CI13XX开发环境效率提升300%》。 二、硬件连接 1、整体组装 到货!到货!CI-D02GS02S开发板套件到了,开始组装。 拿出开发板,插上麦克风(注意按丝印MIC+对MIC+、MIC-对MIC-),插上喇叭(喇叭可以不用分正负方向)。 根据原理图连接跳线帽操作 获取开发板原理图:登录☞启英泰伦语音AI平台,点击"开发资料" 文件名称处搜索底板型号"CI-B02-MB",点击查询后下载文件 打开开发套件底板原理图 通过原理图能看出来,三色LED灯的红色需要连通到PWM5,绿色需要连通到PWM4,蓝色需要连通到PWM3 使用跳线帽连通三路PWM口到LED灯的红绿蓝三个颜色引脚上 3、连接电脑 拿出自己的type-c数据线,将开发板套件和电脑进行连接 三、软件设计与开发 1、"语音AI平台"无代码开发 在启英泰伦语音 AI 平台中,我们需要进行产品固件无代码开发及SDK深度定制,来定义语音指令(如 "开灯""关灯""调亮""调暗"等功能)和PWM口控制定义。 登录☞启英泰伦语音AI平台,默认进入"功能开发"界面,点击"产品固件及SDK深度开发" 点击"+新建项目" 填写"产品信息",填选完毕后点击"创建" 填写基本信息,填完后点击"继续" 固件参数配置选填,CI1302芯片内部自带晶振,所以可以选择"内部RC" PWM配置方面,由于这个例程是控制的一颗白光LED灯珠和一颗黄光LED灯珠,而我们小夜灯打开时只需要发出黄光,所以就要控制三色灯中的"红色LED"和"绿色LED"来组合成黄光使用(红光+绿光=黄光)。 回看底板原理图CI-B02-MB,红光引脚需要连通到PWM5,绿光引脚需要连通到PWM4。 打开☞启英泰伦-文档中心查看开发板套件上CI1302芯片的"芯片引脚功能描述",找出PWM5和PWM4的引脚名称,查表得到PWM5的引脚名称是XIN,PWM4的引脚名称是PA6。 回到语音AI平台继续配置,发现PIN脚只有PA2(PWM0)、PA3(PWM1)、PA4(PWM2)、PA5(PWM3)、PA6(PWM4)五个PWM口可以选择,并没有XIN(PWM5)引脚可供选择。 由于"PIN脚"选项中暂无XIN(PWM5)引脚,我们用PA5(PWM3)替代,然后用杜邦线将PWM3连接到代表红光的LED引脚的排针上。 所以,那我们就假定将"功能"中灯光颜色替换掉,白光替换为红光,黄光替换为绿光,因此这里直接选择"PA5(PWM3)"和"PA6(PWM4)",然后点击"继续" 编辑命令词,勾选不需要的功能,然后点击"删除选中" 勾选"SDK选项",然后点击"立即提交" "当前流程"显示已提交,耐心等待即可......(我用了不到2分钟) 等待间隙,需要创建本地工作目录,在自己电脑除C盘外的一个磁盘创建"CiProject"文件夹(名字可以自己取),路径不要带中文。 几分钟后,网页会自动刷新当前流程显示"已完成",然后点击"下载文件"将文件保存到"CiProject"文件夹中。 点击鼠标右键,在快捷菜单中‌选择"解压到sfw......" 得到包含有"产品固件"和"SDK开发包"的文件夹 2、固件下载烧录 打开"sfw20............"文件夹,进入找到PACK_UPDATE_TOOL.exe固件下载工具 双击打开"PACK_UPDATE_TOOL.exe"工具,若有弹窗选择"是"。 选择开发版套件搭载的芯片信号CI1302,然后点击"确定" 点击"固件升级" 点击"选择固件" 选择刚刚解压的文件夹中的固件,点击"打开" 检查type-c数据线是否连接好,确保开发板套件处于断电状态;此时电源指示灯应该是熄灭状态,若是点亮状态则需要按下电源键让指示灯熄灭。 勾选电脑给开发板分配的端口号(我的是COM8),每台电脑分配的端口号各不相同。 此时按下电源键,开发板电源指示灯亮起,固件开始下载(进度条开始滚动) 当显示"device:update success(...........)"时,表示固件已经下载完毕了 此时,三色LED灯会亮起,呈现黄色光芒。哇,金色传说!!! 四、装机与测试 应该是考虑到家居环境夜晚使用,这个方案没有做播报音,那我们把开发板套件喇叭拔下来。 将开发板放到这个小夜灯里面进行测试,我给小夜灯开了个小孔,用于拾音。 五、成品展示与总结 1、成品展示 选中生效的命令词如下: 不需要唤醒,直接说"小智开灯",OK!成功点亮。"小智关灯"、"小智亮一点"、"小智暗一点"都没问题。 2、总结 初次邂逅 CI1302 芯片时,它强劲的性能介绍瞬间让我 "心动种草",脑海中当即勾勒出用它打造智能语音控制小夜灯的温馨画面 ------ 深夜无需摸黑找开关,轻声呼唤便能点亮柔和灯光,生活该多便捷惬意。本以为这样前沿的芯片开发起来必定困难重重,不仅技术门槛高,开发周期也会相当漫长,甚至做好了熬夜攻坚、反复调试的准备。可当真正着手开发,才发现从方案构思到功能实现,整个流程如行云流水般顺畅,每个环节都暗藏惊喜,原以为复杂的技术难题被其人性化设计与强大功能逐一化解,漫长的开发周期也在高效体验中大幅缩短,这份 "丝滑" 着实令人欣喜不已。 最让我意外的是启英泰伦的☞语音AI平台,不用写代码就能开发,还有特别详细的教程和资料。我这种零基础的小白,跟着步骤走居然也能把项目做出来!在接线、编程的时候,我一点点搞懂了语音控制到底是怎么实现的,感觉自己对智能硬件的认识又进了一步。 现在看着喊句话就能亮起的小夜灯,心里特别有成就感!这可不只是一个会听指令的灯,更是把想法变成现实的成果。以后我还想试试用这个技术开发更多好玩的东西,要是我的经验能帮到其他想入门的朋友,那就再好不过了!咱们一起探索语音开发,做出更多有趣的智能产品!
启友玩AI
8 20 硬创社
【学习&开发之路】放弃Keil吧!VSCode搭建CI13XX开发环境效率提升300%
【学习&开发之路】放弃Keil吧!VSCode搭建CI13XX开发环境效率提升300% 一、概述 CI13XX系列芯片不得不说是Chipintelli(启英泰伦科技有限公司,简称:CI)推出的最为经典的AI语音系列芯片之一。CI13XX系列芯片(CI1301、CI1302、CI1303、CI1306、CI1311、CI1312)集成BNPU V3,高主频(240MHz),更大SRAM,算力更强。采用SSOP24/QFN40/SOP16三种封装,可适应不同应用及贴片要求。集成度更高,外围精简,除MIC,喇叭外,板级仅需要阻容、PA芯片。可实现单麦降噪、AEC、双麦增强、双麦定向等功能,另CI1302、CI1303、CI1306还支持声纹识别和离线自然说。具体的芯片数据信息可以直接参考硬件选型指南 - 启英泰伦文档中心。 要开始使用 CI13XX系列芯片进行开发,您需要一些基本知识: 熟悉 C/C++ 编程语言。 了解电子电路和传感器的基本知识。 串口通信的基本使用步骤。 二、安装VScode 1.下载安装包,到官方网站下载Windows的安装包:Visual Studio Code - Code Editing. Redefined 2.安装 在自己电脑除C盘外的一个磁盘创建“vscode”文件夹,路径不要带中文。 运行下载的安装包 将安装路径选择刚才新建的“vscode”文件夹 勾选下列配置,再点下一步 点击安装 到这里就安装好了,下面进行配置,使vscode支持CI13XX系列芯片的开发。 三、配置VScode+CI TOOL 1.本地创建工作目录 在自己电脑除C盘外的一个磁盘创建“CiProject”文件夹,路径不要带中文。 2.下载SDK开发包,到启英泰伦官方网站下载: 点击进入语音AI平台后,点击登陆语音AI平台 点击注册一个账号,然后登录 成功登录后,点击“开发资料” 点击“CI130X离线SDK”,选择最新Offline版本的SDK文件,点击“下载文件” 将“CI130X_SDK_ASR_Offline_V2.2.0.zip”SDK压缩包保存到开头创建的“CiProject”文件夹中 点击保存 将“CI130X_SDK_ASR_Offline_V2.2.0.zip”SDK压缩包解压到当前文件夹 3.安装ci-tool插件 点击进入“CI130X_SDK_ASR_Offline_V2.2.0”SDK文件开发包,确定.vscode文件夹在该目录中 在空白处右键“通过Code打开” 打开后点击“是,我信任此作者” 点击左侧软件商店图标,再点右上角三个省略号图标 选择“从VSIX中安装” 或 “Installed from VSIX” 找到CI130X_SDK_ASR_Offline_V2.2.0/tools/ci-tool-1.1.2.vsix 点击安装,等待安装完成即可 安装完成后,会在左侧工具栏中出现表示CI TOOL的AI图标 安装gcc编译工具链, gcc编译工具链也需要到 ☞启英泰伦语音AI平台 开发资料中下载 。 可以将riscv-nuclei-elf-gcc-9.2.0.rar压缩包保存到开头创建的“CiProject”文件夹中 用“解压到riscv-nuclei-elf-gcc-9.2.0”将gcc编译工具链解压出来 解压后的gcc编译工具链文件夹如下: 打开刚刚的vscode界面,点击“设置编译器路径” 选择编译器路径 至此,CI13XX系列芯片的开发环境就搭建完毕了! 四、编译链接 1.编译链接当前SDK中的工程 点击AI图标 左上角选项框中可以看到工程名,常用功能“清理”和“生成”有快捷按钮。 备注:更多功能右击需要编译的工程名,选项功能介绍如下: 1: “生成”:编译compile 2:“清理”:清除clean 3: “设为活动工程”:快捷键编译方式默认编译活动工程 4: “设置烧录串口号”:输入串口号,如com3,不区分大小写,请确保输入正确且不被占用。 5: “合成分区bin文件”:调用合成分区bin文件.bat,在vscode软件输出窗口命令行运行合成 6: “启动打包升级工具”:启动串口升级工具.exe 7: “烧录user code”:烧录user_code.bin 五、开发体验“智能管家” 该SDK包中的示例工程可以直接编译运行在CI13XX的开发板上,让我们来感受一下离线AI语音识别的奇妙。 1.开发板选择 进入“启英泰伦官方网站”点击“样品购买” 我选了GPIO数量最多的CI1306开发板“CI-D06GT01D”用来开发。(后续可根据实际项目裁剪下来再用引脚更少、性价比更高的其他CI13XX型号芯片开发板或模块) 注册登录后就可以购买了,我发现微信登录更方便购买和联系客服咨询。 到货!到货!开箱组装! 麦克风和喇叭插入对应插槽(开箱清单:CI-D06GT01D开发板x1 ,驻极体麦克风x1 ,喇叭x1, 包装盒 X1)。 取来一根type-c数据线,如图type-c一端连接到模块,另一端连接到电脑的USB接口; 开发板上用跳帽导通UART0 拨动电源开关,接通电源指示灯点亮(发现开发板批次不同,有的是红色电源指示灯,有的是绿色电源指示灯) 电脑打开“设备管理器”会看到电脑给开发板分配的端口号(win7及以下Windows操作系统需要安装CH340串口驱动) 开发板硬件开发环境就搭建完毕了! 2.编译SDK开发包 回到vscode软件开发环境,点击“资源管理器” 检查板极配置,点击打开system文件夹,再点击sdk_default_config.h头文件,检查板极支持配置宏“BOARD_PORT_FILE”是否和开发板型号一致(我买的是CI-D06GT01D开发板,这里宏定义就必须是"CI-D06GT01D.c") !!!备注:可根据手上开发板型号,修改为其他型号的板极支持配置,可在boards文件夹中进行开发板模块型号的查询 3.生成固件进行烧录 点击CI TOOL工具,首先点击清理图标 然后,点击生成图标进行工程的编译链接,编译完成后会在终端末尾显示“Finished building:......”等打印信息 编译成功后,project/offline_asr_pro_sample/firmware/user_code文件夹中会生成user_code.bin文件 点击CI TOOL工具,鼠标右键工程名,点击“合成分区bin文件” 终端最后输出“output name: mp3\mp3.bin”则表示各个分区的bin文件合成成功 鼠标右键工程名,点击“启动打包升级工具” 有弹窗则选择“是” “打包升级工具”运行成功,选择芯片系列和具体型号,我这里开发板是CI-D06GT01D,所以芯片系列选“CI130X系列”,具体芯片型号选CI1306,点击“确定” 点击“固件打包” 点击“自动分配” 点击“打包固件”,会弹窗显示“固件已生成”,点击“确定”即可(所生成固件的“软件名称”和“软件版本”我这里默认没变,大家可自行取名) 此时,工具会按“软件名称”和“软件版本”中所填信息在SDK开发包中生成一个可烧录的固件"Firmware_V2.0.0.bin",如下图路径: 点击“固件升级” 确认固件存放的路径正确与否 在电脑为开发板分配的端口号(我这里是COM8,大家根据自己电脑实际情况选择)后面方框中打勾 按下开发板上的复位按钮 “打包升级工具”就会开始将固件烧录到开发板中,有进度显示 当进度显示为100%,打印信息显示“device:update success(-)”时,就会听到开发板播放的欢迎语“欢迎使用智能管家,您可以使用智能管家唤醒我” 这时就可以感受到“智能管家”带来的初体验了。照着下面的指令开始念起来吧! 彩蛋:说“关闭语音”后,说任何词都会“哔”的一声叫哦! 有动手能力的小伙伴,还可以在官网购买芯片后,AI平台下载官方原理图,在**嘉立创**打样自行开发模组或开发板。 六、总结 在 VS Code 中即可一站式完成代码开发、编译、烧录与调试全流程,这种丝滑的开发体验令人倍感畅快。对于嵌入式开发而言,如此高效集成的环境堪称刚需,由衷感谢前辈们在适配工作中倾注的心血! 接下来,我将正式开启 CI13XX 系列芯片的开发征程。深知前路漫长且挑战重重,但正如 "路漫漫其修远兮,吾将上下而求索" 所言,定当以探索之心全力以赴,深耕技术突破。期待在实践中沉淀更多成果!
启友玩AI
2 6 硬创社
语音识别路线之战:离线语音如何弯道超车在线语音 - 隐私、效率与稳定性的三重优势解析
语音识别路线之战:离线语音如何弯道超车在线语音 - 隐私、效率与稳定性的三重优势解析 一、引言 在智能音箱唤醒家电、车载系统语音导航的今天,语音识别技术已成为人机交互的核心入口。然而,依赖云端的在线语音识别始终面临网络延迟、隐私泄露等痛点。因此近几年离线语音识别技术快速发展、大有赶超在线语音之势。终究那种技术能脱瘾而出实现一统江湖、各位看官小板凳请坐,听锦诸葛给各位娓娓道来。 几年前智能音箱大火的时候、我也购买了多款包括小米小爱、百度小度、阿里天猫精灵。平时查询个天气啥的、播放个音乐啥的也就还将就能用,慢慢使用的频次就低了,目前已经在吃灰了,现在回想起来应该有以下几个原因导致目前情况: 识别和反馈慢、等音箱反应过来我早就通过手机了解了接下来几天的天气情况; 意图识别不准确,很多时候答非所问,交互智能化还比较缺乏。 去年五一在朋友推荐下购买了一款语音识别风扇,整个夏天使用频率还挺高,语音识别意图准确,识别反应迅速,引起了我的深度思考,未来语音交互究竟如何发展,我预判未来简单的家电控制类将是离线语音技术为主,智慧类的家电会是离线与在线结合的方式进行。 离线语音识别技术通过本地化处理,实现了"无网胜有网"的突破。本文将从技术原理、对比优势、应用场景三大维度,解析离线语音识别如何重塑智能交互的未来。 二、技术原理:从云端到本地的范式革新 离线语音识别的核心在于将算法模型嵌入本地设备(如芯片、模块或SDK),通过硬件算力直接完成声学信号采集、降噪、特征提取到语义解析的全流程(图1)。以启英泰伦CI-D02GS01J模块为例,其内置2MB存储空间,支持300条本地指令识别,无需上传任何数据至云端。 图1:离线语音识别技术链路示意图 三、离线VS在线:五大核心优势深度对比 隐私保护:数据主权回归用户 对比维度 离线语音识别 在线语音识别 数据存储位置 本地设备(如芯片/模块) 云端服务器 传输风险 无数据传输,防窃听/篡改 依赖网络,存在中间人攻击隐患 合规性 符合GDPR等隐私法规要求 需用户授权数据上传,法律风险较高 根据启英泰伦实测数据,离线方案用户语音指令处理全程封闭在设备内,泄露风险降低98% 例如医疗场景中,患者病历语音录入通过离线模块处理,可避免敏感信息外流 。 2. 实时响应:毫秒级交互体验 响应速度:离线识别平均延迟[removed]500ms。 **极端场景适配:**飞机、矿井、偏远乡村等无网环境下,离线模块仍可稳定执行指令。 表1:典型场景响应速度对比 场景 离线语音识别 在线语音识别 智能家居灯光控制 180ms 600ms+ 车载导航语音输入 220ms 800ms+ 工业设备紧急制动 150ms 不可用 3. 稳定性:无惧网络波动与服务器宕机 故障率对比:离线模块本地运算故障率<0.1%,而在线方案因依赖云端,服务可用性受服务器负载、DDoS攻击等影响 抗干扰能力:启英泰伦开发的离线算法支持动态降噪,在85dB工厂环境中识别准确率仍达92% 4. 成本优化:硬件与运维双重降本 成本项 离线方案 在线方案 硬件成本 芯片单价[removed]$5 云服务费 0 0.01−0.1/次API调用 长期运维 无服务器维护开支 需持续支付带宽与算力费用 以智能家电企业为例,年产100万台设备采用离线方案,可节省云端授权费超$500万/年。 5. 能耗与体积:轻量化设计的胜利 功耗对比:启英泰伦低功耗语音识别芯片待机功耗[removed]100mW 集成度:离线模块尺寸可压缩至10mm×10mm,直接嵌入开关面板等微型设备。 四、应用场景:离线语音落地的四大黄金领域 1. 智能家居:无网环境下的控制中枢 案例:支持粤语/闽南话的启英泰伦识别模块,让方言用户通过语音操控空调、照明,识别率>95%。 2. 工业物联网:高噪声环境的可靠交互 实测数据:启英泰伦开发的离线算法在纺织车间(噪声75dB)中,指令识别准确率仍保持95%。 3. 车载系统:安全至上的驾驶助手 功能实现:离线语音导航、车窗控制响应速度[removed]
启友玩AI
0 3 硬创社
从按键到语音:家电设备交互的演进之旅
家电,在人们的日常生活中扮演着不可或缺的角色,也是提升人们幸福感的重要组成部分,那你了解家电的发展史吗?#70年代结婚流行“四大件”:手表、自行车、缝纫机,收音机,合成“三转一响”。#80年代随着改革开放的深化,中国经济开始飞速发展,黑白电视机、冰箱、洗衣机这“新三件”,成为了人们对生活的新诉求。#90年代彩电、冰箱、全自动洗衣机开始大量进入普通家庭,快速全面普及,90年代末,家电产品实现了从奢侈品到必需品的转变。#00年代至今00年代,随着人们追求高品质生活的愿望,常用的电视机、洗衣机等已经远远不能满足人们的需求,各种家电品牌如雨后春笋涌现,微波炉、油烟机、冰箱、电饭煲、油烟机、烤箱等家电已成为家居必备。10年代至今,更是诞生了诸如洗碗机、扫地机器人、吸尘器、热水器、茶吧机、晾衣机等新面孔,让人们的生活更加便捷。---伴随着家电品类和功能的变化,家电的人机交互方式也悄然发生着变化。01 机械按键最早的机械按键技术出现在打字机上,比如1880年代出现的Remington No. 2打字机就采用了机械按键。随着计算机的发展,机械按键技术也逐渐应用于计算机键盘上。后来,机械按键逐渐应用到各种控制设备上,早期的家电设备就使用机械按键作为与用户的主要交互方式。例如,电视机、收音机和录像机等家电产品都配备了机械按键,用户通过按下或者旋转按钮来切换频道、调节音量或进行其他操作。02 红外遥控1955年,美国工程师Eugene Polley发明了第一款无线遥控器Zenith Space Command,它使用了电子管和红外光线来发送信号控制电视机。随后,在1960年,日本的夏普公司进一步改进了红外遥控技术,并将其应用于电视机上。自那时以后,红外遥控技术成为家电产品中广泛应用的标准控制方式,通过遥控器发送红外信号来控制电视、空调、DVD播放器等设备。用户可以通过按下遥控器上的按钮来实现各种操作,如调整亮度、选择菜单项等。03 触屏在1965年,E.A.Johnson教授提出了首个电容式触屏的想法。之后,不同类型的触屏技术相继出现,包括电阻式、电容式、表面声波等。第一个使用触屏技术的商用产品可以追溯到1993年发布的IBM Simon智能手机。后来,触摸屏开始在家电领域得到广泛应用。触摸屏允许用户直接在显示屏上进行操作,无需额外的机械按键或遥控器。油烟机、冰箱、洗衣机等家电产品逐渐采用触摸屏作为主要的人机交互方式,用户可以通过触摸屏上的图标、菜单来控制设备。04 手机APP/小程序2008年,苹果公司推出了iPhone 3G,并在其上发布了iOS App Store,其他智能手机制造商也纷纷推出自己的操作系统和应用商店。从那时起,手机APP得到了爆炸式的增长和发展,各种类型和功能的应用程序涌现出来。2017年,微信推出了小程序,启动快,占用内存少,深受企业和用户青睐。APP/小程序的诞生也使得家电设备与手机之间建立了连接。通过安装相应的APP/小程序,用户可以远程控制和监控家电设备。例如,用户可以使用手机APP/小程序调整空调温度、启动洗衣机、查看冰箱内食物存储情况等。05 语音交互随着人工智能技术的发展,近年来,语音交互逐渐成为家电设备的重要交互方式。语音交互又分为在线语音交互和离线语音交互,在线语音交互可借助语音助手(如Amazon Alexa、Google Assistant和Apple Siri),离线语音交互主要基于智能语音芯片。用户可以通过语音指令控制家电设备,无需使用APP、遥控器或触摸屏,只需说出特定的命令词,设备便可执行相应的操作,如打开设备、播放音乐、查询天气等。与手机APP/小程序相比,语音交互具备更多天然的优势: 1. 语音交互操作更为直接便捷。通过简单的口头指令,用户可以轻松实现对设备的控制,无需繁琐的手动操作或在手机上打开应用程序进行设置。 2. 语音交互消除了视觉界面的限制。手机APP/小程序通常需要用户通过触摸屏幕来完成操作,而语音交互则不受时间和空间的限制。用户可以在驾驶、运动或其他无法使用手机时,通过简单的语音指令即可操控设备,提供了更高的灵活性和便利性。 3. 与传统的图形用户界面相比,语音交互更加自然和人性化,模拟了人与人之间的对话。用户可以以更自然的方式与设备进行交流,享受更加智能和个性化的服务。我们可以构建自己的语音识别产品启英泰伦成立于2015年,作为离线智能语音芯片行业的先行者和领导者,专注于智能语音芯片及算法研发。作为离线智能语音芯片行业的先行者和领导者,截止目前已发布15款芯片,涵盖AI语音芯片、AI语音WiFi Combo芯片、AI语音BLE芯片。AI语音系列芯片集成自研的脑神经网络处理器BNPU V3,具备高集成、高性能、低功耗等优势,可实现远场离线语音交互,识别率高达97%以上。为了提供多样化、个性化的解决方案,启英泰伦推出了AI语音WiFi Combo芯片CI230系列和AI语音BLE芯片CI231系列。CI230系列芯片集成BNPU V3,支持2.4 GHz 802.11 b/g/n Wi-Fi及 BLE 5.1 无线通信协议,可实现离线语音控制+在线APP/小程序控制+云端内容获取。CI231系列芯片集成2.400~2.483GHz世界通用ISM频段无线收发芯片,嵌入基带通讯协议,可实现离线语音控制+小程序BLE控制。
启友玩AI
8 18 硬创社