研究背景
对于不懂普通话的人来说,当他们需要到外地住院或外出务工时,用普通话与当地人交流是一件极其复杂的事情。目前,直接方言识别方法,包括频谱分析、声学特征提取和比较以及声学纹理分析容易受到传输介质、环境噪声和说话者生理状态的干扰。根据发声时喉咙的解剖学基础检测喉咙肌肉的振动进行语音识别的可穿戴压力传感器可以避免这些缺陷。对于声调语言,方言发音之间的差异在于语速、音节和音调,这些是由控制舌骨和软骨运动的喉部肌肉产生的。因此设计低检测下限、低滞后性和耐久性好的压力传感器来捕捉发声过程中喉部肌肉细微而快速的振动用于深度学习模型的训练和识别对于方言识别具有重要意义。
Ti₃C₂Tₓ Composite Aerogels Enable Pressure Sensors for Dialect Speech Recognition Assisted by Deep-learning
Yanan Xiao, He Li, Tianyi Gu, Xiaoteng Jia*, Shixiang Sun, Yong Liu, Bin Wang, He Tian, Peng Sun, Fangmeng Liu*, Geyu Lu
Nano-Micro Letters (2025)17: 101
https://doi.org/10.1007/s40820-024-01605-z
本文亮点
1. 强调了传感性能与机械性能在材料设计和方法上的创新。
2. 复合气凝胶压力传感器表现出低滞后(13.69%)、宽检测范围(6.25 Pa-1200 kPa)和循环稳定性,可获得稳定准确的发音信号。
3. 压力传感器采集了超过6888和4158个发音信号,并用于训练卷积神经网络模型,从而准确识别了六种方言(准确率为96.2%)和七个单词(准确率为96.6%)。
内容简介
能够舒适地贴附在皮肤上的可穿戴压力传感器在声音检测方面大有可为。然而,目前基于压力传感器的智能语音助手只能识别标准语言,这阻碍了非标准语言人群的有效交流。吉林大学卢革宇、刘方猛、贾晓腾等人制备了一种超轻的Ti₃C₂Tₓ MXene/壳聚糖/PVDF复合气凝胶,其检测范围为6.25 Pa-1200 kPa,响应/恢复时间快,滞后低(13.69%)。这种可穿戴气凝胶压力传感器可以通过喉咙肌肉振动检测语音信息,不受任何干扰。在卷积神经网络的辅助下,可以准确识别六种方言(准确率为96.2%)和七种不同的单词(准确率为96.6%)。这项工作标志着用于人机交互和生理信号监测的无声语音识别技术向前迈进了一大步。
图文导读
I Ti₃C₂Tₓ复合气凝胶和用于方言识别的压力传感器的制备过程
Ti₃C₂Tₓ MXene因其可调节的层间距和优异的导电性而成为可穿戴压力传感器的理想材料。然而,纯Ti₃C₂Tₓ通常具有机械脆性和氧化性,因此在反复循环过程中容易崩溃。为防止机械刺激下的传感性能下降,将Ti₃C₂Tₓ层与多糖类生物聚合物壳聚糖复合,可形成牢固的氢键,大大增加分子运动的自由度,提高柔韧性,并隐蔽Ti₃C₂Tₓ的易氧化基团,延缓氧化。作为增强相的PVDF短纤维还能在高压下产生可逆变形,从而提高气凝胶的耐用性(图1a)。在此,基于Ti₃C₂Tₓ MXene/CS/PVDF 复合材料的层状气凝胶基可穿戴压力传感器能够准确获取发声时喉部的振动电信号。采用CNN算法管理压力传感器获取的传感信息,实现了准确的方言识别率(六种方言识别率为96.2%,七种常用词汇识别率为96.6%),满足了方言人群的交流需求(图1b)。
图1. (a)MX/CS/PVDF气凝胶制备示意图。(b)用于方言语音识别的基于 Ti₃C₂Tₓ 的可穿戴气凝胶压力传感器。
II Ti₃C₂Tₓ复合气凝胶的表征
图2a展示了相互连接的层状结构气凝胶的 SEM 图像。随着Ti₃C₂Tₓ浓度的增加,MX/CS/PVDF-x气凝胶形态的演变。MX/CS/PVDF-0.5显示出紧密的结构,气凝胶片层之间的空间更小。在MX/CS/PVDF-1中,空间变得更宽,结构演变得更松散。然而,由于Ti₃C₂Tₓ纳米片之间的分子间作用力很强,随着Ti₃C₂Tₓ的含量继续增大,气凝胶的结构更加紧密。
图2b的XRD 图谱显示,(002) 峰向低角度方向移动且强度降低,这表明CS和PVDF纳米纤维的加入扩大了Ti₃C₂Tₓ层的层间距。共聚焦拉曼光谱显示,与Ti原子和C原子的面外振动有关的A1g从151 cm⁻1 移动到了194 cm⁻1,且晶胞表面单元发生了变形(图 2c)。与Ti₃C₂Tₓ和CS/PVDF气凝胶相比,MX/CS/PVDF-1在 2240 cm⁻1 附近的峰值变宽并发生蓝移(图2d),这证实了 CS 与Ti₃C₂Tₓ之间强大的氢键作用。XPS 图谱揭示了气凝胶的化学状态和成键构型(图 2e)。O₁ₛ峰表明,由于Ti₃C₂Tₓ、CS和PVDF之间形成了氢键,Ti₃C₂Tₓ的氧化被延缓。CS和PVDF 的参与减小了TiO₂相的峰面积。然而,过量的Ti₃C₂Tₓ会增加氧化过程,由于易受氧化基团的继续暴露。
MX/CS/PVDF-x 气凝胶具有25.025 m2·g⁻1的高比表面积(图2f插图)和MX/CS/PVDF-1的超低密度(ρ < 6.86mg·cm⁻3),可以放置在蒲公英表面而不变形(图2g)。MX/CS/PVDF-x的N₂吸附/解吸等温线表现出代表性的H3滞后环和II等温线(图2f),表明基于Ti₃C₂Tₓ的气凝胶的吸附是在介孔或大孔表面发生的多层可逆吸附过程。此外,拐点位于单层吸附附近,多层吸附随着P/P₀的增加而发展。由于吸附层层出不穷,从等温线上无法观察到极限平衡吸附值。
图2. MX/CS/PVDF 气凝胶的表征。(a)截面形态的SEM图像。(b)Ti₃C₂Tₓ纳米片和 MX/CS/PVDF 气凝胶的XRD图和(c)拉曼光谱。(d)Ti₃C₂Tₓ纳米片、CS/PVDF和MX/CS/PVDF-1 气凝胶的傅立叶变换红外光谱。(e)Ti₃C₂Tₓ纳米片、MX/CS/PVDF 气凝胶的O₁ₛ XPS 光谱。(f)MX/CS/PVDF气凝胶的N₂吸附-解吸等温线。(g)将超轻气凝胶切割成 2×2 厘米的小块放置在蒲公英上的光学照片。
III MX/CS/PVDF气凝胶基压力传感器的传感机理分析和压力传感性能
图3a展示了MX/CS/PVDF的应变行为:在超低加载压力下,MX/CS/PVDF 的顶部气凝胶片层发生弯曲和变形,内部的Ti₃C₂Tₓ纳米片则变得更加紧密。当加载压力增加时,MX/CS/PVDF的顶部和底部片层发生变形。因此,MX/CS/PVDF 气凝胶的导电通路增加,电子传输速率加快,从而产生更大的相对电流(图3b)。导电通路的急剧增加是由基于Ti₃C₂Tₓ纳米片的变形和 MX/CS/PVDF片层接触面积的增加造成的。随着负载压力的继续增加,MX/CS/PVDF片层停止了变形。薄片之间的接触面积不断扩大,直至完全接触,导电通路不再增加,同时电子传输速率达到最大值。
为了说明MX/CS/PVDF气凝胶基压力传感器的工作机制,有限元模拟计算了压力加载过程中的应力分布(图3c)。通过施加较小的负载压力,应力分布在整个气凝胶顶层片层上,导致一部分气凝胶在相互接触时发生变形。应力分布范围和气凝胶层之间的接触面积都随着负载压力的增加而增大。这一变化过程与实际情况相符。
图3. MX/CS/PVDF 气凝胶压力传感器的压阻效应。(a)不同负载压力下的压力传感器示意图。(b)不同压力下MX/CS/PVDF片层的变形状态和电子传输过程示意图。(c)通过有限元模拟解释MX/CS/PVDF-1压力传感器的压缩变形机制。彩色等值线表示气凝胶结构在变形过程中的微观应变。
图4a测量了MX/CS/PVDF气凝胶在不同压力下的传感性能。在0-1200 kPa的压力范围内,MX/CS/PVDF-1的灵敏度最高。随着负载压力从265 Pa持续增加到1200 kPa,相对电流强度逐渐增加,从而有效区分了不同的负载压力水平(图4b)。图4c展示了在0至1728 kPa的不同负载压力下,电流-电压(I-V)曲线在-0.3 V至0.3 V之间的良好线性关系。这表明MX/CS/PVDF-1传感层和铜电极之间形成了欧姆接触。随着负载压力的增加,I-V曲线的斜率变得越来越陡,表明器件电阻减小,电流随之增大。基于MX/CS/PVDF-1的压力传感器在17.69 kPa负载压力下的快速响应/恢复时间为72毫秒(图4d)。在0.1至0.75 Hz(图4e)的不同频率下,MX/CS/PVDF-1 具有超常的稳定性和可分辨的响应信号。输出电流变化信号以及压力加载和卸载期间输入负载压力和电流信号的一致性证实了器件的低迟滞性(图4f)。此外,在22.12 kPa压力下进行6000次循环测试时,观察到的衰减很小,相对电流变化几乎相同。初始状态和结束状态的电流振幅相同,证明了其耐用性(图4g)。
图4. MX/CS/PVDF-1气凝胶压力传感器的压力传感性能。(a)不同 Ti₃C₂Tₓ浓度的 MX/CS/PVDF的响应压力曲线。(b)负载压力为265 Pa-1200 kPa 时的相对电流变化。(c)MX/CS/PVDF-1 传感器在不同负载压力下的I-V 曲线。(d)压力为 17.69 kPa 时的响应和恢复时间。(e)不同运行频率负载压力下的 I-t 曲线变化。(f)I-t 和 P-t 曲线的瞬时响应。(g)在 22.12 kPa 压力下进行 6000 次加载/卸载循环的耐久性测试,插图显示了前七个循环和后七个循环的放大曲线。(h)压阻传感器的性能比较。
为了进一步评估实际可行性,将 MX/CS/PVDF-1压力传感器放置在人体关节和声带上,以检测人体动作和生理状态:手指弯曲角度为0°至90°(图5a)心跳(图5b)、和脉搏(图5c)。此外,图5d展示了当传感器放在喉咙上时,还能精确检测到咳嗽和发音(图5e和5f)。
图5. 使用压阻传感器实时监测人体生理信号。(a)手指弯曲角度从0度到30度、45度、60度、90度的相对电流变化。(b)实时记录心跳波形。(c)实时记录手腕脉搏波形(插图为脉搏振动波形的放大图)。(d)将 MX/CS/PVDF-1固定在24岁志愿者喉咙上时对人体生理信号的检测:(e)咳嗽,(f)说 “MXene”。
方言语音识别采用深度学习算法与压力传感器结合,以实现精确分类和方言识别(图6a)。传感器固定在人体喉部收集了超过6888个和4158个喉咙发声振动信号,用于训练CNN模型,以分别识别7个词汇和6种汉语方言(图6b)。最终,测试集对六种汉语方言和七种不同方言词的准确率分别达到了96.2% 和96.6%(图6c和6d)。
图6. 深度学习辅助下的方言识别。(a) 压力传感器固定在喉咙上,用于语音识别。(b)六种汉语方言中的七个词汇产生的连续电流信号。(c)CNN 算法对六种不同汉语方言的混淆矩阵。(d)CNN 算法对七种不同汉语方言词汇的混淆矩阵。
IV 总结
制备了基于MX/CS/PVDF的压力传感器,其具有超轻密度和出色的耐用性,可用于方言识别。基于MX/CS/PVDF-1的压力传感器具有快速响应/恢复时间(< 72 ms)和较低的检测限(6.25 Pa),可以检测到喉咙的轻微振动。在方言语音识别过程中,通过使用7个常见的指令性词汇和6种中文方言,分别获得了超过6888和4158个喉咙发声振动信号,用于训练CNN模型。方言信息的识别准确率分别为96.6%和96.2%。这种高性能压力传感器可在未来的人机交互和健康监测中发挥重要作用,用于表达指令和获取生理信息。
作者简介
本文通讯作者
课题组致力于开发柔性可穿戴敏感材料与传感器、电子皮肤与人机交互界面和生物电刺激治疗。
本文通讯作者
主要研究方向为新型传感器技术与装置:气体传感器、柔性电子技术和传感器件、智能传感系统和检测设备。
本文作者
长期从事传感器、电子材料与器件、物联网研究。
关于我们
Nano-Micro Letters《纳微快报(英文)》是上海交通大学主办、在Springer Nature开放获取(open-access)出版的学术期刊,主要报道纳米/微米尺度相关的高水平文章(research article, review, communication, perspective, highlight, etc),包括微纳米材料与结构的合成表征与性能及其在能源、催化、环境、传感、电磁波吸收与屏蔽、生物医学等领域的应用研究。已被SCI、EI、PubMed、SCOPUS等数据库收录,2023 JCR IF=31.6,学科排名Q1区前3%,中国科学院期刊分区1区期刊。多次荣获“中国最具国际影响力学术期刊”、“中国高校杰出科技期刊”、“上海市精品科技期刊”等荣誉,2021年荣获“中国出版政府奖期刊奖提名奖”。欢迎关注和投稿。
Web: https://springer.com/40820
E-mail: editor@nmlett.org
Tel: 021-34207624
如果文章对您有帮助,可以与别人分享!:Nano-Micro Letters » 吉大卢革宇、刘方猛、贾晓腾等:Ti₃C₂Tₓ复合气凝胶基压力传感器在深度学习辅助下用于方言语音识别