研究背景
人工智能(AI)近年来取得巨大进步,改变了信息收集和处理的方式。目前,基于传统的冯·诺依曼体系结构执行复杂的人工智能任务是具有挑战性的,因为它在物理上将内存和处理单元分离,从而在计算效率和功耗方面产生固有的瓶颈。最近,具有大规模并行性、高效率和容错性的神经形态计算吸引了大量研究人员的注意,其为AI的发展提供了有力支撑。这一领域最具挑战性的任务是将神经系统中的生物行为映射到设备中的电气行为。针对于此,人工突触器件应运而生,它可以模拟生物神经元之间的信息传递行为及其错综复杂的互连结构,连接了生物行为和硬件特性,从而促进了硬件神经形态计算的实现。研究人员已经成功地在突触器件中实现了生物突触的基本行为,例如时序相关可塑性、长时程增强/抑制和双脉冲脉冲易化/抑制。然而,仅仅模仿这些特难以满足AI的智能处理要求。目前,具有高复杂性和完整性的神经形态硬件的实现仍然很少见。
Tailoring classical conditioning behavior in TiO₂ NWs: ZnO QDs-based optoelectronic memristors for neuromorphic hardware
Wenxiao Wang, Yaqi Wang, Feifei Yin, Hongsen Niu, Young-Kee Shin, Yang Li*, Eun-Seong Kim, and Nam-Young Kim
Nano-Micro Letters (2024)16: 133
https://doi.org/10.1007/s40820-024-01338-z
本文亮点
1. 提出并制备了一种具备神经形态计算能力的Ag/TiO₂纳米线 (NWs):ZnO量子点 (QDs)/FTO的光电子突触器件。
2. 人工光电子突触在电与光刺激下展现出优异的长/短期突触可塑性,并且基于其光电性能有效实现了手写字体识别任务。
3. 提出的突触器件成功的模拟了复杂的生物联想学习行为,包括获取、消退、恢复和泛化这四个特征。
内容简介
山东大学李阳团队利用化学溶液法合成并提出了一种基于Ag/TiO₂ NWs:ZnO QDs/FTO的光电子人工突触器件,用于实现神经形态计算以及模拟生物联想学习行为。通过光和电刺激的施加,在器件中实现了包括长期和短期可塑性以及学习-遗忘-再学习行为在内的突触行为。利用光电共调制特性,进行了神经形态计算的模拟,结果显示对手写数字的识别准确率达到了88.9%。此外,通过将光和电刺激映射到条件和非条件刺激,模拟了复杂的生物关联学习行为。在特定的光电信号应用下,高效模拟了经典条件反射的四个特征,即获取、消失、恢复和概括。本研究提供了一种具有联想学习行为的人工光电子突触,为推进电子眼、脑机接口、以及智能机器人的发展提供了新的途径。
图文导读
I 人工光电子突触器件的材料与结构表征
图1a所示为人工光电子突触结构原理图,其垂直排列的结构分别为:Ag顶电极、TiO₂ NWs:ZnO QDs功能层、以及FTO底电极。利用SEM对制备的器件进行形貌表征。如图1b所示,合成的TiO₂ NWs均匀生长在FTO上,直径约为150 nm,TiO₂ NWs:ZnO QDs功能层厚度约为1.6 μm。在380 nm激发波长下测试了器件的PL光谱,结果如图1c所示。位于394 nm、401 nm和421 nm处的峰对应于TiO₂ NWs,而548 nm处的峰可归因于ZnO QDs中的氧空位。此外,采用EDS对制备的器件进行了成分分析。Ti、Zn和O在TiO₂ NWs:ZnO QDs薄膜中的EDS映射和元素分布如图1d所示。通过TEM表征了制备的ZnO QDs的形貌。图1e中证明了直径均匀分布在5.5 ± 1.5 nm的ZnO量子点的成功制备。通过HRTEM获得了ZnO QDs的详细晶体结构信息。如图1f所示, ZnO QDS的晶格间距为0.266 nm,与纤锌矿ZnO的(002)晶面的间距一致。选区电子衍射图案中观察到对应于ZnO QDs (100)、(101)、(102)、(110)和(112)晶面的环状图案,进一步证明了纤锌矿ZnO QDs的成功合成。
图1. 基于Ag/TiO₂ NWs:ZnO QDs/FTO的光电子突触的器件表征; (a) 人工光电子突触器件结构原理图; (b) 人工光电子突触器件的SEM截面表征图; (c) 人工光电子突触器件的PL光谱;(d) 人工光电子突触器中 (ǀ) Ti、(∥) O、和(Ⅲ) Zn的EDS元素映射图;(e) ZnO QDs的低倍率TEM图像; (f) ZnO QDs的高分辨率TEM图像; (g) ZnO QDs的选区电子衍射图像。
II 人工光电子突触器件的电学行为
通过施加电信号验证人工光电子突触在模拟生物突触行为中的潜力。首先,在顶部电极上连续施加了15个周期的扫描电压。如图2a和2b所示,电导随着扫描电压的增加逐渐增加,显示了其模拟阻变行为。图2c和2d中展示了在15个正压周期内,电流从179.2增加到432.1 μA。而在15个负周期内,响应从0.65降至0.30 μA。在正负区域之间观察到电流值的差异是由于Ag/TiO₂ NWs中的接触势垒。这种特性被称为自整流特性,其有利于高密度神经形态计算的实施。
随后,分析了突触器件的长短时可塑性。为了模拟双脉冲易化(PPF)行为,对器件施加了一对电压脉冲。PPF值在开始时随着间隔时间的增加迅速下降,当间隔超过80 ms时降至约8%,然后保持稳定,如图2e所示。从PPF衰减曲线(10个周期)中拟合出两个弛豫因子,τ1和τ2,对应于快速和慢速衰减项。在本工作中,τ1和τ2分别拟合为14.35和54.35 ms。图2f描述间隔时间与PPD值之间的关系,随着间隔时间的增加,PPD呈现下降趋势,其τ1和τ2分别拟合为3.39和41.43 ms。施加了一系列电压脉冲来分析长时可塑性。在+2 V的400个连续电压脉冲的激发下,电流增加,表明通过重复刺激可以增强突触权重,如图2g所示。随后,连续施加了300个–2 V的负脉冲,导致电流返回到初始状态。图2h和2i展示频率/持续时间依赖的突触可塑性。在振幅更高、间隔时间更短和持续时间更长的情况下,可以观察到更大的电导变化。这些行为为多维突触权重更新和神经计算能力奠定了基础。
图2. 人工光电子突触的电学行为; (a) 正向扫描电压下突触器件的连续I-V曲线; (b) 负向扫描电压下突触器件的连续I-V曲线; (c) 正压区域和 (d)负压区域下突触器件的电流和电压数据随时间的变化; (e) PPF和 (f) PPF值(10个周期)与脉冲对间隔的依赖关系; (g) 突触器件的长时程可塑性; (h)突触器件在不同电压脉冲幅度下的电导变化; (i) 突触器件在不同电压持续时间和间隔下的电导变化。
III 人工光电子突触器件的光学行为
人工光电子突触的光学测试在紫外线下测试得到,测试示意图如图3a所示。图3b描述了在各种光密度下器件的电导变化,可以观察到电导响应随密度增加而增加。在关闭光后,从响应峰值到初始值的衰减所需时间随着密度的降低而减少,使得器件能够实现短时可塑性到长时可塑性的转变。图3c描述了突触器件的持续时间依赖的光诱导响应。通过施加持续时间长的光脉冲,器件被转换为更有导电性的状态,从而产生长时间的衰减时间。图3d展现了器件50个开/关光脉冲下的可靠性。可以看到,每次光脉冲后光诱导响应略微增加,并在50个周期后达到饱和。通过施加四个周期的开/关光脉冲来模拟遵循艾宾浩斯遗忘模型的人脑的学习和遗忘行为。打开光代表学习过程,关闭光代表遗忘过程,电导代表记忆强度。如图3e所示,第一个学习过程将电流从0.18增加到0.26 μA,在第一个遗忘过程之后,衰减的电流相比初始状态略微增加,即增强了记忆强度。再学习过程进一步增强了记忆强度。最后,在第一个和第四个学习过程后衰减的电流之间存在一个差距,这表明重复的学习过程显着增强了记忆。
图3. 人工光电子突触的光学行为:(a) 光诱导性能测量的示意; (b) 器件在不同光密度下的电流响应;(c) 器件在不同光持续时间下的电流响应; (d) 连续光脉冲下的电流响应; (e) 四个周期的光诱导学习-遗忘-再学习过程。
基于突触器件的归一化光致长时程可塑性行为,模拟了一个全连接的多层感知器神经网络,包括784个输入神经元、100个隐藏神经元和10个输出神经元,如图4a所示。在训练之前,将一个28×28的手写数字图像转换为灰度值,并初始化为输入层的784个神经元。每个神经元根据忆阻模型的规则更新其权重(图4b),然后在加权求和与激活后将它们传递到输出层。从MNIST数据集中提取了6000个训练图像和4000个测试图像来训练神经网络。如图4c所示,经过100次迭代,识别准确率从58.24%增加到了88.9%。同时,进行了对从0到9的十个数字的识别的概率混淆矩阵分析。如图4d所示,数字被正确识别的概率大于79.2%。
图4. 数字手写字体识别任务:(a) 基于器件的光致长时程可塑性行为的人工神经网络示意图; (b) 归一化脉冲的长时可塑性与归一化电导的关系;(c) 100个训练周期中识别准确度的变化; (d) 对0到9数字的识别的混淆矩阵。
IV 人工光电子突触器件的联想学习行为
图5. (a) 蜜蜂的喙伸反射行为示意图; (b) (I)CS激发后的电导响应,以及(II)被CS激发后的200毫秒内的衰减响应,(III) US激发后的电导响应,以及 (IV) 被US激发后的200毫秒内的衰减响应。
采用蜜蜂的喙伸反射行为(PER)作为范例来展示器件中的联想学习行为。在实施过程中,将光脉冲标记为作为气味的条件刺激(CS),将电压脉冲标记为作为花蜜的非条件刺激(US),如图5a所示。将阈值电流设置为0.6 μA以区分PER的发生。如图5b-(I)所示,连续的CS激应响应仅增加到≈ 0.58 μA,没有超过阈值,表明反射未被触发。关闭光源后,衰减电流始终保持在阈值以下,如图5b-(II)所示。相反,在连续US激发后,响应逐渐超过阈值(达到≈ 1.55 μA),从而表明PER被触发(图5b-(III))。图5b-(IV)展示了US激发后随时间的衰减电流。衰减电流最初高于响应状态对应的阈值电流;然后在100 ms内逐渐下降到阈值以下,从而表明了突触动作电位的发放直至反射结束。
图6. 经典PER的四个特征: (a) 获取、(b) 消退、(c) 恢复和 (d) 泛化。
经典条件反射表现出四个特征:获取、消退、恢复和泛化。其中,同时对器件施加包含光刺激和电刺激的关联对以实现获取特性。如图6a所示,电导响应在阈值以上迅速增加,触发PER。关联对的训练结果表明,仅仅施加也CS可以触发响应;然而,这种神经连接并不是永久的。消退可以主导条件反应的消失。在10分钟后,对每个器件施加了45个周期的光刺激。图6b表明经过10秒的衰减时间后CS单独未能触发PER(消退)。图6c展示了使用相同的关联对进行训练后的电导响应。响应增强到约0.97 μA,初始衰减电流激发到0.95 μA,表明了US和CS之间神经连接的重新加强(恢复)。在泛化过程中,类似的刺激在特定的联想对下形成神经连接后,也可以触发相同的响应。在本工作中,低频联想被视为类似刺激,并在恢复后应用于器件。如图6d所示,电导率响应逐渐增加超过阈值,虽然触发过程缓慢,但具备触发PER的能力。
V 总结
本工作提出并构建了一种基于Ag/TiO₂ NWs:ZnO QDs/FTO的光电子突触,旨在实施硬件神经形态行为。在光和电调制的协同作用下,实现了几种先进的突触可塑性,包括长短时可塑性的转换,光诱导的长时程增强/抑制以及学习-遗忘-再学习功能。基于光致突触可塑性,对MNIST数据集展现了88.9%的识别精度。最重要的是,通过施加光和刺激的关联对,成功模拟了具有四种联想学习特征的蜜蜂PER行为。总的来说,本研究开发了一种有效的人工光电子突触器件,为人工智能、神经假肢和神经机器人技术的发展提供了新的思路。
作者简介
本文通讯作者
(1)氮化镓基/砷化镓基射频无源芯片设计与先进工艺;(2)新型阻变存储器与类脑智能器件设计;(3)柔性感知与智能机器人。
关于我们
Nano-Micro Letters《纳微快报(英文)》是上海交通大学主办、在Springer Nature开放获取(open-access)出版的学术期刊,主要报道纳米/微米尺度相关的高水平文章(research article, review, communication, perspective, highlight, etc),包括微纳米材料与结构的合成表征与性能及其在能源、催化、环境、传感、电磁波吸收与屏蔽、生物医学等领域的应用研究。已被SCI、EI、PubMed、SCOPUS等数据库收录,2022JCR影响因子为 26.6,学科排名Q1区前5%,中科院期刊分区1区TOP期刊。多次荣获“中国最具国际影响力学术期刊”、“中国高校杰出科技期刊”、“上海市精品科技期刊”等荣誉,2021年荣获“中国出版政府奖期刊奖提名奖”。欢迎关注和投稿。
Web: https://springer.com/40820
E-mail: editor@nmlett.org
Tel: 021-34207624
如果文章对您有帮助,可以与别人分享!:Nano-Micro Letters » 山东大学李阳团队:成功模拟生物联想学习行为(如手写体识别)的光电子突触器件,助力神经形态计算