基于单个MTJ的超紧凑CAM阵列及其操作方法


基于单个mtj的超紧凑cam阵列及其操作方法
技术领域
1.本发明涉及存储领域,尤其涉及基于单个mtj的超紧凑cam阵列及其操作方法,考虑运用mtj这一器件,用于具有非易失性的超紧凑高性能cam设计。


背景技术:



2.随着大数据时代的到来,越来越多的数据密集型应用需要具有并行数据处理能力的存内计算(computing in memory,cim)硬件来克服冯诺依曼架构的“内存墙”瓶颈,特别是数据搜索操作。作为一种前景广阔的存内计算硬件解决方案,内容寻址内存(content addressable memory,cam)通过在给定输入查询的情况下对存储阵列进行内容寻址以实现并行搜索功能,在模式匹配、ip路由器和机器学习等多种应用场景中具有重大潜力。
3.由于基于传统cmos的cam设计具有高泄露功耗和低面积密度的缺陷,研究人员正在寻器件级的替代方案以构建紧凑的cam阵列。近年来,具有近零泄露功耗、高存储密度和高开关速度的诸多新型非易失性存储器(emerging non-volatile memories,envms)称为cam发展趋势中的理想选择,这些新型非易失性存储器包括电阻式随机存取存储器(resistive random access memory,reram)、相变存储器(phase-change memory,pcm)、铁电场效应晶体管(ferroelectric field effect transistor,fefet)和磁隧道结(magnetic tunnel junction,mtj)等。这些新型非易失性存储器件的高/低阻状态可以编码为“1”/“0”,从而实现了更紧凑的cam设计。
4.现有的基于mtj的cam技术可以分为两类:一类是基于分压搜索的cam单元,另一类是基于锁存搜索的cam单元。对于基于分压搜索的cam设计来说,由于mtj的开关比有限,cam搜索准确率对mtj的工艺变化较敏感。为了提高搜索可靠性,另一类基于锁存搜索的cam设计在单元内增加了差分检测和正反馈电路来提高检测裕度,但这种方式显著增大了单元内的晶体管数目。此外,上述两种技术都采用多个晶体管和mtj对进行互补数据存储的方式来方便搜索,但这导致了大量面积开销,因此未能充分利用mtj的紧凑且与cmos兼容的优势。基于上述现有技术存在的问题,设计一种新型的基于mtj的cam设计,从而在保持高搜索可靠性和高能效的同时降低cam单元的面积成本是有必要的。


技术实现要素:



5.本发明的目的在于针对目前已有的cam面积成本大,性能不够好的问题,提供一种基于单个mtj的cam设计,实现了更低的面积开销和更优的性能,并提出了一种分段方案,提高了可扩展性。
6.本发明的目的是通过以下技术方案实现的:
7.一种基于单个mtj的超紧凑cam阵列,cam阵列包括存储内容的m*n cam核、额外的存“0”和存“1”参考行与存“0”和存“1”参考列、行译码器、列译码器、传输门en、写入驱动器wd、搜索电流源i
search
两级检测放大器
8.进一步地,cam核包括m*n个cam单元,每个cam单元由1mtj和1nmos构成;
9.cam单元中mtj两端分别与位线bl和nmos漏极相连,nmos栅极与字线wl相连,nmos源极与另一条位线blb相连;
10.cam阵列中每行cam单元位线相连,每列共享同一条纵向的wl。
11.进一步地,行译码器控制传输门en和搜索电流源i
search
,列译码器控制wl,写入驱动器wd分为写入驱动器wd1和写入驱动器wd2,写入驱动器wd1通过传输门en连接bl,写入驱动器wd2连接blb,cam核中的每个存储行的bl接两个两级检测放大器sa的正输入端,两级检测放大器sa分为两级检测放大器sa0和两级检测放大器sa1,存“0”参考行的bl接入所有两级检测放大器sa0的负输入端,存“1”参考行的bl接入所有两级检测放大器sa1的负输入端。
12.进一步地,通过每行的两个写入驱动器wd产生双向电流对mtj进行两种类型的存储:“0”和“1”。
13.进一步地,搜索时通过搜索电流源i
search
在存储行和参考行的bl上分别产生读取电压和参考电压,经每行的两个两级检测放大器sa得到匹配与否的信息。
14.进一步地,存“0”参考行和存“0”参考列中所有1t-1mtj单元存储数据“0”,存“1”参考行和存“1”参考列中所有1t-1mtj单元存储数据“1”,两参考行和两参考列的交叉点上为四个2t单元,用于确保在搜索期间参考行的bl上的参考电压与其他存储行的读取电压不同。
15.进一步地,两级检测放大器sa由第一级差分预放大器和第二级动态锁存电压比较器构成。
16.本发明还提供一种如上所述cam阵列的操作方法,该方法包括:
17.在cam阵列开始工作前,对每个单元进行数据存储,即将信息编码为二进制序列后,通过双向电流对1mtj进行写入;
18.对于每次搜索操作,采用两步搜索方案;
19.第一步:使能搜索序列中所有“0”位对应的wl和存“0”参考列的wl,其余列的wl置0,blb接地,施加搜索电流在存储行bl上产生读取电压v
search0
,存“0”参考行bl上产生参考电压v
ref0
,当时钟信号clk为高电平时,两级检测放大器sa0两输出端预充电至高电平;当clk变低时,若该行有存“1”搜“0”的不匹配情况,v
search0
大于v
ref0
,使得两级检测放大器sa0反向输出端ml0下拉到地;若该行匹配,ml0保持高电平;
20.第二步:使能搜索序列中所有“1”位对应的wl和存“1”参考列的wl,其余列的wl置0,blb接地,施加搜索电流在存储行bl上产生读取电压v
search1
,存“1”参考行bl上产生参考电压v
ref1
,当时钟信号clk为高电平时,两级检测放大器sa1两输出端预充电至高电平;当clk变低时,若该行有存“0”搜“1”的不匹配情况,v
search1
小于v
ref1
,使得两级检测放大器sa1正向输出端ml1下拉到地;若该行匹配,ml1保持高电平;
21.当进行长字节搜索而采用分段设计时,每段的ml经逻辑电路短接,得到第一步和/或第二步的搜索结果,在全局检测器中,第一步的搜索结果经d锁存器和第二步的搜索结果一起接入与门得到整行搜索结果;在第二步的搜索阶段观察与门的输出,若为高电平则该行匹配。
22.本发明的有益效果如下:
23.(1)对于1t-1mtj的cam设计,与默认的采用多个mtj进行互补存储和差分检测的cam单元不同,这种cam每个单元仅包含1个mtj和1个nmos,通过借助额外的参考行与参考
列,使用两级检测放大器获得整行的匹配结果,在保证搜索能效的同时降低了搜索时延;由于1t-1mtj单元内的器件数目较少,因此组成的cam阵列显著提高了面积效率;由于1t-1mtj是主流的mtj产品设计,本发明的cam降低了设计开销,可以带来生产成本的降低;此外,本设计还可以被其他nvm器件采用,具有通用性。
24.(2)对于1t-1mtj的cam设计,当进行长字节搜索时可以采用分段设计,每段都配备额外的参考行与参考列和两级检测放大器,在一次搜索过程中各段并行执行段内搜索,各段由两级检测放大器产生的输出经逻辑电路短接,并通过全局检测器获得搜索结果,这种并行的数据搜索设计方法在确保搜索可靠性的同时提高了可扩展性。
附图说明
25.图1是(a)1t-1mtj的cam单元结构图及其(b)操作原理示意图;
26.图2是(a)v
p
与v
ref
和(b)v
ap
与v
ref
的电压比较示意图以及(c)三者大小关系图;
27.图3是m*n大小的1t-1mtj cam阵列示意图;
28.图4是(a)两级检测放大器的符号、(b)第一级差分预放大器和(c)第二级动态锁存电压比较器示意图;
29.图5是1t-1mtj cam阵列的两步搜索方案的(a)第一步和(b)第二步的原理示意图;
30.图6是两步搜索操作下对存储内容“1010”搜索(a)“1010”和(b)“0110”的示意图;
31.图7是1t-1mtj cam阵列分段设计的(a)整体和(b)逻辑电路与全局检测器内部结构的示意图以及(c)时钟信号与锁存器使能信号示意图;
32.图8是1t-1mtj cam单元写入“0”和“1”的仿真波形图;
33.图9是1t-1mtj cam阵列采用两步搜索方案对存储内容“1010”、“1011”、“0010”和“0011”搜索“1010”的仿真波形图;
34.图10是1t-1mtj cam阵列中(a)不同传输门晶体管宽度下完成写入操作所需的最小写入电压(v
write
)与wl和en
tg
上的使能电压(v
en
)的关系图和(b)写入时间和每比特写入能耗与v
write
的关系图;
35.图11是1t-1mtj cam阵列在最坏情况下的搜索错误率(search-error-rate,ser)与(a)字长n、(b)tmr率、(c)电源电压v
dd
和(d)搜索电流的关系图;
36.图12是1t-1mtj cam阵列(a)完成搜索操作所需的最少准备时间与第一级差分预放大器的偏置电流的关系图以及搜索时延和每比特搜索能耗与(b)字长n、(c)电源电压v
dd
和(d)搜索电流的关系图。
具体实施方式
37.下面结合附图和具体实施例对本发明作进一步详细说明。
38.1、1t-1mtj单元结构和操作流程:
39.如图1(a)所示,1t-1mtj单元包含一个mtj和一个nmos,mtj器件两端分别与位线bl和nmos漏极相连,nmos栅极与字线wl相连,nmos源极与另一条位线blb相连。当mtj自由层和固定层的磁化方向相同时,mtj处于平行状态,对应的等效电阻r
p
较小,表示存“0”;当磁化方向相反时,mtj处于反平行状态,对应的等效电阻r
ap
较大,表示存“1”,mtj的开关比用tmr
表示表示1t-1mtj单元读写操作的偏置条件如图1(b)所示。在写入数据时,wl设置为v
en-write
以导通晶体管,在bl和blb上提供合适的偏置电压以产生大电流来控制mtj自由层的磁化方向,实现写入“1”或“0”。在读取数据时,如图2所示,wl设置为v
en-read
以导通晶体管,在单元上施加读取电流i
read
,使得bl节点上产生“0”(“1”)状态对应的读取电压v
p
(v
ap
),该电压通过两级检测放大器sa与参考电压v
ref
进行比较。需要注意的是,图2(a)和图2(b)中的r
ref
是偏置晶体管的等效电阻,如图2(c)所示,在bl上对应的参考电压v
ref
的大小介于v
p
和v
ap
之间以实现读取操作。
40.2、1t-1mtj的cam阵列整体结构和操作流程:
41.如图3所示,在1t-1mtj的cam阵列中,包括了存储内容的m*n cam核、额外的存“0”和存“1”参考行与存“0”和存“1”参考列、行译码器、列译码器、传输门en、写入驱动器wd、搜索电流源i
search
和两级检测放大器sa等。存“0”参考行与存“0”参考列的所有1t-1mtj单元都存储数据“0”,存“1”参考行与存“1”参考列的所有1t-1mtj单元都存储数据“1”,位于参考行和参考列交叉点上的四个单元为2t结构,其中一个nmos同样受字线wl控制,另一个nmos在栅极电位vb控制下,其等效电阻r
ref
介于r
p
和r
ap
之间,2t单元确保了在搜索期间参考行的bl上的参考电压与其他存储行的读取电压不同。存储行的bl接入两个两级检测放大器sa的正输入端,两个两级检测放大器sa分别为两级检测放大器sa0和两级检测放大器sa1,存“0”参考行的bl接入所有两级检测放大器sa0的负输入端,存“1”参考行的bl接入所有两级检测放大器sa1的负输入端。
42.图4显示了两级检测放大器sa的具体结构,由第一级差分预放大器和第二级动态锁存电压比较器组成。当时钟信号clk为高电平时,两级检测放大器sa的两个输出端均被预充电至高电平;当clk为低电平时,两级检测放大器sa两输入端上的电压差异被第二级动态锁存电压比较器中的交叉耦合反相器的正反馈放大,使两级检测放大器sa的输出端产生比较结果。如果两级检测放大器sa直接使用第二级动态锁存电压比较器,当clk跳变时,由于两级检测放大器sa两输入端(即存储行和参考行的bl)上的电容负载不平衡,两条bl上会存在不同程度的回馈噪声而导致差分误差,因此本发明引入了第一级差分预放大器来抑制回馈噪声,进而提高搜索可靠性。
43.整个1t-1mtj的cam阵列的运行过程如下:
44.(1)在由1t-1mtj cam阵列开始工作前,先对每个cam单元进行数据的存储:即将信息编码为二进制后,通过使能传输门en和wl,由每行的两个写入驱动器wd提供足够大的写入电流。写入操作是逐行进行的,分为写“0”和写“1”两步,在写入时还要关闭所有未选中的行的传输门en和未选中列的wl,以避免写入干扰。
45.(2)对于每次搜索操作,采用两步搜索方案:
46.(2.1)第一步:出所有存“1”搜“0”的不匹配情况。如图5(a)所示,使能搜索序列中所有“0”位对应的wl和存“0”参考列的wl,其余列的wl置0,blb接地,传输门关闭。假设某一行参与搜“0”的i个单元中有k个单元存“1”,实际存“0”的单元有i-k个,再加上存“0”参考列中的一个存“0”单元,这i+1个单元并联后的电阻为其中r
on
为各单元中受wl控制的nmos的导通电阻。则施加搜索电流i
search
在该行的bl上产生的读取电压v
search0
为:
[0047][0048]
同时在存“0”参考行上使能了i个存“0”单元和1个2t单元,并联后的电阻为则施加搜索电流i
search
在存“0”参考行的bl上产生的参考电压v
ref0
为:
[0049][0050]
当clk为高电平时(预充电阶段),两级检测放大器sa0两输出端预充电至高电平;当clk变低时(搜索阶段),若该行有存“1”搜“0”的不匹配情况,v
search0
大于v
ref0
,使得两级检测放大器sa0反向输出端ml0下拉到地;若该行匹配,v
search0
小于v
ref0
,ml0保持高电平。
[0051]
(2.2)第二步:出所有存“0”搜“1”的不匹配情况。如图5(b)所示,使能搜索序列中所有“1”位对应的wl和存“1”参考列的wl,其余列的wl置0,blb接地,传输门关闭。假设某一行参与搜“1”的j个单元中有l个单元存“0”,实际存“1”的单元有j-l个,再加上存“1”参考列中的一个存“1”单元,这j+1个单元并联后的电阻为则施加搜索电流i
search
在该行的bl上产生的读取电压v
search1
为:
[0052][0053]
同时在存“1”参考行上使能了j个存“0”单元和1个2t单元,并联后的电阻为则施加搜索电流i
search
在存“1”参考行的bl上产生的参考电压v
ref1
为:
[0054][0055]
当clk为高电平时(预充电阶段),两级检测放大器sa1两输出端预充电至高电平;当clk变低时(搜索阶段),若该行有存“0”搜“1”的不匹配情况,v
search1
小于v
ref1
,使得两级检测放大器sa0正向输出端ml1下拉到地;若该行匹配,v
search1
大于v
ref1
,ml1保持高电平。
[0056]
因此,综合上述两步搜索操作,只有当ml0在第一步时为高电平且ml1在第二步时为高电平的情况下,才表明存储内容和搜索序列相匹配,否则存在不匹配情况。图6所示为当存储内容为“1100”时的两步搜索方案示例。当搜索匹配的数据“1100”时,如图6(a)所示,第一步时ml0保持高电平,第二步时ml1保持高电平,因此搜索结果为匹配。当搜索不匹配的数据“0110”时,如图6(b)所示,第一步时ml1在搜索阶段下拉到底,第二步时ml1在搜索阶段下拉到底,因此搜索结果为不匹配。通过利用上述的两步搜索方案,在1t-1mtj cam阵列中实现了并行搜索功能。
[0057]
3、1t-1mtj cam阵列的分段设计方案:
[0058]
随着搜索字长的增大时,读取电压和参考电压之间的差异逐渐变小,这会影响搜
索可靠性。因此,本发明提出了分段设计方案以支持长字节搜索。如图7(a)所示,对cam阵列进行了分段,各段包含参考行、参考列和额两级检测放大器以同时生成每一段的搜索结果,再通过逻辑电路和全局检测器得到整行的搜索结果。图7(b)解释了逻辑电路和全局检测器的内部结构,在逻辑电路中每段的输出ml通过一个常规反相器和一个倾斜反相器短接到一起,倾斜反相器中nmos的宽长比β小于pmos的宽长比α,使得倾斜反相器具有强下拉作用,因此只有当各段的输出均为高电平时,各段逻辑电路短接后的输出才为高电平,从而构成了and逻辑。随后在全局检测器中,第一步的搜索结果经d锁存器和第二步的搜索结果一起接入与门得到整行搜索结果。图7(c)表明了时钟信号与d锁存器的使能信号之间的关系,最终在第二步的搜索阶段观察全局检测器输出,若为高电平则表明该行匹配;若为低电平则至少有一段发生了不匹配情况。
[0059]
本发明的功能和效果通过以下仿真实验进一步说明展示:
[0060]
1.仿真条件
[0061]
实验使用基于物理电路的兼容spectre和spice模型对mtj进行仿真,该模型实现了高效的设计与分析,基本晶体管使用45纳米的的预测技术模型(predictive technology model,ptm),电压设置为1.1v,仿真设置的mtj关键技术参数如下表所示。
[0062][0063]
在仿真时,对于1t-1mtj的cam设计采用spectre软件进行仿真,除了对本发明中的cam设计进行仿真,我们将我们的结果与非专利文献1(a.t.do,c.yin,k.s.yeo,and t.t.-h.kim,“design of a power-efficient cam using automated background checking scheme for small match line swing,”in 2013 proceedings of the esscirc(esscirc).ieee,2013,pp.209

212.),非专利文献2(s.matsunaga,a.katsumata,m.natsui,t.endoh,h.ohno,and t.hanyu,“design of a nine-transistor/two-magnetic-tunnel-junctioncell-based low-energy nonvolatile ternary content-addressable memory,”japanese journal of applied physics,vol.51,no.2s,p.02bm06,2012.),非专利文献3(b.song,t.na,j.p.kim,s.h.kang,and s.-o.jung,“a 10t-4mtj nonvolatile ternary cam cell for reliable search operation and a compact area,”ieee transactions on circuits and systems ii:express briefs,
vol.64,no.6,pp.700

704,2016.),非专利文献4(c.wang,d.zhang,l.zeng,e.deng,j.chen,and w.zhao,“a novel mtj-based non-volatile ternary content-addressable memory for high-speed,low-power,and high-reliable search operation,”ieee transactions on circuits and systems i:regular papers,vol.66,no.4,pp.1454

1464,2018.)和非专利文献5(c.wang,d.zhang,l.zeng,and w.zhao,“design of magnetic nonvolatile tcam with priority-decision in memory technology for high speed,low power,and high reliability,”ieee transactions on circuits and systems i:regular papers,vol.67,no.2,pp.464

474,2019.)中的5种cam设计做了比较。
[0064]
比较的指标主要包括晶体管数量、每个cam单元的面积、每次写入每个cam单元的写入能耗、搜索错误率、搜索时延和每次搜索每个cam单元的搜索能耗。对于本发明中的cam设计,测量搜索错误率和搜索延迟均采用的是最差情况下,即只有一个cam单元不匹配;把写入单位数据“0”的能耗和写入单位数据“1”的能耗的平均值作为写入能耗;测量搜索能耗时采用的是一行内有一半的cam单元匹配的平均情况。
[0065]
2.仿真结果
[0066]
1)1t-1mtj cam功能验证
[0067]
1.1)图8给出了1t-1mtj cam单元写入“0”和“1”的仿真波形。mtj单元初始为平行状态,使能en
tg
和wl以分别控制传输门en和1t-1mtj单元的晶体管导通,sl置零,设置两写入驱动器wd1和wd2分别为2v和接地以产生写入电流,使得mtj变为反平行状态。随后,设置写入驱动器wd1和wd2分别为接地和2v,得mtj从反平行状态变回平行状态,从而完成了写入功能的验证。
[0068]
1.2)图9给出了1t-1mtj cam阵列采用两步搜索方案对存储内容“1010”、“1011”、“0010”和“0011”搜索“1010”的仿真波形。使能sl产生搜索电流i
search
,en
tg
置零已关闭传输门。在第一步搜索时,使能存“0”参考列对应的wl[p]和搜索序列中所有“0”位对应的wl[1]与wl[3],在clk为低时,存储内容“1011”和“0011”的ml0变为低电平,表示有存“1”搜“0”的不匹配情况;第二步时,使能存“1”参考列对应的wl[ap]和搜索序列中所有“0”位对应的wl[2]与wl[4],在clk为低时,存储内容“0010”和“0011”的ml1变为低电平,表示有存“0”搜“1”的不匹配情况,综合以上两步,只有存储内容“1010”的ml0第一步保持高电平且ml1在第二步保持高电平,表明匹配,其余三行不匹配,从而完成了搜索功能的验证。
[0069]
2)写入速度和写入能耗分析
[0070]
传输门晶体管宽度、wl和en
tg
上的使能电压v
en
和写入驱动器wd上的写入电压v
write
设置会影响1t-1mtj cam阵列的写入效率,图10(a)显示了不同传输门晶体管宽度下完成写入操作所需的最小v
write
与wl和en
tg
上的v
en
之间的关系。可以看到随着v
en
的增加,所需的最小v
write
减小,同时较大的传输门晶体管宽度也能导致降低的最小v
write
。为了抑制面积开销,同时避免晶体管击穿,设定传输门中nmos(pmos)晶体管宽度为180nm(360nm),v
en
大小为1.3v,并在这种配置中探究了不同v
write
大小下的写入速度和写入能耗入图10(b)所示,随着v
write
的增大,写入时间变短。当v
write
为2v时,每次写入可以图8所示的20ns内完成,每次写入的平均能耗为1.26pj/bit。
[0071]
3)搜索可靠性分析
[0072]
在设置mtj的tmr率、氧化层厚度和自由层厚度的工艺变化率为3%,晶体管的宽度
和阈值电压的工艺变化率为10%的前提下,通过执行只有一个cam单元不匹配情况的蒙特卡洛仿真,得到搜索错误率(ser)以进行搜索可靠性分析。图11(a)表明随着搜索字长n的增大,ser也逐步增大,因此需要使用分段设计来确保搜索可靠性。另一方面,如图11(b)所示,mtj的tmr率增大会导致1t-1mtj cam单元不同状态的读取电压差距增大,从而降低了ser。同时,当电源电压增大时,sa的第二级动态锁存电压比较器中两个放电支路之间的电流差也会增大,导致ser的降低。图11(d)表明搜索电流i
search
过小时,sa难以准确比较电压差,从而引入额外的ser,但当i
search
大于25μa时,对ser的影响可忽略。
[0073]
4)搜索时延和搜索能耗分析
[0074]
在确认了1t-1mtj cam设计的搜索可靠性后,还需要对搜索时延和搜索能耗进行分析。在预充电阶段(clk为高电平)时,不仅sa的输出要预充电至高电平,第一级差分预放大器还需要为第二级的输入准备两个参与比较的电压信号,使sa能够在clk变低时产生比较结果。因此当增大偏置电流来提高第一级带宽时,如图12(a)所示,预充电阶段所需的时间会减少。此外,图12(b)表明搜索时延随着字长n的增加而增大,这是bl上的寄生电容增加而导致的。与此同时,单位搜索能耗呈现相反的趋势,这种现象有两个原因:(1)bl上的电压随着字长n的增大而降低,(2)搜索时间没有随字长n的增加而大幅增长。图12(c)表明较高的电源电压能降低搜索时延,从而进一步提高搜索能效。图12(d)表明随着i
search
的增加,读取电压和参考电压之间的电压差增大,从而降低了搜索时延,但同时也会降低搜索能效。
[0075]
5)性能比较
[0076]
下表给出了本发明中基于单个mtj的cam设计与其他cam设计各项指标的比较。
[0077][0078][0079]
上表总结了1t-1mtj cam和其他cam的技术指标,其中1t-1mtj cam的分段字长设定为每段16bit。由上表可以看出,本发明的1t-1mtj cam的单元面积是基于传统cmos技术的10t单元的1.82%,而与其他基于mtj的cam相比时这一优势进一步被放大。尽管1t-1mtj cam需要参考行、参考列和sa以完成搜索操作,但在进行长字节搜索时这些额外的面积开销
可以忽略不计,且1t-1mtj cam的搜索时延只有10t cam的16%。虽然15t-4mtj/20t-6mtj cam的搜索能耗要低于1t-1mtj cam,但它们的面积开销要大得多。此外,当增大分段字长时,1t-1mtj cam的搜索能耗将进一步降低。同时,由于1t-1mtj cam的写入路径中的mtj和晶体管更少,因此相比于10t-4mtj/15t-4mtj/20t-6mtj cam在写入能效上提高了4.60倍/1.26倍/1.89倍,虽然9t-2mtj cam的写入能耗更低,但1t-1mtj cam的搜索错误率只有9t-2mtj cam的28%。
[0080]
以上结果可以看出,本发明不仅具有cmos设计难以实现的非易失性,以及针对工艺变化的鲁棒性,同时具有设计紧凑、能耗较小、延迟较低的特点。此外,上述结果还验证了采用两步搜索方案和分段设计的1t-1mtj cam阵列在数据密集型搜索应用中的有效性。
[0081]
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

技术特征:


1.一种基于单个mtj的超紧凑cam阵列,其特征在于,cam阵列包括存储内容的m*n cam核、额外的存“0”和存“1”参考行与存“0”和存“1”参考列、行译码器、列译码器、传输门en、写入驱动器wd、搜索电流源i
search
和两级检测放大器。2.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,cam核包括m*n个cam单元,每个cam单元由1mtj和1nmos构成;cam单元中mtj两端分别与位线bl和nmos漏极相连,nmos栅极与字线wl相连,nmos源极与另一条位线blb相连;cam阵列中每行cam单元位线相连,每列共享同一条纵向的wl。3.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,行译码器控制传输门en和搜索电流源i
search
,列译码器控制wl,写入驱动器wd分为写入驱动器wd1和写入驱动器wd2,写入驱动器wd1通过传输门en连接bl,写入驱动器wd2连接blb,cam核中的每个存储行的bl接两个两级检测放大器sa的正输入端,两级检测放大器sa分为两级检测放大器sa0和两级检测放大器sa1,存“0”参考行的bl接入所有两级检测放大器sa0的负输入端,存“1”参考行的bl接入所有两级检测放大器sa1的负输入端。4.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,通过每行的两个写入驱动器wd产生双向电流对mtj进行两种类型的存储:“0”和“1”。5.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,搜索时通过搜索电流源i
search
在存储行和参考行的bl上分别产生读取电压和参考电压,经每行的两个两级检测放大器sa得到匹配与否的信息。6.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,存“0”参考行和存“0”参考列中所有1t-1mtj单元存储数据“0”,存“1”参考行和存“1”参考列中所有1t-1mtj单元存储数据“1”,两参考行和两参考列的交叉点上为四个2t单元,用于确保在搜索期间参考行的bl上的参考电压与其他存储行的读取电压不同。7.根据权利要求1所述的一种基于单个mtj的超紧凑cam阵列,其特征在于,两级检测放大器sa由第一级差分预放大器和第二级动态锁存电压比较器构成。8.一种如权利要求1-7中任一项所述cam阵列的操作方法,其特征在于,该方法包括:在cam阵列开始工作前,对每个单元进行数据存储,即将信息编码为二进制序列后,通过双向电流对1mtj进行写入;对于每次搜索操作,采用两步搜索方案;第一步:使能搜索序列中所有“0”位对应的wl和存“0”参考列的wl,其余列的wl置0,blb接地,施加搜索电流在存储行bl上产生读取电压v
search0
,存“0”参考行bl上产生参考电压v
ref0
,当时钟信号clk为高电平时,两级检测放大器sa0两输出端预充电至高电平;当clk变低时,若该行有存“1”搜“0”的不匹配情况,v
search0
大于v
ref0
,使得两级检测放大器sa0反向输出端ml0下拉到地;若该行匹配,ml0保持高电平;第二步:使能搜索序列中所有“1”位对应的wl和存“1”参考列的wl,其余列的wl置0,blb接地,施加搜索电流在存储行bl上产生读取电压v
search1
,存“1”参考行bl上产生参考电压v
ref1
,当时钟信号clk为高电平时,两级检测放大器sa1两输出端预充电至高电平;当clk变低时,若该行有存“0”搜“1”的不匹配情况,v
search1
小于v
ref1
,使得两级检测放大器sa1正向输出端ml1下拉到地;若该行匹配,ml1保持高电平;
当进行长字节搜索而采用分段设计时,每段的ml经逻辑电路短接,得到第一步和/或第二步的搜索结果,在全局检测器中,第一步的搜索结果经d锁存器和第二步的搜索结果一起接入与门得到整行搜索结果;在第二步的搜索阶段观察与门的输出,若为高电平则该行匹配。

技术总结


本发明公开了一种基于单个MTJ的超紧凑CAM阵列及其操作方法,CAM阵列包括存储内容的M*N CAM核、额外的存“0”和存“1”参考行与存“0”和存“1”参考列、行译码器、列译码器、传输门EN、写入驱动器WD、搜索电流源I


技术研发人员:

尹勋钊 杨泽禹 卓成

受保护的技术使用者:

浙江大学

技术研发日:

2022.05.17

技术公布日:

2022/9/8

本文发布于:2024-09-23 16:26:10,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/22948.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:放大器   电压   两级   单元
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议