3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx

上传人:b****2 文档编号:1735740 上传时间:2022-10-23 格式:DOCX 页数:8 大小:25.88KB
下载 相关 举报
3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx_第1页
第1页 / 共8页
3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx_第2页
第2页 / 共8页
3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx_第3页
第3页 / 共8页
3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx_第4页
第4页 / 共8页
3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx

《3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx》由会员分享,可在线阅读,更多相关《3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx(8页珍藏版)》请在冰豆网上搜索。

3D XPoint的原理解析 NAND和DRAM为什么拼不过它.docx

3DXPoint的原理解析NAND和DRAM为什么拼不过它

3DXPoint的原理解析NAND和DRAM为什么拼不过它

回顾存储的发展历程。

3DXpoint是自NANDFlash推出以来,最具突破性的一项存储技术。

由于具备以下四点优势,3DXpoint被看做是存储产业的一个颠覆者:

(1)比NANDFlash快1000倍;

(2)成本只有DRAM的一半;

(3)使用寿命是NAND的1000倍;

(4)密度是传统存储的10倍;

而得益于这些优势,3DXpoint能被广泛应用在游戏、媒体制作、基因组测序、金融服务交易和个体化治疗等领域。

以上只是3DXpoint的一些应用示例。

但从以上介绍,我们可以看出,3DXpoint未来的应用非常有潜力。

目前存储器存在的一些问题

存储器的性能是PC设备上目前的短板。

这一点从很多用户由HDD更换为SSD后,感觉像是换了一个电脑就能体现出来。

HDD目前的传输速度往往在200MB/s以内,寻道时间约为10ms级;SSD传输速度为数百MB/s到几GB/s,寻道时间约为0.1ms以内;更快的内存带宽为几十GB/s,延迟时间低至ns级。

再向上还有更高速的缓存、寄存器等设备。

DRAM:

易失性难以解决抛开和处理器紧密相关的高速缓存和寄存器不说,先来看内存和外部存储这两个级别。

目前我们使用的内存主要是DRAM。

DRAM的核心问题是易失性,其它方面的表现优秀比如在性能上DRAM的延迟很低(纳秒级别)、带宽较为充裕;寿命方面由于原理所致,DRAM寿命很长。

不过,DRAM的存储需要不停供电,断电就会丢失存储的数据。

从DRAM被发明出来到现在,DRAM只是不断地在预取值和总线上进行调整,核心的存储架构其实变化不大。

NAND:

寿命、延迟不尽如人意再来看目前广泛应用于存储设备的NAND闪存。

NAND闪存分为SLC、MLC、TLC等多种分支颗粒。

从寿命上说,NAND是有平均读写次数的寿命的,即使是性能最好的SLCNAND颗粒,其寿命也比DRAM小得多。

虽然可以通过设置缓冲空间、平衡磨损算法、提前设置寿命预警来确保NAND不会在使用时掉链子、引发数据丢失,但寿命依旧是NAND在使用中不可回避的问题。

此外,受制于存储原理,NAND延迟较高,尤其是写入时存在充电时间,怎么也快不起来,目前只能被用作外部存储设备。

但在今天,由于之前有性能更低的HDD机械硬盘的存在,基于NAND颗粒的SSD仍旧让用户感受到了性能的巨大提升。

▲随着制程提升,NAND的容量正在迅速提升,但寿命和延迟等问题,并没有革命性的变化。

▲NAND工作原理图,绝缘浮置栅极是其存储数据的核心。

性能鸿沟:

PC架构的问题所谓性能鸿沟,就是上下两级系统存在较大的性能差距,使得级次缓存的设计方案很难体现出最佳的效果堪称天堑;在NAND和DRAM上,这个鸿沟相比DRAM和HDD之间的性能鸿沟略有缩小,但是本质上的变化并不明显。

举例来说,NAND设备目前的最快速度差不多在2GB/s~3GB/s,处理器的内存带宽已经突破50GB/s大关,两者间差了一个数量级。

延迟上,DRAM只有十几纳秒,相比NAND的约一百微秒,快了好多个数量级。

实际上,内存和外部存储之间的性能差距过大,已经成为影响用户体验继续提升的瓶颈。

所以研究机构一直在提出很多解决方案,试图解决这个鸿沟,比如相变存储器、赛道存储器、全新的高速磁存储设备等。

但这些技术不是还深藏在实验室中,就是刚在PPT上公诸于众。

到了去年,作为存储业界的领军企业之一的英特尔和美光,终于将其中一种全新的存储技术推向了前台,这种技术同时拥有高性能和非易失性两种特性,这就是今天的主角:

3DXPoint!

▲内存的基本技术结构也已经很久没有革命性的变化。

目前最快的DDR4内存,仍旧只能充当暂存器。

3DXPoint的原理目前英特尔和美光对3DXPoint应用的物理特性闭口不谈,资料更是匮乏。

一些不具名的介绍资料显示,3DXPoint使用的标记数据状态的物理值不是业内常用的电压、也不是电流,更不是目前还在实验室内的磁极,而是电阻。

3DXPoint的工作原理与NAND存在着根本性的不同。

NAND通过绝缘浮置栅极捕获不同数量的电子以实现bit值定义,而3DXPoint则是一项以电阻为基础的存储技术成果,其通过改变单元电阻水平来区分0与1。

3DXPoint的结构非常简单。

它由选择器与内存单元共同构成,二者则存在于字线与位线之间(因此才会以交叉点来定名)。

在字线与位线之间提供特定电压会激活单一选择器,并使得存储单元进行写入(即内存单元材料发生大量属性变化)或者读取(允许检查该存储单元处于低电阻还是高电阻状态)。

猜测,写入操作要求具备较读取更高的电压,因为如果实际情况相反,那么3DXPoint就会面临着上在读取存储单元时触发大量材料变化(即写入操作)的风险。

英特尔与美光双方并没有透露内部读取/写入的具体电压数值,不过根据得到的消息,其电压值应该低于NAND后者需要利用约20伏电压来编写/擦除以创建出足够通过绝缘体的电场电子隧道。

而这种较低的电压要求自然也能够使得3DXPoint拥有比DRAM以及NAND更低的运行功耗。

顾名思义,3DXPoint的存储单元可以以3D方式进行堆叠,从而进一步提升存储密度。

目前第一代晶粒样品使用的是双层设计方案。

双层听起来实在有些寒碜,特别是考虑到目前的3DNAND芯片已经拥有32层,且逐步开始向48层进军。

不过3DXPoint的构建方式完全不同,直接进行层数比较显然并不科学。

3DNAND在制造过程中首先加入沉积导电层,而后再在每一层之上添加绝缘材料。

只有在全部层沉积完毕之后,整个单元塔才能以光刻方式进行定义,而后再在高纵横比蚀刻孔内填充通孔材料以实现各层内存储单元的彼此互通。

相比之下,3DXPoint的每一层都需要进行光刻与蚀刻(即在各层之上重复同样的流程),接下来再对下一层进行沉积。

这种方式牺牲掉了3DNAND所带来的一部分经济优势(即光刻步骤较少),但3DXPoint却同时带来了远高于纯光刻技术所能实现的出色存储密度。

英特尔与美光公司指出,未来工艺尺寸伸缩将同时出现在光刻与层3D堆叠这两个方面。

横向与纵向的规模可调整能力将成为关键,保证其未来仍然具有进一步可延展性,这是因为基于氩氟的传统多模式浸没式光刻技术在10纳米级别上已经失去了经济性优势,而目前尚未出现任何明确的继任技术可供选择。

当下业界普遍将希望寄托在EUV身上,而英特尔与美光则确认称,3DXPoint将(不出所料)兼容EUV光刻,而且存储单元设计尺寸可以最大缩水至个位数纳米级别同时不会对使用帮助/可靠性造成显著影响(事实上,随着物理尺寸的下降,其在某些方面反而有所改善)。

不过在未来几年内,恐怕仍然无法利用EUV实现批量化生产。

首批EUV生产的主要重心也将放在逻辑层面,这一方面是因为其设备成本实在太过高昂,另一方面也是因为逻辑无法像记忆体般进行垂直绽放、因此可能导致散热问题。

从理论层面讲,3DXPoint也支持多层单元设计,但英特尔与美光双方目前并不打算追求这条路线。

虽然在实验室当中实现多个电阻层级并不是件太难的事,但其实际难度还是要远远高于保证生产的数万片晶圆当中、每个晶粒都具备必要的特性以实现双层单元操作。

相比之下,这一思路很像是二十年前每单元2bit机制刚刚出现在NAND领域的状况,因此目前英特尔与美光暂时会将注意力集中在光刻技术及3D伸缩方面,从而提高存储密度及成本效益。

不过相信在未来,多层单元设计也将逐步出现在3DXPoint当中。

而与NAND在架构上的最大区别在于,3DXPoint实际上是以bit层级进行访问。

在NAND当中,整页(在最新节点中为16KB)必须一次性进行编程才能存储1bit数据。

而更糟糕的是,我们必须要在块层级(至少包含200个页)执行擦除操作。

如此一来,NAND就需要使用更为复杂的垃圾回收算法,从而更为高效地实现性能水平。

然而无论算法多么精巧,处于稳定状态的驱动器在性能上仍然会因此受到影响,因为必须采用固定的读取-修改-写入周期才能对块中的单一页进行擦除。

而作为以bit为基础访问单位的3DXPoint来说,其并不需要配合任何垃圾回收机制即可高效运作,这不仅极大简化了控制器与固件结构,更重要的是还将实现更高性能水平与更低功耗需求。

在最终产品特别是面向存储需求的产品当中,3DXPoint仍然会保留一部分逻辑页以降低追踪操作带来的负担,这是因为在bit层级上进行数据追踪将需要大量高速缓存作为配合。

然而,英特尔与美光公司已经在声明当中就此作出了明确回应,表示日前发布的公告仅仅属于一项技术性结论。

两家公司拒绝就基于这项新技术的未来面世产品发表任何评论。

换句话来说,这两家企业将各自打造自己的产品方案,并预计将在明年正式将其交付至广大用户手中。

内存单元:

3DXPoint背后的秘密从子阵级角度出发,3DXPoint的运作方式还算比较容易理解,但探究大量属性变化过程中内存单元之内的实际动态则是个非常复杂的问题。

能想到的就是需要通过两种方式实现这一目标以物理方式利用外部刺激调整存储单元属性,从而实现晶体结构变更;或者是以化学方式对单元内的材料属性进行调整。

在发布会之后的对话环节当中,我们得到的消息3DXPoint所使用的并非相变材料,这就消除了一种潜在可能性即3DXPoint利用相变材料通过单元晶体结构变化来实现电压切换。

英特尔与美光选择的方式也极具现实意义,因为引导稳定晶体结构发生变化很可能意味着对不同原子结构长度进行频繁调节,而这有可能影响到存储单元之间连接材料,最终导致使用寿命降低。

考虑到这一点,惟一可行的就只有化学调整方式了,更具体地讲对存储单元中的bit电子结构进行调整,从而使其出现电阻差异。

咱们不妨在这里就其实现原理展开一番探讨。

自旋交叉

根据以往的经验,自然而然地想到了自旋电子与自旋交叉化合物的应用。

简而言之,这意味着此类材料拥有两种不同电阻级别,具体取决于结构内电子层级中的电子状态。

而外部刺激(包括温度、电压以及磁场的变化)则用于实现两种电子状态之间的切换。

接下来的内容可能有些艰深,我们最好是从单个过渡金属原子出发进行考量。

根据该金属原子周边的局部排列,金属的键合轨道部分会充斥着大量电子:

这里是一个处于2+价环境下的铁化合物分子,其主要成键轨道为t2g(低能量)与eg(高能量)。

根据Pauli提出的不相容原理,6个电子配对构成三条轨道,而且每个电子对中的一个电子自旋加快、另一个则自旋减慢。

这就是我们所说的基态,也被称为低自旋状态。

其整体自旋值S等于0,因为一个电子的自旋值1/2会被另一个电子的自旋值-1/2所抵消。

此原子的另一种模式则为高自旋态,其中2个电子转移到了较高的键合轨道当中,而总体自旋值S=2:

由于外部刺激的存在,其中将有2个电子翻转自旋并占据高能量eg轨道,而这也就是所谓亚稳定状态。

根据周边原子的实际排列,这种状态实际上也可以表现得非常稳定,但却与原始基态在性质上存在很大的不同。

不过将这种原理推广到大量材料之上,从原则上讲非常困难。

简要概括,各类研究论文指出自旋交叉化合物可以直接进行对接并实现电阻变化,但与这类操作相关的大部分论文都属于化工学科,探讨的也主要为碳纳米管、石墨烯层或者有机链等对象。

在这篇论文当中,低自旋/高自旋状态将提供或不提供两种极性之间的导电率,具体取决于金属原子的实际性质、电阻、特性以及/或者平台稳定性水平。

英特尔公司需要开发出这样一种材料,其能够通过电压变化而非外部刺激实现编程,而这显然将复杂性提升到了新的高度。

一般来讲,自旋交叉化合物具备特定的温度窗口,在不同温度下其电子可以在高状态与低状态之间往来切换,这意味着温度因素对其稳定性存在直接影响。

从这一点出发,材料的可延展性与基础特性成为实现大规模自旋交叉的主要障碍,特别是在同时采用碳纳米管的情况之

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1