Tachyum公布Prodigy通用128核CPU规格:高达5.7GHz

2022-06-14 15:29  |  来源:IT之家  |  编辑:夏冰  |  阅读量:14620  |  

感谢本站网友OC_Formula为线索发货!

据tomshardware报道,当Tachy Yum在Hot Chips 18上推出其Prodigy通用处理器的概念时,其芯片设计允许任何代码使用动态二进制转换器运行,这引起了轰动在执行本机代码和翻译代码时,它表现出了高性能Tachyum花了一些时间设计实际硬件,并接受评估套件的预订,该公司还透露了Prodigy的具体规格它们看起来确实令人印象深刻,但每个芯片950瓦的热设计功率也令人害怕

每个Tachyum Prodigy处理器拥有多达128个专有内核,与16个DDR5内存通道配合工作,支持高达7200 MT/s的数据传输速率和64个PCIe 5.0通道此外,该芯片总共支持高达8TB的DDR5内存,与其他厂商即将推出的服务器CPU保持一致时钟频率方面,Tachyum的Prodigy设计运行频率高达5.7 GHz,是TSMC优化N5P工艺技术的产物

在性能方面,Tachyum预计其旗舰Prodigy T16128—AIX处理器可为HPC提供高达90 FP64 TFLOPS和高达12个AI PetaFLOPS用于推理和训练,根据公布的规格,功耗高达950W同时,Tachyum的Prodigy处理器可以在2路和4路配置中工作相比之下,AMD的Instinct MI250X在560W左右的HPC中,峰值吞吐量为96 FP64 TFLOPS相比之下,Nvidia H100 SXM5在700W时可以为AI提供高达20 INT8/FP8 PetaOPS/PetaFLOPS可是,没有一个计算GPU可以用于通用工作负载这就变得有趣了

Tachyum prodigy是一款通用同构处理器,最多可容纳128个专有64位VLIW内核,每个内核都有两个1024位矢量单元和一个4096位矩阵单元此外,每个内核都有一个64KB指令缓存,一个64KB数据缓存和一个1MB L2缓存,其他内核未使用的L2缓存可以用作L3缓存

Tachyum首席执行官兼联合创始人拉多斯拉夫·丹尼拉克在与Golem.de的对话中表示,Tachyum的VLIW内核是有序内核,但当编译器制造商进行适当优化时,它们可以支持4路无序他还再次强调,Prodigy指令集架构通过使用所谓的poison bits软件,可以实现非常高的指令级并行性

据该公司称,这些内核运行为Prodigy和x86,Arm和RISC—V二进制文件编写和显式优化的本机代码,并由软件模拟,不会降低性能历史上所有让VLIW处理器执行x86代码的尝试都失败了,主要是因为特定的CPU架构和模拟效率低Tachyum的负责人承认Qemu二进制翻译降低了30%到40%的性能,但希望真实世界的性能仍然足够高,具有竞争力同时,一些程序已经得到了原生支持

我们原生支持GCC和Linux,FreeBSD现在也可以在Prodigy上运行,Danilak说Apache,MongoDB或者Python已经在原生运行,Pytorch,Tensorflow框架也有

Tachyum强调Prodigy不是加速器,而是真正的CPU,将与AMD,Intel等公司竞争为了确保处理器能够在通用和人工智能工作负载中提供具有竞争力的性能,该公司自2018年首次推出以来,对其设计实施进行了大量修改

我们是CPU替代品,而不是AI加速器公司,我们的目标是云/超大规模和电信公司,丹尼拉克说伴随着时间的推移,我们计划赢得一些超级计算机客户,因此我们将vector/MAC单元的宽度从512位增加到1024位

事实上,Tachyum Prodigy承诺的特殊优势是它可以执行不同类型的代码假设它可以执行通用工作负载,它可能会为亚马逊AWS,微软Azure等提供一些额外的灵活性,因为如果需要,他们可以将相同的机器用于AI,HPC和通用实例当然,它需要来自不同方面的一些实际的软件工作,这可能是可行的,至少在理论上是可行的

需要指出的是,Tachyum仍然没有任何神童芯片所以所有的性能预测都是仿真的产物,公司现在唯一拥有的就是其处理器的FPGA原型

与此同时,Tachyum最近开始接受Tachyum的Prodigy评估平台的预订,该平台将使用一些Prodigy芯片客户必须在2022年7月31日前下单,实际硬件交付时间约为收到订单后的六至九个月

如果一切按计划进行,Tachyum预计在8月中旬推出第一个Prodigy芯片之后,该公司预计将在12月左右获得首批芯片样品如果芯片工作正常,该公司计划开始提供样品通常,芯片从晶圆厂返回需要大约一年的时间尽管如此,Tachyum仍然希望其第一款处理器能够按计划工作,并能在2023年上半年开始实际量产

在未来,Danilak设想Prodigy 2处理器将使用TSMC的N3节点制造,这将提供两倍的性能和相同功率的PCIe Gen6支持。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

上一篇: 新疆伊尔克什坦口岸前5月进出口货值逾115亿元同比增长超三倍 下一篇:返回列表
ad4
ad3