張量處理器

簡介

張量處理器（英語：tensor processing unit，縮寫：TPU）是Google為機器學習定製的專用晶片（ASIC），專為Google的深度學習框架TensorFlow而設計。

與圖形處理器（GPU）相比，TPU採用低精度（8位）計算，以降低每步操作使用的電晶體數量。降低精度對於深度學習的準確度影響很小，但卻可以大幅降低功耗、加快運算速度。同時，TPU使用了脈動陣列的設計，用來最佳化矩陣乘法與卷積運算，減少I/O操作。此外，TPU還採用了更大的片上記憶體，以此減少對DRAM的訪問，從而更大程度地提升性能。

Google在2016年的Google I/O年會上首次公布了TPU。不過在此之前TPU已在Google內部的一些項目中使用了一年多，如Google街景服務、RankBrain以及其旗下DeepMind公司的圍棋軟體AlphaGo等都用到了TPU。而在2017年的Google I/O年會上，Google又公布了第二代TPU，並將其部署在Google雲平台之上。第二代TPU的浮點運算能力高達每秒180萬億次。

世代

第一代

第一代的TPU使用8-bit矩陣乘法引擎，透過PCIe3.0與CISC指令操作。晶片為28nm製程，die≤ 331 mm，700 Mhz，功耗在28至40瓦。

第二代

第二代於2017年五月發表。

第三代

第三代於2018年五月發表。

專用積體電路

專用積體電路（英語：Application-specific integrated circuit，縮寫：ASIC），是指依產品需求不同而客制化的特殊規格積體電路；相反地，非客制化的是套用特定標準產品（Application-specific standard product）積體電路。

專用積體電路是由特定使用者要求和特定電子系統的需要而設計、製造。由於單個專用積體電路晶片的生產成本很高，如果出貨量較小，則採用專用積體電路在經濟上不太實惠。這種情況可以使用可程式邏輯器件（如現場可程式邏輯門陣列）來作為目標硬體實現積體電路設計。此外，可程式邏輯器件具有用戶可程式特性，因此適合於大規模晶片量產之前的原型機，來進行調試等工作。但是可程式邏輯器件在面積、速度方面的最佳化程度不如全定製的積體電路。

一般專用積體電路的ROM和RAM都在出廠前經過掩膜（MASK），如常用的紅外線遙控器發射晶片就是這種晶片。

專用積體電路的特點是面向特定用戶的需求，品種多、批量少，要求設計和生產周期短，它作為積體電路技術與特定用戶的整機或系統技術緊密結合的產物，與通用積體電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優點。

張量處理器

基本介紹

簡介

世代

第一代

第二代

第三代

專用積體電路

相關詞條

熱門詞條