Intel CPU指令集以及運算加速

發(fā)布時間：2020-07-05 12:05:16 來源：網(wǎng)絡(luò) 閱讀：967 作者：fengyuzaitu 欄目：軟件技術(shù)

前沿

???????? ? 人工智能運算分析依賴CPU和顯卡的運算能力。查詢CPU支持的指令集，當(dāng)前加速會用到AVX2指令集,如何查詢是否支持

工具下載

https://www.cpuid.com/softwares/cpu-z.html

AMD Ryzen Threadripper 3000 preliminary support
Intel Ice-Lake preliminary support
NVIDIA RTX 2070 and 2080 Super

下載ZIP.CHINESE
https://www.cpuid.com/downloads/cpu-z/cpu-z_1.90-cn.zip

Linux的查詢指令cat /proc/cpuinfo?

知識儲備

AVX2指令集：AVX指令集的加強版
　　對于指令集和AVX指令集不了解的朋友可以先看看《AVX是什么？AVX指令集技術(shù)與應(yīng)用解析》。當(dāng)年AVX在SSE4指令集的基礎(chǔ)上加入了256位矢量寬度、增強的數(shù)據(jù)排序、3/4個操作數(shù)、不對齊內(nèi)存存取以及VEX編碼方式，最直接的收益就是浮點性能最大提升了2倍。

AVX2的新內(nèi)容
　　在2011年發(fā)布的AVX2則在此基礎(chǔ)上加入了以下新內(nèi)容：
　　-整數(shù)SIMD指令擴展至256位
　　-2個新FMA（融合乘加，即±(a×b)±c）單元及浮點FMA指令
　　-離散數(shù)據(jù)加載指令“gather”、新的位移和廣播指令
理論性能：整數(shù)和浮點性能翻倍
　　其中最為重要的是對256位的整數(shù)SIMD的支持，并新增60條256位浮點SIMD指令，完善從AVX開始的256位擴展，理論上可再次提升整數(shù)和浮點運算速度。

新FMA單元和指令帶來更強的性能
　　 FMA則關(guān)系到浮點運算能力。Haswell架構(gòu)中擁有2個新的FMA單元（Intel的FMA3指令），每個FMA單元支持8個單精度或4個雙精度浮點數(shù)，每周期單/雙精度FLOPs都要比AVX高1倍。
　　 FMA擁有20種指令形式，與3種操作數(shù)次序組合，形成60種新指令，為選擇內(nèi)存操作數(shù)或目的操作數(shù)提供了極大的靈活性。另外融合乘加還會自動選擇多項式的計算過程，降低了延遲。

向AI問一下細節(jié)

Intel CPU指令集以及運算加速

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽