کارت های گرافیک NVIDIA از نظر معماری
کارتهای گرافیک NVIDIA معماریهای مختلفی دارند. هر معماری با توجه به فناوری ساخت، تعداد هستهها، تعداد ترانزیستورها و نوع حافظهای که پشتیبانی میکند، شناخته میشود.
در این مقاله قصد داریم تا با انواع معماری کارت های گرافیک NVIDIA آشنا شویم. با چیپست همراه باشید.

ما در این مقاله، کارت های گرافیک انویدیا را از نظر معماری به 6 بخش تقسیم کرده ایم.
با توجه به پیشرفت تکنولوژی و افزایش نیاز کاربران و تفکیک هر کارت گرافیک برای کارهای معین، معماری GPUها نیز در سال های مختلف تغییر کردند.
Pascal: اولین نسل مدرن با عملکرد بالا در زمان خود اما بدون Tensor و RT Cores که در سال 2016 رونمایی شد.
Volta: معماری Volta که در سال ۲۰۱۷ معرفی شد، اولین معماری NVIDIA با هستههای Tensor بود. این معماری برای کاربردهایی مانند هوش مصنوعی (AI) و پردازشهای سنگین (HPC) بهینهسازی شده است.
Turing: معماری Turing در سال ۲۰۱۸ معرفی شد و اولین معماری NVIDIA بود که از فناوری Ray Tracing پشتیبانی میکرد. این معماری برای گیمینگ و هوش مصنوعی بهطور ویژه بهبود یافته است.
Ampere: جهش بزرگ در عملکرد با افزایش تعداد هسته ها و حافظه GDDR6X/HBM2e که در سال 2020 رونمایی شد.
Ada Lovelace: بهینه سازی شده برای گیمینگ، DLSS 3 و کارایی مصرفی بهتر که در سال 2022 رونمایی شد.
Hopper: در سال ۲۰۲۲ معرفی شد و بهطور خاص برای مراکز داده و پردازشهای سنگین (HPC) طراحی شده است. این معماری تمرکز ویژهای بر هوش مصنوعی و محاسبات عددی با دقت FP8 دارد.
پیشتر با انواع کارتهای گرافیک NVIDIA و کاربردهای آنها آشنا شدهاید.
Hopper (2022) | Ada Lovelace (2022) | Ampere (2020) | Turing (2018) | Volta (2017) | Pascal (2016) | ویژگی ها |
4nm (TSMC) | 4nm (TSMC) | 8nm (Samsung) | 12nm (TSMC) | 12nm (TSMC) | 16nm (TSMC) | فناوری ساخت |
GH100 | AD102 | GA100 | TU102 | GV100 | GP100 | بزرگترین GPU |
80B+ (GH100) | 76.38 (AD102) | 54.28 (GA100) | 18.68 (TU102) | 21.18 (GV100) | 15.38 (GP100) | تعداد ترانزیستور |
HBM3 | GDDR6X | GDDR6, GDDR6X, HBM2e | GDDR6, GDDR6X | HBM2 | GDDR5, HBM2 | حافظه پشتیبانی شده |
16896 (GH100) | 18432 (AD102) | 6912 (GA100) | 4608 (TU102) | 5120 (GV100) | 3840 (GP100) | CUDA Cores |
پشتیبانی از FP8 | دارد (نسل 4) | دارد (نسل 3) | دارد (نسل 2) | دارد (نسل 1) | ندارد | Tensor Cores |
ندارد | دارد (نسل 3) | دارد (نسل 2) | دارد (نسل 1) | ندارد | ندارد | Ray Tracing Cores |
دارد (نسل 4) | دارد (نسل 4) | دارد (نسل 3) | دارد (نسل 2) | دارد (نسل 1) | ندارد | NVLink |
~60 TFLOPS | ~90 TFLOPS | ~19.5 TFLOPS | ~14 TFLOPS | ~15 TFLOPS | ~10 TFLOPS | توان پردازشی FP32 |
HPC, AI، محاسبات علمی | گیمینگ، AI | HPC, AI | گیمینگ | AI, HPC | گیمینگ، HPC | کاربرد اصلی |