Aufbau moderner GPUs

Teaser

Aufbau moderner GPUs

Ein Grafikprozessor (englisch graphics processing unit – GPU) ist ein Prozessor, der für die Berechnungen von Grafiken spezialisiert und optimiert ist. Das Design moderner GPUs legt seinen Fokus auf Datendurchsatz. Sie führen auf mehreren Daten parallel Rechenoperationen aus. Um mit diesen Daten effizient rechnen zu können, werden in Hard- und Software Kernkonzepte genutzt, wie sie bei einem CPU nicht zu finden sind.

Inhalt

Grundlagen

  • Array- und Vektorprozessoren
  • Memory Banking und Vektor-Speichersysteme
  • Vektor Chaining
  • Parallelismus auf Vektor-Befehlsebene

Design und Architektur

  • Unterschiede zwischen GPU und CPU
  • SIMD Processing
  • Shader Stalls
  • Warp-basiertes SIMD versus Traditionelles SIMD
  • Verzweigungen

Beispiele und aktuelle Entwicklung

  • Nvidia Maxwell Architektur
  • Beispiel GPU: NVIDIA GeForce GTX 580
  • Logische Pipeline
  • Heterogene Computersysteme / Accelerated Processing Unit
  • Intel’s Sandy Bridge
  • Nvidia Tegra

Literatur

[AMD11] AMD: Real-Time Rendering Architectures, 2011. http://bps11.idav.ucdavis.edu/talks/04-realTimeRenderingArchitecture-BPS2011-houston.pdf

[Cor10] NVIDIA Corporation: NVIDIA GeForce GTX 580 GPU Datasheet, 2010. Online erhältlich unter http://www.nvidia.de/docs/IO/100940/GeForce_GTX_580_Datasheet.pdf; abgerufen am 14. Mai 2015.

[Fat11] Kayvon Fatahalian: Graphics and Imaging Architectures. Vortragsfolien, 2011. Online erhältlich unter https://www.cs.cmu.edu/afs/cs/academic/class/15869-f11/www/lectures/08_mem_hierarchy.pdf; abgerufen am 15. Mai 2015.

[Fly66] M.J. Flynn: Very high-speed computing systems. Proc. IEEE, 54(12):1901–1909, 1966.

[Gue12] Shay Gueron: Intel R Advanced Encryption Standard (AES) New Instructions Set. Technischer Bericht, Intel Corporation, 2012. Online erhältlich unter https://software.intel.com/sites/default/files/article/165683/aes-wp-2012-09-22-v01.pdf; abgerufen am 14. Mai 2015.

[Gwe10] Linley Gwennap: SANDY BRIDGE SPANS GENERATIONS Intel Focuses on Graphics, Multimedia in New Processor Design. Technischer Bericht, The Linley Groupn, 2010.

[HPAD07] John L Hennessy, David A Patterson und Andrea C Arpaci-Dusseau: Computer architecture. Elsevier/Morgan Kaufmann Publishers, 2007.

[Kub15] Christoph Kubisch: Life of a triangle - NVIDIA’s logical pipeline. Webseite, 2015. Online erhältlich unter https://developer.nvidia.com/content/life-triangle-nvidias-logical-pipeline; abgerufen am 12. Mai 2015.

[Mut13] Onur Mutlu: Computer Architecture: SIMD and GPUs. Vortragsfolien, 2013. Online erhältlich unter https://www.ece.cmu.edu/~ece740/f13/doku.php?id=schedule; abgerufen am 15. Mai 2015.

[New11] AMD Channel News: Wie die APUs von AMD eine ausgewogenere Prozessorarchitektur verkörpern und das volle Potenzial heterogener Computersysteme ausschöpfen. Website, 2011. http://www.amd-news.com/cn_2011-35/de/apu-101.html.

[NVI15] NVIDIA: Tegra X1. Whitepaper, 2015. https://international.download.nvidia.com/pdf/tegra/Tegra-X1-whitepaper-v1.0.pdf.

[Ram06] R.M. Ramanathan: Extending the World’s Most Popular Processor Architecture - New innovations that improve the performance and energy efficiency of Intel R architecture. Technischer Bericht, Intel Corporation, 2006. Online erhältlich unter https://software.intel.com/sites/default/files/m/d/4/1/d/8/322663_322663.pdf; abgerufen am 14. Mai 2015.

[Reg08] Ashu Rege: An Introduction to Modern GPU Architecture. Seminar, 2008. http://http.download.nvidia.com/developer/cuda/seminar/TDCI_Arch.pdf.

Bildquellen

  • http://www.nvidia.de/object/tegra-x1-processor-de.htm
  • http://www.nvidia.de/object/product-geforce-gtx-580-de.html