Results for параллельное выполнение
-
Проблемы векторизации гнезд циклов с использованием инструкций AVX-512
The article was published in issue №3
При оптимизации программ основное внимание уделяется наиболее часто исполняемым участкам кода. Как правило, такими участками являются гнезда циклов. Для оптимизации циклов и гнезд циклов в современных микропроцессорных архитектурах поддерживаются специальные векторные инструкции, позволяющие объединять несколько операций в одну, работающую с упакованными данными. Однако, кроме сокращения количества операций, на повышение эффективности векторизованного кода влияет множество факторов. В данной статье рассмотрены проблемы, возникающие при векторизации гнезда циклов для процессора Intel Xeon Phi Knights Landing на примере реализации сортировки Шелла.