SSE5 - SSE5 - Wikipedia

В SSE5 (Короче для Streaming SIMD Extensions версии 5) был SIMD расширение набора инструкций, предложенное AMD 30 августа 2007 г. как дополнение к 128-битной SSE основные инструкции в AMD64 архитектура.

AMD решила не реализовывать SSE5, как предлагалось изначально. В мае 2009 года AMD заменила SSE5 тремя меньшими расширениями набора инструкций, названными XOP, FMA4, и F16C, которые сохраняют предложенную функциональность SSE5, но кодируют инструкции по-другому для лучшей совместимости с предложенными Intel AVX Набор инструкций.

Три производных от SSE5 набора инструкций были представлены в Бульдозер ядро процессора, выпущенное в октябре 2011 г. 32 нм процесс.[1]

Совместимость

Пакет расширения AMD SSE5 не включает полный набор Intel с SSE4 инструкции, что делает его конкурентом SSE4, а не преемником.

Это усложняет разработку программного обеспечения. Рекомендуется, чтобы программа проверяла наличие расширений набора инструкций с помощью инструкции CPUID перед вводом пути кода, который зависит от правильного функционирования этих инструкций. Для максимальной переносимости оптимизированному приложению потребуются три пути кода: базовый путь кода для совместимости со старыми процессорами (от любого поставщика), отдельно оптимизированный путь кода Intel, использующий SSE4 или AVX, и отдельно оптимизированный путь кода AMD, использующий SSE5.

Из-за этого распространения тесты между процессорами Intel и AMD все больше отражают разумность или качество реализации различных путей кода, а не силу базовой платформы.

Улучшения SSE5

Предлагаемый набор инструкций SSE5 состоял из 170 инструкций (включая 46 базовых инструкций), многие из которых предназначены для улучшения однопоточной производительности. Некоторые инструкции SSE5 3-операндные инструкции, использование которых увеличит среднее количество инструкций за цикл достижимо x86 код.[2] Избранные новые инструкции включают:[3]

AMD утверждает, что SSE5 обеспечит резкое улучшение производительности, особенно в высокопроизводительные вычисления (HPC), мультимедиа, и компьютерная безопасность приложений, включая 5-кратное увеличение производительности для Расширенный стандарт шифрования (AES) и повышение производительности на 30% для дискретное косинусное преобразование (DCT) используется для обработки видеопотоков.[2]

Для получения более подробной информации см. Наборы инструкций, разделенные далее.

Редакция 2009 г.

Спецификация SSE5 включала предлагаемое расширение общей схемы кодирования x86 инструкции, чтобы позволить инструкциям иметь более двух операндов. В 2008, Intel объявили о своих запланированных AVX набор инструкций, который предлагал другой способ кодирования инструкций с более чем двумя операндами. Две предложенные схемы кодирования, SSE5 и AVX, взаимно несовместимы, хотя схема AVX имеет определенные преимущества по сравнению со схемой SSE5: самое главное, AVX имеет много места для будущих расширений, включая большие размеры векторов.

В мае 2009 года AMD опубликовала пересмотренную спецификацию запланированных будущих инструкций. Эта версия изменяет схему кодирования, чтобы сделать ее совместимой со схемой AVX, но с другим байтом префикса, чтобы избежать перекрытия между инструкциями, введенными AMD, и инструкциями, введенными Intel.

Пересмотренный набор инструкций больше не носит название SSE5, которое подвергалось критике за вводящее в заблуждение, но большинство инструкций в новой версии функционально идентичны исходной спецификации SSE5 - отличается только способ кодирования инструкций. Планируемые дополнения к набору команд AMD состоят из трех подмножеств:

  1. XOP: Целочисленный вектор умножать – накапливать инструкции, горизонтальное сложение целочисленных векторов, инструкции сравнения целочисленных векторов, сдвига и поворота, перестановки байтов и условного перемещения, извлечение дроби с плавающей запятой.
  2. FMA4: Вектор с плавающей точкой умножать – накапливать.
  3. F16C: Половинная точность преобразование с плавающей запятой.

Эти новые наборы инструкций включают поддержку будущих расширений для размера вектора от 128 до 256 бит. Из этих предварительных спецификаций неясно, были ли Бульдозер процессор будет поддерживать 256-битные векторные регистры (регистры YMM).[4]

Смотрите также

Рекомендации

  1. ^ Хруска, Джоэл (14 ноября 2008 г.). «AMD Fusion перенесена на 2011 год». Ars Technica.
  2. ^ а б Вэнс, Эшли (30 августа 2007 г.). «AMD планирует однопоточное ускорение с расширениями x86». Реестр.
  3. ^ «128-битный набор команд SSE5». AMD Developer Central. Архивировано из оригинал 15 января 2008 г.. Получено 28 января, 2008.
  4. ^ "Руководство программиста по архитектуре AMD64, том 6: 128-битные и 256-битные инструкции XOP и FMA4" (PDF). AMD. 1 мая 2009 г.

внешняя ссылка