spydell (spydell) wrote,
spydell
spydell

Categories:

Падение Intel. Как AMD беззастенчиво уничтожает конкурента

Исторический перелом, вероятно, уже наступил. Затяжной период снижение доли AMD на процессорном рынке продолжался с 2006 по 2017, остановившись лишь в момент выходе первого поколения процессоров на архитектуре Zen.
Тогда это был фундаментальный прорыв для AMD, но первое поколение имело слишком много недостатков в межъядерном взаимодействии, работе с памятью, совместимостью с памятью и вычислительной мощностью в операциях с плавающей точкой.

На тот момент они приблизились к Intel, но тягаться с ними не могли по результирующей производительности, хотя по энергоэффективности был значительный прорыв. Оптимизированная архитектура Zen в исполнении Ryzen 2000 серии немного подняли производительность в пределах 5-8% с учетом поднятия средних частот, но не решали базовых недостатков первой архитектуры. Это все равно было недостаточно для полноценной конкуренции с Intel. Наконец, третья попытка и уже с новых техпроцессом и с серьезно переработанной архитектурой. Частично я писал об этом летом, но говорил, что как только появится процессор третьей серии, то сразу покажу результаты. 12 и тем более 8 ядерные процессоры не имели никакого смысла в преддверии 16 ядер, поэтому конечно же 16 ядер и никак иначе!

Немного матчасти, чтобы понять революционный потенциал.

Это процессор Ryzen 9 3950x.
0
У него три кристалла. Вот те, что сверху вместе – это два процессорных кристалла на 7нм CCD (чиплеты), внутри каждого по 2 процессорных блока CCX на 4 ядра и по 2 блока кэша 3 уровня, т.е. оба кристалла CCD в совокупности имеют 4 блока CCX по 4 ядра и 4 блока кэша 3 уровня по 16 Мб. Соответственно 16 ядер и невероятные 72 Мб кэша в совокупности. CCX связаны между собой в одном CCD, но сами CCD напрямую не связаны, а через посредника в виде 12 нм внешнего I/O чиплета посредствам шины Infinity Fabric. I/O чиплет ответствен за все взаимодействие с компьютерным оборудованием, точнее с оперативной памятью, чипсетом, PCI интерфейсами и USB, а сами процессорные ядра как бы «изолированы» от внешнего мира и функционируют с окружением только через cIOd чиплет.

Как раз такая компоновка решила множество проблем, как чисто технологических в виде простоты масштабирования, так и архитектурных. С одной стороны, AMD удалось вдвое нарастить пропускную способность шины Infinity Fabric и одновременно с этим за счет иной компоновки практически вдвое снизить задержки при межъядерном взаимодействии (в первую очередь для чипов с двумя CCD, т.е. для 3900x и 3950x). Речь идет о 68нс против 110-115нс в прошлом поколении архитектуры Zen. Это задержки, но и сама скорость обмена выросла в два раза (ширина шины выросла вдвое – с 256 до 512 бит). Реализован асинхронный режим для работы с оперативной памятью, что позволило использовать высокоскоростные модули памяти и качественно решить проблемы с совместимостью и таймингами.

Сами процессорные ядра получили массу улучшений, особенно по FPU части и операциями с плавающей запятой. Увеличение ширины блока операций с плавающей точкой (FPU) с 128 до 256 бит. Улучшения в предсказании переходов, алгоритмы предварительной выборки, матрица планировщика задач, значительная улучшена работа кэша декодирования операций, а сама скорость кэша достигла чудовищных, астрономических показателей.

Чтобы понимать о чем речь - тесты!
Read more...Collapse )
Tags: amd, intel, процессоры
Subscribe

Recent Posts from This Journal

  • Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 207 comments

Recent Posts from This Journal