Помимо новых карт AMD и Nvidia были рассмотрены модели Intel Arc A770 и Arc A750.
NVIDIA и AMD к концу года решат проблемы с ценами на видеокарты
Это означает, что общее количество ядер CUDA на один SM в действительности не изменилось, просто половина из них теперь имеет больше возможностей. В Turing был возможен только второй вариант. Таким образом, новый GPU потенциально может удвоить производительность FP32 по сравнению с его предшественником. Для вычислительных рабочих нагрузок, особенно в профессиональных приложениях, это большой шаг вперед, но для игр польза от этого невелика.
Так почему же вся эта вычислительная мощность тратится зря? Ответ прост: нет, не зря, просто игры не всегда используют инструкции FP32. Эти вычисления обычно выполняются для определения адресов памяти, сравнения двух значений и диспетчеризации логических потоков.
Так что для этих операций функция двойной скорости FP32 не работает, поскольку блоки с поддержкой двух типов данных могут работать либо только с целыми числами, либо только с плавающей точкой. SM-раздел переключится на эту функцию лишь в том случае, когда все 32 потока, обрабатываемые им в данный момент, имеют одну и ту же операцию FP32, выстроенную в очередь для обработки. Во всех остальных случаях разделы в Ampere работают так же, как и в Turing.
Вот почему реальный прирост производительности в играх не столь значителен, как можно было бы предположить. Какие есть ещё улучшения? На каждый SM-раздел теперь приходится меньше тензорных ядер, но каждое из них намного более функционально, чем в Turing.
Эти схемы выполняют очень специфические вычисления например, умножают два значения FP16 и складывают ответ с другим числом FP16 , и теперь каждое ядро выполняет 32 таких операций за цикл. Кроме того, представлена новая функция под названием Fine-Grained Structured Sparsity «тонкоструктурированная разреженность» , и, если не вдаваться в подробности, то по сути это означает, что математическая скорость может быть удвоена путем удаления данных, не влияющих на ответ. Опять же, это хорошая новость для профессионалов, работающих с нейронными сетями и искусственным интеллектом, но для разработчиков игр это не особо погоду меняет.
RT-ядра также были доработаны: теперь они могут работать независимо от ядер CUDA, поэтому, пока они работают с алгоритмом BVH или вычисляют пересечения лучей и примитивов, остальная часть SM может продолжать обрабатывать какие-то шейдеры. И та часть RT-ядра, которая проверяет, пересекает ли луч примитив или нет, также увеличила производительность вдвое. Кроме того, ядра трассировки теперь дополнены схемами, облегчающими применение рейтресинга к размытию в движении, но эта функция доступна пока только через проприетарный движок Nvidia Optix API.
А также ряд других доработок. В целом подход основан на рациональной устойчивой эволюции, а не на чем-либо революционном. Учитывая, что по своим возможностям архитектура Turing с самого начала показала себя совсем неплохо, наблюдаемая сегодня картина выглядит совершенно закономерно.
Ну а теперь — что насчет AMD? Некоторые изменения произошли в отношении того, какие типы данных и связанные с ними математические операции могут выполняться ими, и мы поговорим об этом чуть позже. Для обычного пользователя же наиболее заметным изменением является то, что AMD теперь предлагает аппаратное ускорение для определенных процедур рейтрейсинга.
Эта часть CU выполняет проверки пересечения луча с треугольником или кубом — то же, что и RT-ядра в Ampere. Независимо от того, сколько у вас шейдерных ядер или насколько высоки их тактовые частоты, использование специализированных схем, предназначенных для выполнения только одной задачи, всегда будет лучше, чем универсализированный подход. Именно поэтому и появились GPU — какой угодно рендеринг может сделать и CPU, но его универсализированная природа претит ему заниматься столь специфичными нагрузками.
Модули ускорителей лучей RA units, Ray Accelerators находятся рядом с текстурными процессорами, потому что они фактически являются частью одной структуры. Еще в июле 2019 года мы сообщали о регистрации патента, поданного AMD, в котором подробно описывался «гибридный» подход к обработке ключевых алгоритмов трассировки лучей... Хотя эта система действительно более гибкая и более рационально распределяет нагрузку по трассировке лучей, ее первая реализация у AMD не лишена недостатков.
Наиболее заметный из них в том, что в каждый момент времени текстурные процессоры способны обрабатывать либо только операции, связанные с текстурами, либо только с пересечениями лучей с примитивами. Учитывая, что RT-ядра у Nvidia теперь работают полностью независимо от остальной части SM, это, казалось бы, дает Ampere явное преимущество по сравнению с RNDA 2 в плане проработки структур ускорения и проверки пересечений рейтрейсинга. Мы лишь бегло взглянули на производительность рейтрейсинга в новейших видеокартах AMD, но этого было достаточно, чтобы убедиться, что она сильно зависит от игры.
Чтобы больше рассказать об этой технологии AMD, необходим более детальный анализ рейтрейсинга, но в качестве первого отклика на неё можно сказать, что она выглядит конкурентоспособной, но чувствительной к тому, какое приложение выполняет трассировку лучей. Этот API является недавним дополнением к семейству Microsoft DirectX 12, и сочетание аппаратного и программного обеспечения предоставляет возможность улучшить скорость шумоподавления в алгоритмах трассировки лучей и промежуточного масштабирования. Их система использует тензорные ядра в SM для выполнения части вычислений, но, учитывая, что аналогичный процесс может быть построен посредством DirectML, может показаться, что эти модули в некотором смысле избыточны.
Однако и в Turing, и в Ampere тензорные ядра также обрабатывают все математические операции формата FP16. В RDNA 2 подобные вычисления выполняются с помощью шейдерных блоков SU, shader units , используя форматы пакованных данных, то есть каждый 32-битный векторный регистр содержит два 16-битных. Так чей же подход лучше?
AMD называет свои блоки SIMD32 векторными процессорами, поскольку они выдают единую инструкцию для нескольких значений данных. Каждый векторный блок содержит 32 потоковых процессора SM, Stream Processor , и поскольку каждый из них работает только с одним фрагментом данных, сами операции фактически носят скалярный характер. По сути, это то же самое, что и SM-раздел в Ampere, где каждый блок обработки также несет одну инструкцию для 32 значений данных.
Потоковые мультипроцессоры SM Nvidia могут одновременно обрабатывать инструкции для целочисленных и FP-значений например, 64 FP32 и 64 INT32 и имеют независимые модули для FP16 операций, тензорной математики и для процедур рейтрейсинга. Вычислительные блоки CU AMD выполняют большую часть рабочей нагрузки с помощью блоков SIMD32, хотя у них есть отдельные скалярные блоки, поддерживающие простую целочисленную математику. Таким образом, создаётся впечатление, что здесь преимущество за Ampere: у GA102 больше SM, чем CU у Navi 21, и у них больше возможностей в плане пиковой пропускной способности, гибкости и предлагаемых функций.
Между тем, у AMD в рукаве припрятана одна очень неплохая карта. Миссия: прокормить голодных бегемотов Система памяти, многоуровневые кэши GPU с тысячами логических блоков, которым покорны все затейливости математики — это, конечно, хорошо. Но они будут совершенно беспомощны, если не будут получать необходимые инструкции и данные с достаточной скоростью.
Обе новые разработки имеют множество многоуровневых кэшей с огромной пропускной способностью. Взглянем на Ampere сперва. В целом, внутри произошли некоторые заметные изменения.
Как и прежде, кэши L1 конфигурируются в зависимости от того, сколько памяти в них можно выделить для данных, текстур или общих вычислений.
Monty Loveless 22. Какую же видеокарту купить? Конечно, есть еще интегрированные видеокарты, но с современными играми они справиться практически неспособны, и вам обязательно потребуется дискретная. Она необязательно должна быть дорогой, хотя часто это так. Видеокарта — самый дорогой компонент большинства лучших игровых ПК. Но прежде чем мы разрешим вечный спор между Nvidia и AMD , давайте разберемся, что вообще такое видеокарта и каковы ее функции в игровом ПК. Графический процессор отличается от обычного тем, что он обладает в значительной мере параллельной архитектурой и узкой специализацией. Например, в вашем центральном процессоре может быть восемь ядер, но их можно программировать для выполнения практически любых задач. У главного процессора видеокарты, напротив, может быть более 1000 ядер, но они будут ограниченно программируемыми и заточенными исключительно под задание цвета и текстур пикселям, расчет положения вершин шейдинг и другие манипуляции с треугольниками с дальнейшим преобразованием всего этого в нечто пригодное к выводу на экран.
У каждого производителя есть большой выбор видеокарт базового, среднего и топового уровня, поэтому давайте взглянем, что они могут нам предложить. Для более подробной информации вы можете обратиться к нашему обзору лучших видеокарт. Стоит ли покупать Nvidia?
Открытые платформы всегда перспективнее закрытых, которые нередко становятся рычагом давления на другие компании, особенно в руках монополиста. Во-вторых, плагин DirectML станет доступен даже для владельцев «древних» видеоадаптеров, но при условии поддержки библиотеки DirectX 12. Фото: wccftech. Точные сроки выхода пока не уточняются — ориентировочно в мае. Одно известно, что сразу FFXSR заработать не сможет, поскольку для реализации ее потенциала необходима будет поддержка со стороны разработчиков игр. Дополнительно можно ожидать не самую лучшую реализацию технологии сглаживания, как это было с DLSS 1. Это тоже интересно:.
Ее производительность превысит 2 эксафлопса. Восемь графических процессоров MI300X предназначены для обучения систем генеративного искусственного интеллекта и выполнения приложений логического вывода. Корпоративные заказчики и гиперскейлеры могут использовать платформу Instinct для установки графических процессоров MI300X в существующие серверные стойки OCP. Этот процессор специально проектировался для облачных сред и оснащен большим количеством ядер для запуска виртуальных машин. В общей сложности Bergamo имеет 128 ядер с поддержкой гиперпоточности. Таким образом, в системе с двумя сокетами может насчитываться до 512 виртуальных процессоров. По своей конструкции новые процессоры отличаются от элементной базы, предназначенной для организации вычислений общего назначения — продукты Bergamo меньше по размеру и в значительной степени ориентированы на пропускную способность, отсюда и их многоядерная структура.
Digital Foundry похвалили AMD FidelityFX. Это аналог DLSS от NVIDIA
То есть, видимо, в количественном выражении AMD отстанет от Nvidia далеко не в 10 раз, хотя и всё равно существенно. Intel пока пасёт задних с 500 млн долларов, то есть отстанет от Nvidia уже на два порядка. Хотя и с её продукцией ситуации такая же, как и в случае AMD. В количественном, видимо, показатель будет существенно меньше, но это не так уж и важно в данном сегменте.
Initially only available on Nvidia cards, this clever technology calculates how many frames in your field of vision will be fully shaded and rendered, severely lowering the strain on your GPU at the expense of image quality in your peripheral vision. The technology has found great use in virtual reality applications. The reason for this is simple: AMD simply had atrocious drivers, which severely crippled the performance of its GPUs, even when the hardware inside them was superior to what Nvidia had to offer. On initial release, Vega 56 cost more, was significantly more power-hungry, and performed worse than the 1070. The same happened to the RX 4xx and 5xx series of cards, which nowadays tend to win the AMD vs Nvidia battles they used to lose badly. Is AMD better than Nvidia when it comes to software in 2024? But who is the overall winner?
If not, here it is: there is no clear winner, and your choice will have to depend on availability and preference. Our advice is this: get whichever card you can find in the current situation, and forget about brand loyalty. After many years, both companies are competitive at all price points, so we finally have a real choice on our hands.
В компаниях ожидают, что в ближайшие месяцы их доходы от майнеров сократятся, однако возможен и рост доходов, если криптовалютный рынок перейдет к резкому подъему. Похожие публикации:.
Для проведения тестирования видеокарт были отобраны шесть игр.
Последняя из них запускалась с высоким пресетом, а остальные - со средними настройками графики. Все результаты тестирования вы можете также увидеть на изображениях выше. Вывод Эксперты отмечают, что существуют две разновидности графических процессоров, которых точно нужно избегать.
AMD против Nvidia 2023: кто чемпион по видеокартам?
Невозможно сравнивать Nvidia с AMD, не обсуждая технологию Nvidia Deep Learning Super Sampling (DLSS), особенно сейчас, когда DLSS 3 (и DLSS 3.5) работают в полную силу. AMD планировала крупный шаг в развитии своих графических процессоров с архитектурой RDNA 4, которая обещала знач. Согласно сообщениям, MSI полностью отказалась от производства пользовательских видеокарт AMD Radeon, и компания подтвердила это решение сайту HardwareLuxx.
Nvidia GeForce RTX 3050 vs AMD Radeon RX 6500 XT
Помимо новых карт AMD и Nvidia были рассмотрены модели Intel Arc A770 и Arc A750. Автор YouTube-канала Hardware Unboxed опубликовал первое в 2024 году видео, которое посвящено сравнению топовых видеокарт AMD и NVIDIA в реалиях сегодняшнего дня, когда Radeon RX 7900 XTX стоит менее $1000, а за GeForce RTX 4090 просят порядка $2000. Технические новости Теги: amd nvidia. Новости и статьи по тегам: 59 AMD утверждает, что 110 градусов для Radeon RX 5700 — это совершенно нормально. Найти видеокарту AMD в игровом ноутбуке почти невозможно, тогда как очередные новости от MSI вызвали массу любопытных теорий. Согласно сообщениям, MSI полностью отказалась от производства пользовательских видеокарт AMD Radeon, и компания подтвердила это решение сайту HardwareLuxx. Что такое Nvidia DLSS и DLSS 2.0, и когда AMD выпустит свой аналог глубокого машинного обучения для увеличения частоты кадров, без которого ей не выжить на рынке видеоускорителей?
Digital Foundry похвалили AMD FidelityFX. Это аналог DLSS от NVIDIA
Рост акций AMD может замедлиться и отстать от Nvidia, поскольку бумаги стоят неоправданно дорого, считают аналитики. Профессиональные решения Nvidia Quadro, A, P, T, V или AMD FirePro — не вариант для майнинга из-за плохой окупаемости. Nvidia has seen the highest growth and had Data Center revenue of $10.3 billion in Q2 2023 compared to $1.3 billion for AMD and $4.0 billion for Intel. Сегодня состоялся релиз FidelityFX Super Resolution (FSR) — технологии масштабирования от AMD, которая распространяется в рамках открытого кода и станет альтернативой Nvidia DLSS. Графические процессоры AMD часто считаются второсортными, даже несмотря на то, что их технология близка к Nvidia.