fallback-image

Разгон оперативной памяти DDR4 на AMD Ryzen и Intel Core

На github.com кто-то заморочился и сделал полноценный гайд по разгону оперативной памяти DDR4 на Intel и AMD Ryzen. А в качестве базовой информации в дополнении к нашему видео он будет полезен каждому. 

  • Подготовка
  • Ожидания и ограничения
    • Материнская плата
    • Микросхемы
      • Отчёты Thaiphoon Burner
      • О рангах и объёме
      • Масштабирование напряжения
      • Ожидаемая максимальная частота
      • Биннинг
      • Максимальное рекомендованное повседневное напряжение
      • Ранговость
    • Встроенный контроллер памяти (IMC)
      • Intel – LGA1151
      • AMD – AM4
  • Разгон
    • Нахождение максимальной частоты
    • Пробуем повысить частоты
    • Оптимизация таймингов
    • Дополнительные советы
      • Intel
      • AMD
  • Перед разгоном памяти убедитесь, что ваш процессор полностью исправен, так как нестабильный процессор может привести к ошибкам памяти. При повышении частоты с жесткими таймингами, ваш процессор может начать работать нестабильно.
  • Протестируйте память с помощью MemTestHelper или аналогичного тестера. Утилита Karhu RAM Test (платная) также неплоха. Я бы не советовал тест памяти AIDA64 и Memtest64, поскольку обе они не очень хорошо умеют находить ошибки памяти.
  • TM5 с экстремальными настройками от anta777, кажется, работает быстрее, чем Karhu RAM Test при поиске ошибок. Один пользователь тщательно тестировал эту утилиту, и ни одна ошибка не ускользнула от него.
    • Intel: Asrock Timing Configurator v4.0.4 (работает с большинством материнских плат, за исключением EVGA).
    • AMD:
      • Ryzen 1000/2000: Ryzen Timing Checker.
      • Ryzen 3000: Ryzen Master.
  • AIDA64 – бесплатная 30-дневная пробная версия. Мы будем использовать тесты кэша и памяти (находятся в разделе Tools), чтобы посмотреть, как работает наша память. Щёлкнув правой кнопкой по кнопке запуска теста, можно выбрать запуск только тестов памяти, пропустив тесты кэша.
  • Super Pi Mod v1.5 XS – еще одна чувствительная к памяти бенчмарк-утилита, но я не использовал её так часто, как AIDA64. 1-8M значений [после запятой при вычислении числа π] будет вполне достаточно для быстрого теста. Вам лишь нужно посмотреть на последнее (общее) время, которое чем меньше, тем лучше.
  • В этом разделе рассматриваются 3 компонента, влияющие на процесс разгона: микросхемы (чипы памяти), материнская плата и встроенный контроллер памяти (IMC).

    • Самые высокие частоты достигаются на материнских платах с 2-мя слотами DIMM.
    • На материнских платах с 4-мя слотами DIMM максимальная частота памяти зависит от количества установленных планок.
      • На материнских платах, работающих с цепочечной (daisy-chain) микроархитектурой RAM, лучше использовать 2 планки памяти. Использование 4-х планок может существенно снизить максимальную частоту памяти.
      • Платы же с Т-образной топологией, напротив, наилучшие показатели при разгоне обеспечат с 4-мя планками. А использование 2-х планок не столь существенно повлияет на максимальную частоту памяти, как использование 4-х на daisy-chain (?).
      • Большинство поставщиков не указывают используемую топологию, но её можно «вычислить» на основе прилагаемого к материнской плате списка совместимых устройств (QVL – Qualified Vendor List). Например, Z390 Aorus Master, вероятно, использует Т-топологию, поскольку наибольшая частота демонстрируется с использованием 4-х модулей DIMM. Если же максимальная частота демонстрируется на 2-х модулях DIMM, то, вероятно, используется топология daisy-chain.
      • По словам известного оверклокера buildzoid’а, разница между Т-образной и цепочечной топологиями проявляет себя только на частотах выше 4ГГц. То есть, если у вас Ryzen 3000, то топология значения не имеет, поскольку 3,8ГГц – как правило, максимум для частоты памяти при соотношении MCLK:FCLK 1:1.

      Замечено также, что дешёвые материнские платы могут не разогнаться, возможно по причине низкого качества печатной платы и недостаточного количества слоёв (?).

    По общему мнению, свои отбракованные низкосортные чипы Micron реализует под брендом SpecTek.  Многие стали называть этот чип “Micron E-die” или даже просто “E-die”. Если в первом случае ещё куда ни шло, то во втором уже возникает путаница, поскольку подобная маркировка («буква-die») используется у микросхем Samsung, например – “4 Гб Samsung E-die”. Под “E-die” обычно подразумевается чип Samsung, поэтому стоит уточнять производителя, говоря о чипах Micron Rev. E как об “E-die”.

    • Одноранговые модули обычно позволяют добиться более высоких частот, однако двуранговые модули, при той же частоте и таймингах, могут оказаться более производительными благодаря чередованию рангов.
    • Объем важен при определении того, насколько можно разогнать память. К примеру, AFR 4 Гб и AFR 8 Гб разгоняться будут по-разному, несмотря на то, что оба они AFR.

    Масштабирование напряжения попросту означает, как чип реагирует на изменение напряжения. Во многих микросхемах tCL масштабируется с напряжением, что означает, что увеличение напряжения может позволить вам снизить tCL. В то время как tRCD и tRP на большинстве микросхем, как правило, не масштабируются с напряжением, а это означает, что независимо от того, какое напряжение вы подаёте, эти тайминги не меняются. Насколько я знаю, tCL, tRCD, tRP и, возможно, tRFC могут (либо не могут) видеть масштабирование напряжения. Аналогичным образом, если тайминг масштабируется с напряжением, это означает, что вы можете увеличить напряжение, чтобы соответствующий тайминг работал на более высокой частоте.

    На графике видно, что tCL у CJR 8 Гб масштабируется с напряжением почти ровно до 2533 МГц. У B-die мы видим идеально-ровное масштабирование tCL с напряжением.

    Некоторые старые чипы Micron (до Rev. E) известны своим отрицательным масштабированием с напряжением. То есть при повышении напряжения (как правило, выше 1,35 В) они становятся нестабильными на тех же таймингах и частоте. Ниже приведена таблица некоторых популярных чипов, показывающая, какие тайминги в них масштабируются с напряжением, а какие нет:

    * – результаты тестирования CJR у меня получились несколько противоречивыми. Я тестировал 3 одинаковых планки RipJaws V 3600 CL19 8 Гб. Одна из них работала на частоте 3600 МГц, другая – на 3800 МГц, а последняя смогла работать на 4000 МГц. Тестирование проводилось на CL16 с 1,45 В.

    Суть биннинга заключается в разделении производителем полученной на выходе продукции «по сортам», качеству. Как правило, сортировка производится по демонстрируемой при тестировании частоте.

    Чипы, показывающие одну частоту, производитель отделяет в одну «коробку», другую частоту – в другую «коробку». Отсюда и название процедуры – “binning” (bin – ящик, коробка).

    B-die из коробки «2400 15-15-15» намного хуже чем из коробки «3200 14-14-14» или даже из «3000 14-14-14». Так что не ждите, что третьесортный B-die даст образцовые показатели масштабирования напряжения.

    Чтобы выяснить, какой из одинаковых чипов обладает лучшими характеристиками на одном и том же напряжении, нужно найти немасштабируемый с напряжением тайминг.

    Просто разделите частоту на этот тайминг, и чем выше значение, тем выше качество чипа. Например, Crucial Ballistix 3000 15-16-16 и 3200 16-18-18 оба на чипах Micron Rev. E. Если мы разделим частоту на масштабируемый с напряжением тайминг tCL, мы получим одинаковое значение (200). Значит ли это, что обе планки – одного сорта? Нет.

    Как видите, 3000 15-16-16 более качественный чип, нежели 3200 16-18-18. Это означает, что чипы 3000 15-16-16 очевидно смогут работать и как 3200 16-18-18, а вот смогут ли 3200 16-18-18 работать как 3000 15-16-16 – не факт. В этом примере разница в частоте и таймингах невелика, так что разгон этих планок будет, скорее всего, очень похожим.

    Напряжения, превышающие приведенные в разделе «Абсолютные максимальные значения», могут привести к выходу устройства из строя. Это только номинальная нагрузка, и функциональная работа устройства при этих или любых других условиях выше тех, которые указаны в соответствующих разделах данной спецификации, не подразумевается. Воздействие абсолютных максимальных номинальных значений в течение длительного периода может повлиять на надежность.

    Я бы советовал использовать 1,5 В только на B-die, поскольку известно, что он выдерживает высокое напряжение. Во всяком случае, у большинства популярных чипов (4/8 Гб AFR, 8 Гб CJR, 8 Гб Rev. E, 4/8 Гб MFR) максимальное рекомендуемое напряжение составляет 1,45 В. Сообщалось, что некоторые из менее известных чипов, таких как 8 Гб C-die, имеют отрицательное масштабирование или даже сгорают при напряжении выше 1,20 В. Впрочем, решать вам.

    Для разгона RAM необходимо изменить два напряжения: System Agent (VCCSA) и IO (VCCIO). Не оставляйте их в режиме “Auto”, так как они могут подать опасные уровни напряжения на IMC, что может ухудшить его работу или даже спалить его. Большую часть времени можно держать VCCSA и VCCIO одинаковыми, но иногда перенапряжение может нанести ущерб стабильности, что видно из скриншота:

    tRCD и tRP взаимосвязаны, то есть, если вы установите tRCD на 16, а tRP на 17, то оба будут работать с более высоким таймингом (17). Это ограничение объясняет, почему многие чипы работают не очень хорошо на Intel и почему для Intel лучше подходит B-die.

    В UEFI Asrock и EVGA оба тайминга объединены в tRCDtRP. В UEFI ASUS tRP скрыт. В UEFI MSI и Gigabyte tRCD и tRP видны, но попытка установить для них разные значения приведет просто к установке более высокого значения для обоих.

    В Ryzen 1000 и 2000 IMC несколько привередлив к разгону и может не дать столь же высоких частот, как Intel. IMC Ryzen 3000 намного лучше и более-менее наравне с Intel.

    SoC voltage – это напряжение для IMC, и, как и в случае с Intel, не рекомендуется оставлять его в “Auto” режиме. Тут достаточно 1,0 – 1,1 В, поднимать выше смысла нет.

    » width=»400″> Источник: The Stilt

    В Ryzen 3000 есть также CLDO_VDDG (не путать с CLDO_VDDP), которое является напряжением для Infinity Fabric. Я читал, что напряжение SoC должно быть, по крайней мере, на 40 мВ выше CLDO_VDDG, но другой информации об этом вольтаже я не нашёл.

    «Большинство вольтажей cLDO регулируются с двух главных шин питания процессора. В случае cLDO_VDDG и cLDO_VDDP они регулируются через VDDCR_SoC. Поэтому есть пара правил. Например, если вы установите VDDG на 1,10 В, а фактическое напряжение SoC под нагрузкой у вас составляет 1,05 В, VDDG будет оставаться максимум на ~1,01 В. Аналогично, если вы установили VDDG на 1.10 В и начнете повышать напряжение SoC, ваш VDDG вольтаж будет также повышаться. Точных цифр у меня нет, но можно предположить, что минимальное падение напряжения (Vin-Vout) составляет около 40 мВ. Из чего следует, что ваш ФАКТИЧЕСКИЙ вольтаж SoC должен быть, по крайней мере, на 40 мВ выше желаемого VDDG, чтобы ваша настройка VDDG вступила в силу.
    Регулировка напряжения SoC сама по себе, в отличие от других регулировок, мало что даёт вообще. По умолчанию установлено значение 1.10 В, и AMD не рекомендует менять это значение. Увеличение VDDG в некоторых случаях помогает при разгоне матрицы, но не всегда. FCLK 1800 МГц должен быть выполнимым при значении по умолчанию 0,95 В, и для расширения пределов может быть полезно увеличить его до = <1,05 В (1,100 — 1,125 В SoC, в зависимости от нагрузки).»

    Источник: The Stilt

    • * – 3600+ обычно достигается при 1 DIMM на канал (DPC), материнской плате с 2 слотами DIMM и если используются очень хорошие IMC. См. таблицу
    • * – 3400-3533 МГц – это максимум, если не всё, на что способны IMC Ryzen 2000.
      «Количество протестированных образцов по максимально достижимой частоте распределилось следующим образом: 3400 МГц – 12.5% образцов; 3466 МГц – 25.0%; 3533 МГц – 62.5%.» Источник: The Stilt

    «Для моделей с двумя CCD конфигурация «2 одноранговых DIMM на канал», кажется, является наиболее подходящим вариантом. И 3600, и 3700X достигли 1800 МГц UCLK при конфигурации «1 двуранговый DIMM на канал», но в 3900X, скорее всего, из-за рассогласованности двух его CCD, едва удалось достичь 1733 МГц на этой конфигурации. В то время как с двумя однорангами на канал нет никаких проблем в достижении 1866 МГц FCLK/UCLK.»

    Источник: The Stilt

    Geardown Mode (GDM) автоматически включается на частотах выше 2666 МГц, что обеспечивает четность tCL, четность tCWL и CR 1T. Если вы хотите выставить нечетный tCL, отключите GDM. При нестабильной работе попробуйте использовать CR 2T, но это может свести на нет прирост производительности за счет снижения tCL.

    • К примеру, если вы попытаетесь запустить 3000 CL15 с включенным GDM, CL будет округлено до 16.
    • В понятиях производительности это выглядит так: GDM откл CR 1T > GDM вкл CR 1T > GDM откл CR 2T.

    «В пропускной способности памяти мы видим нечто странное: скорость записи у AMD 3700X – у которого скорость записи благодаря соединению кристаллов CDD и IOD составляет 16 байт/такт – вдвое меньше, чем у 3900X. AMD заявляет, что это позволяет экономить электроэнергию, снизить нагрев процессора (TDP), к чему так стремится AMD. AMD говорит, что приложения редко делают чистые операции записи, но в одном из наших тестов на следующей странице мы увидим, как это ухудшило производительность 3700X.»

    Источник: TweakTown

    Обратите внимание, что это добавочное напряжение. Базовое напряжение изменяется автоматически при увеличении частоты DRAM. Напряжение 0,10 В на частоте 3000 МГц может привести к фактическому напряжению 1,10 В, а 0,10 В на частоте 3400 МГц приводит уже к фактическому напряжению 1,20 В. MSI: CPU NB/SOC.

    4. Постепенно увеличивайте частоту DRAM до тех пор, пока Windows не откажет. Помните об ожидаемых максимальных частотах, упомянутых выше. На Intel, быстрый способ узнать, нестабильны ли вы, это следить за значениями RTL и IOL. Каждая группа RTL и IOL соответствует каналу. В каждой группе есть 2 значения, которые соответствуют каждому DIMM. Используйте Asrock Timing Configurator. Поскольку у меня обе планки стоят во вторых слотах каждого канала, мне нужно посмотреть на D1 в каждой группе RTL и IOL. Значения RTL у планок не должны разниться между собой более чем на 2, а значения IOL более чем на 1. 

    В моём случае, RTL разнятся ровно на 2 (53 и 55), а значения IOL не разнятся вовсе (7 у обоих планок). Все значения в пределах допустимых диапазонов, однако имейте в виду, что это ещё не значит, что всё действительно стабильно.

    • Windows потребуется около 2 Гб памяти для проведения тестирования, поэтому обязательно учтите это при вводе тестируемого объема ОЗУ. У меня 16 Гб RAM, из которых обычно тестируется 14 Гб.
    • Минимальные рекомендуемые значения Coverage:
      • MemTestHelper (HCI MemTest): 200% на поток.
      • Karhu RAMTest: 5000%. Убедитесь, что на вкладке “Advanced” кэш процессора включен (CPU cache: Enabled). Это ускорит тестирование на ~20%.

    8. Теперь вы можете либо попытаться перейти на ещё более высокую частоту, либо начать подтягивать тайминги. Ее забывайте об ожидаемых максимальных частотах, о которых мы говорили ранее. Если вы достигли пределов возможностей чипа и/или IMC, то самое время заняться оптимизацией таймингов.

    • Повысьте вольтажи VCCSA и VCCIO до 1,25 В
    • Установите командный тайминг (“Command Rate”, CR) на 2T, если ещё не установлен.
    • Поменяйте значение tCCDL на 8. В UEFI Asus’ов нет возможности менять этот тайминг.
    • Рассинхронизация MCLK и FCLK может привести к значительному ухудшению таймингов, поэтому вам лучше не оптимизировать их, чтобы сохранить MCLK:FCLK 1:1. Подробнее об этом см. выше, раздел AMD – AM4.
    • Либо же установите FCLK на стабильное значение (если не уверены, установите на 1600 МГц).

    2. Увеличьте основные тайминги до 18-22-22-42.
    3. Повысьте вольтаж DRAM до 1,45 В.
    4. Выполните шаги 4-7 из раздела «Нахождение максимальной частоты».
    5. Выполните оптимизацию («подтягивание») таймингов.

    • Я бы рекомендовал выполнять бенчмарк-тесты 3-5 раз и усреднять результаты, так как тесты памяти могут немного отличаться.
    • Теоретическая максимальная пропускная способность (Мб/с) = ddr_freq*num_channels*64/8.
    Частота (МГц) Максимальная пропускная способность в двухканальном режиме (Мб/с)
    3000 48000
    3200 51200
    3400 54440
    3466 55456
    3600 57600
    3733 59728
    3800 60800
    4000 64000

    На процессорах Ryzen 3000 с одним CCD пропускная способность записи должна составлять 90-95% от половины теоретической максимальной пропускной способности. Можно достичь половины теоретической максимальной пропускной способности записи. См. здесь (англ.)

    2. Я бы рекомендовал для начала подтянуть некоторые второстепенные тайминги в соответствии с таблицей ниже, поскольку они могут ускорить тестирование памяти.

    • Начинайте с tCL и уменьшайте его на 1 до появления нестабильности.
    • То же самое проделайте с tRCD и tRP.
    • После того, как вышеупомянутые тайминги будут подтянуты до предела, выставите tRAS по формуле tRAS=tCL+tRCD(RD)+2* и tRC по формуле tRC=tRP+tRAS. 
      • Если tRAS будет ниже, то возникнут проблемы с производительностью.
      • Установка tRC доступна только в UEFI AMD и некоторых Intel. 
      • * – Для Micron Rev. E, похоже, нужно выставлять tRAS=tCL+tRCD(RD)+4 (ну, по крайней мере для моих планок так).
    • Перевод в нс: 2000*timing/ddr_freq. Пример: tRFC 250 на 3200 МГц = 2000*250/3200 = 156,25 нс.
    • Перевод из нс: ns*ddr_freq/2000. Пример: 180 нс на 3600 МГц = 180*3600/2000 = 324.

    На Intel значения таймингов tWTRS/L следует сначала оставить в “Auto”, изменяя вместо них значения tWRRD_dg/sg соответственно. Уменьшение tWRRD_dg на 1 приведет к уменьшению tWTRS на 1. Аналогично с tWRRD_sg. Как только они достигнут минимума, вручную установите tWTRS/L.

    Тайминг Надёжно
    (Safe)
    Оптимально
    (Tight)
    Предельно
    (Extreme)
    tRDRD_sg/dg/dr/dd 8/4/8/8 7/4/7/7 6/4/6/6
    tWRWR_sg/dg/dr/dd 8/4/8/8 7/4/7/7 6/4/6/6
    • О настройке tWRRD_sg/dg см. пункт 5.
    • Настройка tRDWR_sg/dg/dr/dd сводится к постепенному уменьшению на 1 до появления признаков нестабильности. Как правило, значения у них одинаковые, например – 9/9/9/9.
    • Обратите внимание, что dr влияет только на двуранговые планки. Поэтому, если у вас одноранговые планки, можете игнорировать этот тайминг.

    Не стоит слишком увлекаться им, поскольку перепады температур окружающей среды (например, зима-лето) могут быть достаточными для возникновения нестабильности.

    7. Также можно увеличить напряжение DRAM, чтобы ещё больше снизить тайминги. Вспомните про масштабирование напряжения чипов и максимальное рекомендованное повседневное напряжение, о чём мы говорили выше.

    • Увеличение частоты DRAM на 200 МГц обычно поднимает тайминги tCL, tRCD и tRP на 1 с сохранением латентности, зато повышается пропускная способность. К примеру, 3000 15-17-17 имеет ту же латентность, что и 3200 16-18-18, однако 3200 16-18-18 обладает большей пропускной способностью. 
    • Второстепенные и третьестепенные тайминги (за исключением tRFC) в частотном диапазоне не сильно изменяются, если вообще изменяются. Если у вас второстепенные и третьестепенные тайминги стабильно работают на частоте 3200 МГц, то скорее всего они и на 3600 МГц будут работать так же, и даже на 4000 МГц, при условии полноценной работы чипов, IMC и материнской платы.
    • Понижение tCCDL до 8 может помочь восстановить стабильность, особенно на частотах выше 3600 МГц.
    • Повышение частоты внеядерного кэша (aka uncore, ring cache) может повысить пропускную способность и понизить латентность.
    • Для уменьшения значений RTL и IOL следует увеличивать значения IOL-офсетов (IOL offsets). Подробнее здесь (англ.)
    • Пользователям материнских плат Asus Maximus, имеющим проблемы с загрузкой, стоит попробовать настроить значения управления перекосами (skew). Подробнее здесь (англ.)
    • Если не можете загрузиться, попробуйте поиграть со значениями ProcODT. На Ryzen 1000 и 2000 используйте значения в диапазоне 40-68,6 Ом. На Ryzen 3000 пользователь 1usmus предлагает значения в диапазоне 28-40 Ом. С ними согласуются настройки, предлагаемые пользователем The Stilt. Сбросьте всё в дефолт AGESA, кроме ProcODT – ему выставите 40 Ом, что является нормой ASUS для OptiMem III.
    • Понижение напряжения SoC может помочь восстановить стабильность.
    • На Ryzen 3000 повышение значения CLDO_VDDP поможет со стабильностью на частотах выше 3600 МГц.

    Увеличение CLDO_VDDP похоже влияет положительно на частотах выше 3600 МГц, так как, по-видимому, улучшается гибкость и, следовательно, становится меньше ошибок.

    admin

    Related Posts

    fallback-image

    Razer DeathStalker

    fallback-image

    Обзор материнской платы Biostar X470GT8 серии Racing. Разгоняя процессор, не забудьте про память

    fallback-image

    Гаджеты

    fallback-image

    Разгон процессора