Разгоняя компьютер, мы больше внимания уделяем таким компонентам как процессор и видеокарта, а память, как не менее важную составляющую, иногда обходим стороной. А ведь именно тонкая настройка подсистемы памяти может дополнительно увеличить скорость рендеринга сцены в трехмерных редакторах, уменьшить время на компрессию домашнего видеоархива или прибавить пару кадров за секунду в любимой игре. Но даже если вы не занимаетесь оверклокингом, дополнительная производительность никогда не помешает, тем более что при правильном подходе риск минимален.

Уже прошли те времена, когда доступ к настройкам подсистемы памяти в BIOS Setup был закрыт от лишних глаз. Сейчас их столько, что даже подготовленный пользователь может растеряться при таком разнообразии, не говоря уже о простом "юзере". Мы постараемся максимально разъяснить действия, необходимые для повышения производительности системы посредством простейших настроек основных таймингов и, при необходимости, некоторых других параметров. В данном материале мы рассмотрим платформу Intel с памятью DDR2 на базе чипсета от той же компании, и основной целью будет показать не то, насколько поднимется быстродействие, а то, как именно его необходимо поднять. Что касается альтернативных решений, то для памяти стандарта DDR2 наши рекомендации практически полностью применимы, а для обычной DDR (меньшие частота и задержки, и большее напряжение) есть некоторые оговорки, но в целом принципы настройки те же.

Как известно, чем меньше задержки, тем меньше латентность памяти и, соответственно, выше скорость работы. Но не стоит сразу же и необдуманно уменьшать параметры памяти в BIOS, так как это может привести к совершенно обратным результатам, и вам придется либо возвращать все настройки на место, либо воспользоваться Clear CMOS. Все необходимо проводить постепенно - изменяя каждый параметр, перезагружать компьютер и тестировать скорость и стабильность системы, и так каждый раз, пока не будут достигнуты стабильные и производительные показатели.

На данный момент времени самым актуальным типом памяти является DDR2-800, но он появился недавно и пока только набирает обороты. Следующий тип (вернее, предыдущий), DDR2-667, является одним из самых распространенных, а DDR2-533 уже начинает сходить со сцены, хотя и присутствует на рынке в должном количестве. Память DDR2-400 нет смысла рассматривать, так как она практически уже исчезла из обихода. Модули памяти каждого типа имеют определенный набор таймингов, а для большей совместимости с имеющимся разнообразием оборудования они немного завышены. Так, в SPD модулей DDR2-533 производители обычно указывают временные задержки 4-4-4-12 (CL-RCD-RP-RAS), в DDR2-667 - 5-5-5-15 и в DDR2-800 - 5-5-5-18, при стандартном напряжении питания 1,8-1,85 В. Но ничто не мешает их снизить для увеличения производительности системы, а при условии поднятия напряжения всего до 2-2,1 В (что для памяти будет в пределах нормы, но охлаждение все же не помешает) вполне возможно установить еще более агрессивные задержки.

В качестве тестовой платформы для наших экспериментов мы выбрали следующую конфигурацию:

  • Материнская плата: ASUS P5B-E (Intel P965, BIOS 1202)
  • Процессор: Intel Core 2 Extreme X6800 (2,93 ГГц, 4 Мб кэш, FSB1066, LGA775)
  • Система охлаждения: Thermaltake Big Typhoon
  • Видеокарта: ASUS EN7800GT Dual (2хGeForce 7800GT, но использовалось только "половина" видеокарты)
  • HDD: Samsung HD120IJ (120 Гб, 7200 об/мин, SATAII)
  • Привод: Samsung TS-H552 (DVD+/-RW)
  • Блок питания: Zalman ZM600-HP

В качестве оперативной памяти использовалось два модуля DDR2-800 объемом 1 Гб производства Hynix (1GB 2Rx8 PC2-6400U-555-12), благодаря чему появилась возможность расширить количество тестов с различными режимами работы памяти и комбинациями таймингов.

Приведем перечень необходимого ПО, позволяющего проверить стабильность системы и зафиксировать результаты настроек памяти. Для проверки стабильной работы памяти можно использовать такие тестовые программы как Testmem, Testmem+, S&M, Prime95 , в качестве утилиты настройки таймингов "на лету" в среде Windows применяется MemSet (для платформ Intel и AMD) и A64Info (только для AMD) . Выяснение оправданности экспериментов над памятью можно осуществить архиватором WinRAR 3.70b (имеется встроенный бенчмарк), программой SuperPI , рассчитывающая значение числа Пи, тестовым пакетом Everest (также есть встроенный бенчмарк), SiSoft Sandra и т.д.

Основные же настройки осуществляются в BIOS Setup. Для этого необходимо во время старта системы нажать клавишу Del, F2 или другую, в зависимости от производителя платы. Далее ищем пункт меню, отвечающий за настройки памяти: тайминги и режим работы. В нашем случае искомые настройки находились в Advanced/Chipset Setting/North Bridge Configuration (тайминги) и Advanced/Configure System Frequency (режим работы или, проще говоря, частота памяти). В BIOS"е других плат настройки памяти могут находиться в "Advanced Chipset Features" (Biostar), "Advanced/Memory Configuration" (Intel), "Soft Menu + Advanced Chipset Features" (abit), "Advanced Chipset Features/DRAM Configuration" (EPoX), "OverClocking Features/DRAM Configuration" (Sapphire), "MB Intelligent Tweaker" (Gigabyte, для активации настроек необходимо в главном окне BIOS нажать Ctrl+F1 ) и т.д. Напряжение питания обычно изменяется в пункте меню, отвечающем за оверклокинг и обозначается как "Memory Voltage", "DDR2 OverVoltage Control", "DIMM Voltage", "DRAM Voltage", "VDIMM" и т.д. Также у различных плат от одного и того же производителя настройки могут отличаться как по названию и размещению, так и по количеству, так что в каждом отдельном случае придется обратиться к инструкции.

Если нет желания поднимать рабочую частоту модулей (при условии возможностей и поддержки со стороны платы) выше ее номинальной, то можно ограничиться уменьшением задержек. Если да, то вам скорее придется прибегнуть к повышению напряжения питания, равно как и при снижении таймингов, в зависимости от самой памяти. Для изменения настроек достаточно необходимые пункты перевести из режима "Auto" в "Manual". Нас интересуют основные тайминги, которые обычно находятся вместе и называются следующим образом: CAS# Latency Time (CAS, CL, Tcl, tCL), RAS# to CAS# Delay (RCD, Trcd, tRCD), RAS# Precharge (Row Precharge Time, RP, Trp, tRP) и RAS# Activate to Precharge (RAS, Min.RAS# Active Time, Cycle Time, Tras, tRAS). Также есть еще один параметр - Command Rate (Memory Timing, 1T/2T Memory Timing, CMD-ADDR Timing Mode) принимающий значение 1T или 2T (в чипсете AMD RD600 появилось еще одно значение - 3Т) и присутствующий на платформе AMD или в чипсетах NVidia (в логике от Intel он заблокирован в значении 2T). При снижении этого параметра до единицы увеличивается быстродействие подсистемы памяти, но снижается максимально возможная ее частота. При попытке изменить основные тайминги на некоторых материнских платах могут ожидать "подводные камни" - отключив автоматическую настройку, мы тем самым сбрасываем значения подтаймингов (дополнительные тайминги, влияющие как на частоту, так и на быстродействие памяти, но не так значительно, как основные), как, например, на нашей тестовой плате. В этом случае придется воспользоваться программой MemSet (желательно последней версии) и просмотреть для каждого режима работы памяти значения подтаймингов (субтаймингов), чтобы установить аналогичные в BIOS"e.

Если названия задержек не совпадут, то тут хорошо проявляет себя "метод научного тыка". Незначительно изменяя дополнительные настройки в BIOS Setup, проверяем программой, что, где и как изменилось.

Теперь для памяти, функционирующей на частоте 533 МГц, можно попытаться вместо стандартных задержек 4-4-4-12 (или какого-либо другого варианта) установить 3-3-3-9 или даже 3-3-3-8. Если с такими настройками система не стартует, поднимаем напряжение на модулях памяти до 1,9-2,1 В. Выше не рекомендуется, даже при 2,1 В желательно использовать дополнительное охлаждение памяти (простейший вариант - направить на них поток воздуха от обычного кулера). Но сперва необходимо провести тесты при стандартных настройках, например в очень чувствительном к таймингам архиваторе WinRAR (Tools/Benchmark and hardware test). После изменения параметров проверяем снова и, если результат удовлетворяет, оставляем как есть. Если нет, как это произошло в нашем тестировании, то при помощи утилиты MemSet в среде Windows (эта операция может привести либо к зависанию системы, либо, что еще хуже, полной неработоспособности ее) или же средствами BIOS Setup поднимаем на единицу RAS# to CAS# Delay и снова тестируем. После можно попытаться уменьшить на единицу параметр RAS# Precharge, что немного увеличит быстродействие.

Тоже самое проделываем для памяти DDR2-667: вместо значений 5-5-5-15 выставляем 3-3-3-9. При проведении тестов нам пришлось также увеличить RAS# to CAS# Delay, иначе быстродействие ничем не отличалось от стандартных настроек.

Для системы, использующей DDR2-800, задержки можно уменьшить до 4-4-4-12 или даже 4-4-3-10, в зависимости от конкретных модулей. В любом случае подбор таймингов сугубо индивидуален, и дать конкретные рекомендации достаточно сложно, но приведенные примеры вполне могут помочь вам в тонкой настройке системы. И не забываем о напряжении питания.

В итоге мы провели тестирование с восемью различными вариантами и комбинациями режимов работы памяти и ее задержками, а также включили в тесты результаты оверклокерской памяти, - Team Xtreem TXDD1024M1066HC4, работавшей на эффективной частоте 800 МГц при таймингах 3-3-3-8. Итак, для режима 533 МГц вышло три комбинации с таймингами 4-4-4-12, 3-4-3-8 и 3-4-2-8, для 667 МГц всего две - 5-5-5-15 и 3-4-3-9, а для режима 800 МГц, как и в первом случае, три - 5-5-5-18, 4-4-4-12 и 4-4-3-10. В качестве тестовых пакетов использовались: подтест памяти из синтетического пакета PCMark05, архиватор WinRAR 3.70b, программа расчета числа Пи - SuperPI и игра Doom 3 (разрешение 1024x768, качество графики High). Латентность памяти проверялась встроенным бенчмарком программы Everest. Все тесты проходили в среде Windows XP Professional Edition SP2. Представленные результаты на диаграммах расположены по режимам работы.

Как видите по результатам, разница в некоторых тестах незначительная, а порой даже мизерная. Это обусловлено тем, что системная шина процессора Core 2 Duo, равная 1066 МГц, имеет теоретическую пропускную способность 8,5 Гб/с, что соответствует пропускной способности двухканальной памяти DDR2-533. При использовании более скоростной памяти ограничивающим фактором быстродействия системы становится шина FSB. Уменьшение задержек ведет к росту быстродействия, но не так заметно, как повышение частоты памяти. При использовании в качестве тестового стенда платформы AMD можно было бы наблюдать совсем другую картину, что мы по возможности и сделаем в следующий раз, а пока вернемся к нашим тестам.

В синтетике рост производительности при уменьшении задержек для каждого из режимов составил 0,5% для 533 МГц, 2,3% для 667 МГц и 1% для 800 МГц. Заметен значительный рост производительности при переходе от памяти DDR2-533 к DDR2-667, а вот смена с 667 на DDR2-800 дает уже не такую прибавку скорости. Также память уровнем ниже и с низкими таймингами вплотную приближается к более высокочастотному варианту, но с номинальными настройками. И это справедливо практически для каждого теста. Для архиватора WinRAR, который достаточно чувствителен к изменению таймингов, показатель производительности немного вырос: 3,3% для DDR2-533 и 8,4% для DDR2-667/800. Расчет восьмимиллионного знака числа Пи отнесся к различным комбинациям в процентном соотношении лучше, чем PCMark05, хоть и незначительно. Игровое приложение не сильно жалует DDR2-677 с таймингами 5-5-5-15, и только снижение последних позволило обойти менее скоростную память (которой, как оказалось, все равно, какие тайминги стоят) на два кадра. Настройка памяти DDR2-800 дала прибавку еще в два кадра, а оверклокерский вариант, который имел неплохой разрыв в остальных тестах, не слишком вырвался вперед относительно менее дорогого аналога. Все же, кроме процессора и памяти, есть еще одно звено - видеоподсистема, которая вносит свои коррективы в производительность всей системы в целом. Результат латентности памяти удивил, хотя, если присмотреться к графику, становится ясно, отчего показатели именно такие, какие есть. Падая с ростом частоты и уменьшением таймингов от режима DDR2-533 4-4-4-12, латентность имеет "провал" на DDR2-667 3-4-3-9, а последний режим практически ничем кроме частоты от предыдущего не отличается. И благодаря столь низким задержкам DDR2-667 запросто обходит DDR2-800, которая имеет более высокие значения, но пропускная способность DDR2-800 позволяет в реальных приложениях все же вырваться вперед.

И в заключение хотелось бы сказать, что несмотря на небольшой процент прироста быстродействия (~0,5-8,5), который получается от уменьшения временных задержек, эффект все же присутствует. И даже при переходе с DDR2-533 на DDR2-800 мы получаем прибавку в среднем 3-4%, а в WinRAR более 20. Так что подобный "тюнинг" имеет свои плюсы и позволяет даже без серьезного разгона немного поднять производительность системы.

В данном исследовании мы попробуем найти ответ на следующий вопрос - что важнее для достижения максимальной производительности компьютера, высокая частота оперативной памяти или же ее низкие тайминги. А помогут нам в этом два комплекта оперативной памяти производства Super Talent. Давайте посмотрим, как выглядят модули памяти внешне, и какими характеристиками обладают.

⇡ Super Talent X58

Данный комплект производитель "посвятил" платформе Intel X58, о чем свидетельствует надпись на наклейке. Однако здесь сразу же возникает несколько вопросов. Как всем хорошо известно, для достижения максимальной производительности на платформе Intel X58 настоятельно рекомендуется использовать трехканальный режим работы оперативной памяти. Несмотря на это, данный комплект памяти Super Talent состоит лишь из двух модулей. Конечно, у ортодоксальных сборщиков систем такой подход может вызвать недоумение, однако рациональное зерно в этом все же есть. Дело в том, что сегмент топовых платформ относительно невелик, и большинство персональных компьютеров используют оперативную память в двухканальном режиме. В этой связи покупка комплекта из трех модулей памяти обычному пользователю может показаться неоправданной, а если необходимо действительно много оперативной памяти, можно приобрести три комплекта по два модуля в каждом. Производитель указывает, что память Super Talent WA1600UB2G6 может работать на частоте 1600 МГц DDR при таймингах 6-7-6-18. Теперь давайте посмотрим, какая информация зашита в SPD профиле этих модулей.

И опять наблюдается некоторое несоответствие реальных и заявленных характеристик. Максимальный профиль JEDEC предполагает работу модулей на частоте 1333 МГц DDR при таймингах 9-9-9-24. Впрочем, присутствует расширенный профиль XMP, частота которого совпадает с заявленной - 800 МГц (1600 МГц DDR), но тайминги несколько отличаются, причем в худшую сторону - 6-8-6-20, вместо 6-7-6-18, которые указаны на наклейке. Тем не менее, данный комплект оперативной памяти без проблем работал в заявленном режиме - 1600 МГц DDR при таймингах 6-7-6-18 и напряжении 1,65 В. Что касается разгона, то более высокие частоты модулям не покорились, несмотря на установку повышенных таймингов и увеличение напряжения питания. Более того, при увеличении напряжения Vmem до уровня 1,9 В наблюдалась нестабильность работы и в исходном режиме. К сожалению, радиаторы очень прочно приклеены к чипам памяти, поэтому мы не рискнули их снимать, опасаясь повредить модули памяти. А жаль, тип используемых микросхем мог бы пролить свет на такое поведение модулей.

⇡ Super Talent P55

Второй комплект оперативной памяти, который мы рассмотрим сегодня, производитель позиционирует как решение для платформы Intel P55. Модули оснащены низкопрофильными радиаторами черного цвета. Максимальный заявленный режим предполагает работу данных модулей на частоте 2000 МГц DDR при таймингах 9-9-9-24 и напряжении 1,65 В. Теперь посмотрим на зашитые в SPD профили.

Наиболее производительный профиль JEDEC предполагает работу модулей на частоте 800 МГц (1600 МГц DDR) при таймингах 9-9-9-24 и напряжении 1,5 В, а профили XMP в данном случае отсутствуют. Что касается разгона, то при небольшом повышении таймингов данные модули памяти оказались способны работать на частоте 2400 МГц DDR, о чем свидетельствует скриншот ниже.

Более того, система загружалась и при частоте модулей 2600 МГц DDR, однако запуск тестовых приложений приводил к зависанию или перезагрузке. Как и в случае с предыдущим комплектом памяти Super Talent, данные модули никак не реагировали на повышение напряжения питания. Как оказалось, лучшему разгону памяти и стабильности работы системы более способствовало увеличение напряжения контроллера памяти, встроенного в процессор. Впрочем, поиск максимально возможных частот и параметров, при которых достигается стабильность работы в таких экстремальных режимах, оставим энтузиастам. Далее мы сосредоточимся на изучении следующего вопроса - в какой степени частота работы оперативной памяти и ее тайминги влияют на общую производительность компьютера. В частности, мы попробуем выяснить, что лучше - установить скоростную оперативную память, работающую с высокими таймингами, или же предпочтительнее использовать как можно более низкие тайминги, пусть и не при максимальных рабочих частотах.

⇡ Условия тестирования

Тестирование проводилось на стенде следующей конфигурации. Во всех тестах процессор работал на частоте 3,2 ГГц, причины этого будут объяснены ниже, а мощная видеокарта была необходима для тестов в игре Crysis.

Как уже говорилось выше, мы попробуем выяснить, как частота работы оперативной памяти и ее тайминги влияют на общую производительность компьютера. Конечно, данные параметры можно просто задать в BIOS и провести тесты. Но, как оказалось, при частоте Bclk равной 133 МГц, диапазон рабочих частот оперативной памяти в использованной нами материнской плате составляет 800 - 1600 МГЦ DDR. Этого оказывается недостаточно, ведь один из рассматриваемых сегодня комплектов памяти Super Talent поддерживает режим DDR3-2000. Да и вообще, скоростных модулей памяти выпускается все больше, производители уверяют нас в их небывалой производительности, так что выяснить их реальную производительность определенно не помешает. Для того, чтобы установить частоту памяти, скажем, 2000 МГц DDR, необходимо увеличить частоту шины Bclk. Однако при этом изменятся частоты как ядра процессора, так и его кэш-памяти третьего уровня, которая работает с той же частотой, что и шина QPI. Разумеется, сравнивать результаты, полученные в таких разных условиях, некорректно. Кроме того, степень влияния частоты CPU на результаты тестирования может оказаться куда значительнее таймингов и частоты оперативной памяти. Возникает вопрос - нельзя ли как-то обойти эту проблему? Что касается частоты процессора, то в некоторых пределах ее можно изменять с помощью множителя. Однако при этом желательно выбирать такое значение частоты bclk, чтобы итоговая частота оперативной памяти была равна одному из стандартных значений 1333, 1600 или 2000. Как известно, в настоящее время базовая частота bclk в процессорах Intel Nehalem равна 133.3 МГц. Давайте посмотрим, какова будет частота оперативной памяти при разных значениях частоты шины bclk с учетом множителей, которые может выставить используемая нами материнская плата. Результаты приведены в таблице ниже.

Частота bclk, МГц
133.(3) 150 166.(6) 183.(3) 200
Множитель памяти Частота оперативной памяти, МГц DDR
6 800 900 1000 1100 1200
8 1066 1200 1333 1466 1600
10 1333 1500 1667 1833 2000
12 1600 1800 2000 2200 2400

Как видно из таблицы, при частоте bclk равной 166 МГц, для оперативной памяти можно получить частоты 1333 и 2000 МГц. Если частота bclk равна 200 МГц, то получаем совпадение частот оперативки при 1600 МГц, а также требуемые 2000 МГц. В остальных случаях совпадений со стандартными частотами памяти не наблюдается. Так какую же частоту bclk в итоге предпочесть - 166 или 200 МГц? Ответ на этот вопрос подскажет следующая таблица. Здесь приведены значения частоты CPU, в зависимости от множителя и частоты bclk. Для оценки влияния таймингов нам необходимы не только одинаковые частоты памяти, но и CPU, чтобы это не влияло на получаемые результаты.

Частота bclk, МГц
Множитель CPU 133.(3) 150.0 166.(6) 183.(3) 200.0
9 1200 1350 1500 1647 1800
10 1333 1500 1667 1830 2000
11 1467 1650 1833 2013 2200
12 1600 1800 2000 2196 2400
13 1733 1950 2167 2379 2600
14 1867 2100 2333 2562 2800
15 2000 2250 2500 2745 3000
16 2133 2400 2667 2928 3200
17 2267 2550 2833 3111 3400
18 2400 2700 3000 3294 3600
19 2533 2850 3167 3477 3800
20 2667 3000 3333 3660 4000
21 2800 3150 3500 3843 4200
22 2933 3300 3667 4026 4400
23 3067 3450 3833 4209 4600
24 3200 3600 4000 4392 4800

В качестве отправной точки мы брали максимальную частоту процессора (3200 МГц), которую он может показать при базовой частоте bclk равной 133 МГц. Из таблицы видно, что в данных условиях только при частоте bclk=200 МГц можно получить точно такую же частоту CPU. Остальные частоты хоть и близки к 3200 МГц, но не точно равны ей. Конечно, в качестве исходной можно было взять частоту CPU и поменьше, скажем - 2000 МГц, тогда можно было бы получить корректные результаты при всех трех значениях шины bclk - 133, 166 и 200 МГц. Тем не менее, мы отказались от этого варианта. И вот почему. Во-первых, настольных процессоров Intel c архитектурой Nehalem с такой частотой нет, и вряд ли они появятся. Во-вторых, снижение частоты CPU более чем в 1,5 раза может привести к тому, что он станет ограничивающим фактором, и разница в результатах практически не будет зависеть от режима работы оперативной памяти. Собственно, первые прикидки именно это и показывали. В-третьих, вряд ли тот пользователь, который покупает заведомо слабый и дешевый процессор, будет сильно озабочен вопросом выбора дорогой скоростной оперативной памяти. Итак, мы будем тестировать при значениях базовой частоты bclk - 133 и 200 МГц. Частота CPU в обоих случаях одинакова и равна 3200 МГц. Ниже приведены скриншоты утилиты CPU-Z в данных режимах.

Если вы обратили внимание, частота QPI-Link зависит от частоты bclk и, соответственно, они отличаются в 1,5 раза. Это, кстати, позволит выяснить, как влияет частота кэш-памяти третьего уровня в процессорах Nehalem на общую производительность. Итак, приступим к тестированию.

Чем отличаются модули памяти?

Многие пользователи думают, что DDR400 всегда на много быстрее, чем DDR333.
В общем, это правда, но далеко не все знают, что модули с одинаковой частотой DDR могут сильно отличаться по производительности.
В первую очередь, производительность модулей памяти зависит от так называемых «таймингов памяти».

Существует множество различных параметров, которые задают тайминги памяти, но чаще всего используются четыре из них: CAS Latency, RAS-CAS задержка (tRCD), RAS Precharge (tRP) и tRAS (продолжительность цикла).

Если вы увидите на модулях обозначения: 2.0-2-2-5 или 3.0-4-4-7, можете не сомневаться, это упомянутые четыре параметра.
Выясним, что представляет собой каждый из них.

CAS Latency - это задержка в тактах между получением команды чтения и окончанием ее выполнения.
Стандартные значения для памяти DDR - 2 и 2,5 такта.
В некоторых системах возможны значения 3 или 1,5.
Например, CAS Latency 2 означает, что данные будут получены только через два такта после получения команды Read.

Задержка RAS-CAS известна как tRCD .
Это задержка в тактах между получением команды Active и выполнением следующей за ней команды Read или Write (чтения или записи).
Обычно, это 2, 3 или 4 такта.

RAS Precharge .
Это задержка в тактовых циклах с момента получения команды Precharge до возможности выполнения следующей за ней команды Active.
Обычные значения для этого параметра 2, 3 или 4 такта.

tRAS отображает минимальную задержку между командами Active и Precharge.
Измеряется тоже в тактах и обычно имеет значение от 5 до 10.

Четверку этих параметров, как правило, можно изменять в разделе BIOS «Advanced Chipset», но вполне возможно, что производители вашей материнской платы решили поместить эти настройки куда-нибудь в другой раздел.

Вы уже могли заметить, что это задержки, поэтому, чем меньше значения таймингов, тем выше производительность памяти.
Например, модуль с латентностью CAS 2,5 должен работать лучше, чем с латентностью 3,0 .

Драйвер AMD Radeon Software Adrenalin Edition 19.9.2 Optional

Новая версия драйвера AMD Radeon Software Adrenalin Edition 19.9.2 Optional повышает производительность в игре «Borderlands 3» и добавляет поддержку технологии коррекции изображения Radeon Image Sharpening.

Накопительное обновление Windows 10 1903 KB4515384 (добавлено)

10 сентября 2019 г. Microsoft выпустила накопительное обновление для Windows 10 версии 1903 - KB4515384 с рядом улучшений безопасности и исправлением ошибки, которая нарушила работу Windows Search и вызвала высокую загрузку ЦП.

Драйвер Game Ready GeForce 436.30 WHQL

Компания NVIDIA выпустила пакет драйверов Game Ready GeForce 436.30 WHQL, который предназначен для оптимизации в играх: «Gears 5», «Borderlands 3» и «Call of Duty: Modern Warfare», «FIFA 20», «The Surge 2» и «Code Vein», исправляет ряд ошибок, замеченных в предыдущих релизах, и расширяет перечень дисплеев категории G-Sync Compatible.

ВведениеК тестированию зависимости производительности современных платформ верхнего уровня от характеристик подсистемы памяти мы обращаемся не слишком часто. Не такая это животрепещущая и интересующая широкие массы пользователей тема. Все давно привыкли к тому, что частота работы DDR3 SDRAM и её тайминги не оказывают заметного влияния на быстродействие, а потому выбору памяти отводится не слишком большое внимание. Подбор модулей памяти при сборке новых систем в большинстве случаев происходит по остаточному принципу, причём таким подходом грешат даже многие энтузиасты. Фактически, единственная характеристика памяти, о которой задумываются серьёзно – это её объём. Все знают, что нехватка оперативной памяти может приводить к свопу приложений и операционной системы, и это в конечном итоге вызывает ухудшение отзывчивости компьютера. А вот о том, что на скорость работы могут существенно повлиять и скоростные спецификации модулей памяти, думать как-то не принято.

Сложилась такая ситуация не на пустом месте. Раньше от таких параметров DDR3 SDRAM, как её частота и задержки, зависело, и правда, не слишком многое. Объяснялось это сразу несколькими причинами. Во-первых, некоторое время тому назад процессоры обзавелись значительными объёмами кэш-памяти, снабжённой эффективными алгоритмами предварительной выборки данных, которые хорошо скрывают от программ реальную скорость обмена информацией с памятью. Во-вторых, скорости и латентности доступных на рынке до недавнего времени вариантов DDR3 SDRAM на самом деле различались не слишком сильно. И, в-третьих, ворочающие действительно большими объёмами информации приложения в обиходе у обычных пользователей встречались нечасто. Вследствие всего этого и возникло суждение, что быстрая DDR3 SDRAM – это своего рода статусный товар для перфекционистов, а обычным людям она не нужна.

Однако это мнение, которое ещё пару лет тому назад можно было считать вполне обоснованным, на сегодняшний день несколько устарело, и его нетрудно подвергнуть критике. Главное: сегодняшние приложения сильно изменились по своей структуре, теперь они оперируют гораздо большими, чем ранее, объёмами информации. Популярна стала обработка цифровых фотографий размером в несколько десятков мегапикселей, многие пользователи занялись творческой работой с видеофайлами, снятыми в FullHD или даже 4K-разрешении, а современные 3D-игры дошли до взаимодействия с воистину колоссальными объёмами текстурной информации. Такие массивы данных уже не могут уместиться в процессорном кэше, вместимость которого, кстати, в течение нескольких последних лет практически прекратила свой рост.

Доступная же на рынке память, напротив, существенно расширила своё видовое разнообразие. Частоты представленной на прилавках компьютерных магазинов DDR3 SDRAM отличаются сегодня более чем в два раза, так что за счёт одного только выбора тех или иных модулей можно варьировать пропускную способность двухканальной подсистемы памяти в очень широких пределах: от 21 до 47 Гбайт/с и даже больше. Не следует забывать и о том, что новейшие процессоры Haswell стали заметно производительнее своих предшественников, а, следовательно, их потребность в быстром получении данных для обработки возросла. Поэтому, вполне можно ожидать, что тот критический рубеж, до которого скорости небыстрой памяти вроде DDR3-1333 или DDR3-1600 вполне хватало для подавляющего большинства нужд, наконец-то пройден. Иными словами, аргументов в пользу исследования зависимости реальной производительности современных систем от параметров подсистемы памяти набирается предостаточно.

Но есть и ещё одна причина, по которой сегодня мы решили обратиться к тестам DDR3 SDRAM с различными частотами и таймингами. Дело в том, что возможность исследования тонкостей работы такой памяти на актуальном материале сейчас предоставляется нам практически в последний раз. Начиная со второй половины этого года на рынок настольных систем постепенно начнёт внедряться более быстрая, экономичная и прогрессивная DDR4 SDRAM. Впервые её поддержка появится в процессорах Haswell-E, а затем, в 2015-2016 годах, приход DDR4 SDRAM состоится и в перспективной платформе LGA 1151 и процессорах Skylake. Иными словами, тесты DDR3 SDRAM не просто давно назрели, но и нет никакой возможности тянуть с ними дальше. Поэтому о том, что может предложить разная DDR3 SDRAM для платформ на базе наиболее востребованных на данный момент процессоров Haswell, мы поговорим именно сейчас.

Особенности контроллера памяти Haswell

На первый взгляд, контроллер памяти современных процессоров для платформы LGA 1150, известных под кодовым именем Haswell, не особенно отличается от контроллеров памяти предшественников – Sandy Bridge и Ivy Bridge. Эволюция алгоритмов работы с памятью в интеловских процессорах, была долгой и многоступенчатой. Но в последних поколениях CPU идейное развитие, похоже, подошло к финалу – современные технологии взаимодействия с DDR3-памятью не просто хорошо оптимизированы, а отточены до совершенства. Основным шагом, поставившим современные контроллеры Intel на голову выше прочих решений, стало введение для соединения всех структурных единиц в процессорном дизайне кольцевой шины Ring Bus, и сделано это было ещё в Sandy Bridge. Благодаря кольцевой шине все вычислительные и графические ресурсы процессора получили быстрый и равноправный доступ как к кэшу третьего уровня, так и к контроллеру памяти. В результате, практическая пропускная способность подсистемы памяти существенно возросла, а её латентности уменьшились.

Однако заложенный ранее в виде кольцевой шины фундамент контроллера памяти в Haswell всё-таки претерпел некоторые важные изменения. Дело в том, что в более ранних процессорных дизайнах кольцевая шина вместе с кэш-памятью третьего уровня работала синхронно с вычислительными ядрами CPU. И это создавало некоторые неудобства при переходе процессора в энергосберегающие состояния: L3-кэш и кольцевая шина могли снизить своё быстродействие вместе с вычислительными ядрами несмотря на то, что эти ресурсы оставались востребованными графическим ядром. Чтобы такие неприятные коллизии больше не возникали, в Haswell шина Ring Bus и L3-кэш были выделены в отдельный домен и получили собственную независимую частоту.



Введение возможности асинхронного тактования кольцевой внутрипроцессорной шины, естественно, внесло неминуемые задержки в операции с L3-кэшем и контроллером памяти, однако интеловские разработчики попытались противопоставить замедлению работы подсистемы памяти различные микроархитектурные усовершенствования. Так, кэш третьего уровня получил две параллельных очереди для обработки запросов разного назначения, а в контроллере памяти были увеличены очереди и улучшен планировщик.

К тому же, асинхронность кольцевой шины, L3-кэша и контроллера памяти проявляется далеко не всегда. В реальности, если не брать во внимание энергосберегающие состояния, их частота почти всегда совпадает с частотой вычислительных ядер. Расхождения возникают лишь в двух ситуациях: при переходе процессора в турбированные режимы, либо при разгоне. Но даже в этих случаях частота L3-кэша и внутрипроцессорной шины остаётся близка к частоте вычислительных ядер, и разница между ними обычно не превышает 300-500 МГц, что, как показывает практика, почти не влияет на итоговую производительность.

При прямом сравнении быстродействия контроллера памяти Haswell и контроллера памяти Ivy Bridge, оказывается, что при одинаковых настройках более новый вариант обеспечивает в целом близкую пропускную способность и латентность. Например, в этом можно убедиться на примере результатов тестов в AIDA64.



Ivy Bridge, 4 ядра, 4.0 ГГц, DDR3-1600 9-9-9-24-1N



Haswell, 4 ядра, 4.0 ГГц, DDR3-1600 9-9-9-24-1N


Впрочем, как видно по приведённым результатам, несмотря на все старания инженеров Intel, память в Haswell всё же работает чуть медленнее, чем в LGA 1155-системах прошлого покления, основанных на процессоре Ivy Bridge. И если отличие в практической пропускной способности почти незаметно, то латентность подсистемы памяти у Haswell оказывается примерно на 9 процентов выше. Это – плата за асинхронность.

Второе существенное изменение, касающееся работы подсистемы памяти в LGA 1150-системах, относится к конструкционному исполнению материнских плат. Разработанный Intel эталонный дизайн разводки для слотов DIMM теперь основывается на T-топологии, которая уравнивает слоты DIMM, подключенные к каждому из каналов, в правах. Это улучшает стабильность контроллера памяти и обеспечивает его совместимость с более широким набором различных модулей памяти и их конфигураций. Особенно приятно здесь то, что контроллер памяти процессоров Haswell получил возможность поддерживать скоростные режимы работы даже при использовании четырёх двухсторонних модулей, установленных во все доступные слоты DIMM. Учитывая же, что максимальный объём имеющихся на рынке планок DDR3-памяти составляет 8 Гбайт, платформа LGA 1150 может обеспечить беспроблемную работу 32-гигабайтных массивов оверклокерской памяти с высокими частотами и низкими задержками.

В остальном же всё осталось, как и раньше. Контроллер памяти у Haswell двухканальный, способный работать как в симметричном двухканальном, так и в одноканальном режимах. Осталась поддержка и технологии Flex Memory, позволяющей использовать двухканальный доступ в ассиметричных конфигурациях, когда объёмы и характеристики установленных в разных каналах памяти модулей не совпадают.

Как и в процессорах Ivy Bridge, частота DDR3 SDRAM у Haswell изменяется с дискретностью 266 или 200 МГц, что даёт определённую гибкость в выборе режимов и серьёзно расширяет множество доступных для контроллера частот работы DDR3 SDRAM. При этом формально контроллером поддерживается лишь DDR3-1333 и DDR3-1600 SDRAM, однако все сделанные в нём усовершенствования позволяют беспрепятственно использовать в платформе LGA 1150 память, работающую на значительно более высоких частотах. Так, имеющийся набор множителей для частоты памяти позволяет активировать режимы вплоть до DDR3-2933, причём столь скоростные режимы действительно достижимы, никаких проблем со стабильностью при их задействовании не наблюдается.

Если же к этому добавить появившуюся возможность разгона базовой частоты Haswell со 100 до 125 МГц, то доступные для задействования частоты памяти вырастут до 3666 МГц. Причём, в сети можно встретить массу свидетельств того, что и в таком состоянии в LGA 1150-системах избранная оверклокерская память может быть вполне работоспособна.



Как известно, важные изменения в Haswell произошли с системой питания. В этом процессоре появился встроенный преобразователь питания, самостоятельно формирующий все необходимые для работы CPU напряжения. От материнской платы теперь зависит только два напряжения: входное для процессора – Vccin и напряжение, подаваемое на модули питания, – Vddq. Все же внутренние процессорные напряжения, в том числе сигнальное напряжение кольцевой шины и напряжение питания L3-кэша и контроллера памяти, формируются процессорной силовой схемой самостоятельно. Такое нововведение освободило напряжение на памяти от каких-либо ограничений, и в процессорах Haswell допускается безопасное его увеличение выше уровня в 1,65 В. Иными словами, в LGA 1150 разгонять память с изменением её напряжения питания можно как угодно, не беспокоясь о возможной деградации процессорного контроллера памяти.



Таким образом, совокупность нововведений сделала новый контроллер DDR3 SDRAM процессоров Haswell не просто высокоэффективным, но и хорошо подходящим для работы с оверклокерскими модулями памяти. А это значит, что у энтузиастов в выборе памяти для LGA 1150 систем есть огромная свобода, которая вполне может повлиять на итоговое быстродействие.

G.Skill F3-2933C12D-8GTXDG

Прежде чем перейти к результатам тестирования, несколько слов необходимо сказать о тех модулях памяти, благодаря которым это исследование стало возможным. Для того чтобы получить максимально полную картину зависимости производительности от параметров подсистемы памяти, нам был нужен комплект модулей DDR3 SDRAM с предельно возможной частотой. Таким комплектам памяти свойственна наибольшая гибкость. Их не обязательно эксплуатировать на заявленных для них космических частотах, просто для своих флагманских оверклокерских планок DDR3 производители отбирают наиболее выигрышные чипы, сохраняющие стабильность на максимально широком поле настроек. Если же принять во внимание тот факт, что контроллер памяти Haswell способен обеспечить режимы вплоть до DDR3-2933, именно такую DDR3 мы и захотели получить на тестирование.

Серийный выпуск оверклокерских комплектов DDR3-2933 SDRAM на данный момент освоило лишь несколько производителей. В их числе: ADATA, Corsair, Geil и G.Skill. И именно последняя компания из этого списка откликнулась на нашу просьбу предоставить нам на тесты свой флагманский продукт, благодаря чему мы и получили в распоряжение набор G.Skill TridentX F3-2933C12D-8GTXDG, состоящий из пары 4-гигабайтных высокоскоростных «планок». Рассчитана такая память на эксплуатацию при частоте 2933 МГц с номинальными таймингами 12-14-14-35-2N, однако, как мы смогли убедиться в процессе тестов, на деле она способна работать и в немного более скоростном режиме при установке Command Rate 1N.



Спецификации этого набора оверклокерской памяти выглядят следующим образом:

Двухканальный комплект состоит из двух модулей по 4 Гбайт каждый;
Номинальная частота: 2933 МГц;
Тайминги: 12-14-14-35-2N;
Рабочее напряжение 1,65 В.

Модули, входящие в рассматриваемый комплект, с двух сторон закрыты фирменными двухцветными красно-чёрными алюминиевыми теплорассеивателями серии TridentX. Особенность этих радиаторов – двухъярусная сочленённая конструкция. В отличие от многих других производителей, G.Skill вняла многочисленным жалобам пользователей на то, что высокие радиаторы плохо совмещаются с массивными процессорными кулерами. Поэтому радиаторы серии TridentX сделаны разборными. Верхняя (красная) их часть легко снимается после откручивания двух крепёжных винтов, и в «облегчённом» варианте высота модулей сокращается с 54 мм до всего лишь 39 мм. В этом случае проблем механической совместимости с массивными кулерами на CPU не возникает, а оставшейся части радиатора вполне хватает для эффективного отвода тепла от чипов памяти.



Для обеспечения простоты установки и конфигурирования модули G.Skill TridentX F3-2933C12D-8GTXDG обладают поддержкой технологии XMP 1.3. В единственном подготовленном XMP-профиле содержатся задекларированные в спецификации частота и задержки. Если же добавить к этому гибкость и простоту конфигурирования контроллера памяти процессоров Haswell, практический запуск этой памяти на частоте 2933 МГц не составляет никакого труда. Формула «воткнул - и работай» в данном случае превосходно применима. Для обеспечения стабильной работы контроллера памяти не потребуется, скорее всего, даже дополнительного увеличения каких-либо внутрипроцессорных напряжений. Впрочем, на всякий случай для обеспечения максимальной совместимости в SPD рассматриваемых модулей прописана конфигурация для разнообразных вариантов DDR3-1333.



В основе скоростной памяти G.Skill лежат весьма популярные в среде оверклокеров чипы Hynix H5TQ4G83MFR, которые смонтированы на специально разработанной восьмислойной печатной плате. Такой дизайн, отличающийся отменным разгонным потенциалом и низким тепловыделением, отлично себя зарекомендовал, и его применение в памяти, нацеленной на покорение сверхвысоких частот, вполне закономерно. Практическая проверка показала: в LGA 1150-системе комплект G.Skill TridentX F3-2933C12D-8GTXDG может превосходно работать на частоте 2933 МГц с таймингами 12-14-14-35-1N.



Надо сказать, что модули G.Skill TridentX F3-2933C12D-8GTXDG специально ориентированы на системы с процессорами Haswell, которые основываются на материнских платах на базе Intel Z87. Частота памяти DDR3-2933 МГц доступна пока лишь в таких платформах. При этом рассматриваемые модули имеют достаточно обширный список протестированных на совместимость материнских плат. Фактически, можно говорить о том, что использование такой памяти не вводит никаких ограничений на выбор материнской платы. Большинство моделей материнок средней и верхней ценовой категории всех ведущих производителей могут стабильно работать с комплектом G.Skill TridentX F3-2933C12D-8GTXDG, что является его важным преимуществом.



Фактически, единственный минус скоростных комплектов DDR3 SDRAM вроде рассматриваемого, заключается в их значительной цене. Например, набор G.Skill TridentX F3-2933C12D-8GTXDG стоит дороже аналогичного двухканального комплекта DDR3-1866 в несколько раз. Так что обоснованность выбора такого варианта с точки зрения рационального покупателя находится под большим вопросом. Это – эксклюзивное предложение для энтузиастов высокой производительности.

Описание тестовых систем

В подготовке этого материала была задействована платформа LGA 1150, построенная на современной материнской плате с набором логики Intel Z87, в которую мы устанавливали оверклокерский процессор Core i5-4670K с дизайном Haswell. Однако главная роль в исследовании зависимости производительности от настроек подсистемы памяти досталась высокоскоростному комплекту памяти G.Skill F3-2933C12D-8GTXDG стандарта DDR3-2933, предоставленному нам для этого тестирования производителем.

В целом в тестировании были задействованы следующие аппаратные и программные компоненты:

Процессор: Intel Core i5-4670K, разогнан до 4,4 ГГц (Haswell, 4 ядра, 6 Мбайт L3);
Процессорный кулер: NZXT Havik 140;
Материнская плата: Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
Память: 2x4 Гбайт, DDR3-2933 SDRAM, 12-14-14-35 (G.Skill TridentX F3-2933C12D-8GTXDG).
Графическая карта: NVIDIA GeForce GTX 780 Ti (3 Гбайт/384-бит GDDR5, 876-928/7000 МГц).
Дисковая подсистема: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Блок питания: Corsair AX760i (80 Plus Platinum, 760 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Enterprise x64 с использованием следующего комплекта драйверов:

Intel Chipset Driver 9.4.0.1027;
Intel Management Engine Driver 9.0.2.1345;
Intel Rapid Storage Technology 12.9.0.1001;
NVIDIA GeForce Driver 334.89.

Заметьте, в настоящем тестировании мы использовали разогнанный до 4,4 ГГц процессор Haswell. Дело в том, что внештатное повышение тактовой частоты дополнительно увеличивает производительность и позволяет получить более ярко выраженную картину зависимости быстродействия от параметров подсистемы памяти.

Частота против таймингов

Каждый раз, когда речь заходит об оптимальном выборе памяти, рано или поздно встаёт вопрос о том, к чему стоит стремиться в первую очередь: к повышению частоты работы подсистемы памяти или же к снижению её задержек. Однако на этот раз мы избежим подробных тестов модулей DDR3 SDRAM, отличающихся одними лишь таймингами. Дело в том, что с выходом каждой новой платформы влияние задержек на общую производительность уменьшалось, и к настоящему времени оно, пожалуй, уже прошло критическую точку. Конечно, зависимость производительности от таймингов всё ещё возможно заметить, но по сравнению с тем эффектом, который оказывает на быстродействие системы изменение частоты DDR3 SDRAM, она стала незначительной.

Тому есть две основные причины. Во-первых, с ростом частоты работы памяти её минимальная латентность в любом случае увеличивается, и на этом фоне относительная величина прибавки варьируемых задержек становится всё менее и менее заметной. Одно дело - увеличение тайминга на пару циклов с трёх-четырёх (как было в случае DDR2 SDRAM), а другое - с девяти-десяти (в случае скоростной DDR3 SDRAM). В первом случае латентность возрастает на 50-70 процентов, а во втором - лишь на 20-22 процента. Соответственно, разница между различными вариантами таймингов у современной памяти с практической точки зрения уже далеко не так существенна, как ранее. Кроме того, на потерю схемой таймингов своего первоначального значения повлияло и общее совершенствование схемы работы процессоров с памятью. Применяемое в современных процессорах многоуровневое кэширование, а также алгоритмы предварительной выборки серьёзно маскирует реальную латентность оперативной памяти, сдвигая акценты на её пропускную способность.

Собственно, отсутствие нужды в гонке за низкими таймингами у высокочастотной DDR3 SDRAM давно уже осознали производители оверклокерских комплектов памяти. Предложения с латентностью 7-8 циклов давно исчезли из продажи, и сейчас на прилавках магазинов достаточно трудно найти модули DDR3 SDRAM с параметром CAS Latency менее 9-10 циклов. Число же предложений со сверхвысокими частотами и большими задержками при этом неуклонно растёт.

Впрочем, мы бы не хотели оставлять голословными утверждения о незначительности влияния таймингов на производительность подсистемы памяти в современных платформах, построенных на процессорах Haswell. Поэтому мы провели и практическое тестирование, в рамках которого сравнили реальное быстродействие идентичных систем, укомплектованных DDR3-1600 и DDR3-1867 SDRAM с различными задержками.












Приведённые графики выступают яркой иллюстрацией всего вышесказанного. Увеличение частоты работы памяти на 266 МГц оказывается заметно более эффективным, нежели снижение всех задержек на 3-4 цикла. И даже с точки зрения реальной латентности, которая реагирует на изменение задержек наиболее чутко, DDR3-1867 с достаточно слабыми таймингами 10-10-10-29 оказывается лучше, чем отсутствующая в продаже DDR3-1600 с агрессивными задержками 7-7-7-21. Если же судить о быстродействии подсистемы памяти, опираясь на показатели реальной пропускной способности, то DDR3-1600 не может сравниться со слегка более высокочастотным вариантом вообще ни при каких обстоятельствах.

Иными словами, задержки памяти в современных системах действительно стали совсем малозначительным фактором. Поэтому при выборе DDR3 SDRAM для процессоров Haswell в первую очередь надо обращать внимание на частоту её работы, а низкая CAS Latency и прочие подобные величины практически не сказываются на реальном быстродействии. Аналогичным образом следует поступать и при настройке и разгоне системы - сначала следует бороться за повышение частоты работы DDR3 SDRAM, а уж потом, при особом желании, заниматься минимизацией задержек.

Зависимость производительности от частоты памяти

Переходим к основной части исследования, ради которой всё и затевалось: попробуем определить, насколько сильно параметры подсистемы памяти в платформе LGA 1150 влияют на быстродействие в обычных общеупотребительных приложениях. Как было показано выше, тайминги DDR3 SDRAM в современных компьютерных системах оказывают крайне незначительное влияние даже на результаты синтетических тестов. Поэтому в подробном практическом тестировании мы решили отказаться от сравнения подсистем памяти с одинаковой частотой, но разными задержками, сосредоточившись на более ценной с практической точки зрения задаче сравнения DDR3 с различной частотой. Тем более, большинство имеющихся в продаже комплектов оверклокерской памяти отличаются друг от друга одними только задержками крайне редко. Частоты же имеющейся на рынке DDR3 SDRAM в настоящее время чрезвычайно разнообразны и, желая покрыть полный спектр доступных для использования вариантов, мы протестировали систему на базе Haswell с различными типами памяти, начиная с DDR3-1333 и заканчивая DDR3-2933 SDRAM. При этом задержки устанавливались по наиболее популярной для каждой частоты схеме. Конкретнее это означает, что испытания проводились со следующими вариантами двухканальной DDR3-памяти:

DDR3-1333, 9-9-9-24-1N;
DDR3-1600, 9-9-9-24-1N;
DDR3-1866, 9-10-9-28-1N;
DDR3-2133, 11-11-11-31-1N;
DDR3-2400, 11-13-13-31-1N;
DDR3-2666, 11-13-13-35-1N;
DDR3-2933, 12-14-14-35-1N.

Кроме настроек подсистемы памяти в тестовой платформе, основанной на разогнанном до частоты 4,4 ГГц четырёхъядерном процессоре поколения Haswell, ровным счётом ничего не менялось.

Синтетические тесты

Начать мы решили с измерения практической пропускной способности и латентности. Для этого использовался бенчмарк Cache and Memory из утилиты AIDA64 4.20.2820.









Как видно из результатов, варьируя частоту работы DDR3-памяти, можно добиться почти двукратного изменения практической пропускной способности. Что, в общем-то, вполне закономерно: частота и теоретическая полоса пропускания DDR3-1333 и DDR3-2933 различается более чем в два раза. Что же вызывает некоторое удивление, это то, что зависимость результатов от частоты оказывается далеко не линейной. Наиболее быстрые режимы памяти по каким-то причинам не обеспечивают максимальную пропускную способность. Лучший результат демонстрирует DDR3-2400 и DDR3-2666. Дальнейшее же увеличение частоты влечёт за собой некоторое падение в скорости обмена данными с памятью.

Впрочем, практическая латентность изменяется немного по другому закону.



Задержки при увеличении частоты DDR3 SDRAM снижаются в любом случае, включая и переход к наиболее скоростным режимам. Таким образом, оверклокерская DDR3-2666 и DDR3-2933 может оказаться далеко не бесполезной с точки зрения быстродействия обычных приложений. Чтобы проверить это, обратимся к тестам в реальных задачах.

Комплексная производительность

Для анализа комплексной средневзвешенной производительности в общеупотребительных применениях мы использовали популярный бенчмарк Futuremark PCMark 8 2.0, а, конкретнее, его три тестовые трассы: Home, моделирующую типичную интернет-активность домашних пользователей в, плюс их работу в текстовых и графических редакторах; Work, моделирующую работу с различными офисными приложениями и в интернет; и Creative, воспроизводящую поведение продвинутых пользователей, увлекающихся серьёзной обработкой фото и видео контента, 3D-играми, а также активно использующих сеть для получения информации и общения.









Результаты получились явно не в пользу быстрых вариантов DDR3 SDRAM. В синтетических тестах памяти всё выглядело очень красиво, но Futuremark PCMark 8 2.0 рисует диаметрально противоположную картинку. Если верить показателям производительности этого теста, то правы оказываются те пользователи, которые считают, что за последние 10-15 лет скоростные параметры подсистемы памяти так и не получили достаточного значения. Отличия в производительности систем с быстрой и медленной двухканальной DDR3 SDRAM не превышают 1-2 процентов.

Однако мы не будем полагаться на один лишь только комплексный тестовый пакет и дополнительно посмотрим на скорость работы в популярных приложениях.

Тесты в приложениях

В Autodesk 3ds max 2014 мы измеряем скорость рендеринга в mental ray специально подготовленной сложной сцены.



На скорость финального рендеринга частота работы памяти оказывает крайне малозаметное влияние. Более чем двукратное увеличение пропускной способности DDR3 SDRAM позволяет получить лишь совсем несерьёзное преимущество на уровне одного процента.

Производительность в новом Adobe Premiere Pro CC тестируется измерением времени рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.



А вот тут, при обработке видеоконтента высокого разрешения, ситуация складывается уже совсем иначе. Разница в производительности системы с DDR3-1333 и с DDR3-2933 достигает 8 процентов, и незаметной её назвать никак нельзя. Иными словами, среди современных задач существуют и такие, для которых скорость памяти играет весьма заметное значение.

Кстати, если посмотреть на результаты более подробно, то становится очевидно, что наиболее выгодный для Premiere Pro тип памяти – это DDR3-2400. Дальнейшее повышение частоты уже не влечёт за собой заметного роста быстродействия, а вот цены на комплекты DDR3-2666 и DDR3-2933, напротив, заметно выше, чем у более медленных продуктов.

Измерение производительности в новом Adobe Photoshop CC мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, включающий типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.



К числу приложений, чутко реагирующих на параметры подсистемы памяти, можно отнести и Photoshop. Платформа, снабжённая высокоскоростной двухканальной DDR3-2933 SDRAM, превосходит по скорости работы аналогичную платформу с DDR3-1333 на 12 процентов. Преимущество же «оптимального выбора», DDR3-2400 над повсеместно распространённой DDR3-1600 также хорошо заметно: оно достигает 8 процентов.

Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR 5.0, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1,7 Гбайт.



Архивация файлов – такая задача, в которой можно было наблюдать хорошую масштабируемость производительности в зависимости от частоты памяти и ранее, в эпоху популярности процессоров под разъёмы LGA 1155, LGA 1156 и даже LGA 775. Ничего не изменилось и сейчас. Каждый 266-мегагерцовый шаг в частоте DDR3 SDRAM увеличивает скорость работы архиватора WinRAR на 3-4 процента. В целом же, DDR3-2933 позволяет процессору Haswell достичь на 23 процента более высокой производительности, чем в том случае, когда в системе установлена DDR3-1333.

Для оценки скорости перекодирования видео в формат H.264 использовался тест x264 FHD Benchmark 1.0.1 (64bit), основанный на измерении времени кодирования кодером x264 исходного видео в формат MPEG-4/AVC с разрешением 1920x1080@50fps и настройками по умолчанию. Следует отметить, что результаты этого бенчмарка имеют огромное практическое значение, так как кодер x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч. Мы периодически обновляем кодер, используемый для измерений производительности, и в данном тестировании приняла участие версия r2389, в которой реализована поддержка всех современных наборов инструкций, включая и AVX2.



А вот при транскодировании видео высокого разрешения масштабируемость производительности в зависимости от параметров подсистемы памяти не столь заметна. Преимущество DDR3-2400 над общеупотребительной DDR3-1600 составляет всего 3 процента, в то время как один 266-мегагерцовый шаг в частоте памяти позволяет добиться ускорения выполнения перекодирования примерно на 1 процент. Причём, после повышения частоты памяти за 2400-мегагерцовую отметку рост производительности становится ещё более неуловимым.

Игровая производительность

Самая интересная часть нашего тестирования – измерение игровой производительности. Дело в том, что современные 3D-игры относятся к числу задач, нуждающихся в быстрой памяти, и мы ожидаем, что при игровом использовании быстрая память сможет раскрыть свои преимущества в полной мере.

В то же время, производительность актуальных высокопроизводительных платформ в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании мы выбирали наиболее процессорозависимые игры, а измерение количества кадров провели дважды. Первым проходом тесты выполнялись без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки дают возможность оценить то, насколько нужна быстрая память игровым системам в принципе. То есть, позволяют строить догадки о том, как будут вести себя платформы с различной DDR3 SDRAM в будущем, когда на рынке появятся более быстрые варианты графических ускорителей. Второй же проход измерения производительности выполнялся с реалистичными установками – при выборе FullHD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд такие результаты не менее интересны, так как они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности можно получить прямо сейчас – в современных условиях.












При измерении частоты кадров в 3D-играх с установкой пониженного разрешения оказывается, что современные шутеры легко можно отнести к числу задач, чрезвычайно отзывчивых к производительности подсистемы памяти. Как видно по результатам, одна лишь частота работы памяти может повысить производительность на треть – именно такая ситуация наблюдается в новом Thief. В других играх влияние памяти менее выражено, но, тем не менее, среднее различие в производительности основанной на Haswell платформы с медленной DDR3-1333 и оверклокерской DDR3-2933 составляет порядка 20 процентов. Иными словами, увеличение частоты DDR3 SDRAM на каждые 266 МГц увеличивает игровую производительность на 2-3 процента.

Впрочем, столь впечатляющая масштабируемость получена во многом благодаря тому, что мы целенаправленно разгрузили графическую подсистему. Если же в играх выставлять максимальные настройки качества, то картина будет такой.












Здесь влияние скорости памяти на производительность выражено гораздо менее явно. Если раньше различие в быстродействии систем с быстрой и медленной памятью доходило до десятков процентов, то выбор высокого качества изображения снижает максимальный прирост примерно на порядок. Впрочем, на примере Thief можно сделать вывод, что такая ситуация свойственна далеко не любым играм. Существуют ситуации, в которых частота DDR3-памяти может заметно повлиять на производительность и в режимах с максимальными настройками качества. Таким образом, бескомпромиссные геймеры, стремящиеся выжать максимум из своих систем, не должны пренебрегать скоростной памятью. Ситуации, когда именно эта составляющая платформы сможет оказать заметное влияние на производительность, отнюдь не невероятны.

Выводы

Производительность современных систем, построенных на процессорах поколения Haswell, продемонстрировала достаточно заметную зависимость от параметров подсистемы памяти, и в первую очередь, от частоты используемых модулей. Со всей определённостью можно сказать о том, что эпоха, когда параметры памяти практически ни на что не влияли, уже прошла. Сегодня одним только подбором характеристик установленных в системе планок DDR3 SDRAM можно увеличить скорость работы на 20-30 процентов.

Правда, столь явное влияние на быстродействие в приложениях скорость подсистемы памяти оказывает далеко не всегда. Среди распространённых задач, решаемых персональными компьютерами, есть как малочувствительные к производительности памяти, так и такие, для которых быстрая DDR3 SDRAM более чем важна. Обобщая результаты тестов можно сказать, что задумываться о выборе скоростных комплектов модулей DDR3 SDRAM стоит в двух случаях: либо при комплектовании игровых систем, либо при сборке домашних рабочих станций, направленных на обработку изображений и видео высокого разрешения.

При этом основное внимание в выборе памяти для LGA 1150-платформ верхнего уровня следует уделить частоте (естественно, после принятия взвешенного решения о необходимом объёме), а не задержкам. Представленные на прилавках магазинов комплекты DDR3 SDRAM мало отличаются по латентностям, зато их частоты различаются более чем вдвое. И это неспроста. Как показывает практика, именно частота DDR3 SDRAM оказывает первоочередное влияние на производительность.

Современные системы, построенные на процессорах Haswell, хорошо подготовлены для работы с высокоскоростной DDR3. Тактование памяти на частоте вплоть до 2933 МГц не вызывает никаких проблем и не требует каких-либо ухищрений в настройке. Поэтому такую память вполне можно было бы рекомендовать всем энтузиастам, если бы не одно но. Высокочастотная память несусветно дорога, поэтому заинтересовать она может разве только тех редких покупателей, которые не имеют никаких ограничений по бюджету. С точки же зрения здравого смысла наиболее интересным вариантом для высокопроизводительных систем имеет все шансы стать DDR3-2400 SDRAM. Оверклокерская наценка на такую память не слишком высока, а прирост быстродействия по сравнению со стандартными вариантами вроде DDR3-1600 она обеспечивает очень достойный. Более того, дальнейший рост частоты памяти, как показывают тесты, даёт заметно меньший эффект, но вот цена после перехода через 2400-мегагерцовую отметку взлетает астрономически.

Основные характеристики оперативной памяти (ее объем, частота, принадлежность к одному из поколений) могут быть дополнены еще одним важнейшим параметром - таймингами. Что они представляют собой? Можно ли их изменять в настройках BIOS? Как это делать наиболее корректным, с точки зрения стабильной работы компьютера, образом?

Что такое тайминги ОЗУ?

Тайминг оперативной памяти - это временной интервал, за который команда, отправляемая контроллером ОЗУ, выполняется. Измеряется эта единица в количестве тактов, которые пропускаются вычислительной шиной, пока идет обработка сигнала. Сущность работы таймингов проще понять, если разобраться в устройстве микросхем ОЗУ.

Оперативная память компьютера состоит из большого количества взаимодействующих ячеек. Каждая имеет свой условный адрес, по которому к ней обращается контроллер ОЗУ. Координаты ячеек, как правило, прописываются посредством двух параметров. Условно их можно представить как номера строк и столбцов (как в таблице). В свою очередь, группы адресов объединяются, чтобы контроллеру было "удобнее" находить конкретную ячейку в более крупную область данных (иногда ее называют "банком").

Таким образом, запрос к ресурсам памяти осуществляется в две стадии. Сначала контроллер отправляет запрос к "банку". Затем он запрашивает номер "строки" ячейки (посылая сигнал типа RAS) и ждет ответа. Длительность ожидания - это и есть тайминг оперативной памяти. Его общепринятое наименование - RAS to CAS Delay. Но это еще не все.

Контроллеру, чтобы обратиться к конкретной ячейке, нужен также и номер приписанного к ней "столбца": посылается другой сигнал, типа CAS. Время, пока контроллер ждет ответа, - это тоже тайминг оперативной памяти. Он называется CAS Latency. И это еще не все. Некоторые IT-специалисты предпочитают интерпретировать такое явление, как CAS Latency, несколько иначе. Они полагают, что этот параметр указывает, сколько должно пройти единичных тактов в процессе обработки сигналов не от контроллера, а от процессора. Но, как отмечают эксперты, речь в обоих случаях, в принципе, идет об одном и том же.

Контроллер, как правило, работает с одной и той же "строкой", на которой расположена ячейка, не один раз. Однако, прежде чем обратиться к ней повторно, он должен закрыть предыдущую сессию запроса. И только после этого возобновлять работу. Временной интервал между завершением и новым вызовом строки - это тоже тайминг. Называется он RAS Precharge. Уже третий по счету. На этом все? Нет.

Поработав со строкой, контроллер должен, как мы помним, закрыть предыдущую сессию запроса. Временной интервал между активацией доступа к строке и его закрытием - это тоже тайминг оперативной памяти. Его наименование - Active to Precharge Delay. В принципе, теперь все.

Мы насчитали, таким образом, 4 тайминга. Соответственно, записываются они всегда в виде четырех цифр, например, 2-3-3-6. Кроме них, к слову, есть еще один распространенный параметр, которым характеризуется оперативная память компьютера. Речь идет о значении Command Rate. Оно показывает, какое минимальное время тратит контроллер на то, чтобы переключиться от одной команды к другой. То есть, если для CAS Latency значение - 2, то временная задержка между запросом от процессора (контролера) и ответом модуля памяти составит 4 такта.

Тайминги: порядок расположения

Каков порядок расположения в этом числовом ряду каждого из таймингов? Он практически всегда (и это своего рода отраслевой "стандарт") таков: первая цифра - это CAS Latency, вторая - RAS to CAS Delay, третья - RAS Precharge и четвертая - Active to Precharge Delay. Как мы уже сказали выше, иногда используется параметр Command Rate, его значение пятое в ряду. Но если для четырех предыдущих показателей разброс цифр может быть достаточно большим, то для CR возможно, как правило, только два значения - T1 или T2. Первый означает, что время с момента, когда память активируется, до наступления ее готовности отвечать на запросы должен пройти 1 такт. Согласно второму - 2.

О чем говорят тайминги?

Как известно, объем ОЗУ - один из ключевых показателей производительности этого модуля. Чем он больше - тем лучше. Другой важный параметр - это частота оперативной памяти. Здесь тоже все однозначно. Чем она выше, тем ОЗУ будет работать быстрее. А что с таймингами?

В отношении них закономерность иная. Чем меньше значения каждого из четырех таймингов - тем лучше, тем производительнее память. И тем быстрее, соответственно, работает компьютер. Если у двух модулей с одинаковой частотой разные тайминги оперативной памяти, то и их производительность будет отличаться. Как мы уже определили выше, нужные нам величины выражаются в тактах. Чем их меньше, тем, соответственно, быстрее процессор получает ответ от модуля ОЗУ. И тем скорее он может "воспользоваться" такими ресурсами, как частота оперативной памяти и ее объем.

"Заводские" тайминги или свои?

Большинство пользователей ПК предпочитает использовать те тайминги, которые установлены еще на конвейере (либо в опциях материнской платы выставлена автонастройка). Однако на многих современных компьютерах есть возможности для того, чтобы выставить нужные параметры вручную. То есть, если нужны более низкие значения - их, как правило, можно проставить. Но как изменить тайминги оперативной памяти? Причем сделать это так, чтобы система работала стабильно? А еще, быть может, есть случаи, при которых лучше выбрать увеличенные значения? Как выставить тайминги оперативной памяти оптимальным образом? Сейчас мы попробуем дать ответы на эти вопросы.

Настраиваем тайминги

Заводские значения таймингов прописываются в специально отведенной области микросхемы ОЗУ. Называется она SPD. Используя данные из нее, система BIOS адаптирует оперативную память к конфигурации материнской платы. Во многих современных версиях BIOS настройки таймингов, выставленные по умолчанию, можно корректировать. Практически всегда это осуществляется программным методом - через интерфейс системы. Изменение значений как минимум одного тайминга доступно в большинстве моделей материнских плат. Есть, в свою очередь, производители, которые допускают тонкую настройку модулей ОЗУ при задействовании гораздо большего количества параметров, чем четыре указанных выше типа.

Чтобы войти в область нужных настроек в BIOS, нужно, зайдя в эту систему (клавиша DEL сразу после включения компьютера), выбрать пункт меню Advanced Chipset Settings. Далее в числе настроек находим строку DRAM Timing Selectable (может звучать несколько по-другому, но похоже). В нем отмечаем, что значения таймингов (SPD) будут выставляться вручную (Manual).

Как узнать тайминг оперативной памяти, установленный в BIOS по умолчанию? Для этого мы находим в соседствующих настройках параметры, созвучные CAS Latency, RAS to CAS, RAS Precharge и Active To Precharge Delay. Конкретные значения таймингов, как правило, зависят от типа модулей памяти, установленных на ПК.

Выбирая соответствующие опции, можно задавать значения таймингов. Эксперты рекомендуют понижать цифры очень постепенно. Следует, выбрав желаемые показатели, перезагружаться и тестировать систему на предмет устойчивости. Если компьютер работает со сбоями, нужно вернуться в BIOS и выставить значения на несколько уровней выше.

Оптимизация таймингов

Итак, тайминги оперативной памяти - какие лучше значения для них выставлять? Почти всегда оптимальные цифры определяются в ходе практических экспериментов. Работа ПК связана не только с качеством функционирования модулей ОЗУ, и далеко не только скоростью обмена данными между ними и процессором. Важны многие другие характеристики ПК (вплоть до таких нюансов, как система охлаждения компьютера). Поэтому практическая результативность изменения таймингов зависит от конкретной программно-аппаратной среды, в которой пользователь производит настройку модулей ОЗУ.

Общую закономерность мы уже назвали: чем ниже значения таймингов, тем выше скорость работы ПК. Но это, конечно, идеальный сценарий. В свою очередь, тайминги с пониженными значениями могут пригодиться при "разгоне" модулей материнской платы - искусственном завышении ее частоты.

Дело в том, что если придать микросхемам ОЗУ ускорение в ручном режиме, задействовав слишком большие коэффициенты, то компьютер может начать работать нестабильно. Вполне возможен сценарий, при котором настройки таймингов будут выставлены настолько некорректно, что ПК и вовсе не сможет загрузиться. Тогда, скорее всего, придется "обнулять" настройки BIOS аппаратным методом (с высокой вероятностью обращения в сервисный центр).

В свою очередь, более высокие значения для таймингов могут, несколько замедлив работу ПК (но не настолько, чтобы скорость функционирования была доведена до режима, предшествовавшего "разгону"), придать системе стабильности.

Некоторыми IT-экспертами подсчитано, что модули ОЗУ, обладающие CL в значении 3, обеспечивают примерно на 40 % меньшую задержку в обмене соответствующими сигналами, чем те, где CL равен 5. Разумеется, при условии, что тактовая частота и на том, и на другом одинаковая.

Дополнительные тайминги

Как мы уже сказали, в некоторых современных моделях материнских плат есть возможности для очень тонкой настройки работы ОЗУ. Речь, конечно, не идет о том, как увеличить оперативную память - этот параметр, безусловно, заводской, и изменению не подлежит. Однако в предлагаемых некоторыми производителями настройках ОЗУ есть очень интересные возможности, задействуя которые, можно существенно ускорить работу ПК. Мы же рассмотрим те, что относятся к таймингам, которые можно конфигурировать в дополнение к четырем основным. Важный нюанс: в зависимости от модели материнской платы и версии BIOS, названия каждого из параметров могут отличаться от тех, которые мы сейчас приведем в примерах.

1. RAS to RAS Delay

Этот тайминг отвечает за задержку между моментами, когда активизируются строки из разных областей консолидации адресов ячеек ("банков" то есть).

2. Row Cycle Time

Этот тайминг отражает временной интервал, в течение которого длится один цикл в рамках отдельной строки. То есть от момента ее активизации до начала работы с новым сигналом (с промежуточной фазой в виде закрытия).

3. Write Recovery Time

Данный тайминг отражает временной интервал между двумя событиями - завершением цикла записи данных в память и началом подачи электросигнала.

4. Write To Read Delay

Данный тайминг показывает, сколько должно пройти времени между завершением цикла записи и моментом, когда начинается чтение данных.

Во многих версиях BIOS также доступен параметр Bank Interleave. Выбрав его, можно настроить работу процессора так, чтобы он обращался к тем самым "банкам" ОЗУ одновременно, а не по очереди. По умолчанию этот режим функционирует автоматически. Однако можно попробовать выставить параметр типа 2 Way или 4 Way. Это позволит задействовать 2 или 4, соответственно, "банка" одновременно. Отключение режима Bank Interleave используется довольно редко (это, как правило, связано с диагностикой ПК).

Настройка таймингов: нюансы

Назовем некоторые особенности, касающиеся работы таймингов и их настройки. По мнению некоторых IT-специалистов, в ряду из четырех цифр наибольшее значение имеет первая, то есть тайминг CAS Latency. Поэтому, если у пользователя немного опыта в "разгоне" модулей ОЗУ, эксперименты, возможно, следует ограничить выставлением значений только для первого тайминга. Хотя эта точка зрения не является общепринятой. Многие IT-эксперты склонны считать, что три других тайминга не менее значимы с точки зрения скорости взаимодействия между ОЗУ и процессором.

В некоторых моделях материнских плат в BIOS можно настроить производительность микросхем оперативной памяти в нескольких базовых режимах. По сути, это выставление значений таймингов по шаблонам, допустимым с точки зрения стабильной работы ПК. Эти опции обычно соседствуют с параметром Auto by SPD, а режимы, о которых идет речь, - Turbo и Ultra. Первый подразумевает умеренное ускорение, второй - максимальное. Эта возможность может быть альтернативой выставлению таймингов вручную. Похожие режимы, к слову, есть во многих интерфейсах усовершенствованной системы BIOS - UEFI. Во многих случаях, как отмечают эксперты, при включении опций Turbo и Ultra достигается в достаточной мере высокая производительность ПК, а его работа при этом стабильна.

Такты и наносекунды

Реально ли выразить тактовые циклы в секундах? Да. И для этого существует очень простая формула. Такты в секундном выражении считаются делением единицы на фактическую тактовую частоту ОЗУ, указываемую производителем (правда, этот показатель, как правило, нужно делить на 2).

То есть, например, если мы хотим узнать такты, формирующие тайминги оперативной памяти DDR3 или 2, то мы смотрим на ее маркировку. Если там указана цифра 800, то фактическая частота ОЗУ будет равна 400 МГЦ. Это значит, что длительность такта составит значение, получаемое в результате деления единицы на 400. То есть 2,5 наносекунды.

Тайминги для модулей DDR3

Одни из самых современных модулей ОЗУ - микросхемы типа DDR3. Некоторые специалисты считают, что в отношении них такие показатели, как тайминги, имеют гораздо меньшее значение, чем для чипов предыдущих поколений - DDR 2 и более ранних. Дело в том, что эти модули, как правило, взаимодействуют с достаточно мощными процессорами (такими как, например, Intel Core i7), ресурсы которых позволяют не столь часто обращаться к ОЗУ. Во многих современных чипах от Intel, так же, как и в аналогичных решениях от AMD, есть достаточная величина собственного аналога ОЗУ в виде L2- и L3-кэша. Можно сказать, что у таких процессоров есть свой объем оперативной памяти, способный выполнять значительный объем типовых для ОЗУ функций.

Таким образом, работа с таймингами при использовании модулей DDR3, как мы выяснили, - не самый главный аспект "разгона" (если мы решим ускорить производительность ПК). Гораздо большее значение для таких микросхем имеют как раз-таки параметры частоты. Вместе с тем, модули ОЗУ вида DDR2 и даже более ранних технологических линеек сегодня все еще ставятся на компьютеры (хотя, конечно, повсеместное использование DDR3, по оценке многих экспертов, - более чем устойчивый тренд). И потому работа с таймингами может пригодиться очень большому количеству пользователей.