Студентам > Курсовые > Новые технологии в организации PC
Новые технологии в организации PCСтраница: 2/6
1. шина
способна передавать два блока данных за один 66 MHz цикл (AGP 2x);
2. устранена
мультиплексированность линий адреса и данных (напомню, что в PCI для
удешевления конструкции адрес и данные передавались по одним и тем же линиям);
3. дальнейшая
конвейеризация операций чтения/записи, по мнению разработчиков, позволяет
устранить влияние задержек в модулях памяти на скорость выполнения этих
операций.
В результате пропускная способность шины была оценена в 500
МВ/сек, и предназначалась она для того, чтобы видеокарты хранили текстуры в
системной памяти, соответственно имели меньше памяти на плате, и,
соответственно, дешевели.
Парадокс в том, что видеокарты все-таки предпочитают иметь
БОЛЬШЕ памяти, и ПОЧТИ НИКТО не хранит текстуры в системной памяти, поскольку
текстур такого объема пока (подчеркиваю - пока) практически нет. При этом в
силу удешевления памяти вообще, карты особенно и не дорожают. Однако
практически все считают, что будущее - за AGP, а бурное развитие
мультимедиа-приложений (в особенности - игр) может скоро привести к тому, что
текстуры перестанут влезать и в системную память. Поэтому имеет смысл, особо не
вдаваясь в технические подробности, рассказать, как же это все работает.
Итак,
начнем с начала, то есть с AGP 1.0. Шина имеет два основных режима работы:
Execute и DMA. В режиме DMA основной памятью является память карты. Текстуры
хранятся в системной памяти, но перед использованием (тот самый execute)
копируются в локальную память карты. Таким образом, AGP действует в качестве
"тыловой структуры", обеспечивающей своевременную "доставку
патронов" (текстур) на передний край (в локальную память). Обмен ведется
большими последовательными пакетами.
В режиме Execute локальная и системная память для
видеокарты логически равноправны. Текстуры не копируются в локальную память, а
выбираются непосредственно из системной. Таким образом, приходится выбирать из
памяти относительно малые случайно расположенные куски. Поскольку системная
память выделяется динамически, блоками по 4К, в этом режиме для обеспечения
приемлемого быстродействия необходимо предусмотреть механизм, отображающий
последовательные адреса на реальные адреса 4-х килобайтных блоков в системной
памяти. Эта нелегкая задача выполняется с использованием специальной таблицы
(Graphic Address Re-mapping Table или GART), расположенной в памяти.
При этом адреса, не попадающие в диапазон GART (GART range),
не изменяются и непосредственно отображаются на системную память или область
памяти устройства (device specific range). На рисунке в качестве такой области
показан локальный фрейм-буфер карты (Local Frame Buffer или LFB). Точный вид и
функционирование GART не определены и зависят от управляющей логики карты.
Шина AGP полностью поддерживает операции шины PCI, поэтому
AGP-траффик может представлять из себя смесь чередующихся AGP и PCI операций
чтения/записи. Операции шины AGP являются раздельными (split). Это означает,
что запрос на проведение операции отделен от собственно пересылки данных.
Такой подход позволяет AGP-устройству генерировать очередь
запросов, не дожидаясь завершения текущей операции, что также повышает
быстродействие шины.
В 1998 году спецификация шины AGP получила дальнейшее
развитие - вышел Revision 2.0. В результате использования новых низковольтных
электрических спецификаций появилась возможность осуществлять 4 транзакции
(пересылки блока данных) за один 66-мегагерцовый такт (AGP 4x), что означает
пропускную способность шины в 1GB/сек! Единственное, чего не хватает для
полного счастья, так это чтобы устройство могло динамически переключаться между
режимами 1х, 2х и 4х, но с другой стороны, это никому и не нужно.
Однако потребности и запросы в области обработки
видеосигналов все возрастают, и Intel готовит новую спецификацию - AGP Pro (в
настоящее время доступен Revision 0.9) - направленную на удовлетворение
потребностей высокопроизводительных графических станций. Новый стандарт не
видоизменяет шину AGP. Основное направление - увеличение энергоснабжения
графических карт. С этой целью в разъем AGP Pro добавлены новые линии питания.
Предполагается,
что будет существовать два типа карт AGP Pro - High Power и Low Power. Карты
High Power могут потреблять от 50 до 110W. Естественно, такие карты нуждаются в
хорошем охлаждении. С этой целью спецификация требует наличия двух свободных
слотов PCI с component side (стороны, на которой размещены основные чипы)
карты.
При этом данные слоты могут использоваться картой как
дополнительные крепления, для подвода дополнительного питания и даже для обмена
по шине PCI! При этом на использование этих слотов накладываются лишь незначительные
ограничения.
При
использовании слотов для подвода дополнительного питания:
· Не использовать для питания линии V I/O;
· Не устанавливать линию M66EN (контакт 49В) в GND (что вполне
естественно, так как это переводит шину PCI в режим 33 MHz).
При
использовании слота для обмена по шине:
· Подсистема PCI I/O должна разрабатываться под напряжение 3.3V c
возможностью функционирования при 5 V.
Поддержка
64-разрядного или 66 MHz режимов не требуется.
Карты Low Power могут потреблять 25-50W, поэтому для
обеспечения охлаждения спецификация требует наличия одного свободного слота
PCI.
При этом все retail-карты AGP Pro должны иметь специальную
накладку шириной соответственно в 3 или 2 слота, при этом карта приобретает вид
достаточно устрашающий.
При
этом в разъем AGP Pro можно устанавливать и карты AGP.
3. Registered DIMM SDRAM
Я думаю, что все знают, что модули оперативной памяти
обычного компьютера вставлена в разьёмы SIMM или DIMM. Есть также ещё пока мало
распространённые RIMM, ну а про RDIMM совсем мало, что слышно.
Для начала надо сказать, что разработчиком памяти стандарта
RDIMM являются IBM и Intel. Модули памяти для RDIMM SDRAM поддерживаются
чипсетом BX, соответсвуют спецификации PC-100 и являются усовершенствованными,
а точнее Регистровыми (Registered) DIMM SDRAM . Основное отличие RDIMM от
обычных DIMM SDRAM заключается в пропускной способности (bandwith): 800 и 1600
Мбайт/сек (последняя цифра особенно нравится, так как первой уже наступают на
пятки мощные 3D-приложения) и называются соответсвенно SDR (Single Data Rate) и
DDR (Dual Data Rate) RDIMM SDRAM. Не путать DDR SDRAM с DR DRAM (отличается
работой на чаcтототе до 800 MHz, выйдет во 2 квартале и будет дороже за счёт
обязательного лицензирования).
Итак, IBM анонсировала модули такой памяти обьёмом 256
Мбайт, сделанной по технологии 0.20 мкм и имеющие плотность чипов в 4 раза
больше, чем у обычных, что сделало возможным создание буферизированного 256
Мбайтного модуля памяти. Кстати, по заявлению той же IBM нет никаких преград
для увеличения плотности записи в 8 раз выше обычной, а значит, есть
теоритическая возможность создания буферизированных 512 Мбайтных модулей.
Теперь рассмотрим архитектуру DDR RDIMM SDRAM на примере 64
Мбайтных модулей. Для осуществления эффективного ввода/вывода данных
устанавливаются конденсаторы (рядом с каждым чипом). Эти конденсаторы сделаны
из новейших диэллектрических материалов. Сама IBM уже применяет модули RDIMM
64-256 Мбайт, а также небуферизированные модули обьемом 512 Мбайт в своих
Hi-End системах серии Netfiniti.
<TBODY>
|
SDR RDIMM
|
DDR RDIMM
|
Время
прерывания (циклов) (Burst length )
|
2,
4, 8
|
2,
4, 8
|
Тип
прерывания (Burst type)
|
Последовательное
чередование (sequential interleave)
|
последовательное
чередование (sequential interleave)
|
Число
тактов для работы с памятью (CAS latency)
|
2,
3, 4
|
2,
2.5, 3
|
Режим
работы
|
Нормальный,
Режим записи (single write), Режим тестирования (test mode)
|
Нормальный,
Режим сброса операций DLL, Режим тестирования (test mode), Режим расширенного
регистрирования (Extended register mode set), Включение/выключение операций
DLL</TBODY>
|
Из таблицы мы видим, что SDR является упрощенным вариантом
DDR RDIMM SDRAM. Особенности DDR заключаются в следующем:
· Работа на частоте 125, 133 и 143 MHz за 2, 2,5 и 3 такта (CAS
latency = 3), в зависимости от разновидности модулей
· Однотактовое формирование сигнала RAS (Signal-pulsed RAS
interface)
· Встроенный блок DLL (Delay Locked Loop), который синхронизирует
вывод информации с частотой ее ввода
· Возможность отключения блока DLL через функцию расширенного
режима регистрирования (например для экономии питания)
· Удвоенная скорость обмена данных (DDR)
· Двунаправленный поток данных
· Полная синхронизация
· Программируемый тип и длина прерываний
· Прерывание операций чтения (специальной командой прерывания) и
записи. Смена операций осуществляется последовательно
· Четыре банка (Bank) памяти
· Способность работы при пониженном потреблении питания
· Операции чтения и записи выполняются за 4 и 8 циклов
(соответственно), операция контроля затрачивает удвоенное количество циклов на
соответствующую операцию
· Произвольный доступ к столбцам (в памяти)
· Ждущий режим и режим пониженного питания
· 4096/8192 циклов обновления для 64 и 256 мб модулей
· Автоматические, контролируемые команды дозарядки (Automatic and controlled precharge command). Энергия,
подаваемая на модуль памяти может быть неодинаковой.
· Вольтаж: 3,3В
Данный набор характеристик не является окончательным
перечнем характеристик DDR SDRAM для RDIMM, а потому может быть модифицирован в
будущих стандартных DDR SDRAM, однако благодаря таким нововведения получаем:
проускная способность на пин составляет 200 Мбайт (200Мбайт/пин).
4. Новые технологии памяти: DDR SDRAM
Уже давно, еще со времен 486 процессоров, отставание
скорости системной шины PC от скорости убыстряющихся CPU все более
увеличивалось. Именно тогда Intel впервые отказался от частоты процессоров,
синхронной с частотой системной шины, и применил технологию умножения частоты
FSB. Этот факт отразился даже в названии - 486DX2. Хотя частота системной шины
осталась той же, несмотря на название, производительность процессора выросла
почти вдвое.
В дальнейшем разброд в тактовой частоте различных системных
компонентов только увеличивался: в то время, как частота системной шины выросла
сначала до 66 МГц, а затем и до 100, шина PCI осталась все на тех же давних 33
МГц, для AGP стандартной является 66 МГц и т.д. Шина памяти же до самого
последнего времени оставалась синхронной с системной шиной (название обязывает
- Synchronous DRAM, SDRAM). - Так появились спецификации PC66, затем PC100,
потом, с несколько большими организационными усилиями, PC133 SDRAM.
Однако за то время, за которое частота шины памяти
увеличилась на треть и, соответственно, на столько же возросла ее пропускная
способность (с 800 Мбайт/с до 1,064 Мбайт/с), частота процессоров увеличилась в
два с половиной раза - с 400 МГц до 1 ГГц. Наблюдается некоторый дисбаланс, не
так ли? Пропускная способность PC133 SDRAM составляет лишь 1,064 Мбайт/с, тогда
как сегодняшним PC требуется по крайней мере: 1 Гбайт/с для процессора с
частотой системной шины 133 МГц, столько же - для графической шины AGP 4X, 132
Мбайт/с для 33 МГц шины PCI. То есть, около 2.1 Гбайт/с - как и говорилось
только что, дисбаланс более чем в два раза.
Однако дальнейшее увеличение частоты SDRAM при современном
техническом уровне оснащения ее производителей невозможно: уже 166 МГц SDRAM
получается слишком дорогой, особенно с учетом сегодняшних объемов оперативной
памяти в PC. Этот момент сыграл не слишком приятную шутку с Direct Rambus DRAM.
В то же время отказываться от синхронизации шины памяти с системной шиной по
ряду причин не хотелось бы.
Технологии, пытающиеся залатать SDRAM путем добавления кэша
SRAM, вроде ESDRAM, или же путем оптимизации ее работы, вроде VCM SDRAM, не
помогли. На выручку пришла популярная в последнее время в компонентах PC
технология передачи данных одновременно по двум фронтам сигнала, когда за один
такт передаются сразу два пакета данных. В случае с используемой сегодня 64-бит
шиной - это два 8-байтных пакета, 16 байт за такт. Или, в случае с той же 133
МГц шиной, уже не 1,064, а 2,128 Мбайт/с. Те самые 2.1 Гбайт/с, что и требуются
для сегодняшних PC.
Причем
по цене, мало отличающейся от обычной 133 МГц памяти: технология та же (включая
методику упаковки чипов - TSOP, не microBGA, как у RDRAM), оборудование - то
же, энергопотребление, практически не отличающееся от SDRAM, площадь чипа
отличается лишь на несколько процентов. Именно это сочетание доступности с
требующейся на сегодняшний день производительностью и заинтересовало в первую
очередь прагматичную индустрию DRAM - точно так же в свое время они выбирали
PC66, PC100, PC133…
Однако в отличие от этих спецификаций, в название которых
входила тактовая частота шины памяти, так же, как и в отличие от спецификации
Direct Rambus DRAM, где за основу берется результирующая частота (тактовая
частота, помноженная на те же два пакета на такт, что и у DDR SDRAM) - PC600,
PC700, PC800, компании, разрабатывавшие DDR SDRAM, а точнее, маркетинговые
отделы этих компаний, избрали ту систему (помните мультфильм про
относительность единиц измерения - 48 попугаев?), которая позволила получить
максимальную цифру в названии - они выбрали пиковую пропускную способность и
получили PC1600 для 100 МГц и PC2100 для 133 МГц чипов DDR SDRAM.
|