Процессоры AMD Bulldozer !

aleks-as · 17.10.2011

DeathMaster сказав(ла):
Thuban ~1 млрд транзисторов, 6 полноценных ядер, 294mm2, 45нм
Bulldozer ~2 млрд транзисторов, 8 неполноценных ядер,315mm2, 32нм
т.е ядер больше на 33% (и то неполноценных), транзисторов в 2 раза, площадь кристалла примерно одинаковая, но все равно больше...

А проиводительность одинаковая.

Ожидали, по крайней мере, что не будет деградации

в двух или трех тестах одинаковая? а так лучше вникай в статью......

DeathMaster · 17.10.2011

aleks-as сказав(ла):
в двух или трех тестах одинаковая? а так лучше вникай в статью......

сам вникай. В то, что написали разные источники по всему миру. Отдельно взятый есет + отдельно взятый архиватор рар, а остальное в жопе = заебись?

turboracer · 17.10.2011

aleks-as

Да бульбозерами особо не побарыжишь процы гауно получились, одна надежда на дешевый 4х ядерник в ровне с и3

DeathMaster · 17.10.2011

ой, совсем забыл. еще частота ядер выше. Щаз подправлю пост

_Maxik_ · 17.10.2011

⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.

Второе пришествие? Молитесь, АМД фаны! И да порвёт ~~тузик~~ булль ~~грелку~~ сандик!

anatolikostis · 17.10.2011

хотелось бы, а то хочется айвы по-дешевле...

diocilis сказав(ла):
anatolikostis у буля есть несколько системных дыр, которые надо затыкать компилятором или руками. О них даже говорили сами АМД-шники.
в первую очередь это касается распараллеливания и операций с плавающей точкой. Есть, так-же дыры, которые заложены в идеологию

Тут дело вот в чем.
1 модуль бульдозера состоит из двух независимых блоков для работы с целыми числами и одного широкого (256 бит) блока, который предназначен для работы с плавающей точкой и который может делиться на 2 части, если идет вычисление сразу с двух полуядер
см. рисунок
https://www.***************/images/news/2009/11/12/bulldozer_01.gif
и вот таких модулей - ровно 4 штуки. Обмениваются они (модули) друг с другом через кэш третьего уровня (который не быстр) или через память, которая еще медленнее. Однако при выполнении одной распараллелиной задачи относимой к одной программе, полуядра могут общаться через общий l2. Это самая оптимальная ситуация, для двухпоточных программ

например
Программа выполняет 2 процесса, которые попадают на ядро А1 и А2, тогда эти полуядра молотят данные из общего кэша второго уровня. если-же планировщик кидает процесс на ядра А1 и В1 то обмен данными уже идет через Л3 и всё это начинает тормозить. Т.е. Планировщик должен разбирать какая программа выполняется и закидывать её на соседние "полуядра". Помимо всего

Еще одна проблема, которая пока не сильно заметна, но которая проявится на бульдозерах в будущем.
Исполнение широких AVX (256 бит) возможно только на общем фпу -> если avx исполняется на ядре А1 ядро А2 начинает тротлить, потому что свободные мощности заняты.

еще одна проблема бульдозера
очень узкий декодер. Декодер может производить до 4х моп-ов за так, однако этого для 2х полуядер может-быть недостаточно. Мало того. система предсказания ветвлений у бульдозера Очень сильно улучшилось по сравнению с к10 (у них это вообще головная боль была). и система декодирования может банально не успевать генерить моп-ы для исполнительных юнитов.
Полагаю, что подобный фокус провернут из-за того, что декодер должен работать на частоте большей, чем частота процессора, а буль рассчитывается на высокие частоты, судя по его микроархитектуре.

еще одна проблема
сами по себе ядра бульдозера (по сравнению с к10) урезаны на один ALU и на один AGU. это связано с тем, что декодер стал уже и не способен "кормить" мопами вычислительные блоки.

Итак. кратко резюмирую.
1 какая должна выглядеть программа, идеально работающая на бульдозере.
Программа должна быть распараллелена на 8 потоков. У неё должны отсутствовать инструкции AVX исполняемые одновременно. В идеале надо почитать оптимизационный мануал. и использовать такие инструкции, которые преобразуются в 1-2 моп-а (или больше, но тогда ядра должны быть загружены работой, пока инструкция декодируется [например FMULL 64 может выполняться до 36 тактов машинного времени]), тогда все полуядра будут загружены и бульдозер полностью продемонстрирует свой потенциал

2. что ждать от амд
а. В ближайшее время выйдет драйвер процессора, который оптимизирует раскидывание процессов по ядрам (на многозадачке, думаю, %10 производительности это прибавит) Помимо всего прочего этот-же меджик драйвер должен научиться загружать ядра однопоточными приложениями по принципу 1модуль 1 программа, тогда весь широкий fpu блок будет в распоряжении 1 программы. и это еще даст неплохой процент при условии, что декодер справится с такой работой.

б. в перспективе.
Расширение декодера (реально бутылочное горлышко) Но надо учитывать, что декодер, по идее, это самое сильно нагруженное место в процессоре и он не хило так греется. А более широкий декодер будет греться еще сильнее.

добавление 1-2 ALU и AGU, что позволит сравняться с ipc на 1 полуядро с К10 (+1) Nehalem (+2)

но это произойдет только в том случае, если в АМД поймут, что высоких частот выжать с нового процессора не получится. Или мы увидим процессор, который в штатной частоте будет брать 4.5 ггц (такое, кстати, тоже возможно)

вот интересное мнение - чувствуется, человек немного в курсе событий...

turboracer · 17.10.2011

anatolikostis

Почитал интересно, но как можно было делать бульдозер 4 года, что бы напороть такой хуйни при этом рядовой юзер указывает им на целый ряд ошибок?

Честно досижу на том что в подписи своё и буду брать штеуд... :рл:

anatolikostis · 17.10.2011

наврядле пилили 4 года...года 2 от силы...либо 4, но с перерывами на новые ревизии Deneb, а потом Thuban - штат-то не очень большой...)))
либо компания действительно решила снять приоритет с этого направления...апу?

в любом случае надеялся на АМД с целью получения айвы задешево, а так - пока не получается...

Sonar · 17.10.2011

На войне как на войне. Вспомните как санди на 1155 появлялся. Был ржач и маты в адрес интела. Буквально ведь недавно это было. Это тоже были на первый взгляд нелогичные действия. В то время, когда интел херил нихуя себе ~~1356~~ 1156 ( исправлено, заёбся в этих цифрах) сокет, амд обещали приехать на бульдозере и усе поровнять. Сюда же косяки с ревизиями. Война ведь? Война... Ну и пусть себе воюют. Никто ведь не знает, как ржали с интел в компании амд . Вдруг по заслугам все.

Или наоборот. На "планерке" в Интел, через год, руководство будет швырять в инженеров ноутбуки и папки с документами, с криками - пидарасы бля, как вы сука не могли доглядеть от них такого хода...а? увелю всех к енбеням и рука не дрогнет!!! 2011 им нужно было! ну блядь я вам приделаю по паре ножек щас...тикайте сука бо душить буду...

NaV · 17.10.2011

может они выбрали стратегию АТИ , сравнительно недавно только зеленые и красные борются за первые места а так зел в переди были

anatolikostis · 17.10.2011

а тем временем 6 ядер "на 2011 ножек" от Интель тоже будут "пылать" жаром...
Интел обрезает 2 ядра (оставляя 6) для удержания пакета в рамках 130Вт...
иначе 150Вт легко...
так что Бульдик еще легко отделался...

Danchich · 17.10.2011

А что кричали на санди? Я что то пропустил?

NaV · 17.10.2011

anatolikostis сказав(ла):
а тем временем 6 ядер "на 2011 ножек" от Интель тоже будут "пылать" жаром...
Интел обрезает 2 ядра (оставляя 6) для удержания пакета в рамках 130Вт...
иначе 150Вт легко...
так что Бульдик еще легко отделался...

ну водянку не только интел собирается продавать

, так что посмотрим как будет

_Maxik_ · 17.10.2011

anatolikostis сказав(ла):
а тем временем 6 ядер "на 2011 ножек" от Интель тоже будут "пылать" жаром...
Интел обрезает 2 ядра (оставляя 6) для удержания пакета в рамках 130Вт...
иначе 150Вт легко...
так что Бульдик еще легко отделался...

если при этом производительность/ядро поднимут, то ты сравниваешь х.. с пальцем

anatolikostis · 17.10.2011

_Maxik_ сказав(ла):
если при этом производительность/ядро поднимут, то ты сравниваешь х.. с пальцем

к сожалению камни за 600уе и больше - не пипенец с пленом...
я думаю, такое даже не каждому оверу по карману...

есть конечно Core i7-3820, но его цена будет больше 2600к, а как оно будет - неясно...

aleks-as · 17.10.2011

AMD X6 FX-6100 (Socket AM3+) BOX едет в харьков

AMD_Processor · 17.10.2011

А вот и реакция на критику AMD :

⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.

Morlock · 17.10.2011

Интересно а сколько будет стоить i7-3960X?

aleks-as · 17.10.2011

Morelock сказав(ла):
Интересно а сколько будет стоить i7-3960X?

интел сказл мне по сикрету, что бесплатно раздавать будут

Niro · 17.10.2011

Morelock сказав(ла):
Интересно а сколько будет стоить i7-3960X?

⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.

Core i7-3960X Extreme Edition -> шесть ядер, поддержка Hyper-Threading, 15 Мб кэша третьего уровня, номинальная частота 3.3 ГГц, разгон до 3.9 ГГц в рамках Turbo Boost, уровень TDP не более 130 Вт, свободный множитель, цена $999;
Core i7-3930K -> шесть ядер, поддержка Hyper-Threading, 12 Мб кэша третьего уровня, номинальная частота 3.2 ГГц, разгон до 3.8 ГГц в рамках Turbo Boost, уровень TDP не более 130 Вт, свободный множитель, цена $583;
Core i7-3820 -> четыре ядра, поддержка Hyper-Threading, 10 Мб кэша третьего уровня, номинальная частота 3.6 ГГц, разгон до 3.9 ГГц в рамках Turbo Boost, уровень TDP не более 130 Вт, цена $294.