Single precision julia что это
Перейти к содержимому

Single precision julia что это

  • автор:

Aida64

This benchmark measures the single precision (also known as 32-bit) floating-point performance through the computation of several frames of the popular “Julia” fractal. The code behind this benchmark method is written in Assembly, and it is extremely optimized for every popular AMD, Intel and VIA processor core variants by utilizing the appropriate x87, 3DNow!, 3DNow!+, SSE, AVX or FMA4 instruction set extension.

FPU Julia test consumes 4 MB system memory per calculation thread, and it is HyperThreading, multi-processor (SMP) and multi-core (CMP) aware.

Практически топовое железо не тянет игры

Да устаревший сокет, но . есть проблемка заключается она в том что игрушки которые эта система должна глотать даже не задумываясь выдают 30-40 фпс, Кризис 3 после первой мисси, когда выбираешься в джунгли фпс просидает как бы наплывами 60 потом до 40 ну и постоянно неважно стоишь ты на месте или передвигаешься.
ГТА либерти, на минималках 30 40 это уже не смешно,Шадов оф мордор на ультра 30, на средних 60 стабильно,
Юнити 40 больше не дает, батла 4 на ультра 40 на максах 60.
Фиг знает я грешу на то что не хватает 500ватника всему этому, либо поведайте мне дураку, в чем могут быть проблемы.

Добавлено через 1 час 23 минуты
неужели знающих нет ?

94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
Ответы с готовыми решениями:

Тянет ли железо видеокарту?
Хочу приобрести видеокарту gtx 650 ti или что то подобное на 2 гб.На материнке у меня есть PCI.

4850×2 не тянет игры
купил парудней назад 4850×2 проблема с играми со стротегиями отнес в магозин говорю им комп.

нормально не тянет игры на новой видеокарте
видеокарта Radeon hd6670 GDDR5, купил недавно и она себя не оправдала. т.к. практически не.

не тянет игры zotac GTX 560
Всем доброго времени суток! Ув. специ подскажите в чем трабл видеокарта zotac GTX 560 1 Gb не хочет.

Эксперт Hardware

4040 / 2505 / 301
Регистрация: 22.04.2012
Сообщений: 10,745
Записей в блоге: 2
Один проц тянет 130 Вт.под нагрузкой.Температуры и напряжения под нагрузкой покажите.
Регистрация: 24.03.2015
Сообщений: 31

Температура самого горячего ядра под нагрузкой с боксовым охладом 67-69 при нагрузке 50-60 % при 100 ке до 75 сегодня ставлю новый охлад огромный, при простое 40 градусов

Добавлено через 2 минуты
спрашивайте, дам любой тест, дабы решить эту бесячную проблему.
если тест то при помощи чего если можно )

Эксперт Hardware

4040 / 2505 / 301
Регистрация: 22.04.2012
Сообщений: 10,745
Записей в блоге: 2
Проведите стресс тест Аиды,для начала.Там и температуры и напряжения,и троттлинг покажет.
Регистрация: 24.03.2015
Сообщений: 31
Регистрация: 24.03.2015
Сообщений: 31
Регистрация: 24.03.2015
Сообщений: 31

Benchmark Result Run Time Build Time
————————————————————-
Memory Read 3161 MB/s 952 ms
— Pinned 3161 MB/s 9 ms
— Pageable 2545 MB/s 12 ms
Memory Write 2988 MB/s 686 ms
— Pinned 2988 MB/s 10 ms
— Pageable 2477 MB/s 12 ms
Memory Copy 198277 MB/s 3463 ms
— 15 MB Block 153537 MB/s 0 ms
— 32 MB Block 174615 MB/s 0 ms
— 64 MB Block 183570 MB/s 1 ms
— 128 MB Block 190504 MB/s 1 ms
— 256 MB Block 192033 MB/s 3 ms
— 512 MB Block 198277 MB/s 5 ms
Single-Precision FLOPS 3563 GFLOPS 7582 ms
— float1 3563 GFLOPS 617 ms 202 ms
— float2 3241 GFLOPS 679 ms 172 ms
— float4 3270 GFLOPS 672 ms 125 ms
— float8 3181 GFLOPS 691 ms 141 ms
— float16 3035 GFLOPS 725 ms 125 ms
Double-Precision FLOPS 795.7 GFLOPS 9204 ms
— double1 795.5 GFLOPS 691 ms 406 ms
— double2 795.7 GFLOPS 691 ms 328 ms
— double4 793.8 GFLOPS 693 ms 312 ms
— double8 628.2 GFLOPS 875 ms 328 ms
— double16 617.8 GFLOPS 890 ms 343 ms
24-bit Integer IOPS 3269 GIOPS 7519 ms
— int1 3247 GIOPS 677 ms 63 ms
— int2 3223 GIOPS 682 ms 78 ms
— int4 3269 GIOPS 673 ms 94 ms
— int8 3020 GIOPS 728 ms 109 ms
— int16 3018 GIOPS 729 ms 125 ms
32-bit Integer IOPS 620.2 GIOPS 10608 ms
— int1 597.9 GIOPS 919 ms 1763 ms
— int2 505.3 GIOPS 544 ms 109 ms
— int4 620.2 GIOPS 886 ms 125 ms
— int8 604.2 GIOPS 910 ms 156 ms
— int16 603.4 GIOPS 911 ms 266 ms
64-bit Integer IOPS 163.5 GIOPS 11887 ms
— long1 161.3 GIOPS 852 ms 1762 ms
— long2 163.5 GIOPS 841 ms 156 ms
— long4 143.7 GIOPS 956 ms 218 ms
— long8 144.5 GIOPS 951 ms 468 ms
— long16 135.5 GIOPS 507 ms 1046 ms
SHA-1 Hash 34175 MB/s 15693 ms
— 512 blocks 2567 MB/s 779 ms 687 ms
— 1024 blocks 5134 MB/s 779 ms
— 2048 blocks 10247 MB/s 781 ms
— 4096 blocks 20477 MB/s 781 ms
— 8192 blocks 20429 MB/s 783 ms
— 16384 blocks 27192 MB/s 588 ms
— 32768 blocks 32520 MB/s 984 ms
— 65536 blocks 32629 MB/s 981 ms
— 131072 blocks 34175 MB/s 936 ms
Single-Precision Julia 446.9 FPS 12542 ms
— float1 break 245.5 FPS 521 ms 94 ms
— float1 stay / unroll 3 315.9 FPS 810 ms 78 ms
— float2 stay / unroll 3 320.7 FPS 798 ms 78 ms
— float4 stay / unroll 3 372.4 FPS 688 ms 94 ms
— float8 stay / unroll 3 224.2 FPS 1142 ms 109 ms
— float1 stay / unroll 9 334.7 FPS 765 ms 94 ms
— float2 stay / unroll 9 446.9 FPS 573 ms 93 ms
— float4 stay / unroll 9 327.1 FPS 783 ms 109 ms
Double-Precision Mandel 152.4 FPS 11045 ms
— double1 break 96.1 FPS 666 ms 109 ms
— double1 stay / unroll 3 118.8 FPS 539 ms 63 ms
— double2 stay / unroll 3 152.4 FPS 840 ms 78 ms
— double4 stay / unroll 3 134.0 FPS 955 ms 109 ms
— double1 stay / unroll 9 121.5 FPS 527 ms 62 ms
— double2 stay / unroll 9 140.5 FPS 911 ms 109 ms
— double4 stay / unroll 9 101.6 FPS 630 ms 141 ms

Эксперт Hardware

4040 / 2505 / 301
Регистрация: 22.04.2012
Сообщений: 10,745
Записей в блоге: 2

Для не большого времени тестирования температура процессора высокая и есть просадка по линии 12 Вольт.Проконтролируйте мультиметром во время нагрузки.

CPU vs GPU догоняет потихоньку

Как сказано, на CPU использовался не OpenCL, а специально оптимизированные программы для вычислений, да и карточка уже далеко не топовая, но тем не менее. Видно, что в некоторых случаях CPU даже быстрее, а почти во многих не принципиально отстает.

Особенно интересно, что в таком очень важном для вычислений вопросе как скорость вычислений с плавающей запятой с двойной точностью (64 бита) процессор уже в два раза быстрее обычной карточки.

Топовые процессоры типа TR 3990x наверное и вообще быстрее будут. История развивается по спирали? С CPU начали массивно-параллельные задачи переносить на GPU, но по мере нарастания гонки ядер обычных CPU преимущества вычислений на видеокарте слабеют.

praseodim ★★★★★
01.03.20 04:01:18 MSK

В задачах, где игровой GPU хорош, CPU его ещё не догнали и никогда не догонят за счёт более узкой специализации первого. Начнём с того, что карта стоит 15 т.р. а процессор 42.5 т.р. и это цены по первой ссылке, которую я нашёл — реально б/у варианты карт после майнинга можно найти сильно дешевле.

Memory Read, Memory Write — судя по значениям это скорость PCI-express на твоей машине. Видимо карта одна, воткнута куда надо — в первый 16-лэйновый слот. Пиковая теоретическая скорость должна быть около 16 ГБ/c. У CPU времена read, write и copy плюс-минус одинаковые из-за того что оперативка подключена к CPU. На GPU видим что read/write — через PCI, а copy сильно быстрее — это уже работает контроллер памяти на GPU, он значительно быстрее по пропускной способности чем CPU-шный (в 4.25 раз уже давно не супер-карта обгоняет жирненький проц).

Single-Precision FLOPS в 4 раза больше чем на 24-ядерном процессоре. А вот с double видно что у процессора скорость только в два раза ниже, а у GPU — ровно в 16. Это нормально для игровых карт, так и заявлено в характеристиках. Есть профессиональные решения, в которых double на GPU только в два раза медленнее чем float. Но в играх такие вычисления не нужны, на игровых чипах их вырезают.

AES-256 — на CPU есть AES-NI, т.е. сравнивается по сути аппаратная реализация на CPU с софтварной на GPU. В Ryzen есть инструкции также и для ускорения семейства хешей SHA1, SHA256 — не знаю, используются ли они в тесте, может и да.

Итого, плюсы GPU — быстрая шина памяти внутри GPU, много ядер которые позволяют поддержать огромную производительность float, для double нужны профессиональные карты для вычислений.

CPU — много специальных команд для частых задач, обычная память но с хорошим кэшированием, double всего в два раза меньше по производительности чем float.

Особенно интересно, что в таком очень важном для вычислений вопросе как скорость вычислений с плавающей запятой с двойной точностью (64 бита) процессор уже в два раза быстрее обычной карточки.

Я вижу обратную тенденцию — когда-то игровые GPU просто не умели работать с double, а сейчас работают с 1/8 — 1/16 от производительности float.

Из любопытного — на GPU 24-битная целая арифметика работает с огромной скоростью, такой же как float — за счёт переиспользования вещественных ALU. А на CPU, который в основном и работает с целыми числами — 24-битные по скорости как 32-битные. А есть ли там вообще 24-битные инструкции, на CPU? Я таких не знаю. Если их нет — то очень логично что скорость как на 32-битных. Также эта скорость равна половинке от скорости даблов. Видимо из-за отсутствия инструкций типа multiply-add (mad), которые есть на GPU в том числе для 24-битных чисел.

Эффективность процессоров с разным GPU

team

Есть такая прога как AIDA64, многие наверняка в курсе. Показывает какое железо установлено в пк без драйверов. В ней есть бенчмарк для видео карт и процессоров — GPGPU Benchmark. Данный тест тестирует видео карту и процессор по ряду характеристик. Так вот там есть 2 интересных параметра которые имеют интересные показатели.

1. Single-Precision FLOPS — производительность с плавающей запятой для 32 бит приложений.

2. Single-Precision Julia — непосредственно тест на основе производительности в фпс.

Чем больше производительность по 1 характеристике, тем выше фпс по 2. Эти показатели(точнее 1) напрямую влияют на фпс в играх.

В чем суть наблюдения? В закономерности. Вот тут пример(скрин) теста на оригинальном сайте Аиды64. На этом скрине протестированы видео карта и процессор, неважно какие по сути.

Видео карта показала производительность(сухую так скажем) — 5518 Гфлопс, а процессор — 341 Гфлопс. При этом видео карта смогла отрисовать — 862 кадра в секунду(фпс), а процессор всего лишь — 142 фпс.

В чем интерес?)) В соотношениях. Производительность(сухая) видео карты — в 16 раз больше чем процессора. Но производительность в реальном(не сухом) тесте — в 6 раз больше.

К чему я веду? К тому на сколько неэффективно используется видео карта по сравнению с процессором. Сколько производительности просто вылетает в трубу.

В тестах производительность огромная и растет, а на деле растут лишь цифры. Эффективность видео карты ниже 50% от мощностей — Нонсенс.

Если Интел будет делать видео карты такими эффективными как процессоры, тогда у АМД и Нвидиа не будет ни шанса.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *