Я так в двух словах.
Все современные процессоры, даже те на которых написано что они одноядерные - на самом деле многоядерные. Только програмному коду эти ядра не видны. Так делают потому что оказалось что для современной промышленности легко сделать много транзисторов, но сложно поднять частоту.
Архитектура x86 вообще не поддерживает распараллеливание. Поэтому на самом деле современные процессоры x86 сначала переводят программу на некий внутрений язык, который поддерживает распараллеливание, а затем виртуальные, невидимые для программного кода ядра, эту программу исполняют. Потом результат исполнения внтуренней программы переводят на язык программы x86. Все это крайне неэффективно. Когда говорят "процссор восьмиядерный" - это имеется ввиду 8 видимых для программы ядер. На самом деле ядер может быть 32. Или 1024. Как думаете почему у совремнного процессора который работает на инструкциях x86 транзисторов в 1000 и более раз больше чем у 486?
Следующее слово в развитии техники, это RISC процессоры. Для них программа сразу пишется на языке поддерживающем распараллеливание, не нужно переводить программу с x86 языка на RISC и обратно. Но все равно распараллеливание осуществляется неким заранее предусмотренным алгоритмом, на который программист или компиллятор повлиять не может. Из-за этого часто распараллеливание оказывается неэффективным.
Вот архитектура ELBRUS - это следующий шаг в развитии, когда компилятору (или программисту) дается почти полный доступ к реальным ресурсам ЦПУ, в частности дается возможность указать, как именно в тех или иных местах программы использовать ресурсы многоядерного ЦПУ. Это открывает возможность к созданию программ которые будут реально эффективно использовать все транизисторы из которых состоит ЦПУ. Потому что в совремнных ЦПУ энергию жрут все транзисторы, но выполняют полезные операции только 3-4% транзисторов.
Не в том вопрос в какой стране эти ЦПУ будт делать. Главное чтобы их начали делать, а под них писать программы и компилляторы.