Статус:
Offline
Реєстрація: 18.08.2006
Повідом.: 647
Реєстрація: 18.08.2006
Повідом.: 647
- 🟢 11:26 Відбій тривоги в м. Харків та Харківська територіальна громада.Слідкуйте за подальшими повідомленнями.#м_Харків_та_Харківська_територіальна_громада
- #1
проблема с массивом
Может кто-нибудь подскажет?
Есть такая задача:
С диска считывается в память массив байтов, цепочки из которых упорядочены по законам естественного языка. Каждая цепочка, в свою очередь, тоже упорядочена по законам того же самого естественного языка. В исходной 33-ричной системе исчисления при общей длине массива более миллиона байтов время нахождения частоты повторения каждой исходной цепочки в считываемой кипе байтов начинает расти с невероятной быстротой (предположительно по геометрической прогрессии, где знаменатель прогрессии - это кол-во шагов, необходимых для определения частоты повторения цепочки при условии, что в исходном массиве таких цепочек две, а члены прогрессии - это просто-напросто ряд натуральных чисел - считываемые цепочки байт). Подскажите, не поможет ли мне перевод из 33-ричной с-мы в двоичную, или может, кто-нибудь сталкивался с подобной задачей и натолкнет меня на правильный путь? Хочется приемлемых временных результатов хотя бы с десятком миллионов байт. Может проблема в аглоритме, и если да, то как мне выбрать нужный алгоритм и какими методами мне его оценить? Спасибо
Может кто-нибудь подскажет?
Есть такая задача:
С диска считывается в память массив байтов, цепочки из которых упорядочены по законам естественного языка. Каждая цепочка, в свою очередь, тоже упорядочена по законам того же самого естественного языка. В исходной 33-ричной системе исчисления при общей длине массива более миллиона байтов время нахождения частоты повторения каждой исходной цепочки в считываемой кипе байтов начинает расти с невероятной быстротой (предположительно по геометрической прогрессии, где знаменатель прогрессии - это кол-во шагов, необходимых для определения частоты повторения цепочки при условии, что в исходном массиве таких цепочек две, а члены прогрессии - это просто-напросто ряд натуральных чисел - считываемые цепочки байт). Подскажите, не поможет ли мне перевод из 33-ричной с-мы в двоичную, или может, кто-нибудь сталкивался с подобной задачей и натолкнет меня на правильный путь? Хочется приемлемых временных результатов хотя бы с десятком миллионов байт. Может проблема в аглоритме, и если да, то как мне выбрать нужный алгоритм и какими методами мне его оценить? Спасибо