Статус: Офлайн
Реєстрація: 18.08.2006
Повідом.: 643
Реєстрація: 18.08.2006
Повідом.: 643
проблема с массивом
Может кто-нибудь подскажет?
Есть такая задача:
С диска считывается в память массив байтов, цепочки из которых упорядочены по законам естественного языка. Каждая цепочка, в свою очередь, тоже упорядочена по законам того же самого естественного языка. В исходной 33-ричной системе исчисления при общей длине массива более миллиона байтов время нахождения частоты повторения каждой исходной цепочки в считываемой кипе байтов начинает расти с невероятной быстротой (предположительно по геометрической прогрессии, где знаменатель прогрессии - это кол-во шагов, необходимых для определения частоты повторения цепочки при условии, что в исходном массиве таких цепочек две, а члены прогрессии - это просто-напросто ряд натуральных чисел - считываемые цепочки байт). Подскажите, не поможет ли мне перевод из 33-ричной с-мы в двоичную, или может, кто-нибудь сталкивался с подобной задачей и натолкнет меня на правильный путь? Хочется приемлемых временных результатов хотя бы с десятком миллионов байт. Может проблема в аглоритме, и если да, то как мне выбрать нужный алгоритм и какими методами мне его оценить? Спасибо
Может кто-нибудь подскажет?
Есть такая задача:
С диска считывается в память массив байтов, цепочки из которых упорядочены по законам естественного языка. Каждая цепочка, в свою очередь, тоже упорядочена по законам того же самого естественного языка. В исходной 33-ричной системе исчисления при общей длине массива более миллиона байтов время нахождения частоты повторения каждой исходной цепочки в считываемой кипе байтов начинает расти с невероятной быстротой (предположительно по геометрической прогрессии, где знаменатель прогрессии - это кол-во шагов, необходимых для определения частоты повторения цепочки при условии, что в исходном массиве таких цепочек две, а члены прогрессии - это просто-напросто ряд натуральных чисел - считываемые цепочки байт). Подскажите, не поможет ли мне перевод из 33-ричной с-мы в двоичную, или может, кто-нибудь сталкивался с подобной задачей и натолкнет меня на правильный путь? Хочется приемлемых временных результатов хотя бы с десятком миллионов байт. Может проблема в аглоритме, и если да, то как мне выбрать нужный алгоритм и какими методами мне его оценить? Спасибо
Но ни те ни другие результатами и наработками делиться с общественностью не любят.
.