Статус: Офлайн
Реєстрація: 29.01.2007
Повідом.: 236
Реєстрація: 29.01.2007
Повідом.: 236
Местами согласен, местами нет. Но, вообщем то вина, конечно, моя. Именно поэтому переписываю все. Кое-что из понятийного приходится переопределять. Тут никуда не денешься, если понятия новые.Тема превратилась в помойку по большей части потому, что от Вас так и не дождались четких, кратких и логичных разъяснений в общепринятых в IT терминах. Вы меня извините, пожалуйста, но вот это
- несерьезно. Не в том смысле, что своими мозгами думать не нужно - еще как нужно! - но вот изобретать заново понятийную систему, причем понятную, похоже, только вам - уж точно не стОит. С Вами неоднократно пытались дискутировать предметно, приводя конкретные примеры из существующих и распространенных (!) языков программирования, в ответ же, увы - все таже достаточно пространная философия.
Очень показательно что это уже и так делается. А вопросы хранения и обработки да. Решено по другому. Если вы человек способный воспринимать, то малость раскрою подход. Когда мы говорим про знаки, то это изображения. Для обработки используются не знаки а то, что ассоциируется с этими знаками. Т.е. необходимо разделить изображения (это назовем знаками?) и ассоциации в которые они отображаются (именно это называется алфавитом). Так одно и тоже изображение в разных алфавитах (читай языках) порождает разные ассоциации. К примеру знак "Р" в русском и английском языке порождает разные ассоциации. И нет русской буквы "Р" и английской буквы "Р". смысле разницы в кодировании. Когда говорят русская "Р" это касается именно уточнение изображения в случае устной речи. На письме этот вопрос не возникает вообще. Очень четко можно это понять представляя алфавит. Там же нет ни шрифтов, ни размеров и даже больших и маленьких букв нет! Алфавит это чисто нумерация соответствия со знаками. Т.е. с какой-то характеристикой (пусть это будет номер знака) собственно изображения этого знака. Вот отсюда такая беда с понятиями. У меня знак это одно, а буква это совершенно другое. Даже другой класс. Дальше сообразишь...Очень показательно, кстати, ваше утверждение про порочность Unicode. Да, технически можно хранить знакогенератор/шрифт вместе с документом. Но как вы себе в таком случае представляете машинную обработку информации, если в одном документе один и тот же символ будет закодирован так, а в другом - эдак? Заниматься распознаванием образов символов знакогенератора? А внедрение именно шрифтов в документ, собственно, уже давно придумано... Даже если каждый символ является объектом, все равно он должен в конечном итоге превратиться в некий набор битов на физическом носителе, причем, желательно, понятный не только системе Lada.
Хотя и сам путаюсь..Ну, так бывает. Пока мозги перестроишь. Я ж из этого мира, а придумываю другой. Сори...
Ну, отсюда легко понять что имея набор знаков, для того что бы написать новый (пользовательский) алфавит, необходимо просто перечислить знаки в каком-то порядке. Этот порядок.. Дальше, надеюсь понятно. Если не хватает знаков, что ж прийдется добавить. Вот и вся проблема.
Да.. И стандарт надо иметь не на алфавиты, а на знаки. И тут еще немного отвлекусь. А все ли в современном кодировании является знаками? Как насчет перевода строки? Если стоит вопрос хранения объектов таких как буквы (имеется ввиду алфавит), то они представляют собой объекты как то расположеные в другом объекте (странице). Каждая на какой-то позиции обычно следуя друг за другом и этой последовательностью (имеется ввиду последовательность хранения) определяя собственную позицию. А это уже правило! Что следующая буква должна находится за предыдущей и положение ее изображения находится на каком-то расстоянии от предыдущей. И перевод строки это правило, а не знак .А пробел это знак или правило? Поразмышляй.. Интересно.. И не ссылайся на то как сейчас .. А думай как оно должно быть, что бы было правильно.. Если интересно думать на эту тему..