Статус:
Offline
Реєстрація: 27.10.2004
Повідом.: 5958
Реєстрація: 27.10.2004
Повідом.: 5958
Ну, я думаю, что если сделать это по уму, то это будет поисковик, хотя и необычный. Архитектурные отличия будут довольно существенными, хотя концептуально это будет тот же поисковик.Я думаю, что программка- это обычный поисковик. То есть ты вбиваешь текст, или часть текста, а программа идет на пару сайтов и проверяет эти тексты на идентичность с имеющимися на этих сайтах.
Если ориентироваться на абсолютную релевантность, то с такой системой научатся бороться довольно быстро - воды налили, растекся мыслью по древу, малозначимыми словами разбавил и все - релевантность уже не абсолютная. Тут нужно в каждом параграфе считать статистику по ключевым словам и уже плясать от нее.Процесс, мне кажется, должен занимать приличное время, ибо релевантность должна быть абсолютная.
Совпадать должны не так фразы, как статистика по ключевым словам. При правильной архитектуре поиск по таким образам или как это называется document fingerprints довольно таки быстрый (в реал-тайме). Только для этого нужно строить немного другие индексы, не совсем такие как для поисковых систем.Примерных результатов поиска быть не может.. то есть если в вашем тексте и тексте на сайте совпали три слова подряд, то это ещё ничего не доказывает. Совпадать должны целые фразы, а на их поиск уйдет приличное время.
Напрасно. С технической точки зрения особых сложностей в реализации такой системы нет. Были б денежные знаки.Именно поэтому я и думаю, что все эти разговоры- лихой развод..