Программа проверки дипломных работ на плагиат

Bonanza · 21.05.2007

balik сказав(ла):
Я думаю, что программка- это обычный поисковик. То есть ты вбиваешь текст, или часть текста, а программа идет на пару сайтов и проверяет эти тексты на идентичность с имеющимися на этих сайтах.

Ну, я думаю, что если сделать это по уму, то это будет поисковик, хотя и необычный. Архитектурные отличия будут довольно существенными, хотя концептуально это будет тот же поисковик.

Процесс, мне кажется, должен занимать приличное время, ибо релевантность должна быть абсолютная.

Если ориентироваться на абсолютную релевантность, то с такой системой научатся бороться довольно быстро - воды налили, растекся мыслью по древу, малозначимыми словами разбавил и все - релевантность уже не абсолютная. Тут нужно в каждом параграфе считать статистику по ключевым словам и уже плясать от нее.

Примерных результатов поиска быть не может.. то есть если в вашем тексте и тексте на сайте совпали три слова подряд, то это ещё ничего не доказывает. Совпадать должны целые фразы, а на их поиск уйдет приличное время.

Совпадать должны не так фразы, как статистика по ключевым словам. При правильной архитектуре поиск по таким образам или как это называется document fingerprints довольно таки быстрый (в реал-тайме). Только для этого нужно строить немного другие индексы, не совсем такие как для поисковых систем.

Именно поэтому я и думаю, что все эти разговоры- лихой развод..

Напрасно. С технической точки зрения особых сложностей в реализации такой системы нет. Были б денежные знаки.

Bonanza · 21.05.2007

balik сказав(ла):
Не.. я имел в виду примеры того, как какого-то ленивого студента поймали и отправили на пересдачу..

Говорят же, что вроде кучу денег заплатили за программу... должна же быть какая-то отдача, правда? То есть должны быть примеры применения..

Если примеры есть и хотя бы одного студента этой программой накыли, то снимаю шляпу и каюсь.. Если же примеров нет, то мне кажется нет и программы дорогой..

Я думаю, за примерами надо скорее в американские или европейские универы идти.

balik · 21.05.2007

Bonanza сказав(ла):
Напрасно. С технической точки зрения особых сложностей в реализации такой системы нет. Были б денежные знаки.

Вижу логику.. Может быть я и не прав по сути. Создать поисковик возможно.

Но вот морочиться с этой фигнёй всё равно никто не станет..

Кстати.. я никогда в сети не вдел готовых кандидатских, а уж тем более докторских.. Рефераты и курсовики- эт да.. хмм.. дипломов тоже не припомню..

Может просто не сталкивался...

Август · 21.05.2007

Эт они надеятся вернуть уровень образования, при числе и объемах даваемых взяток? ... не с того начинают или цель этого - окупить стоимость и получить "навар"? ...

RAFAIL · 21.05.2007

А алгоритм мысли как она угадывает? Если все заменил своими словами, но основная идея, построение мысли осталось. Все плагиат? Это что искусственный интелект?

ar4ik · 21.05.2007

RAFAIL сказав(ла):
Да с ИНЖЕКА. Зав. кафедрой на этой недели уже дискеты собирает с готовыми дипломами для проверки. Хотя сам говорил, что ваши работы слишком просты для программы, она рассчитана на докторские работы, диссертации.

Есть свои люди в ректорате, и я за это недели 3 назад узнавал. Такую программу действительно купили еще в прошлом году. В этом году не планируется проверка дипломов таким образом. А вот в следующем возьмутся за это. Какой факультет?

ar4ik · 21.05.2007

Август сказав(ла):
Эт они надеятся вернуть уровень образования, при числе и объемах даваемых взяток? ... не с того начинают или цель этого - окупить стоимость и получить "навар"? ...

Пропускать паленые работы на защиту в несколько раз дороже, чем написать диплом на заказ.

Bonanza · 21.05.2007

Bonanza сказав(ла):
Я думаю, за примерами надо скорее в американские или европейские универы идти.

Кстати вот... пример использования
Посилання видалено

NU began using the service after a number of students plagiarized final papers last spring. Philosophy Prof. Axel Mueller said he caught 12 students who had lifted a page or more from other sources without citation in their final papers.

Students who are caught plagiarizing are turned in to the undergraduate dean, along with evidence of plagiarism. If the dean decides the evidence is good, the student is interviewed and punished, Mueller said. The sanctions can range from a letter of reprimand to dismissal from the university.

RAFAIL · 21.05.2007

ar4ik сказав(ла):
Есть свои люди в ректорате, и я за это недели 3 назад узнавал. Такую программу действительно купили еще в прошлом году. В этом году не планируется проверка дипломов таким образом. А вот в следующем возьмутся за это. Какой факультет?

Факультет ЭиП. А дисеты зачем собирает? Припугивает?

MegaShop · 21.05.2007

кроме компов должен быть еще и сканер + нормальная программа-распозвавалка. или вы сдаете файлы на проверку ?
думаю основное время будет занимать ввод инфы в комп для проверки.
даже просто просканировать 20-30 страниц - мин 20 минимум надо потратить. ИМХО проверка если и будет то только выборочная

Bonanza · 21.05.2007

balik сказав(ла):
Вижу логику.. Может быть я и не прав по сути. Создать поисковик возможно.

Но вот морочиться с этой фигнёй всё равно никто не станет..

Как тут уже правильно сказали - не с той стороны начинают.

Кстати.. я никогда в сети не вдел готовых кандидатских, а уж тем более докторских.. Рефераты и курсовики- эт да.. хмм.. дипломов тоже не припомню..
Может просто не сталкивался...

Видел кандидатские, видел докторские. Видел PhD тезисы. Все зависит от того где искать.

К тому же совсем необязательно слизывать докторскую или кандидатскую один в один. Там статейку дернул, там главу слямзил, там результатов или статистики натырил. С миру по нитке - голому на бутылку.

Я помню, в свое время, в Вестнике Политеха пошла мода - разные молодые ученые и аспиранты стали передирать статьи с английского. Т.е. бралась статья, переводилась, цифры и рез-ты не менялись и вуаля! Есть публикация. Нужно ли говорить, что довести таким образом число своих публикаций до неприлично большого уровня совсем несложно.

ar4ik · 21.05.2007

RAFAIL сказав(ла):
Факультет ЭиП. А дисеты зачем собирает? Припугивает?

У нас уже года 3 так собирают. Факультет УиА.
Будут эти работы продавать другим дипломникам или себе на всякие дисертации.

RAFAIL · 21.05.2007

ar4ik сказав(ла):
У нас уже года 3 так собирают. Факультет УиА.
Будут эти работы продавать другим дипломникам или себе на всякие дисертации.

Спасибо за инфу. Очень помог. Теперь париться на счет ссылок не буду.

junglist · 22.05.2007

а если к примеру в дипломе поменять все русские а на английские, все русские о на английские, поменять буквы с, е... Думаю, прогамма будет сосать. Ибо скорее всего проверяются слова полностью а не сочетания букав.!!!!

ar4ik · 22.05.2007

junglist сказав(ла):
а если к примеру в дипломе поменять все русские а на английские, все русские о на английские, поменять буквы с, е... Думаю, прогамма будет сосать. Ибо скорее всего проверяются слова полностью а не сочетания букав.!!!!

А это идея! :клас:

Только может вызвать подозрение тотальное подчеркивание ошибок в ворде.

LionHeart · 22.05.2007

такой вот вопрос к знатокам:

значиться 20% плагиат и не проходит?
а как тогда должна выглядеть работа если плагиат в ней по сути своей будет больше чем 50% ?

любая информация высказана может быть разными словами но суть то не измениться. На одном потоке учащиеся на одном факе у одного препода если предположить что все честные и ни один не полезет в инет, и даже не попросит помощи, и то напишет текст с 40-50% плагиатом ибо инфа то одна и таже...

"ничего не понимаю"(с)

АК · 22.05.2007

balik сказав(ла):
Вижу логику.. Может быть я и не прав по сути. Создать поисковик возможно.

Но вот морочиться с этой фигнёй всё равно никто не станет..

Кстати.. я никогда в сети не вдел готовых кандидатских, а уж тем более докторских.. Рефераты и курсовики- эт да.. хмм.. дипломов тоже не припомню..
Может просто не сталкивался...

есть
но по таким областям - что малейшее копирование даже мысли выдает плагиат
например докторская диссертация Козырева по оценке интеллектуальной собственности

читал и поражался какой умный дядька

тут как - даже если скопируешь.. все равно видно бут

Bonanza · 23.05.2007

junglist сказав(ла):
а если к примеру в дипломе поменять все русские а на английские, все русские о на английские, поменять буквы с, е... Думаю, прогамма будет сосать.

Есть крайне категорическое мнение, граничащее с уверенностью, что если это программа от серьезной конторы, а не студенческая поделка, то сосать будут плагиаторы, а не программа.

Эта проблема, как и ее алгоритмическое решение стара как мир. Ее обходили даже древние поисковики для зоны Ру и Уа.

Ибо скорее всего проверяются слова полностью а не сочетания букав.!!!!

Один мой знакомый как-то очень правильно сказал: Assumption is the mother of all fuck up's! (c) Запомните это высказывание. Пригодится в жизни.

Теперь к теме.
Подобные системы устроены несколько сложнее, чем представляется на первый взгляд. В таких системах оперериуют лексемами (численное представление слова), а не строками как последовательностями символов. Документ это не последовательность символов, а последовательность лексем, которые по сути есть целые числа.
В процессе обработки документа все слова приводятся к одному регистру, если слово идентифицируется как русское или украинское, все совпадающие латинские символы (типа а, с, е, i и т.п.) будут приведены к кодовой странице оригинального языка. И только после этого, по полученному слову система будет строить лексему. Соотв. все эти "хитрые" уловки не прокатят.

Сорри, за технические детали. Просто пока еще не поздно надо было развеять ваши (а может и не только ваши) иллюзии.

Bonanza · 23.05.2007

LionHeart сказав(ла):
такой вот вопрос к знатокам:

значиться 20% плагиат и не проходит?
а как тогда должна выглядеть работа если плагиат в ней по сути своей будет больше чем 50% ?

любая информация высказана может быть разными словами но суть то не измениться. На одном потоке учащиеся на одном факе у одного препода если предположить что все честные и ни один не полезет в инет, и даже не попросит помощи, и то напишет текст с 40-50% плагиатом ибо инфа то одна и таже...

"ничего не понимаю"(с)

Если ты указываешь источник, откуда ты "гарну мыслю поцупив", то это не плагиат.
А вот если ты ее выдаешь за свою...

Bonanza · 23.05.2007

Вообще это не студенты должны бояться... С них что взять. По большому счету от них и не ожидают супер новизны в их работах, так грамотный анализ и умение применять знания на практике. А вот если через такую антиплагиатную системку пропустить всякие статьи научные, да кандидатские... у-у-у... Боюсь, что тогда наши "доценты с кандидатами" забегают как в ж*пу раненые...