Обсуждение:Выявление плагиата

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Иллюстрация «методы выявления плагиата»[править код]

Методы выявления плагиата (перевод)
Plagiarism detection (оригинал)

Замечания к иллюстрации. Мои пожелания к переводу:

  • 'local similarity assessment' = 'оценка локального сходства';
    • соответственно по аналогии будет 'оценка сходства в целом' для 'global similarity assessment';
  • "дактилоскопирование"?, если проще, то "дактилоскопия";
  • 'term occurence analysis' = 'анализ встречаемости термина' (не 'возникновения');
  • 'substring matching' = "соответствие подстроки" ("подстроковое" - не надо);

Чтобы не было грязного муара вокруг букв - сохраняйте изображение в PNG, а не сильно пожатый JPEG.

P.S. Если вы не против, то я указал здесь, что работа основана на иллюстрации File:PDS Classification.png.

Чтобы загрузить исправленную версию картинки - идите на страницу cвоего рисунка [1], нажмите внизу страницу ссылку "Upload a new version of this file" и зааплоадьте новую версию.

Если будут вопросы - пишите здесь или на моей странице обсуждения. Удачи! -- Andrew Krizhanovsky 19:23, 9 октября 2012 (UTC)[ответить]

Вопрос по обновлению файла[править код]

Андрей Анатольевич, я исправила схему и пытаюсь ее загрузить. но у меня не получается(

Выдает ошибку "File extension ".jpeg" does not match the detected MIME type of the file (image/png)." я не очень понимаю, в чем проблема.

Когда я начала обновлять файл поле "Destination filename:" уже было заполнено - "Методы_выявления_плагиата.jpeg" , и я не могу исправить на расширение png.

Эту ошибку мне выдает не зависимо от того, какой файл с каким расширением пытаюсь загрузить! Что можно с этим сделать?

Заранее спасибо!)

Вероятно, нельзя загрузить PNG файл, если в первый раз загружали JPEG. Варианты:
  1. сделать новую страницу на Викискладе, т.е. загрузить иллюстрацию заново, но уже PNG;
  2. либо загрузить новую версию JPEG, но не делать сильное сжатие, т.е. оставить качество получше.
P.S. Чтобы подписать своё сообщение, используйте четыре тильды (~~~~) -- Andrew Krizhanovsky 20:31, 9 октября 2012 (UTC)[ответить]

Ещё небольшое замечание. Вместо "Анализ сумки слов" поставьте 'Анализ "bag of words"', как-то получше звучит. -- Andrew Krizhanovsky 20:56, 9 октября 2012 (UTC)[ответить]

Спасибо, создала новую страничку на Викискладе, надеюсь, все верно. Grishenkova Alena 21:25, 9 октября 2012 (UTC)[ответить]

Отлично! Напишите с большой буквы "выявления плагиата, основанное на цитировании", обновите рисунок и это задание будет готово. Ура :) -- Andrew Krizhanovsky 12:12, 10 октября 2012 (UTC)[ответить]

Исправила!) Grishenkova Alena 20:49, 10 октября 2012 (UTC)[ответить]

Отлично! Задание с добавлением иллюстрации засчитано. -- Andrew Krizhanovsky 11:37, 11 октября 2012 (UTC)[ответить]

Ссылки[править код]

Похоже, что я сделала ссылки на литературу в черновик своей статьи. Посмотрите пожалуйста!

И еще я хотела уточнить, на паре Вы показывали последнее задание на примере моей картинки. Мне надо что-то делать по 5 заданию??у меня у картинки есть категории) Grishenkova Alena 22:01, 15 октября 2012 (UTC)[ответить]

Ссылки оформлены правильно, молодец Алёна :)
Да, категории у иллюстраций уже проставлены, вам этого делать не надо. Задание выполнено.
Добавьте в свою статью - мою картинку из примера. Что ж я её зря рисовал?
Прошу отвечать о выполненом задании на моей странице обсуждения: Обсуждение участника:AKA MBG. -- Andrew Krizhanovsky 10:19, 17 октября 2012 (UTC)[ответить]

Определение плагиата (преамбула)[править код]

Андрей Анатольевич, я не нашла никакого определения "обнаружения плагиата". То определение, которое я давала на паре, было взято из статьи Википедии "Plagiarism detection". Но, как я понимаю, нельзя ссылаться на эту статью, а надо брать какую-то научную работу, правильно? Grishenkova Alena 22:06, 21 октября 2012 (UTC)[ответить]

Думаю, что необходимо два определения:
  1. что такое плагиат?
  2. что такое - его обнаружение?
1) Определения для плагиата есть в статьях, которые указаны в вашем списке литературы:
  1. целый спектр определений есть в разделе "The unbearable vagueness of plagiarism" в статье [2]
  2. раздел "What is plagiarism?" в статье [3]

Выберите функциональные определения, т.е. такие, которые позволяют действительно определить, что это плагиат или нет. Определений типа "Плагиат - это грех и преступление", т.е. эмоций, не нужно - не функционально.

2) Совершенно верно, Алёна, Википедия не является авторитертным источником для себя самой. Однако разумно было бы использовать литературу, на которую ссылаются в английской статье ВП "Plagiarism detection". В частности, в статье "Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection" даётся определение для "Анализа плагиата" (что равно "Определению плагиата").
Из последней статьи также следует, что вам необходимо упомянуть в своей статье о родственной проблеме обнаружении "почти дубликатов" (Near-duplicate detection), конечно, со ссылкой на статью, откуды вы берёте информацию. -- Andrew Krizhanovsky 06:01, 22 октября 2012 (UTC)[ответить]

Почему-то как раз ссылка (из Примечаний) с определения "определения плагиата" (Benno S., 2011) и не работает!?.. -- Andrew Krizhanovsky 16:37, 30 октября 2012 (UTC)[ответить]

Обзор существующих систем[править код]

Сейчас вместо раздела "Обзор существующих систем" с обсуждением этих систем, с указанием на достоинства и недостатки систем, со сравнением этих систем друг с другом (всё это было в какой-то мере в докладе)... вместо всего этого счастья есть только сухое перечисление систем. Недостаточно. -- Andrew Krizhanovsky 06:28, 14 ноября 2012 (UTC)[ответить]

  • Использовать двоеточие для отступа в названиях систем - идея понравилась :)
  • Вы викифицировали текст "[[Критерий|критериями]]". Прочитал эту статью "Критерий". Её чтение действительно что-то добавляет к пониманию вашей статьи? Кажется, это чрезмерная викификация.
  • Зачем использовать шаблон {{нп3}} для ссылки на статью en:Suffix tree, если интервики в статье en:Suffix tree ясно показывают, что уже есть статья в рувики и она называется Суффиксное дерево. Напомните мне, пожалуйста, на лекции, мы ещё раз разберём ВП:интервики, с чем их едят и для чего они, и как ими пользоваться.
  • Поставьте ссылку со слов "сопоставление подстроки" на статью Поиск подстроки, если вы именно об этом говорите.
  • Прочие замечания по статье вручу на лекции. До встречи! Не болейте. -- Andrew Krizhanovsky 19:11, 26 ноября 2012 (UTC)[ответить]

Рецензирование[править код]

По данной работе имеется ряд предложений для её улучшения.

  1. Сразу хочется попросить сделать ссылки на все сервисы по выявлению плагиата. Ссылки на них можно сделать прямо в статье при упоминании сервиса, и/или добавить в конец статьи в раздел ссылки. А то ведь интересно попробовать, что они покажут хотя бы на моих горе-курсачах :).
  2. Мне кажется, что как и перечисление сервисов, так и перечисление методов лучше выделить в подразделы (с тремя "="), ввиду того, что некоторые могут получиться достаточно большими, а в будущем может быть и все, а подобное разделение позволит легко редактировать содержание.
  3. Неплохо было бы сделать в статье Плагиат раздел про определение плагиата, и кратко дать инфу об этом с ссылкой на эту страницу. Мне кажется это там было бы к месту.

--Ageev Andrew 22:43, 1 декабря 2012 (UTC)[ответить]

  1. Добавила ссылки на каждый сервис, спасибо, отличная идея*)
  2. Посмотрела, как будет выглядеть, если все перечисления (методов и сервисов) выделить в подразделы. Честно говоря, мне совсем не понравилось, тк сейчас их не так много и все выглядит как-то нагружено!
  3. Как только закончу с этой статьей, можно будет добавить подраздел в статье Плагиат. Пока что я просто там сделала ссылку на свою статью)

Grishenkova Alena 13:29, 16 декабря 2012 (UTC)[ответить]

Прекрасно. Тогда ждём подраздела в статье Плагиат. -- Andrew Krizhanovsky 19:09, 16 декабря 2012 (UTC)[ответить]

Дактилоскопия vs. Стилометрия[править код]

Алёна, меня очень интересует вопрос "Дактилоскопии" в вашей статье.

  1. С этого слова (точнее со следующего предложения) идёт ссылка номер 8 на "Brin S., 2001, pp. 36-41"
  2. C этого "Brin S." меня перекидывает на "Brin S., Davis J., Garcia-Molina H. Plagiarism issues for higher education (англ.) // Vine.. — 2001."
  3. И по последней ссылки с этого Брина я попадаю сюда: [4] (Руководство "Как хорошо писать эссе").

В этом руководстве ни про какого Брина и слыхом не слыхивали и уж точно ничего нет про дактилоскопию, которая нас с вами сейчас интересует. Поэтому большая просьба, проверьте, пожалуйста, 18 ссылок в разделе "Литература" в вашей статье и убедитесь, что название книги или статьи соответствует тому направлению, куда вы посылаете читателя :)

Анализ текстов на основе последовательности частей речи (статья, что я вам дал) - скорее, относится к одному из видов Стилометрии. Кстати, почему вы ссылаетесь на английский вариант статьи "Стилометрии", если есть русский? Думаю, в раздел со стилометрией добавить описание этого алгоритма с частями речи.

Уточните - на какие системы вы затрудняетесь поставить ссылки? -- Andrew Krizhanovsky 11:47, 9 декабря 2012 (UTC)[ответить]

Литературу проверила и исправила)

Хорошо, спасибо!)

Теперь только на программу Praide Unique Content Analyser. И еще я не могу найти в английской википедии статьи про шинглы.( Grishenkova Alena 12:54, 9 декабря 2012 (UTC)[ответить]

Praide Unique Content Analyser там: [5].
Ссылка на шинглы есть в списке тем: Участник:AKA MBG/Todo2012: w:w-shingling.
Просьба — оформлять внешние ссылки через шаблон «ref», например так.[1]Andrew Krizhanovsky 16:07, 9 декабря 2012 (UTC)[ответить]

Примечания[править код]