суббота, 26 декабря 2015 г.

Чем измерить уникальность: сравниваем онлайн-сервисы

Тестируем онлайн-сервисы по проверке уникальности текста

Источники

1. http://mexboy.ru/?p=43 (старый пост)
2. http://mexboy.ru/?p=408 (старый пост, обновлённая версия предыдущего)
3. Собственный опыт (два последних сервиса).

Обзор

1. http://www.copyscape.com/

  • Анализирует ссылку (не введённый текст и не текст из файла) с другими страницами Интернета.
  • Не требует регистрацию.
  • Выдаёт страницы, дублирующие материал. Проценты не выдаёт.
  • В бесплатном тарифе количество проверок с одного компьютера ограничено.
  • Англоязычный, но с яндекс-переводом понятен.
  • В качестве теста проверил несколько страниц сайта Общественной палаты Астраханской области: выдал страницы, дублирующие контент.
  • См. также: www.copy-scape.ru (нелестно описан в источнике и, по-моему, уже не существует, яндекс-браузером не выдаётся).

  • Проверяет и файлы, и тексты без загрузки на сторонний хостинг; страницы сайтов, видимо, нет.
  • Требует регистрацию.
  • Выдаёт процент уникальности и страницы, дублирующие материал.
  • В бесплатном тарифе ограничена регулярность проверки.
  • Русскоязычный
  • Протестировал свой реферат. Результаты: при загрузке файлом: 90, 28. 
Загружать реферат текстом по частям не стал из-за больших ограничений на объём (5000 знаков), хотя для эксперимента загрузил целиком, сервис ошибку не выдал и даже как-то посчитал процент (89,9). Это как??? Может, он автоматически отрезает 5000 символов от любого объёма?


Однако проверка явно нулевого новостного текста (т. е. взятого с открытого ресурса и, значит, имеющего уникальность в 0%) дала уникальность в 100%. Как пишет источник, «Изначально, этот сервис делался для выявления скачанных из интернета рефератов, курсовых, дипломов и т.д. Собственно, для этих целей сервис замечательный, а вот для проверки контента сайта на уникальность не подходит. Ради интереса протестировал на пяти разных текстах,  как уникальных, так и взятых с чужих ресурсов – антиплагиат упорно выдает, что уникальность текста 100%».

Подтвержу от себя, что для оценки реферата и вправду оказался хорош: выдал и процент, и страницы с совпадениями.

3. www.findcopy.ru

Обладает тем же неудобным принципом работы, что и первый пример + требует регистрацию. Не стал регистрироваться и тестировать. Даже не понял, как зарегистрироваться. Ничего не понял об этом сервисе. Комментарии о нём в источнике положительные.

См. также: www.miratools.ru. Меня ссылка вывела на «ту же» страницу, что и  www.findcopy.ru
Источник пишет, что это отдельный сервис.

4. http://www.istio.com/

  • Анализирует текст (файлы или страницы сайта — нет)
  • Выдал хороший анализ по стоп-словам, но процента уникальности нет, как и страниц с дублированием контента (вопреки тому, что написано в источнике). Есть процент водности и какой-то тошноты, суть последнего понятия не объясняется.
  • Регистрация возможна, но не понял, что она даёт, всё сработало и так.
  • Бесплатный
  • Русскоязычный.
  • В качестве теста проверил страницу сайта Общественной палаты Астраханской области.

5. content-watch.ru/website/

  • Анализирует тексты, страницы сайтов, целые сайты и даже группы ссылок сразу.
  • Удивительно: я проверил два нулевых текста, но мне были выданы проценты уникальности в интервале 49–65%. Полностью стопроцентные дубляжи сервис игнорирует? Выдаёт страницы с дубляжом, процент уникальности относительно каждой страницы и подсвечивает дублированный текст.
  • Есть платные тарифы.
  • Ограничения бесплатного тарифа — 10000 символов в одном тексте (до 20 проверок день).
  • Русскоязычный.
  • Результаты по реферату (четыре части из-за ограничений):

1 часть — 86,9%;
2 часть — 100%,
3 часть — 100%.
4 часть — 100%.

Этот результат некорректен: части 2, 3 и 4 у меня не могут быть на 100% уникальны, в них много цитат.

Собственный опыт

Переходим к собственному опыту

1. Обычно я пользуюсь сервисом http://text.ru/

  • Проверяет только тексты (файлы, страницы или сайты — нет),
  • Регистрация снимает какие-то ограничения на проверку, но я, пользуясь этим сайтом очень долго и проверяя по множеству текстов в день без регистрации, так и не понял, в чём были ограничения.
  • Выдаёт страницы с дубляжом, процент уникальности относительно каждой страницы и подсвечивает дублированный текст.
  • Бесплатный.
  • Русскоязычный.
  • Ограничения по объёму — 15000 символов.
  • Протестировал реферат

1 часть — 86,13%
2 часть — 71, 13%
3 часть — 67,83%


Этот сервис также завалялся у меня в закладках.
  • Проверяет только тексты (файлы, страницы или сайты — нет),
  • Регистрация снимает очень сильные ограничения на объём текста (1000 символов).
  • Выдаёт страницы с дубляжом, процент уникальности относительно каждой страницы и подсвечивает дублированный текст.
  • Бесплатный.
  • Русскоязычный.
  • Ограничения по объёму после регистрации — 5000 символов.
  • Протестил случайный новостной текст. Реферат из-за сильных ограничений на объём тестить не стал.

Выводы

Лучшие сервисы для измерения уникальности реферата — Текст.ру и Антиплагиат.

Для тестирования рерайтов подходят многие из перечисленных, но лучшим кажется Текст.ру, хотя возможно, дело привычки. Худший (из числа в принципе работающих) — Антиплагиат.






Комментариев нет:

Отправить комментарий

Спасибо вам за то, что читаете мой блог! Мне будут очень полезны ваши комментарии по теме этого сообщения.

Если у вас нет аккаунта в Blogger, то, чтобы оставить комментарий, выберете из выпадающего меню строчку Имя/URL, укажите своё имя и напишите отзыв в поле для текста.

Анонимность не приветствуется.

Чтобы вставить гиперссылку, используйте код:

<a href="ССЫЛКА">ТЕКСТ</a>

Related Posts Plugin for WordPress, Blogger...