Наверх
Отображение
Настройки отображения:

Изменить размер шрифта х2
Изменить размер шрифта х4
Изменить цвет шрифта на красный
Изменить цвет шрифта на синий
Изменить цвет шрифта на серый
Изменить шрифт
Как взломать страницу в социальной сети в контакте?
Как правильно записать операционную систему на диск. Точные инструкции.
Как сделать Microsft Internet explorer браузером по умолчанию? Подробные инструкции.
Как запустить компьютер в безопасном режиме (Safe Mode)
Как убрать баннер с рабочего стола и из браузера. Самые действенные методы борьбы.
Подключение к удаленному рабочему столу - Вход в систему невозможен из-за ограничений учетной записи
Записываем диск. Разными методами.
История развития и эволюция клавиатуры.
Зомби ферма - весёлая игра в контакте.
Как удалить страницу в одноклассниках? как же "хорошо" в одноклассниках
Система Orphus

Что такое уникальность текста и как ее проверить?

Вы наверняка уже не раз слышали, что поисковые системы особенно ценят уникальные тексты, и потому, создавая свой сайт или какой-либо интернет-проект, искренне намерены наполнять его только оригинальными произведениями мастеров пера.

Интуитивно вы уже понимаете, что уникальный текст – это текст, написанный с нуля и непохожий на другие, то есть он такой один. Без копий, без повторений. Когда вы пишете текст сами, вы уверены, что ваш текст уникален. Однако каково же бывает удивление, когда вдруг обнаруживается, что текст, который вы сами сочинили, отнюдь не уникален с точки зрения поисковых систем.

Простой пример. Вы придумали название статьи, забиваете его в поисковик и вдруг видите, что его до вас уже придумали…

На практике уникальность текстов проверяется с помощью специальных онлайн-сервисов или устанавливаемых на компьютере программ, которые работают по принципу поисковых систем. Ими пользуются и редактора сайтов, и студии интернет-сайтов, и сами авторы.

Однако оказывается, что ничего непогрешимого нет, и идеальных приложений по оценке уникальности текстов тоже. Так, взяв одну давно опубликованную на проекте статью (а следовательно, уже имеющую немало дубликатов), я решила проверить, насколько сходными окажутся результаты. Так, сервис copyscape.ru показал 9 копий, miratools.ru обнаружил 39 дубликатов, istio.com – 23, программа DСF – более 50. Я заинтересовалась, почему же результаты столь различны.

Если объяснять простыми словами, то, с точки зрения роботов, уникальнымбудет тот текст, в котором порядок слов не совпадает ни с одним из имеющихся в арсенале вариантов. Именно поэтому одним из самых простых и быстрых способов сделать текст оригинальным является перестановка предложений или замена некоторых слов синонимами. И там, где человек заметит явный плагиат, робот, возможно, одобрительно пройдет мимо.

Уникальность текста проверяется поисковыми системами на основе сложных алгоритмов, смысл работы которых заключается в том, чтобы проанализировать разбитые на кусочки цепочки слов проверяемых текстов и сравнить полученные результаты. Чем короче отрезки текста, тем точнее выходит результат.

Текст разбивается на отрезки из пяти-шести слов, которые преобразуются в двоичный код. Во время проверки каждому участку текста присваивается некое уникальное число, и результат вычисляется по заданному алгоритму в виде контрольной суммы. У разных текстов контрольные числа не могут совпадать. Причем в процессе подобного «сканирования» текста конечное слово одного отрезка является первым для нового отрезка, и, следовательно, ни одно слово не теряется. Этот метод называют методом шинглов. Чем короче будут проверяемые отрезки текста, тем точнее результат. Обнаружатся не только точные копии вашего текста, но и его «легкие» переделки.

Метод пассажей предполагает разбивку текста на более крупные участки: проверка идет уже не на уровне словосочетаний, а на уровне предложений. Например, если из десяти слов одного предложения пять слов совпадут с составом другого предложения, его уникальность будет оценена в 50 процентов.

В основе большинства приложений, созданных для проверки уникальности текста, лежит метод шинглов. Однако, наряду с высокой эффективностью поиска дубликатов, у метода есть свой минус.

Надо быть очень осторожным с подобными приложениями, если вы, например, используете цитаты: тексты в кавычках могут значительно уменьшить показатель уникальности текста. То же касается и различных распространенных выражений: поговорки, пословицы, фразеологические обороты, придавая тексту оригинальность, могут существенно поубавить его уникальность.

Поэтому не стоит удивляться, если ваш собственноручно написанный оригинальный текст вдруг забракует программа: ей не до изысков стиля, все дело – в обычной математике.

Опубликовано: 2011-05-16

В рубрике: «Компьютер и интернет»

Просмотров: 472

Автор: Wikispace

Статья была добавлена на сайт анонимно и её автор неизвестен.




Рейтинг: 2 из 5 (голосов: 3)

Общий (округлённый) рейтинг статьи: 2    (фактический: 2.6666666666667 )
Всего баллов: 8     Голосов: 3
  • Disqus
  • Facebook
  • Native
  • Cackle

Свежие статьи в рубрике «Компьютер и интернет»

Как пользоваться фотошопом?

Фотошоп очень замечательная программа для редактирования фотографий и различных изображений в целом, безусловно это знают сейчас все. Это незаменимый…

Как создать сайт?

Для создания своего сайта вовсе не нужно вникать во все тонкости web программирования учить такие вещи как HTML, XHTML, CSS, PHP, JavaScript, perl и множество других языков…

Как скачать видео с YouTube?

На самом деле скачать видео с YouTube проще чем кажется по началу. Собственно это не составит труда даже для самого не подготовленного пользователя персонального…

Как увеличить скорость и эффективность работы за ПК

Здравствуйте уважаемый читатель. В этой статье хотелось бы рассказать о том как максимально эффективно использовать персональный компьютер в наши дни. Не…

Что такое спам?

Что же такое спам? Наверное это слово знакомо уже каждому пользователю ПК и обывателю интернета. Ведь правда, спам повсюду, от него уже некуда деться, он везде.…

Как узнать свой IP адрес? Все способы!

Как узнать свой IP адрес, этим вопросом задаются многие люди, которые не сильно разбираются в сетевых протоколах и вообще устройствах современных сетей.…

Недостаточно памяти на флешке! Решение проблемы

Наверное каждому знакома ситуация когда пытаешься копировать на флэш накопитель какие либо данные (объемом более 4 гигабайт) и операционная система выдает…

Как создать сервер в Left 4 Dead 2 ?

В этой статье я опишу Как создать сервер L4D2 через клиент Garena.Итак, начнем... 1. Закрываем все программы, которые активно используют интернет-соединение вашего ПК…