Содержание

Что такое стоп-слова? Допустимый процент вхождения стоп-слов в текстах

SEO-тексты отличаются от простых текстов тем, что с помощью ключевых слов/ фраз оптимизируются под определенные поисковые запросы, облегчая пользователям поиск нужной информации. Проводить SEO-оптимизацию нужно грамотно, учитывая не только релевантность ключевиков содержанию страницы, но и множество других, влияющих на результат факторов. Поскольку, для того чтобы индексировать, а затем выдать пользователю максимально соответствующие его запросу веб-страницы, поисковые роботы подвергают содержание каждой из них тщательному анализу по многим параметрам. Наиболее важными среди них являются правильная концентрация в представленном контенте ключевых фраз, оптимальная тошнота текста и пропорция значимых и шумовых слов. Последние принимают активное участие в формировании каждого из этих параметров, поэтому познакомимся с ними поближе.

Что такое стоп-слова?

Стоп-слова (иначе называемые шумовыми) – это слова, знаки, символы, которые самостоятельно не несут никакой смысловой нагрузки и просто игнорируются поисковыми системами при осуществлении ранжирования или индексации сайтов. Но которые, тем не менее, совершенно необходимы для нормального восприятия текста, его целостности, читабельности. Без использования стоп-слов невозможно создать полноценный контент, хорошо воспринимаемый не только поисковиками, но и людьми. При написании SEO-текста они позволяют максимально органично вписать в него ключевые фразы, соединив несогласованные между собой ключевые слова с помощью предлогов или разделив их знаками препинания.

 * — Примеры стоп-слов выделены в предыдущем абзаце.

Перечни стоп-слов (индивидуальные для каждой из поисковых систем, таких как Яндекс или Гугл) регулярно обновляются, поэтому представить их здесь полностью практически невозможно. Чаще всего стоп-слова подразделяют на 2 группы: общие, зависимые.

  • К общим относят предлоги, частицы, междометия, союзы, наречия, местоимения, вводные слова, числа от 0 до 9 (однозначные), другие часто употребляемые служебные, самостоятельные части речи, символы, знаки препинания. Относительно недавно этот список пополнили такие часто используемые в сети Интернет последовательности символов, как www, com, http и др.
  • Во вторую группу попадают слова, которые в ключевом запросе определяются, как второстепенные. Пример: в запросе «Лев Николаевич Толстой» поисковые системы выделяют основной компонент запроса – «Толстой» и второстепенные, то есть зависимые стоп-слова, имеющие значение только рядом с главным ключевым словом, – «Лев», «Николаевич». Поэтому среди выпавших в поисковой выдаче страниц будут только те, которые содержат значимый компонент запроса – «Толстой». Зависимые стоп-слова будут учитываться только при его наличии рядом с ними.

Стоп-слова и поисковые роботы

Все вышеперечисленные шумовые слова удаляются поисковыми роботами из текстов при их индексации, из ключевых фраз при определении соответствия документа конкретному запросу, заменяясь специальными символами – маркерами (*). Это делается с целью уменьшения размеров индекса, снижения нагрузок на сервер, рационального использования пространства баз данных. Кроме того, вычеркивание стоп-слов из запросов позволяет сократить количество операций по поиску каждого элемента ключевой фразы, а значит, повысить скорость, эффективность поиска нужной информации, сохранив релевантность запроса. Если вы хотите, чтобы система учла ваш ключевой запрос целиком (включая общие или зависимые стоп-слова), вам нужно для этого просто добавить к фразе знак «+». 

И снова повторимся. Несмотря на полное игнорирование шумовых слов со стороны поисковых систем, при создании связных, интересных для интернет-пользователей текстов без них не обойтись. Поэтому важно найти оптимальный баланс между их откровенным недостатком и явным переизбытком, удерживая правильное их соотношение с общей массой слов и ключевыми фразами. При недостатке шумовых слов вы получите сухой, нечитаемый текст, понятный только поисковым роботам, но совершенно неинтересный для посетителей сайта. А при переизбытке – текст с повышенной водностью, утяжеляющей его восприятие читателями и размывающей суть изложенной информации.

Оптимальная концентрация стоп-слов по отношению к общему количеству слов в тексте составляет около 30%, уровень тошноты текста (на которую также влияет количество стоп-слов) старайтесь удерживать в пределах значения указанных в таблице.

Символов

Слов

Допустимая тошнота*

До 1000

~167

До 3

До 2000

~334

До 3.5

До 3000

~500

До 4

До 4000

~667

До 4.5

До 5000

~834

До 5

До 6000

~1000

До 5.5

До 7000

~1167

До 6

* Данные значения являются усредненными и не значительно отличаться для разных тематик.

В качестве вывода:

обязательно учитывайте факт пропуска стоп-слов поисковиками при формировании поисковых запросов, ключевых фраз для SEO-текстов и определении их правильной плотности, которая неминуемо повысится после замены всех стоп-слов маркерами. Но при этом не забывайте, что текст должен оставаться читабельным. Для определения оптимального количества шумовых слов в статье в помощь авторам и оптимизаторам существует множество специализированных сервисов и программ для SEO-анализа текстов. Мы привыкли пользоваться Textus Pro и Advego.

Если же для вас это сложно, то звоните нам или заказывайте услугу продвижения сайта по словам.

Хочешь стать экспертом в SEO?

Пройди курсы от SEO Интеллект

Подробнее

Понравилось? Репост!

Что такое стоп слово в тексте и какие они бывают

Стоп-слова в копирайтинге можно сравнить с красным знаком светофора. Что такое стоп-слово? Это фразы, слова, словоформы, не несущие никакой смысловой нагрузки. Их легко можно заменить или выбросить из статьи. Стоп-слова в копирайтинге делают текст малоинформативным и пресным. Поисковые системы подобный материал игнорируют, как итог — шанс оказаться в топ-выдаче невысок. Не менее печальной выглядит картина, когда заказчики просят написать SEO-текст, да еще с использованием большого количества «ключей» на пару тысяч знаков.

Как же выглядит список ненужных стоп-слов? К ним относятся:

  • наречия и определения;
  • штампы;
  • паразиты времени;
  • модальные фразы;
  • очевидные формулировки;
  • отглагольные существительные.

Сюда же можно причислить местоимения, междометия и фразы-клише. Интересно, но даже предлоги и цифры некоторые проверочные сервисы относят в эту категорию. В качестве стоп-слов можно привести такие примеры:

  • все знают, что;
  • ни для кого не секрет;
  • кроме того, необходимо подумать;
  • следует упомянуть, что;
  • давно известно;
  • в первую очередь необходимо учитывать;
  • в общем-то;
  • на мой взгляд и т. д.

Главная проблема стоп-слова в тексте — отсутствие этой самой проблемы. Но многие оптимизаторы и заказчики впадают в крайности. Написать текст без одного или двух этих слов — задача непростая по одной причине: текст с указанными словами становится «живее» и «человечнее». Учитывать правила поисковых роботов нужно, но не стоит забывать — ваш клиент не робот, а человек!

Употреблять ли стоп-слова в тексте?

Поисковые системы вполне благосклонно относятся к наличию тех или иных стоп-слов в тексте. Вопрос в их количестве. Любой нормальный копирайтер, будь он новичок или профи, не сможет обойтись в копирайтинге без стоп-слова. Если они есть в русском или украинском языке, значит для чего-то были придуманы. Наличие стоп-слов в тексте — нормальная практика, ведь без них материал будет выглядеть слабым, пустым и безэмоциональным. Другое дело, если речь идет о технических документах, инструкциях, законодательных статьях и актах. В остальном наличие стоп-слов ничем не навредит статье.

Ведь что такое стоп-слово? Это некий баланс между словами, которые можно оставить, а какие-то следует удалить без нарушения логики и связующей мысли. Распространенная ошибка — желание полностью убрать местоимения в тексте. В итоге мы получаем сухой безжизненный текст, написанный как для телеграммы.

Золотая середина — где она?

Когда заказчик или оптимизатор составляет техническое задание копирайтеру для написания СЕО-текста, никто не обращает внимание на количество ключевых слов, необходимых для употребления. Т. е. внести с десяток «ключей» в материал из 2000 символов — нормально, а вот прописать парочку стоп-слов — смерти подобно. Во всем должна быть норма, и в стоп-словах тоже.

SEO-специалисты считают, что в тексте может присутствовать не больше 30% стоп-слов от их общего количества. А чтобы понять это, поможет специальная проверка на стоп-слова. Но после нее не нужно сразу удалять все лишние фразы, иначе велик риск получить не просто сжатый текст, а совершенную бессмыслицу.

Без прилагательных текст становится скучным и неинтересным, а без местоимений появляются нестыковки в предложениях. Стоп-слова и полезны, и вредны одновременно. Но задача копирайтера в том и состоит, чтобы найти баланс между ними. Не нужно доходить до фанатизма и удалять все неугодные слова, фразы, предлоги, местоимения и наречия. Если видите, что из текста можно убрать шумовое слово — удаляйте без сожаления. А если понимаете, что оно приукрашает, добавляет эмоций, то пусть остается.

Надеемся, что статья была полезной и интересной, и мы смогли ответить на вопрос, что такое стоп-слово и как с ним бороться.

Ильяхов: 11 заметок с тегом стоп-слова

Ильяхов: 11 заметок с тегом стоп-слова

Rose debug info
---------------



Тег: стоп-слова





Было Данный микрофон обеспечивает оптимальный звуковой охват за счёт передовых технологий, а также надежное высококачественное поглощение вибраций за счет инновационной системе подвесов

Вот несколько примеров: .error{ color: #dA570f; font-style: normal;…





В информационном стиле есть понятие мусора. Это слова и выражения, которые не несут смысла для читателя





Есть такой корпоративный штамп «товары и услуги». Юридически он верный: фирма продает товары и оказывает услуги

Все неопределенное — кандидаты в стоп-слова. Читаю какие-то статьи, отвечаю на какие-то звонки → Читаю статьи, отвечаю на звонки

Сослагательное наклонение и частица «бы» — кандидаты в стоп-лист

В продолжение разговора о словах «просто» и «но». У Карнеги наконец-то нашёл почти универсальную пилюлю от «но»

Слова вроде: действительно, реально, на самом деле…

Такой комментарий подойдёт любой книге: Книга очень понравилась, никого не оставит равнодушным. Отличается интересным стилем, читается легко, доступна любому виду читателей

«Просто» — опасное слово-паразит. Оно всплывает, когда человек оправдывается

This text was created with a very old version of Aegea that used a formatter called Calliope. It is no longer included with Aegea 2


Стоп-слова – что это такое и как правильно применять.


Стоп-слова – seo-термин, обозначающий слова, не обладающие смысловой нагрузкой («шумовые слова»).


Что считать стоп-словами?


Стоп-слова – название слов-связок, без которых невозможно построение полноценного текст, обладающего должным смыслом. Включают в себя:


  • Вводные слова;

  • Знаки препинания;

  • Междометия;

  • Местоимения;

  • Предлоги;

  • Союзы и союзные слова;

  • Указательные слова;

  • Цифры;

  • Частицы.


Это могут быть определённые существительные, глаголы, наречия (всегда, давать, например, однако и т.п.).


Поскольку алгоритмы поисковых системнеустанно развиваются и совершенствуются, происходит периодическое обновление и изменение списков стоп-слов. Собственная база стоп-слов имеется у всех поисковиков. При написании текстов обязательное внимание стоит обращать на вхождение стоп-слов из вышеуказанных категорий и соотношение их с общей словесной массой, включая ключевые слова.


Значение для поисковых роботов и пользователей


Стоп-слова не оказывают никакого влияния на поисковые системы, автоматически пропускаясь при индексации для того, чтобы сэкономить пространство баз данных. Данный факт обязательно следует учитывать при продвижении сайта в момент составления поисковых запросовс определением плотности ключевых слов, что касается контентного наполнения страниц.


Увеличение количества стоп-слов в тексте приводит к затруднённому восприятию читателями и создаёт впечатление «водянистости». Если стоп-слов в тексте недостаточно (оптимизатор ориентировался преимущественно на поисковые роботы, а не на читателя), такой контентпостепенно становится неинтересным пользователю.

Услуги, связанные с термином:

Стоп слово — что это? Примеры списков стоп слов от Семён Ядрён

Стоп слова в семантике

Стоп слово в семантическом ядре — это слово, которое является не целевыми для выбранной тематики.

Например: для тематики «клининг, уборка квартиры», стоп слова будут: пшеница (уборка пшеницы), игра (игра об уборке для девочек) и т.д.

Другие встречаемые варианты терминов стоп слов:

  • минус слова
  • мусорные ключи
  • не целевые запросы

Стоп слова в seo используются для:

  • при обязательной чистке семантического ядра от различного мусора и не целевых тематик.
  • для правильной настройки контекстной рекламы, исключив показы объявления для не целевой аудитории.

Скачать примеры

Что такое стоп слова в тексте

Понятие стоп-слова в тексте документа — это фразы и слова, которые не несут смысловой нагрузки и затрудняют индексирование страницы поисковыми системами. Стоп-слова не любят редакторы и поисковые системы.

Примеры стоп слов в тексте:

  • Междометия: ах, ух, ну, уж, ой.
  • Местоимения: я, мы, мой, вы, ваш.
  • Неопределенность: где-то, что-то, зачем-то, как-то, какой-то, около, порядка, примерно, всего.
  • Вводные структуры: на самом деле, допустим, скажем.
  • Слова-усилители: предельно, максимально, наиболее, очень, самый, абсолютно, сильно.
  • Оценочные: роскошный, уютный, красивый, дорогой (не следует сочетать их со словами из предыдущего пункта).
  • Очевидные формулировки: данный документ, этот сайт, на данной странице, кликните эту кнопку, нажмите тут, форма внизу страницы.
  • Бытовые штампы: направо и налево, сплошь и рядом, шаг за шагом, так или иначе, мало-помалу.
  • Штампы, характерные для прессы: ударными темпами, пески времени, царила атмосфера, в лучших традициях.
  • Штампы корпоративного или рекламного характера: индивидуальный подход, решать бизнес-задачи, завоевать доверие клиентов, расширить географию продаж.
  • «Временные» слова-паразиты: в наши дни, в настоящее время, в современном мире.
  • Словосочетания с отглагольными существительными: оказывать услуги по ремонту, производить ремонт, осуществлять деятельность.
  • Модальные фразы: нужно пройти процедуру, можете авторизоваться, должны завершить заказ.
  • Страдательные глаголы и сказуемые в безличных предложениях: спорткомплекс построен по заказу мэрии, леса вырубают.

Для анализа и подсчета стоп-слов в тексте, можно воспользоваться — advego.ru/text/seo/

Видео

Общие стоп слова

Общие стоп слова — это предлоги, суффиксы, причастия, междометия, цифры, частицы и т. п. Общие шумовые слова всегда исключаются из поискового запроса (за исключением поиска по строгому соответствию поисковой фразы), также они игнорируются при построении инвертированного индекса. Считается, что каждое из общих стоп-слов есть почти во всех документах коллекции. Источник: wikipedia

В качестве вывода

Стоп слова — одинаково вредны, как при составлении семантического ядра, так и при написании текста.

Что такое стоп-слова? | Агентство копирайтинга Text iS

Стоп-слова (или шумовые слова) это лексические единицы текста, лишенные смысловой нагрузки и особенно нелюбимые заказчиками. К категории стоп-слов относится в основном служебная лексика и не значимые части речи (особенно – вводные слова), а также предлоги, междометия, союзы, частицы. У каждой из поисковых систем имеется собственный список шумовых слов.

Стоп-слова первого абзаца выделены жирным.

Некоторые биржи контента и SEO-компании даже дают своим штатным копирайтерам списки стоп-слов, которые не должны встречаться в тексте. И если во времена глупого SEO, когда уникальным рерайтом можно было завести тексты в ТОП, такое было вполне оправдано, то сегодня это, скорее недостаток.

Нужны ли стоп-слова сегодня?

По собственным наблюдениям, шумовые слова вполне благосклонно воспринимаются поисковыми системами. Естественно, только в том случае если они не переполняют текст, создавая ощущение, будто бы автор намеренно напихал их в материал «для веса». В своей работе каждый нормальный автор не может вообще обходиться без использования стоп-слов.

Как вы понимаете, если какие-то слова встречаются в русском языке, значит, они зачем-то были придуманы. Лишать текст вводных слов, частиц или междометий опасно по той простой причине, что в нормальных текстах стоп-слова являются нормой. Во времена доминирования поведенческих факторов крайне нежелательно делать пустые, эмоционально и лексически слабые тексты. Уж лучше со стоп-словами, но достойно и полновесно, чем намеренная лингвистическая кастрация. Поисковые системы давно уже стремятся к максимальной естественности, а потому стоп-слова все же необходимы, как органичная и обязательная часть русского языка.

 

 

Поделиться

Твитнуть

Поделиться

Отправить

Оценить статью

Загрузка…

Ответить

2 Comment threads

1 Thread replies

0 Followers

 

Most reacted comment

Hottest comment thread

из nltk.corpus импорт стоп-слов

k из nlt .tokenize import word_tokenize

example_sent =

stop_words = установить (стоп-слова)слов ( 'английский' ))

word_tokens = word_tokenize (example_sent)

filter_sentence = для [w43 ] w в word_tokens если не w в stop_words]

filter_sentence = []

w в word_tokens:

если w не в stop_words:

filter_sentence.append (w)

print (word_tokens)

print (filter_sentence)

import io

from nltk.corpus import stopwords

from nltk.tokenize import word_tokenize

stop_words = установить (stopwords.слов ( 'английский' ))

файл1 = открыть ( "text.txt" )

строка = файл1 .read ()

слова = line.split ()

для r в слов:

если не r в stop_words:

appendFile = открыть ( 'отфильтрованный текст.txt ' , ' a ' )

appendFile.write ( "" + r)

appendFile.close ()

A

a
около
выше
фактически
после
снова
против
все
почти
также
хотя
всегда
am
и
и
любые

как
на

B

было
стало
стало
, потому что
было
до
было
ниже
между
и
, но
на

C 9400005 может мог

D

сделал
до
сделал
сделать
вниз
в течение

E

каждый
либо
либо еще

несколько
для
от
дальше

H

было
было
иметь
иметь
он
он бы
он будет
следовательно
он
ее
здесь
вот
ее
сама
он
сам
его
как
как

я

я
я бы
я
я
я
если
в
в
это
это
это
это
само по себе

J

просто

L

давайте

M

я
мог бы
мой
больше
больше всего
должен
мой
сам

N

ни
, ни
не

O

из
ой
на
один раз
только
ОК
или
другие

сами
наши из
более
собственных

S

то же
она
она будет
она будет
она
должна
так
некоторые
такие

T

90

, чем
, это
, это
,
, их
, их
, они
, сами
, затем
, там
, там
, эти
, они
, они бы
, они будут
, они
, они имеют
, это
те, с
по
до
тоже

U

и er
до
вверх

V

очень

W

было
мы
мы бы
мы
мы
мы ' ve
были
, что
, что
, когда
, когда
, когда это
, где
, тогда как
где угодно,
, где
, то ли
, то ли
, тогда как
, кто
, кто угодно,
, кто
, кто
, кто
, почему
, почему
будет
с
внутри
, будет

Y

да
еще
вы
вы
вы
вы
у вас
свое
сами
сами