В новом аудиоподкасте №230 Николай Шмичков рассказал про то, что такое семантический анализ текста из словаря SEOшника.
Текстовая версия выступления:
“Всем привет.
Вы на канале Сеоквик и сегодня мы продолжаем нашу рубрику словарь сеошника.
И сегодня я решил ответить на какую тему – что такое семантический анализ текста.
Для многих это может словосочетание казаться таким сложным, какой-то там там замудренной задачей, которую делают только гуру сео и новички понять не могут.
Но на самом деле, всё куда проще.
В общем, семантический анализ текста, это когда вы создаете искусственный интеллект, который распознаёт соответствие написанного текста непосредственно к поисковому запросу.
Семантический анализ это последовательность действий алгоритма автоматического понимания текстов.
Она заключается в выделении семантических отношений, формирования семантического представления текстов.
Это структуры состоящие из текстовых фактов.
Семантический анализ в рамках одного предложения называется локальным семантическим анализом.
Это так говорит об этом Википедия.
В SEO семантический анализ это чуть-чуть другое.
В сео семантический анализ это когда вы анализируете текст на определенные ключевые слова.
Когда вы хотите понять, какие ключевые слова являются смысловыми, какие ключевые слова являются ненужными, на какие не нужно обращать внимание.
И по этому анализу вы должны определить насколько качественно написанный текст.
Самое сложное, это установить содержательное семантическое соотношение между элементами текста, потому что как бы мы пишем не одним словом, мы добавляем литературные определённые обороты, мы добавляем какие-то предыстории для того, чтобы удержать пользователя и поэтому наша задача бороться между удержанием пользователя, облегчения контента и изложения тематики по сути.
Семантический анализ это показатель качественности текста, который составляется размещать на страницах сайта, с целью его продвижения.
Написание текста для оптимизации, требует у него наличия ряда показателей, которые не должны превышать соответствующие нормы.
Есть определённый анализ, который позволяет проверить не переспамлен ли текст, насколько велика его тошнота, не преобладает ли в нём вода и какие слова являются в нём подавляющими.
Таким вот образом, копирайтеру нужно найти баланс между тем как писать тексты как для поисковой машины, так и для человека.
Этот абзац является ключевым, потому что в сео в написании текстов, мы должны балансировать между тем, чтобы учесть, что семантика не расползалась мыслями по древу, что вы должны четко удерживать себя в определенных рамках тошноты, в определенных рамках переспама, и определенного анализа и ключевых слов, но и при этом конечно же, писать как для людей, потому что в противном случае, вступит другой алгоритм, который мы знаем как Баден Баден или Google Фред, как его еще называют, тот самый алгоритм, который определяет бессмысленные тексты и понижает позиции.
Поэтому мы пройдемся по темам семантического анализа.
Первая тема – это тошнота ключевых слов.
Это частота употребления ключевых слов, которые составляют семантическое ядро.
Если вы слишком часто упоминаете ключевые слова, которые у написаны и являются вашим семантическим ядром, то есть их плотность по соотношению к тексту высокая, значит тошнота высокая.
Метод борьбы с тошнотой – увеличить объем контента, либо исключить определенные повторы ключевых слов, знаменив их на LCI синонимы.
Второй термин – это стоп слова.
Это слова, которые не несут смысловой нагрузки, в стоп слова входят предлоги, местоимения, наиболее часто употребляемые в интернете существительные и глаголы.
Стоп слова при индексации, поисковики практически не учитывают, определённым исключением.
Новый алгоритм Гугл Берт внимательно учитывает соотношение этих самых стоп-слов в составе ключевого предложения.
Надо рассматривать предложения пытаясь довоссоздать дополнительный контент.
Предлоги тоже имеют значение в запросе и в контенте, которые вы пишите.
Так что на самом деле, когда вычисляется процент плотности ключевых слов, должны понимать, что предлоги в ходе большинства сервисов не учитывает, поисковики не очитывают, но наличие предлогов в определенных ключевых словах являются важным и поэтому здесь нужно писать по делу.
Вода – это процент незначимых слов и выражений.
Есть некая база слов, которые являются повторяющимися, например, слова-паразиты.
Соотношение воды и общего количества слов в тексте, не должно превышать определённо значение.
Путем несложного анализа большинства текстов, вычислили, что соотношение воды нормальное это 30-40% процентов.
Соотношение тошноты не более 6%, ну а стоп-слова не учитывают.
Существует целый вагон программ для семантического анализа.
Самое известное это Адвего.
Про Адвего мы писали большую статью, рекомендую сходить почитать.
Она называется “Как заработать на Адвего”.
Адвего позволяет анализировать количество символов в тексте, общее количество слов в тексте.
Я закинул свой свеже написанный текст, написал его на 3000 символов, или 2600 без пробелов, на 440 слов.
Из уникальных 256 слов, система не распознала 158 значимых слов.
Нашла у меня 64% воды Я просто много предлагов пишу обычно, это факт.
И акадамическая тошнота у меня получилось 6.8%, что в принципе довольно таки высоко.
Но на самом деле, я этот текст написал без разбавления, просто изложил мысли и получилось такое соотношение.
Количество грамматических ошибок 23, но причина заключается в том, что это грамматические ошибки, которые не являются ошибками. Это слова Google, ранжировать, система не очень понимает их.
Конечно же он помогает исправить тест, но не является панацеей.
Мне Адвего очень нравится, он позволяет разбить слова по группам, это очень удобно.
Он разбивает сразу по семантическому ядру, написанный текст, разбивает его по отдельным словам, выделяют отдельно стоп-слова, можно посмотреть, какие стоп-слова он увидел.
И вы можете от них избавиться, перефразировать предложение, уменьшив эти показатели. Это очень удобно.
Второй сервис, для семантического анализа это текст.ру.
Текст.ру больше заточен на анализ именно доли документа.
Он не разбивает документ по семантическому ядру и он больше нужен для анализа уникальности.
Но для семантического анализа Адвего в этом плане лучше и мне пока больше всего нравится.
Если у вас возникли вопросы, задаём их пожалуйста у нас в телеграм группе, я буду рад на них ответить.
Также у нас есть чатик непосредственно на нашем сайте, можно задать вопросы.
Приходите к нам по четвергам, к нас есть вебинары на нашем youtube-канале, где мы рассказываем те или иные фишки по сео продвижению, обычно у нас в гостях кто-то есть.
Вы можете задать вопрос как мне, так и нашему гостю, и мы в прямом эфире на них конечно же ответим.
Не забываем читать статьи на нашем блоге, там много чего интересного.
До новых встреч.”