Что такое LSI или как Google и Яндекс понимают контекст веб-страниц?
На результаты поисковой выдачи влияют разные факторы. В Гугле сегодня это не только обратные ссылки (весомость), позволяющие поисковику понять, насколько качественная страница. Королем современной выдачи является контент, а ссылки - лишь его королевой. Поэтому и о таком понятии, как латентно-семантический индекс или же LSI не стоит забывать. Есть ещё один важный фактор - социальный, но его влияние лишь будет усиливаться в перспективе, а пока - куда важнее понимать сущность LSI.

LSA (расшифровка аббревиатуры Latent semantic analysis) - это латентно-семантический анализ (на русском языке также используется сокращение ЛСА), являющийся методом обработки текстовой информации, используемым алгоритмами поисковых систем. Этот анализ позволяет определить взаимосвязь между различными терминами и документами на основании сопоставления и проверки связей в общей совокупности коллекций документов.
Общие сведения
В основе LSA лежит факторный анализ, позволяющий выявлять скрытые связи между объектами и явлениями. При группировке текстовых документов данный метод применяется для определения зависимых в плане контекста значений в рамках статистической обработки больших объемов данных.
Латентно-семантический анализ - это фактически простейший вид нейросети, в составе которой имеется три слоя:
- первый включает большой набор терминов (слов);
- второй - это определенное множество документов, которое соответствует определенным условиям анализа;
- третий - это средняя скрытая прослойка, которая является узловой системой с разными коэффициентами и связывает два первых слоя друг с другом.
Трактовка идеи ЛСА
Основной смысл LSA заключается в том, что при одних условиях связи между двумя любыми терминами (словами) может и не наблюдаться, но после определенных преобразований зависимость все же проявляется. К тому же показатель этой зависимости будет обусловлен силой семантико-ассоциативной связи между исходными терминами.
Для понимания разберем на примере:
Предположим, что на двух веб-ресурсах имеются следующие текстовые фрагменты:
- первый источник - реклама - «Сей фантастический смартфон N получил емкий аккумулятор»;
- второй источник - запись в блоге «между прочим, батарейка у N долго держит заряд».
Лексика рекламного сообщения и текста в блоге отличается, поэтому и фразам типа «батарейка», «аккумулятор» присваивается разный весПерелинковка - процесс связывания ссылками. Происхождение слова обязано англоязычному термину - link - ссылка или линк. Перелинковка - это не просто одна ссылка, а…Перейти к словарю терминов . Допустим, первому - относительно большой, а второму - относительно малый. И имеющиеся фрагменты можно объединить только по названию устройства «N», а все подробности о батарейке/аккумуляторе пропадут.
Благодаря латентно-семантическому анализу весомость близких по сути терминов - «аккумулятор» и «батарейка» подравняется, причем оба фрагмента текста можно объединить на основании общего и важного для товара «N» параметра (автономность), хоть связующим звеном между фразами выступает одно единственное слово.
Именно так LSA «объединяет» и «стягивает» в одну группу (кластер) разные по стилистике и написанию, но связанные по смыслу термины.
О теории LSI (latent semantic analysis)
Начнем с азов. Благодаря таким гугловским алгоритмам, как Колибри или Панда, самый крутой поисковик сегодня хорошо распознает не только сам контентContent - контент или содержимое - собирательный термин, под который подходит все данные на информационных ресурсах - тексты, графика, видео. Разновидности…Перейти к словарю терминов , но и контекстную составляющую страничек. Рассмотрим этот вопрос на примере.
Если вы вводите запросЗапрос — слово или символ, вводимое в строке выдачи.Используется расширенный поиск:1) Оператор «+» (или кавычки) перед требуемым словом ищет запросы с…Перейти к словарю терминов "kino", то задача поисковика достаточно сложна, нужно понять, что вы ищете:
- фильмы;
- кинотеатры;
- информацию о рок-группе.
Вариантов, которые могут оказаться в выдаче, очень много. Задача Гугла определить, релевантные для пользователя варианты и предложить вам!
Как Гугл оценивает контекст страниц?
В этом аспекте поисковик и возлагает большие надежды на латентно-семантический индексИндексация - процедура добавления данных о веб-ресурсе в общую поисковую базу. Индексирование осуществляет робот поисковика. Работы по SEO делятся на проработку…Перейти к словарю терминов (далее LSI), чтобы распознавать контекст.
Если поисковые боты обнаруживают на веб-страничке слова - кинофильм, режиссер, актеры, то понять о чем веб-страница несложно, контекст становится понятен.
Как идентифицировать LSI-ключи?
С этим не возникнет сложностей. Несколько элементарных способов позволит собрать данные, нужные для SEO слова, и оптимизировать с их помощью продвигаемый ресурс.
Cпособы
1. Похожие результаты. Введите основной запрос в строку поиска и переходите в самый низ результатов - "вместе с "ключ" ищут". Там, Гугл и предлагает LSI-ключи, выделяя их жирным. Позаботьтесь о том, чтобы данные слова присутствовали в контенте продвигаемой страницы.
Как это сделать:
- собираем ключи, имеющие для нас смысл;
- отсеиваем все то, что не связано с нашим веб-ресурсом.
Данный вариант является простейшим, чтобы найти LSI-фразы и применять их непосредственно для оптимизации страничек.
2. Выделенные слова и фразы в выдаче. Введите в поиске слово и анализируйте результаты - все словосочетания с жирным шрифтом. Эти ключи также стоит добавить в содержание продвигаемой странички.
3. Применяем Google Planner
Получить информацию о LSI-ключам можно и в гугловском планировщике ключевиков. Для этого нужно:
- Задать страничку конкурента;
- Просмотреть все ключи;
- Почерпнуть те из них, которые тематически и по сути подходят вашему веб-ресурсу.
Сделать подобное следует хотя бы по первой десятке выдачи по продвигаемым вами ключам. В результате вы получите:
- собственно LSI-ключи;
- другие ключевые фразы, которые не используются вами, но способствуют выходу в ТОП.
После этого следует оптимизировать содержание страницы под эти ключевые слова. Результаты - в виде роста трафика - не заставят себя долго ждать.
LSI ключи активно используются многими оптимизаторами. А все, что понадобится для учета данного важного в Гугле фактора, это найти их, отобрать нужные, оптимизировать контент на продвигаемом сайте под эти слова и словосочетания.
Если у вас остались вопросы по поводу LSI-ключевиков, то смело оставляйте их в комментариях или же свяжитесь с нашими консультантами удобным вам способом!
Бесплатное обучение основам LSI копирайтинга, не пропусти!
Нужна помощь?
Предлагаю обсудить что такое LSI по телефону. Оставьте ваши контакты ниже и мы вам перезвоним!
Ксения Смирнова (SEO-аналитик)
- семантика которую делает в нашей компании специально обученный сециалист - широкая и оъватывающая максимум запросов пользователей на основе поисковых подсказок
- LSI семантика собирается после группировки запросов на основе нашего алгоритма берущего данные о сайтах в поисковой выдаче по каждому запросу и сравнивающему выдачу (вы получаете семантический скелет сайта в том виде, как его воспринимает Google)
- семантик нашей компании вручную проверяет целесообразность каждой группы запросов (бущей страницы) для продаж на вашем сайте (группы не ведущие к продаже ваших товаров и услуг не используются в основе нашей семантики)
- вы гарантированно получаете веб-страницы по каждой группе запросов с обязательным вхождением слов из запросов и их синонимов в ключевых местах на ваших страницах на сайте
- мы, в отличии от других компаний, не ограничиваемся наполнением существующих страниц сайта, но и создаем новые страницы, которые связываем непосредственно с формой заказа или страницей контекстно-связанного товара/услуги на вашем сайте