Как проложить кратчайший путь на вершину YouTube

Маруся

Администратор
Команда форума
Регистрация
21 Окт 2020
Сообщения
195
Основатель «Школы траблшутеров» Олег Брагинский рассказал про разработку алгоритма для подбора сильных названий, описаний и тегов к видеороликам. В ходе эксперимента удалось повысить seo-качество канала на 14,5%.

Опытные блогеры и начинающие пользователи сети действуют вслепую, надеясь на художественность оформления каналов и роликов. Читают тайные форумы, используют покупные плагины, нанимают гроусхакеров, надеясь на мгновенный взлёт популярности, не стыдятся закупать таргетированную рекламу.
Специализированные агентства и фрилансеры обещают золотые горы под разумный бюджет, но по факту перенаправляют половину средств третьим исполнителям, превращаясь в квалифицированных спекулянтов. Странно наблюдать всё это, находясь на территории, которая когда-то славилась крутыми программистами.

С Александром Яценко, коллегой по «Бюро Брагинского», решили показать класс и сформулировали задачу:
  • разработать инструмент, регулярно собирающий статистику YouTube-канала
  • создать алгоритм подбора сильных слов для названий, описаний, тегов
  • научиться прогнозировать просмотры, лайки, дислайки, комментарии.
Итогом исследования предположили технологию, помогающую заполнять текстовые поля видеороликов лучшими фразами по оценке самой сети. Наверняка подобный инструмент могут создать ещё несколько команд в мире, но пускать его в бой мало кто решится, ведь в таком случае соперничество тут же закончится.
Да, признаём, что обошли вниманием вопросы оформления самого канала: шапки и описания, видеовизитки и тегов, создания плейлистов и сортировки видео в горизонтальных рядах, но кто сказал, что мы к этому не вернёмся на следующей итерации, тем более что множественные задумки и значительные наработки уже есть.

Решили не громоздить сложные конструкции, а «починить забор» с помощью палочки и верёвочки. На этот раз отказались от макросов, вспомнив про Python, предлагающий сотни готовых библиотек. Обилие заготовок обнадёжило, но найти подходящие оказалось делом нетривиальным:
b_5ec3ccc5ef9be.jpg


На вход скрипту передаём ссылку на YouTube-канал стоматолога-ортодонта Инессы Брагинской:
b_5ec3cce87c26a.jpg


Собираем перечень плейлистов, для каждого формируем список видео, для роликов сохраняем:
  • количество просмотров, лайков и комментариев
  • название, длительность и дату публикации
  • текстовое описание и список тегов:
b_5ec3cd1ba07b6.jpg


После выгрузки собранной информации в Excel получаем первый полезный эффект — становится доступна проверка орфографии. Названий роликов и ошибок, мешающих поиску, оказывается немало:
b_5ec3cd36d79a3.jpg


Вторая находка — пропущенные нумерованные видео, недоступные сюжеты, дублированные ролики в плейлистах. Особо не мешает, но и на пользу точно не идёт:
b_5ec3cd4f49e23.jpg


Третьей победой стало программирование сбора информации канала, настроенного через планировщик заданий Windows на ежедневный сбор показателей в 12:00...
b_5ec3cd7664fa1.jpg


... с сохранением в базу данных SQL Lite для последующего анализа:
b_5ec3cd9190d6f.jpg


Четвёртым шагом построили температурную карту тегов при описании видео — стала отчётливо видна классическая ошибка новичков: использовать слабые однородные слова для всех роликов плейлиста, вместо того чтобы тщательно подбирать индивидуальные ключевые слова к каждому сюжету:
b_5ec3cdb324c8f.jpg


Пятым этапом собрали статистику поисков тегов в Гугл и YouTube, чтобы оценить количество релевантных результатов, после чего повторили операцию для роликов, которые оказывались выше в выдаче при использовании браузера в режиме «инкогнито», что позволило найти «улучшенные» ключевые слова:
b_5ec3cdcded89c.jpg


На шестой ступени оценили распределение роликов по seo-корзинам:
  1. к первой отнесли 159 видео, набравших менее 50 баллов (1.1)
  2. ко второй — 0 получивших ровно полусотню
  3. к третьей — 12 рекордсменов (3.1):
b_5ec3cde853670.jpg


На седьмом уровне изучили теги третьей корзины...
b_5ec3ce0f75a9e.jpg


... и, варьируя параметрами сортировки, подобрали лучшую очерёдность ключевых слов...
b_5ec3ce2fe9ce7.jpg


...создали таблицу групповых замен тегов по маске названий...
b_5ec3ce45e2e5c.jpg


... для видео первой корзины:
b_5ec3ce5d407a1.jpg


...при которой SEO-оценка роликов сразу же становилась не менее чем 48.7...
b_5ec3ce79b3e74.jpg


... улучшив корзинную статистику:
  1. первая «потеряла» всего 9 видео (1.2)
  2. вторая, как и раньше осталась пустой
  3. третья пополнилась из первой (3.2):
b_5ec3ce93e2730.jpg


Восьмой очередью запустили анализ тегов под видео, которые выдавал YouTube в ответ на уже собранные нами ключевые слова:
b_5ec3ceb98d735.jpg


Удалив очевидно неподходящие, провели оценку всех слов-претендентов под каждым видео из первой корзины:
b_5ec3ced059634.jpg


Девятым подходом занялись исследованием роликов, получивших SEO-балл выше ожидаемого. Вставляли по одному ключевому слову, чтобы зафиксировать его силу под конкретным видео. Гипотеза оказалась верна: тот же тег под разными роликами приобретал силу от 0 до 13.1 баллов:
b_5ec3ceeb8c829.jpg


Десятым шагом стала попытка вставлять под «не взлетевшими» видео первой корзины...
b_5ec3cf0a48271.jpg


... сортированную очерёдность индивидуально оценённых тегов с попыткой удаления последних для поиска строки пикового seo-значения...
b_5ec3cf26b7f69.jpg


... что дало новые сдвиги:
b_5ec3cf4157c97.jpg


Температурная карта ключевых слов предсказуемо улучшилась:
b_5ec3cf5b2d061.jpg


Как, впрочем, и распределение по seo-корзинам:
b_5ec3cf745f6f2.jpg


В ходе эксперимента удалось повысить seo-качество канала на 14,5%:
b_5ec3cf984b9c9.jpg


Переместить все отстающие видео во вторую корзину не вышло из-за слабости найденных тегов, но мы обязательно продолжим эксперименты, тем более что все требуемые программные инструменты уже созданы:
b_5ec3cfd8db1fd.jpg


Источник
 
Сверху