Главная Обратная связьКарта сайта

Вам нужен сайт?

Компания Oversoft профессионально занимается разработкой и созданием сайтов, раскруткой сайтов, интернет-проектов различного уровня сложности и разнообразной тематики.
Мы осуществляем комплексное обслуживание сайтов, в которое входит поддержка сайта, продвижение и раскрутка сайта в Яндексе и прочих поисковых системах - поисковая оптимизация сайта, как наиболее эффективный метод раскрутки.

1 Cоздание сайтов 2 Продвижение сайтов 3 Реклама в Интернете

Александр Садовский - конференция NetPromoter 09 «Поиск Яндекса в вопросах и ответах»

Александр Садовский на конференции NetPromoter 09 отвечает на вопросы о поиске Яндекса

 

Поиск Яндекса в вопросах и ответах 

На конференции Net Promoter 09 Александр Садовский, руководитель отдела веб-поиска компании Яндекс, выступил с кратким докладом и ответил на вопросы участников.
Тема выступления - “Поиск Яндекса в вопросах и ответах”.

“Чтобы обосновать тему доклада, расскажу, как я рассуждал, - начал свой доклад Александр Садовский, - Формулу ранжирования вы уже знаете, а если не знали, на первых докладах вам о ней рассказали. Учить как делать сайты – тоже, наверное, не нужно…”

Далее Александр Садовский представил 11 интересных фактов о поиске и его пользователях.
Первый факт: формула ралевантности не одна. Сергей Людкевич в свое время такую формулу написал - почти угадал, но сейчас она не работает. Сейчас можно просчитать только как конкретному сайту стать лучше.
Вес же ссылочных факторов снижается. За 2 года - вдвое, хотел сказать втрое, но цифра все-таки округляется до двух.

Второй факт: поисковые подсказки используют 45% пользователей.

Третий факт: по 6-8% запросов пользователи кликают только на результаты параллельных поисков

Четвертый факт: все пользователи равны, но не все одинаково активны. 18% самых активных любимых нами пользователей задают в 100 раз больше запросов.

Пятый факт: 5,6 % в сутки, 11% в месяц - региональный поиск (с галочкой искать по региону)

Шестой факт: число уникальных запросов на пользователя мало зависит от размера региона и равно 20-30 в месячном срезе. Вывод: каждый пользователь доносит свое разнообразие запросов

Седьмой факт: есть поиск по картинкам. Он умеет отличать дубликаты

Восьмой факт: мы выделили группы пользователей домашних и рабочих и решили, что у них будет разный график активности. Но… все пики совпадают. Единственное отличие: в будние дни домашние пользователи активны с 22 до 1 и выходные с 20 до 2 часов - но в остальном графики практически совпадают.

Девятый факт: и мы, и вы идентифицируем пользователей по кукам. Мы взяли репрезентативную выборку и поняли, что период распада куки - 2 месяца у 17% куки чередуются (разные браузеры + мобильный интернет).

Десятый факт: среднее количество поисковых систем, которые используют пользователи - больше 2.
Предпочитают 1 поиск - только 13% пользователей.

Одиннадцатый факт - самый интересный. Ашманов и партнеры пытались построить такой график, вот какой он на самом деле.

CTR ссылок в результатах поиска по вебу.
По графику видно, что CTR последней ссылки на страницах чуть-чуть выше чем предыдущих. Речь идет не о трафике. 11 позиция дает меньше трафика, чем остальные. Речь только о CTR

Cовершенно секретно - схема антиспама
Вы ребята умные, поэтому схема реальная, но не свежая - на конец 2007 года, но вот - можно посмотреть, как работает антиспам Яндекса.

Александр Садовский предложил участникам конференции сделать Яндекс удобней - выбрать фичу, которую в первую очередь добавят в панель вебмастера.
фича 1
понедельная история для запросов
фича 2
настройка регистра имени сайта
фича 3
ошибки скачивания url -ов из sitemap
фича 4
указание региона сайта
фича 5
указание адресной информация (в сниппете)
фича 6
список зеркал сайта

(Голосованием выбрали - в первую очередь реализовать ошибки скачивания url -ов из sitemap)


Ответы на вопросы

Вопрос про график с СTR
Ответ: разница огромная по различным запросам. Если говорить по количеству позиций - 3-4, зависит от подсказок, 5 точно нее влазит целиком.

Вопрос: количество картинок дублированных может ли наносить вред сайту?
Ответ: у нас есть алгоритм, который помогает выявить дублированный контент, но если мы не уверены - то удалять мы не будем.

Вопрос: может ли владелец сделать что-то, чтобы обеспечить право первоисточника?
Ответ: только просить обратную ссылку

Вопрос - xml скоро отменят?
Ответ - в ближайшее время (месяцы) не отменят. Но мы считаем, что xml не лучший вариант, вот поиск по сайту - показал себя хорошо. Мы планируем всех вебмастеров при поиске по сайту перевести на такой поиск. Но кардинально прикрывать пока не планируем. Количество покупок xml в свое время было минимальным, поэтому мы развивать его не планируем. Затраты на процессинг не были оправданы.

Вопрос - дадите возможность легально парсить Яндекс?
Ответ - если цель парсинга противоречит интересам Яндекса - то мы это мы делать не будем

Вопрос - а если цель - проверка позиций?
Ответ - напрямую эта цель интересам яндекса не противоречит. Но так как это делают в основном оптимизаторы… Понимаете, нет смысла, если можно посмотреть глазами. Сейчас позиции вы можете видеть в яндекс-вебмастере, там это будет развиваться.

Вопрос - про ссылки. Нужно ли прятать ссылки и оформлять ее, ссылку, как естественную или оформлять на рекламную и ничего не бояться?

Ответ - бояться или нет - личный выбор. Если профессионал из Яндекса не может понять, что это ссылка неестественная - то здорово, ставьте таких побольше, другое дело, что это вам дорого (в деньгах) обойдется.
Ответ на второй вопрос. Приведу пример из книги Пелевина «Чапаев и пустота». Там есть момент, когда Чапаев рассказывает про Красную бабочку. Когда персонажу снится, что он бабочка и он не может понять, толи он действительно бабочка и ему снится, что он революционер или он революционер и ему снится, что он бабочка. Сайту может сниться, что он торгует ссылками, а может быть, и торговой площадке снится, что она нормальный сайт… Ну так возвращаясь к книжке, там Петька спрашивает Чапаева - что было дальше? - Поставили к стенке и разбудили. - А он? – Ну, наверное, полетел дальше…

(смех в зале)

Вопрос - 3 марта выпали 4 миллиона страниц - что произошло?
Ответ - речь шла о базе зеркал. Мы научились определять дубликаты. В итоге мы не зафиксировали падения хороших сайтов. Кардинально ничего не поменялось. Если вам кажется, что пропал нормальный качественный сайт - пишите.

Вопрос - естественная ссылка от seo-ссылки отличается ссылочными связями или здесь отличие - что-то другое?
Ответ - что-то другое

Вопрос - сейчас идет большая ставка на обучение алгоритма, асессоры + взвешивание факторов. Не может случиться, что положительные факторы будут влиять отрицательно?
Ответ - нет ограничений для проверки факторов, но есть контрольные точки. У нас сотни размеченных запросов. Незначимые факторы выкидываются и в формуле остаются только значимые факторы.

Вопрос - TF и DF должны быть более значимыми факторами?
Ответ - нельзя одновременно использовать автоматическое и ручные обучение. Иначе будет в итоге просто ручное обучение. Мы не идем по этому пути. Есть тест здравого смысла. Но безусловно меняется и наш взгляд на этот текст. Нам же не нужно настраивать в ручную сотни факторов. В ручную расставить веса человек не сможет. Кстати, в этом году конкурс интернет-математика 2009 предлагает такое задание: попробовать настроить формулу так, как это делает Яндекс.

Вопрос - про Википедию. Откуда у Яндекса такая любовь к Википедии? Почему другие источники (словари) не выводятся?
Ответ - если посмотреть на оценки ассесоров - то окажется, что на самом деле очень мало сайтов являются классным ответом на запрос. И Википедия - один из них. При этом, Википедия - энциклопедия с хорошей, современной лексикой. Искусственно мы его не поднимаем наверх.

Вопрос - про сниппеты из либ.ру взятые не из кода страницы
Ответ - да, есть отдельные алгоритмы которые обрабатывают часть запросов и позволяют выдавать их в лучшем виде. О каких-то зонах речь не идет.

Ответ на вопрос про асессоров - у нас есть много настроек взятых из разметок асессоров, у выбранных сайтов есть особенности, и эти особенности у валидных сайтов просто в итоге становятся более весомыми.

Вопрос - временной фактор
Ответ - влиять можно на все, при определенной степени просветления… Факторов временных много. Количество факторов возросло, но про влияние я не могу сказать. Если этот фактор сейчас влияет на релевантность, в формуле он будет.

Ответ на следующий вопрос про асессоров - у асессоров есть возможность находить соответствующие запросу сайты разными путями и есть возможность вручную добавлять сайты. При этом, асессоры замотивированы добавлять сайты вручную. Фактически, они не смотрят существующую выдачу и не размечают конкретно ее - у них есть выбор несколько источников. Поиск Рамблера, поиск Мейла, поиск Гугла, каталоги, общая эрудиция, кругозор. Систематического искажения тут нет. Разметка идет по очень многим запросам. И по частотным, и нет.

Вопрос - как не специалисты оценивают контент узкотематического сайта и как стать асессором?
Ответ - к асессорам нет требований по образованию, но они совершенно разные. Но дело в том, что запросы даются точные. Например, продажа плит в омске. И кроме понимания, написана правда или нет - есть еще объем и вообще здравый смысл.

Вопрос - когда будет Анадырь?
Ответ - веселье будет в марте

Вопрос - мнение клиента - не все слова, по которым мы продвигаемся, выпадают в списке подсказок, при этом слова эти правильные, наилучшим образом характеризующие информацию и так далее.
Ответ - у яндекса есть принцип - мы не учим аудиторию.

Вопрос - вы стремитесь не делать ничего руками (настройка поиска). Значит ли это, что санкции не накладываются в ручном режиме.
Ответ - они и сейчас накладываются не в ручном режиме. Ручной - это корректировка автомата. Ручных исключений мы стараемся не вносить

Вопрос - когда передается асессору запрос - ему передается сайт или страница, или запрос?

Ответ - у нас есть разметка страниц и у нас очень много разметок. Есть критерии к сайту. Глядя на конкретный урл он должен оценить и сайт (и навигацию), опубликовать критерии не можем. Список секретен.

Вопрос - Директ конкурент оптимизаторов. Какое может оказывать влияние Директ на вас?
Ответ - на поиск не влияет, при этом еще Директ обижается, если поиск его ущемляет. Мы очень тщательно все просчитываем. И менять местами колонки не планируем.

вопрос - расширенный поиск не работает. В вебмастер панели нельзя посмотреть скачанные Яндексом файлы и сравнения с тем, что в индексе. Чтобы посмотреть реальные ошибки

ответ - ошибки неудачного скачивания мы стараемся заносить. Специально парсить терабайты индексации, чтобы что-то выдавать в панели вебмастера - нет

вопрос - отрицательные факторы у ссылок есть?
ответ - есть и отрицательные и положительные факторы.

вопрос - что есть уникальность?
ответ - уникальность не надо воспринимать как отличие текста а от текста б. Уникальный текст - который дает новую информацию. Например, так ведь работает и БСЭ - в конце каждой статьи БСЭ стоит список источников.

ответ на вопрос про группы запросов: две классификации запросов - темы (литературный, например) и прогматики (шахматы - онлайн партнер, литература и прочее. Тема одна прогматики разные.

Вопрос - как ставится фильтр аффилированности и как снять?
Ответ - это нормальное поведение системы. Удаление дублей по снипетам давно работает. Иногда привязываются сайты, которые очень похожи. Делайте сайты непохожие на другие.

вопрос - вебархив или сохраненная копия может быть доказательством первоисточника?
ответ - если у вас есть и то и другое, упоминайте в письме об этом. Но надо понимать, что вебархив и сохраненная копия - все это зависит от обхода робота, ошибка может быть.

И еще:
По окончанию выступления Александра Садовского, руководителя отдела веб-поиска компании Яндекс, за рамками официальной части некоторые слушателей конференции лично пообщалась с Александром. Поднимались насущные вопросы, на которые находились компетентные ответы от самого представителя компании Яндекс.

Вопрос: Какие стадии проходит сайт при бане?
Садовский: Стадий, по сути, три. Они характеризуются тем, как работает поиск.
Первая стадия – быстро убрать спам, который вдруг пролез со страниц результата поиска. Тогда сайт есть в индексе, он может теоретически находиться, но он удаляется с результатов поиска.

Вторая стадия, это убрать большую часть мусорных страниц с поиска и, возможно, и из робота. Вторая стадия, это когда сайт ещё не настолько плохой, чтобы вообще он пропадал из индекса.
Третья стадия – сайт пропадает целиком, и с поиска, и с индекса, мы даже его не хотим хранить. Эта стадия в основном применяется к спаму махровому, дорвеям, которые мы точно не хотим хранить.

Вопрос: Влияет ли тИЦ на выдачу?
Садовский: В ссылке набор множества данных, в которых содержатся сотни факторов. Как фактор – влияет.

Вопрос: Процесс оценки продажной ссылки и естественной ссылки – это какой-то параметр или это зависит от всего сайта или от ссылочной?
Садовский: Я не могу ответить ничего.

Вопрос: Вот вы сказали по поводу того, что выгружаются ссылки в вебмастер (когда в архиве). Там по-моему дата указана?
Садовский: Дата страницы там указана.

Вопрос: Какой первоисточник вы определяете, то есть та страница, которая первая проиндексируется или та, которая более трастовая?
Садовский: Там тоже система. Необходимо ставить обратные ссылки с копией, не обязательно со всех, на ваш оригинал. То есть у вас скопировали текст, значит, просите адрес.

Вопрос: Учитывается дизайн сайта или юзабилити?
Садовский: При прочих равных, это учитывается.

Вопрос: А фильтры есть какие-нибудь на текстовую составляющую, если она переоптимизирована, но сайт не является дорвеем?
Садовский: Есть. Не фильтр, но фактор.

Вопрос: Я имею релевантный по вч сайт. Если я говорю, что у меня украли контент, а злоумышленники не хотят удалять или менять контент. Стоит ли мне переписать контент?
Садовский: Если сайт старый, и действительно много статей регулярно создаётся, то гоняться за одним вором не стоит.

Вопрос: Если регулярно с сайта воруют контент, то это увеличивает риск попадания под фильтр «Ты последний»?
Садовский: А кто вам сказал, что этот фильтр существует?

Вопрос: Когда сайт недоступен по причинам хостинга, через сколько времени сайт может выпасть из индекса?
Садовский: Через 4 захода робота. Если сайт не популярный, то примерно через неделю. Но этот критерий надо уточнять, так как это зависит от того, как не работает сайт. Если сайт недоступен и робот это понимает, то выкидываться он не будет. Если для робота выдастся страница 200, то он её переиндексирует. Всё зависит от типа ошибки хостинга.

Вопрос: Текстовая составляющая учитывается сразу после индексации или спустя время?
Садовский: Всё учитывается одновременно, в момент обновления индексной базы.

Вопрос: Раньше регулярные апы были, а на данный момент наблюдается сбой. Планируете восстановить регулярность?
Садовский: Они у нас обновляются регулярно, просто по разным причинам какие-то базы мы решаем не выкладывать. То есть внутри процесс регулярный, идёт с той же частотой. Просто мы не всё пропускаем наружу.

Вопрос: А подскажите пожалуйста, есть ли какие-то временные ограничения по количеству увеличения анкоров в анкор-файлах?
Садовский: В общем, пришлите список ссылок :)
Людкевич: Александр скажет, брать или не брать :)

Вопрос: При обновлении индекса бету откроете?
Садовский: Ещё решение не принимали. Не знаем. Мы открываем её, в зависимости от того, насколько ожидаем увидеть от тестирования обратную связь, собрать недочёты. Есть разные типы изменений. Некоторые очевидны. Например, если меняем сниппеты, то можно сказать, что хороший сниппет или плохой. Если мы меняем в тонкостях ранжирования, где изменения будут незаметны, то скорее всего обратной связи нам не дадут. То есть это зависит от типа изменений.

Вопрос: Существует некая отраслевая необходимость собирать документы на одном сайте. И Яндекс может это посчитать неуникальным контентом, возможно даже дорвеем.
Садовский: Зависит от специфики. Например, украинские законодательные сайты все законы выложили на одном единственном сайте. От того, что они дублируются в десятках тысяч источников, мы не считаем его ни клоном, ни кем. У них тоже отраслевая необходимость.
У нас нет цели доказать дублирование как таковое или понизить сайт или ещё что-нибудь сделать. У нас есть цель – увеличить разнообразие результатов поиска. Поэтому если у вас есть отраслевая необходимость, не сомневайтесь – собирайте.

Вопрос: После того, когда Яндекс все биржи закроет, будут ли применены санкции к сайтам, которые раскручивались с помощью ссылочных бирж?
Садовский: )))) Мы писали, что сайты, которые размещают у себя ссылки, могут тоже пострадать.

Вопрос: Считаете ли вы выдачу без продвигаемых сайтов релевантной? И собирался ли такой эксперимент?
Садовский: Это довольно бессмысленный эксперимент, потому что определить, какой сайт продвигался, а какой нет и на каком временном отрезке, невозможно. Важно не что, а КАК продвигают. Если посмотреть списки клиентов крупных оптимизаторских контор, то бывают вполне хорошие лидеры своих отраслей. Поэтому важно как продвигают, а не какой сайт.

Вопрос: Александр, вы знаете сейчас какие ссылки seo, а какие естественные? Если вы их выключите, что станет с выдачей?
Садовский: Во-первых, вес ссылок сильно снизится. Ну, во-вторых, важно то, на сколько они влияют.

Вопрос: Реклама Яндекса на сайте облегчает ли в какой-то мере жизнь сайта?
Садовский: Не помогает и не облегчает.

Вопрос: Часть текста в сниппетах часто воспроизводится либо случайно с сайта, либо не с сайта вовсе. Такая ситуация?
Садовский: Источники формирования снипетов бывают разные:
1. текст с ключевиками;
2. начало страницы;
3. описание в каталоге Яндекса;
4. текст ссылок.

Вопрос: То есть можно выделить кусочек текста на странице и поработать с ним, чтобы он показывался в сниппете?
Садовский: Попробуйте, но не факт. На самом деле для чего служат сниппеты? Если мы дадим возможность выбирать сниппеты оптимизаторам, то страница выдачи может ухудшиться. Красивые сниппеты – не значит понятные, релевантные. Важно, чтобы сниппет помогал отличить страницы, которые релевантны этому запросу, а которые менее релевантны. И второе важно, чтобы общая формулировка сниппета давала как можно ближе ответ к запросу. Например, запрос «высота Эвереста». Лучше всего выводить число – сколько метров высота горы будет прямо в сниппете. Очень часто пользователи кликают, когда сниппет вообще непонятен – хороший или плохой, ни о чём не говорит.
С каталога мы берём сниппет, когда человеку нужен не текст, а сайт. Например, по запросу МТС человек не хочет найти текст МТС, а хочет найти именно сайт компании.

Вопрос: С <description> сниппет берётся сейчас?
Садовский: Я не помню, по-моему, он учитывается как один из возможных вариантов.

Вопрос: Борьба с биржами возможна?
Садовский: Бабочку разбудили :)

Вопрос: Отрицательное влияние обратных ссылок не невозможно: либо нулевой эффект, либо положительный?
Садовский: Самостоятельно подставить конкурента внешними ссылками вы нее сможете.

Вопрос: Как вы можете определить, на свой сайт я покупаю ссылки или на сайт конкурента?
Садовский: То, что отрицательно и положительно – это снимок в определённый момент времени. Мы смотрим факторы как положительные, так и отрицательные. Если сайты, которые имеют ссылки определённого типа, а асессоры начнут помечать как плохие, то в какой-то момент положительный фактор может стать отрицательным или наоборот, то есть это не вопрос какой-то идеологии, это вопрос настройки.

Вопрос: Про ссылки дополнительно. Получается, отрицательного вклада нет, но вклад в том, что вес сайта может потихоньку упасть в глазах Яндекса? То есть я много ставлю плохих ссылок.
Садовский: Мы стараемся это не учитывать вообще.

 

Источники - Анна Стусь и Светлана
При перепечатке ссылка на оригинал обязательна.

© Copyright 2006-2009 ООО Оверсофт. Все права защищены.