Вернуться   SEO форум - оптимизация и продвижение сайтов > Поисковые системы > Яndex

Важная информация
Яndex - Поисковая система Yandex. Раскрутка, оптимизация, продвижение сайтов под Яндекс. Фильтры, алгоритмы, апдейты...

Ответ
 
Опции темы Рейтинг: Рейтинг темы: голосов - 2, средняя оценка - 3.00. Опции просмотра
Старый 09.07.2010, 13:55   #1
 
Аватар для Umka
 
Сообщений: 4,143
FR (активность): 80,659

Доп. информация
По умолчанию Автор темы Яндекс ищет в реальном времени

Яндекс ищет в реальном времени

Интернет, 9 июля 2010 года. Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить совсем свежие документы — через минуты после их появления в интернете.

Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс, во-первых, научился выявлять их среди общего потока, и во-вторых, внедрил нового поискового робота — Orange. Orange работает в режиме реального времени. Он умеет находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера буквально за несколько секунд.

Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме.

«В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска. — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко».

Робот Orange и технология поиска в реальном времени были разработаны специалистами из Yandex.Labs — калифорнийского офиса компании — в сотрудничестве с разработчиками из московского офиса. Подробнее о новых технологиях можно почитать в блоге Яндекса.
Контакты:
Компания «Яндекс»
Пресс-служба

http://company.yandex.ru/news/press_...0709/index.xml

Добавлено через 13 минут
З.Ы. Интересно а этот Оранжевый робот форумы индексирует?
Umka вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
"Спасибо" от:
Alex LM (17.08.2010), bespredel__ (23.08.2010), Byblik (17.08.2010), Toni4 (09.07.2010), WebCr (17.08.2010)
Старый 09.07.2010, 16:13   #2
 
Аватар для Cheshir
 
Сообщений: 148
FR (активность): 2,181

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

Сомнительно это все... Индексирует "риал тайм" скорее всего только архиавторитетные сми сайты/порталы... пуп развяжется актуальную информацию искать по всей сетке.


http://jino.ru/banners/468x60/c1.png

Лучшее спасибо
- Плюс (+) к репутации
Cheshir вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 10.07.2010, 12:22   #3
 
Аватар для TIMUR-TT
 
Сообщений: 311
FR (активность): 5,788

Доп. информация
Восклицание Re: Яндекс ищет в реальном времени

Оффтоп:
Цитата:
Сообщение от umka from ufa Посмотреть сообщение
Яндекс ищет в реальном времени

Интернет, 9 июля 2010 года. Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить совсем свежие документы — через минуты после их появления в интернете.

Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс, во-первых, научился выявлять их среди общего потока, и во-вторых, внедрил нового поискового робота — Orange. Orange работает в режиме реального времени. Он умеет находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера буквально за несколько секунд.

Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме.

«В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска. — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко».

Робот Orange и технология поиска в реальном времени были разработаны специалистами из Yandex.Labs — калифорнийского офиса компании — в сотрудничестве с разработчиками из московского офиса. Подробнее о новых технологиях можно почитать в блоге Яндекса.
Контакты:
Компания «Яндекс»
Пресс-служба

http://company.yandex.ru/news/press_...0709/index.xml

Добавлено через 13 минут
Цитата:
Сообщение от umka from ufa Посмотреть сообщение
З.Ы. Интересно а этот Оранжевый робот форумы индексирует?
Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.


Ну а в целом еще выложу вес пост с блога Яндекс компании.

Цитата:

Легко ли быть зеркалом?вчера, 11:44
Источник; блог яндекс компании

Яндекс всегда хотел быть зеркалом интернета. На 100% это невозможно, и мы хотим сделать вид, что мы — зеркало для тех, кто на нас смотрит. Мим за пустой рамкой несуществующего зеркала должен быть внимательным и иметь хорошую реакцию, чтобы создать иллюзию, что он — отражение. Мы в Яндексе работаем над технологиями «свежести», чтобы сделать отличия поискового индекса от интернета незаметными для людей.

Веб-мастера рунета знают, что последние несколько лет в Яндексе существовал так называемый «быстрый робот». В его задачу входила быстрая индексация и выкладывание на поиск наиболее ценных свежепоявившихся документов. Быстрый робот неплохо решал эту задачу, однако имел определенные ограничения.

Как и «большой робот», быстрый был построен по «пакетному» принципу: какое-то время готовил версию индекса с новыми документами, потом выкладывал ее на поиск. Это вносило задержку на время обработки, которую можно было сократить с помощью разных ухищрений для части документов до 20 минут, но нельзя было устранить полностью.

С момента запуска быстрого робота мир изменился. В интернете стало много людей, интересы которых далеки от технических проблем поиска, и у них вызывает крайнее изумление ситуация, когда страница на сайте есть, а в поиске ее нет. Именно поэтому правилом хорошего тона в ближайшие годы станет индексация нового за секунды.

Чтобы окончательно сделать из поискового индекса отражение, мы создали и запустили новые технологии — робот «Orange Crawler» и «Real-Time поиск». Основная разработка была сделана калифорнийским отделением Яндекса — Yandex Labs в сотрудничестве с программистами московского офиса.

Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.

Веб — это не набор отдельных страниц, которые можно рассматривать независимо. Страницы сильно связаны друг с другом, данные о ссылках очень интенсивно используются в ранжировании и в отборе из всего бесконечного интернета страниц, интересных человеку.

Люди обычно попадают на новые урлы через первые страницы любимых сайтов или по ссылкам с других новых сообщений. Поисковый робот должен находить эти же ссылки, часто освежая старые страницы, и ходить по ссылкам из новых уже скачанных документов. Именно поэтому для получения качественных свежих данных робот просто обязан работать не только с новыми документами, а со всем вебом, зная его структуру.

Orange познает ссылочную структуру интернета. Для этого ему достаточно скачивать и переобходить только часть «старых» страниц — хоть и достаточно большую. Полученные знания позволяют Orange обнаруживать почти все новые страницы, выбирать из огромного их количества все хоть сколько-нибудь интересные и мгновенно рассчитывать для них ссылочные факторы ранжирования. Вслед за роботом Orange документы обрабатывает Real-Time поиск — он подхватывает выбранные документы, индексирует их и за секунды выкладывает на поиск.

С помощью Orange мы достигли значительного улучшения свежести базы. В будущем мы сделаем его еще более агрессивным: Orange будет использовать все доступные источники информации об изменениях в интернете и реагировать на эти изменения мгновенно.

Кластер Orange Crawler реализован как распределенная вычислительная система: на каждой машине одновременно выполняются сотни небольших задач, результаты их работы в виде маленьких асинхронных сообщений отправляются на другие машины. На всем кластере сегодня обрабатывается более 100 тысяч сообщений в секунду. Подобная архитектура позволяет исключить задержки при обработке Real-Time информации, очень надежна и дает неограниченные возможности к масштабированию кластера.

Свежесть — еще одна составляющая в поиске, где простой эффект достигается сложными средствами. Хорошо, когда смотрящий в зеркало видит не особенности зеркала, а только то, что в нем отражается.

Федор Романенко и Екатерина Вебер, операторы сетевой соковыжималки
Сразу задается куча вопросов, может обсудем, хотелось бы услышать мнение общества, и специалистов.

один вопрос я задал в блоге, незнаю ответят ли нанего.. Но возникают вопросы.


Это: Книга #1, Книга #2 Спеши! Повысит продажи до 70%
TIMUR-TT вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
"Спасибо" от:
Umka (17.08.2010)
Старый 17.08.2010, 15:16   #4
 
Аватар для Alex LM
 
Сообщений: 972
FR (активность): 222,016

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

Оффтоп:
Цитата:
Сообщение от umka from ufa Посмотреть сообщение
З.Ы. Интересно а этот Оранжевый робот форумы индексирует?
Во всяком случаи на трастовых форумах это действительно Real-Time... Дело минут.
Alex LM вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
"Спасибо" от:
Umka (17.08.2010)
Старый 17.08.2010, 20:13   #5
 
Аватар для TIMUR-TT
 
Сообщений: 311
FR (активность): 5,788

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

Цитата:
Сообщение от Alex LM Посмотреть сообщение
Оффтоп:

Во всяком случаи на трастовых форумах это действительно Real-Time... Дело минут.
Alex LM, я думаю зависит от трафика, и частоты обновления..


Это: Книга #1, Книга #2 Спеши! Повысит продажи до 70%
TIMUR-TT вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 17.08.2010, 20:16   #6
 
Аватар для Alex LM
 
Сообщений: 972
FR (активность): 222,016

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

В этом нет противоречий.
Обычно, трастовые форумы хорошо обновляются (по понятным причинам) и соответственно имеют хороший трафик... Обычно по НЧ.
Alex LM вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 17.08.2010, 22:46   #7
 
Аватар для WebCr
 
Сообщений: 203
FR (активность): 5,031

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

Это конечно хорошо. Но, что если возникает ситуация:
У меня сайт, который выдаётся по запросу: прогулки по воде.
Крупные информационные порталы публикуют новость с пометкой молния: прогулки по воде закончились плачевно.

С этого момента возможна выдача новостных порталов выше в топе (по запросу: прогулки по воде)?

Мне кажется новостым порталам карты в руки дали!

Или я что-то не так понимаю...


Каждое посещение seocafe - +1 к моему опыту и +10 к знаниям!!!
WebCr вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 18.08.2010, 16:39   #8
 
Аватар для TIMUR-TT
 
Сообщений: 311
FR (активность): 5,788

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

думаю, уних вообще определеный белый список, и в него входят проекты в которые вложены не малые деньги. а уж потом может что то выборочно из остального добавили, и отбор ручной.


Это: Книга #1, Книга #2 Спеши! Повысит продажи до 70%
TIMUR-TT вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 18.08.2010, 18:52   #9
 
Аватар для arnowtaa
 
Сообщений: 15
FR (активность): 268

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

Очень похоже на правду, у меня в панели вебмастера ссылка появилась через несколько часов после опубликования статьи на другом сайте.


Займусь продвижением Вашего сайта- ICQ 594315409
arnowtaa вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Старый 09.09.2010, 13:30   #10
 
Аватар для gast
 
Сообщений: 1
FR (активность): 15

Доп. информация
По умолчанию Re: Яндекс ищет в реальном времени

так в итоге ищет реал-тайм или нет?
gast вне форума  
Ответить с цитированием Сказать Плохо за это бесполезное сообщение Быстрый ответ на это сообщение
Ответ

Быстрый ответ
Ваше имя пользователя: Регистрация. Для входа нажмите здесь
Случайный вопрос

Сообщение:
Опции
Внимание!
Этой теме более 2650 дней. Вы можете оставить сообщение здесь. Но, обращаем внимание. Возможно, рациональней создать новую тему (найти свежее обсуждение)?


Опции темы
Опции просмотра Оценка этой теме
Оценка этой теме:

Ваши права в разделе
Вы не можете создавать новые темы
Вы можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

Текущее время: 03:14. Часовой пояс GMT +3.