Какими были поисковики. Краткий экскурс в прошлое

Михаил Парфенов (г. Ессентуки)

Интернет… Мы заходим туда по любому поводу, в любую погоду и в любое время года. Заходим, когда хотим общения, когда хотим развлечься, и когда нужно отправить почту, посмотреть фото или картинки. Но, наверное, чаще всего мы заходим, если нужно найти какую-либо информацию. И что мы делаем для этого? Мы вводим поисковый запрос в специальную строку браузера и выбираем поисковую службу. И каждый для себя уже давно выбрал самую удобную, ту, которой чаще всего пользуется. И вот после ввода поискового запроса и нажатия на кнопку «Поиск» мы попадаем на страницу с результатами поиска, выданными поисковой машиной, давно такую знакомую, с привычным интерфейсом. Глядя на эту страницу, кто-нибудь задавался вопросом – а всегда ли она была такой? Как вообще выглядела эта страница поисковой системы в самом начале, с чего все началось?

Лихие 90-е

А началось возникновение поисковых систем со знаменитой статьи американского ученого Вэннивера Буша (Vannevar Bush), «Пока мы мыслим», в июле 1945 года. В этой статье было предсказано появление компьютера и сформулирована сама идея гипертекста. Вэннивер Буш даже сам занимался созданием прототипа современной поисковой системы, но тогда это было устройство для поиска информации в микрофильмах, разработанное и запатентованное им в 1938 г. Хотя Буш стал родоначальником идеи Интернета и технологий поиска, как это не редко случается в жизни, его идеи на практике реализовали другие ученые. Сначала Министерством обороны США планировалось использовать передачу зашифрованных данных посредством компьютерной сети, для чего было создано Агентство Передовых Исследовательских Проектов (Advanced Research Projects Agency — ARPA), где несколько лет, с 1963 по 1969 год, ученые разрабатывали новую концепцию передачи информации в военных целях. Но столкнувшись с проблемой секретности и не сумев обеспечить высокий уровень безопасности передачи информации, они отказались от продолжения разработок.

Затем, в конце 1980-х идея создания компьютерной сети возникла вновь, когда несколько университетов США объединили свои библиотеки образовательной информации, основав единую сеть. И тут все завертелось…

В 90-х годах интернет начал входить в массы, началось его бурное развитие. Но до 1991 года Интернет еще не был Всемирной паутиной. Только когда Тим Бернерс-Ли, объединив Интернет и гипертекст и разработал WorldWideWeb, обозреватель и редактор в одном лице и создал первый веб-сервер, названный “httpd”, родилась Всемирная паутина. Первый в мире веб-сайт имел адрес: http://info.cern.ch/.

В те времена найти нужную информацию можно было с помощью каталогов, в которых вся информация о сайтах была упорядочена по  тематиками и рубрикам. Но и каталогов и сайтов на тот момент было не много. Когда в середине 90-х годов стало увеличиваться количество сайтов, то, естественно, возникла потребность в организации более совершенного алгоритма поиска. В 1993 году в сети уже была тройка ботов поисковых систем, но они были несовершенны, с резко увеличивающимся потоком информации они не справились и исчезли в бурных волнах мощного  развития Интернета.

Все популярные сегодня поисковые системы появились еще в далеких девяностых, сразу после того как интернет начал входить в массы. Да и как могло быть иначе? Сегодня это уже не просто поиск информации, это поисковые гиганты, предоставляющие множество новых сервисов в виде почты, хранилища файлов, социальных сетей и т.д. Но и, конечно, постоянно совершенствующие свою главную функцию – поиск. Такие знакомые каждому пользователю и такие популярные поисковые сервисы как Google, Яндекс, Аппорт, Rambler, Yahoo!, начинались с маленького ручейка, с маленькой компании, превратившись в большую реку информации. Одни гиганты стали поменьше, другие побольше.

Google

Начнем историю с Гугла. И не потому, что он лучше всех, как уже говорилось, каждый определяет это для себя, и навязывать предпочтения никто не собирается. Просто начать с него есть повод. Дело в том, что недавно, а именно 15 сентября, поисковому гиганту исполнилось 13 лет. С чем всех нас можно поздравить. 13 лет — возраст подростка — переходный возраст. Но только не для такой серьезной компании, Google, хорошо зарекомендовавшую себя и в мире, и в нашей стране, не назовешь подростком. Популярность Google подтверждается, например осуществлением поиска веб-страниц на 191 языке. Только за месяц обрабатывается около 40 млрд. поисковых запросов, а количество индексируемых страниц составляет около 25 млн.

BIGITALRU_11

На рисунке: Google, сентябрь 1998 года

А началось все в марте 1996 года, когда студентам Ларри Пейджу и Сергею Брину пришла в голову идея выяснить, какие веб-страницы ссылаются на данную страницу, взяв за аналогию роль цитат в научных публикациях, рассматривать число и характер таких обратных ссылок с точки зрения ценности информации на странице.  Эту идею порекомендовала выбрать научный руководитель Ларри Пейдж, Терри Винограда, для темы диссертации.

Ими был разработан алгоритм PageRank, анализирующий результаты BackRub, по данным URL и состояла из обратных ссылок, ранжированных по важности. Такой подход, по мнению создателей, должен был привести к лучшим результатам, чем существующие на тот момент алгоритмы поиска, основанные на принципе «какое количество раз, искомое слово встречалось на странице».

Официально компания Google родилась в гараже друга Ларри Пейджа и Сергея Брина, в Менло-Парк, штат Калифорния и была зарегистрирована   4 сентября 1998 г…  Ах, эти гаражи, поистине место приложения творческих замыслов, фигурирующие в анекдотах и кино, созидательная лаборатория и дегустационный зал в одном месте.

Имя «Google» происходит от слова «Гугол», это цифра 1 со ста нолями. В повседневном языке употребляется как глагол «to google», проще говоря – гуглить, то есть использовать Google для поиска в интернете. Слово Гуглить даже было внесено в Оксфордский английский Словарь в 2006-м году.

Поиск Google привлекает пользователей прежде всего использованием простого интерфейса и скоростью работы. Число поклонников в среде Интернет-пользователей растет с каждым годом, а компания увеличивает число сервисов.

Яндекс

«Яндекс» — наша, российская компания. по количеству обработанных поисковых запросов «Яндекс» занимает седьмое место в мире среди крупнейших поисковых сайтов. Поисковая система Yandex.ru была анонсирована 23 сентября 1997 года на выставке Softool. Но какое-то время существовала в рамках компании CompTek International, и лишь в 2000 году стала самостоятельной.

BIGITALRU_22

На рисунуе: Яндекс, 1998 год

Главными отличительными чертами поисковой системы являются проверка уникальности документа и ключевые свойства поискового ядра Яndex. Что подразумевает:

  • <br>- учет морфологии русского языка – поиск по точной словоформе;
  • <br>- поиск с учетом расстояния —  точное словосочетание в пределах абзаца;
  • <br>- совершенствуемый алгоритм оценки релевантности – когда ответ соответствует запросу. Все это способствует тому, что Yandex.Ru понимает длинные запросы, составленные «по-русски».
  • <br>Сегодня пользователями интернета в нашей стране слово «Яндекс» произносится чаше других, это точно. И что приходит в голову в первую очередь при виде названия Яндекс? Думаю – индекс. Очень созвучно. Яndex – Index. И это совершенно верно. Когда в 1993 году Аркадий Волож и Илья Сегалович, будущие  генеральный директор и директор по технологиям компании «Яндекс», занимались разработкой поиска неструктурированной информации с учетом русского языка, старались дать благозвучное имя поисковой системе. И раз слово search («поиск») не очень сладкозвучное, то слово index было более удачной комбинацией. Yandex — yet another indexer, что означает — еще один индексатор или Языковой иНдекс. На основе этой комбинации, и с русской буквой «Я» вначале, было изобретено слово «Яndex» — Языковый iNDEX. Слово действительно оказалось благозвучным, и пользователи системы до сих пор предлагают свои трактовки названия, типа: Яша или метко подмеченное словосочетание — ИНЬдекс и Яндекс, как две стороны интернета.

 Rambler

Это еще одна поисковая машина, созданная нашими соотечественниками. В 1996 году Сергей Лысаков и Дмитрий Крюков при поддержке Компания «Стек», занимающейся локальными сетями и подключением к Интернету, приняли решение о разработке первой русской поисковой системы для Интернета. Это решение можно назвать прозорливой ставкой на будущее. Дело в том, что на тот момент российский сегмент сети Интернет был очень мал и насчитывал не более 30-50 сайтов.

С названием проекта все просто. Оно взято из англо-русского словаря, в котором слово Rambler означает — скиталец, странник, бродяга. Что совершенно соответствует смыслу работы поисковой системы. В том смысле, что роботы поисковой машины действительно странствуют по сайтам, собирая информацию беспрерывно.

BIGITALRU_33

На рисунке: Rambler, 1997 год

Aport, или очень печальная история

Что вы думаете по этому поводу? Я про название.

Со дня своего рождения поисковая система Aport работает под управлением операционной системы Windows и причиной тому компания «Агама» — разработчик программного обеспечения для Windows, которая, по сути, является создателем Aport. В самом начале поисковая система Aport работала только по сайту russia.agama.com, и в феврале 1996 года прошла ее презентация на пресс-конференции компании «Агама». Но уже в следующем 1997 году поисковиком был проиндексирован первый миллион документов, которые располагались на десяти тысячах серверов. А еще через год в 1998 году Aport был продан. Приобрел поисковик гражданин Израиля Джозефу Авчук, сохранив, однако названия торговых марок «Апорт» и «Агама». Затем в поисковую систему были произведены финансовые вливания, и на компьютерных выставках появился  «Апорт – 2000», интегрированный с каталогом AtRus, ранее переименованный из каталога Ау!.  Причина – новая метла… Следствие — теперь Каталог – Апорт (Catalog — Aport).

В то время работа поисковой системы Aport 2000 основана на выдаче результатов по отдельным сайтам используя информацию предоставляемою каталогом AtRus а так же владельцами ресурсов. Поисковиком первым были реализованы базовые технологии Google, «Page rank». А так же был применен подход – приоритет сайтам, которые вошли в высшие лиги Апорт – Каталог и впервые реализована возможность поиска по новостным лентам.

Но семейство интернет-проектов «Агама», куда входил Aport вместе с AtRus, опять, продали… купил их Golden Telecom 31 июля 2000 года для включения в «Россию-он-лайн». А затем сменился и владелец самого Golden Telecom, которым в итоге стал «Альфа-Банк». Какая печальная история! И все же поисковик существует и является одной из популярных поисковых машин российского Интернета.

Но что же с названием? Да все просто! Вспомните, какую команду вы даете своему четвероногому другу, когда хотите подвигнуть его на действие к поиску. Aport!

BIGITALRU_44

На рисунке: Апорт, 1997 год

Yahoo!

В 1994 году студенты-аспиранты  Джерри Янг и Дэвид Фило готовили к защите диссертацию в области компьютерного проектирования интегральных схем.

Опять студенты! Ну, все правильно, раньше — не то, что нынче. Теперь у нас много студентов, а учебные заведения можно найти в любом, далеко не приспособленном для храма науки, месте, даже в подворотне. А какого качества образование можно получить в подворотне… Раньше студенты, и в нашей стране и за рубежом, это самая прогрессивная, самая творческая, самая активная часть населения.

Информацию для диссертации приходилось искать в интернете, поэтому через некоторое время у них скопилось много списков со ссылками, в результате Янг и Фило вообще  забросили работу над диссертацией и принялись исключительно коллекционировать ссылки, создав веб-сайт, с называнием «Путеводитель Джерри по Всемирной Паутине». Доступ к списку со ссылками на этом сайте был предназначен для друзей, таких же студентов, с целью поделиться собранной информацией. Но как это всегда бывает, желающих воспользоваться готовой и бесплатной информацией было много. Адрес сайта передавался из рук в руки, посещаемость росла. В середине 1994 года, к тому времени ссылок скопилось много, стали сортировать эти ссылки по категориям. Когда и в категориях ссылок стало много, стали разбивать на подкатегории. В конце 1994 года, как уже говорилось, полностью оставив диссертации, приступили к работе над поисковиком, дав ему очень запоминающееся имя – Yahoo!, добавив новые категории и разделы. Работе над поисковиком сопутствовала удача. Появление компании Netscape,  предложившей ресурсы для содержания поисковой системы, на пути развития поисковика обусловлено появлением своего домена — yahoo.com. Затем Yahoo! получил первого инвестора в лице инвестиционного фонда «Seqouia Capital». Джерри и Янг открыли офис и наняли команду web-серферов. В апреле 1996 года www.Yahoo.com выпустил свои акции, которые к концу первого дня продажи выросли в цене с 12 долларов за штуку до 33 долларов. Чему способствовала реклама ресурса в печатных СМИ и на телевидении, которую создатели Yahoo! стали применять первыми.

BIGITALRU_55

На рисунке: Yahoo!, 1996 год

Сегодня  Yahoo.com является одной из основных поисковых систем Интернета.

История происхождения названия Yahoo! не менее интересна. Тут все неоднозначно и таинственно. Существует три версии происхождения названия. И это совсем не плохо, каждый может выбрать для себя понравившуюся и ее может считать правильной. Сами же создатели Yahoo! настаивают на версии, согласно которой слово взято из книги «Путешествия Гулливера» Джонатана Свифта. Слово Yahoo в переводе на русский Йеху, еху и обозначает расу человекообразных существ, тупых и грубых.

По второй версии, слово Yahoo! образовано из фразы «Еще один иерархический неотесанный (неофициальный) прорицатель», в английском варианте — Yet Another Hierarchical Officious Oracle.

Третья версия происхождения названия, слово Yahoo произошло от японского Yahhoo, что в неформальном варианте перевода означает «Привет».

Но название Yahoo уже использовалось, и было зарегистрировано торговой маркой соуса для барбекю, поэтому создатели и добавили в конце восклицательный знак.

Все еще впереди

Перечислены наиболее популярные поисковые системы, а есть еще — Alexa Internet, Поисковик Blinkx TV, Поисковик Topix, Поисковик Search, Поисковик Scirus, История Info, Поисковик GigaBlast, Поисковик FindSounds, Поисковик Ditto, Поисковик Dictionary.com. Не хватит страницы перечислить все, да это и не возможно. Каждая чем-то отличается от собрата. Но есть одно, что их все объединяет, кроме поиска информации, есть  один общий недостаток.

Современные поисковые системы постоянно улучшают свои технологии поиска. Потому что совершенных поисковиков нет, и ни одна из них не может похвастаться совершенным поиском. Основной недостаток любой системы поиска — это слаборазвитая система обобщения запроса и огромная зависимость выбора источников информации. Причина кроется в неодушевленности системы. Ну как объяснить машине простым языком, что именно хочет найти человек. Все же хочется надеяться, что будущее развитие поисковых систем будет направлено на преодоление барьера восприятия машиной  человеческих понятий. Все еще впереди – поиск продолжается!

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *