История поисковой системы — первые годы

Так с чего все началось? В первом из трех постов об истории поисковых систем я смотрю на историю самого Интернета и предшественников современных поисковых систем Интернета (в период, непосредственно предшествующий созданию первой широко используемой сети браузеров). В этом туре с комментариями я теперь использую забытые инструменты, такие как Арчи, Вероника и WAIS.

Краткая история интернета

Интернет, вероятно, величайшее изобретение двадцатого века, обеспечивающее практически неограниченную связь людей друг с другом и с ресурсами, которые они ищут. Хотя изобретение телеграфа, телефона, радио и компьютера стало ареной этой революции в области коммуникаций, в шестидесятые годы произошел ряд быстрых технологических изменений, которые проложили путь к созданию Интернета.

Интернет-бабушка и дедушка, вероятно, были J.C.R. Ликлайдер и Леонард Кляйнрок, оба в Массачусетском технологическом институте (MIT). Ликлайдер был первым руководителем программы компьютерных исследований в Агентстве перспективных исследований (DARPA), а в августе 1962 года он написал статью о «галактической сети» компьютеров, подключенных по всему миру, благодаря которой каждый мог быстро получить доступ к данным и программам с любого сайта. Kleinrock сделал эту мечту возможной благодаря работе над теорией обмена пакетами (с 1961 по 1964 год) и созданию первой (хотя и небольшой) широкой компьютерной сети (или WAN) в 1965 году (Соединение компьютера TX-2 в MIT с Q- 32 в Калифорнии).

Кляйнрок тесно сотрудничал с Лоуренсом и Дж. Робертсом над созданием WAN, и именно Робертс в конце 1966 года начал проект ARPANET (Сеть проектов расширенного тестирования), все больше и больше сотрудничая с командами из Национальной физической лаборатории (NPL) в Великобритании. и RAND Corporation (обе независимо разработали технологии коммутации пакетов, не зная об их работе).

В 1968 году Болт Беранек и Ньюман (BBN) были избраны для создания ARPANET, а в сентябре 1969 года первый узел был установлен в Калифорнийском университете (UCLA). Месяц спустя был добавлен второй узел (в Стэнфордском научно-исследовательском институте), и из UCLA было запущено первое сообщение Host-to-Host, которое когда-либо отправлялось в Интернет. Месяц, в котором я родился!

В 1970-1972 годах в ARPANET было добавлено много компьютеров, разработаны протоколы и написано программное обеспечение. В октябре 1972 года Рэй Томлинсон из BBN разработал первую систему электронной почты и отправил первое электронное письмо («quertyuiop»). В следующем году ARPANET совершила первые звонки за пределы США, в NORSAR в Норвегии и в Университетский колледж Лондона (UCL) в Великобритании. Чтобы посмотреть отличный документальный фильм о ARPANET с 1972 года, посетите мой блог.

Хотя оригинальный ARPANET быстро развивался в 1970-х годах, он оставался в основном академическим консерватором. Ключевой следующий шаг в развитии современной сети начался в 1982 году с принятия многими участниками протокола TCP / IP, который был быстрее, проще в использовании и дешевле в реализации, чем предыдущие протоколы. Это, в свою очередь, позволило небольшим сетям намного легче подключаться к сети и соединять эти филиалы во всех направлениях. Отныне все сети, использующие протокол TCP / IP, определяются как часть Интернета (не ARPANET), а стандартизация TCP / IP позволяет увеличивать экспоненциальное количество веб-сайтов и пользователей.

Чтобы использовать аналогию, эти изобретения создали мольберт, но у художника все еще было мало ценных красок. Большинство ранних инструментов онлайн-СМИ были слишком техническими и сложными в использовании. Кто-нибудь помнит такие термины, как WAIS (поиск в широкой области), Archie (поиск файлов), Gopher (загрузка), Newsnet и другие?

Два ключевых инструмента должны были изменить все навсегда. В 1989 году Тим Бернерс-Ли и команда из CERN (Европейская лаборатория физики частиц) разработали глобальную гипертекстовую сеть. Четыре года спустя, в 1993 году, Марк Андрисен из Национального центра суперкомпьютерных приложений (NCSA) в США запустил первый в мире коммерческий веб-браузер Mosaic. Оригинальные спецификации Тима для URI, HTTP и HTML были улучшены в ближайшие годы, и Andreesen разработал веб-браузер Netscape на основе исходного ядра MOSAIC.

Остальное, как говорится, история! С тех пор Интернет растет в геометрической прогрессии. По данным Internetworldstats.com, в декабре 1995 года было всего 16 миллионов пользователей Интернета (0,4% населения мира), но это число увеличилось до 361 миллиона в декабре 2000 года (рост на 2 300%) и 1 018 миллионов в декабре 2005 года.

Первая поисковая система в мире

Арчи и Вероника были отцом и матерью современной поисковой системы. Archie, разработанный в 1990 году Эмтеном, Хиланом и Дойчем (студенты Университета Макгилла в Монреале), был в некотором смысле первой в мире поисковой системой. Арчи был инструментом для индексации FTP-архивов и позволял пользователям искать и находить определенные файлы. У пользователя должна была быть довольно хорошая идея для имени файла, который он искал, потому что Арчи только индексировал имена файлов (хотя были поддержаны подстановочные знаки, что помогло).

В самых ранних версиях Archie система работала просто, выполняя задачу один раз в месяц, чтобы войти на каждый из FTP-серверов и запросить запись. Эти списки были сохранены в локальных файлах для поиска с помощью команды Unix grep. Когда пользователь нашел файл в индексе Archie, ему пришлось подключиться к FTP-хосту и порыться, пока они не нашли нужный файл (точно так же, как первые годы совместного использования музыкальных файлов Napster почти 10 лет спустя). Это было не для людей со слабыми нервами, и система использовалась только техником или общежитием!

Имя Арчи происходит от слова «архив», но пользователи связывают его с серией одноименных комиксов, созданных Бобом Монтаной (с вымышленными персонажами-подростками Арчи Эндрюсом, Бетти Купер, Вероникой Лодж, Реджи Мэнтлом и Форсайтом «Персонажи« Джугхед »Джонс) Поэтому, когда Gopher начал соревноваться в 1992 году, Фостер и Барри (из Университета Невады) назвали свою новую поисковую систему Gopher Veronica в комиксе Archi. Официально Вероника обменялась «Очень простым в использовании индексом грызунов всей сети для компьютерных архивов». ».

Вероника была постоянно обновляемой базой данных имен почти всех пунктов меню на тысячах серверов Gopher, и ее можно было искать непосредственно из большинства основных меню Gopher. Технически Вероника стала усовершенствованием Арчи в том, что он проиндексировал полное название документа, а не только имя файла, и (б) связал пользователя напрямую с исходным файлом одним щелчком мыши. То, что ни Арчи, ни Вероника не делали, было полной индексацией целевого документа. Это означало, что оба не обладали так называемой «семантической емкостью», то есть умением объединять документы с разными заголовками, но с одинаковым содержанием.

В 1991 году Брюстер Кале (в Thinking Machines) запустил глобальный информационный сервер (WAIS) в Xerox PARC. WAIS пользовался лишь кратким присутствием на сцене онлайн-истории. Тем не менее, его, безусловно, можно описать как первый настоящий предшественник для современных поисковых систем, в том смысле, что он был первым, кто полностью проиндексировал весь текст в Gopher и других интернет-документах. Как выразился Кале, он хотел, чтобы пользователи могли «прыгать по центру свитка». WAIS была завершена Вероникой, которая искала только заголовки меню сайта Gopher, но быстро устарела из-за быстрого развития Всемирной паутины (которая заменила все основные службы FTP, Archie, Gopher и WAIS).

комментарий

На момент написания статьи на онлайн-продажи приходилось около 15% всех продаж в Великобритании (рост на 50% по сравнению с прошлым годом). Цифры еще выше в Северной Америке. U-Switch прогнозирует, что до 2020 года 40% всех продаж будет осуществляться онлайн, и теперь Google является лучшим брендом в мире; не плохо для бизнеса менее чем за десять лет! Иногда мне кажется невероятным, что так много всего произошло так быстро. Мои причины для написания этой серии статей частично дают свидетельство этим ранним пионерам Интернета и поиска, так что мы не забудем об их важном вкладе.

Во второй части этой серии статей в своем блоге я проверяю поисковую систему в Интернете, пока не появился доминирующий Google; Глядя на первый веб-сайт робота Wanderer и первых пионеров, таких как Altavista и Northern Light.

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *