Публикации »

Интернет для строителя: поиск информации

В современном мире обладание информацией дает столь значительные преимущества, что можно рассматривать ее как одну из неотъемлемых составляющих успешной деятельности фирмы. При этом небольшая часть информации является платной (что обычно, но не обязательно означает ее большую значимость). Рассмотрение необходимости ее приобретения и использования выходит за рамки этой статьи. Однако преобладающая часть данных общедоступна, к ней относится и большинство ресурсов (сайтов) глобальной информационной сети Интернет. ИНФОРМАЦИЯ В ИНТЕРНЕТЕ Нередко от пользователей Интернета можно услышать два мнения: — Интернет является неисчерпаемым океаном информации. — Интернет не содержит многих данных. Обе эти точки зрения являются достаточно правдивыми, и невозможно отбросить одну из них как не соответствующую действительности. И в то же время ни одна не является абсолютной истиной, а значит, не следует ни рассматривать Интернет как достаточный источник информации, ни полностью отказываться от его использования. Одной из причин этого является то, что сеть Интернет развивается децентрализованно посредством добавления в нее документов и информация становится доступна только в случае ее размещения каким-либо пользователем. Это означает, что вероятность найти общеупотребительную и востребованную информацию в сети больше, чем вероятность нахождения уникальной или специфической информации, не пользующейся высоким спросом у аудитории Интернета. Следует отметить значительный объем содержащейся в сети Интернет информации. За 6 лет ее развития (лавинообразное увеличение количества пользователей и документов началось только после появления в 1995 г. World Wide Web — «Всемирной Паутины») она прошла путь от многообещающей, но малоиспользуемой сети до стандартного средства получения, передачи и размещения информации. По данным исследования, проведенного компанией Inktomi и исследовательским институтом корпорации NEC в апреле 2001 г., количество документов, опубликованных в Интернете, превысило 1 млрд. страниц, при этом 86,5% этих документов опубликовано на английском языке. Количество работающих web-сайтов превысило 4,2 млн. Объем русской части Internet (по данным Яндекса) превысил 100 Гбайт текстов и 10 млн. документов (уникальных web-страниц). И это при том, что еще только год назад в русском Интернете было 833 тыс. страниц общим объемом 6,15 Гбайт. Каждая 3-я крупная компания в России имеет свой web-сайт. В апреле 2001 г. по данным Nielsen//NetRatings количество пользователей Интернета в мире достигло 379 млн. человек (211 млн. активных пользователей). А аудитория пользователей сети в России за тот же период составила 12,8 млн. человек при почти двукратном годовом увеличении (Monitoring.ru). В отчете заместителя министра связи РФ Александра Волокитина на конференции «Интернет-экономика в России: практика и перспективы» в Вене прогнозируется рост числа пользователей в России до 26 млн. к 2010 г. Другой распространенной причиной ненахождения информации в Интернете является неумение ее искать, вытекающее все из той же децентрализованности сети. Умение вести поиск информации в Интернете стало в наши дни необходимым навыком. Немного теории Базовой информационной единицей сети Интернет является «страница», обладающая уникальным адресом. Некоторое множество страниц может составлять сайт (смысловую единицу). Страницы могут быть статическими (неизменными со временем без прямого редактирования) или динамическими (содержание страницы может меняться в зависимости от многих факторов: уровня доступа пользователя, даты и времени посещения, возможностей компьютера пользователя и т. п.). В обычном случае в начале поиска информации пользователь Интернета не знает адреса конкретной страницы, содержащей требующуюся информацию (если он ее не посещал ранее и она не была передана ему другим пользователем). Собственно задачей этого поиска и становится выяснение ее адреса. НАПРАВЛЕНИЯ ПОИСКА В зависимости от типа требующейся информации различными будут и средства ее поиска. Рекомендации по наиболее рациональному использованию этих средств будут даны в конце этой статьи, пока же мы рассмотрим имеющиеся в наличии у каждого пользователя Интернета средства поиска информации. К ним относятся: поисковые системы, общие и тематические каталоги, новостные сайты, сайты-источники. ПОИСКОВЫЕ СИСТЕМЫ Основным способом поиска информации в Интернете был и остается поиск по ключевым словам. Средством его осуществления являются поисковые системы, специализированные серверы, состоящие из двух частей: так называемого «робота», с определенной периодичностью обходящего все зарегистрированные в системе сайты и собирающего их информацию в свою базу данных, и собственно поисковой системы, позволяющей по определенным алгоритмам (уникальным для каждой поисковой системы) производить поиск в проиндексированной «роботом» информации. Соответственно, наиболее интересующими пользователей параметрами поисковой системы являются: — объем информации, которую собирает робот (чем больше объем, тем больше пользователь системы уверен в достаточности проведенного поиска); — периодичность обновления информации (определяет актуальность выборки); — алгоритм выборки (определяет правильность поиска, например поиск слова в других падежах). Например, размер индекса поисковой машины AltaVista составляет 150 млн. документов при скорости индексирования 10 млн. документов в день. К наиболее известным англоязычным поисковым системам относятся AltaVista (www.av.com), Lycos (www.lycos.com) и Google (www.google.com), а к русскоязычным — Яндекс (www.yandex.ru), Апорт (www.aport.ru) и Rambler (www.rambler.ru). На сегодняшний день для русскоязычного пользователя Интернета наиболее интересными являются Google (англо- и русскоязычный) и Яндекс (русскоязычный), причем если Google выделяется высоким объемом собираемой информации и возможностью поиска слов на многих языках, то Яндекс обладает оптимизированным под русский язык алгоритмом выборки. Ни один из них нельзя считать достаточным, поэтому рекомендуется проводить поиск сразу с помощью обоих, что обычно и дает оптимальный результат. Следует учитывать, что средняя периодичность обновления проиндексированной информации в поисковых системах равна 7 дням даже для доменов второго уровня (например, www.ccr.ru), поэтому очень мала вероятность нахождения подобным способом информации с высокой актуальностью. К такой информации можно отнести новости и обновления тематических сайтов (например, появление электронных версий новых номеров изданий на сайте www.stroy-press.ru). Для поиска подобной информации существуют специализированные новостные сайты и периодическое посещение информационных сайтов. НОВОСТНЫЕ САЙТЫ Новостные ресурсы сети Интернет предлагают своим посетителям информацию небольшого объема, основная ценность которой заключается в ее актуальности. При этом с каждым днем ценность новостей теряется, что и является основной причиной использования подобных сайтов (и только их) для поиска новостей. Примером новостных сайтов могут служить информационные интернет-агентства, такие как Vesti.Ru (www.vesti.ru), Газета.Ru (www.gazeta.ru) и Lenta.Ru (www.lenta.ru), а также специализирующиеся на деловых новостях «РосБизнесКонсалтинг» (www.rbc.ru) и «ФИНМАРКЕТ» (www.finmarket.ru). Информация на подобных сайтах обновляется довольно часто, иногда по несколько раз в день, поэтому они наиболее часто посещаются. При выборе источников новостей для периодического посещения следует ориентироваться в первую очередь на тематику ресурса (общая, деловая, строительная), а также на личные предпочтения. Обычно бывает достаточно выбрать по одному сайту каждой тематики (например, Vesti.Ru как источник общих новостей, «РосБизнесКонсалтинг» для деловых новостей, «Строительная пресса» (www.stroy-press.ru) для новостей строительства) и с определенной периодичностью посещать их. Периодичность посещения зависит как от необходимости постоянного получения новостей по конкретной тематике, так и от периодичности и времени обновления информации. Не следует пренебрегать и возможностью подписки на рассылку новостей ресурсов по электронной почте. В этом случае исчезает необходимость бесполезного посещения сайтов, поскольку в случае обновления подписчики будут проинформированы об этом. КАТАЛОГИ В некоторых случаях для пользователя Интернета может быть целесообразно посещение конкретных сайтов: обычно тематических, а также сайтов организаций и объединений. Основной причиной предпочтений при их использовании является достоверность публикуемой информации. Так, если вам нужна достоверная информация о Госстрое России, то, посетив сайт www.gosstroy.ru, вы ее получите, в то время как достоверность информации, найденной через поисковую систему или новостной сайт, может быть недостаточной. В нахождении адресов конкретных сайтов способны помочь интернет-каталоги. Каталоги могут существовать как часть поисковой системы (Яндекс, Апорт) или как отдельный ресурс (Yahoo, WWW.RU). Каждый каталог состоит из ряда рубрик («Бизнес», «Интернет», «Спорт») и подрубрик («Работа», «Финансы», «Связь»), определяющих тематику сайтов. Условием существования ресурса в каталоге является его регистрация (обычно бесплатная) в нем. В процессе регистрации указывается название ресурса, выбирается его тематика и определяются ключевые слова, наиболее полно отражающие содержание сайта. СПЕЦИАЛИЗИРОВАННЫЕ КАТАЛОГИ Общетематические интернет-каталоги при обилии содержащихся в них категорий обладают одним существенным недостатком — сложностью поиска тематической информации, если нужная тематика не выделена в отдельный раздел или раздел сложно найти. Этого недостатка лишены тематические (в нашем случае строительные) каталоги, поскольку они содержат ресурсы, относящиеся только к их тематике, сгруппированные в разделы и подразделы. К их числу относятся такие строительные каталоги, как «Строительный комплекс России» (www.ccr.ru), «Московский территориально-строительный каталог» (www.stroi.ru/Catalog) и многие другие. В некоторых случаях строительные каталоги могут содержать также ресурсы по недвижимости, что может дезориентировать пользователя и оставить плохое впечатление от использования каталога. Если каталог поддерживает поиск данных, этой услугой имеет смысл воспользоваться, поскольку интересующие вас сведения могут содержаться в нескольких рубриках. Так, по поиску слова «кирпич» в каталоге «Строительный комплекс России» (www.ccr.ru) были получены следующие результаты: — поиск в названии компании: 1; — поиск по сведениям о компании: 19; — поиск по сведениям о продукции: 5; — поиск по прейскурантам: 2. Проанализировав полученный при поиске список ресурсов, можно сделать выбор. Следует отметить, что при традиционном методе визуального поиска по разделам для получения этих результатов следовало бы изучить разделы «Стеновые, сыпучие материалы, бетон, железобетон», «Кровельные и гидроизоляционные материалы», «Строительные материалы» и «Услуги». РАБОТА С ИСТОЧНИКАМИ После нахождения в поисковых системах и каталогах нужных сайтов начинается их изучение. При работе с источниками информации следует обращать внимание на: • достоверность источника: информация, полученная с использованием новостного сайта или доски объявлений, не может считаться полностью достоверной. Целесообразно уточнить ее на более достоверном сайте — собственном сайте компании или организации; • возможность уточнения: информация становится более ценной, если она содержит ссылки на другие интернет-страницы, указание печатных источников или координаты (телефон, адрес электронной почты); • «свежесть» информации: особенностью сети Интернет является возможность нахождения устаревшей информации, которую можно принять за актуальную. Этому способствуют такие фразы, как «этот год», «недавний», «сегодня», и отсутствие обозначения времени размещения информации. Особую осторожность следует проявлять при использовании прейскурантов как наиболее устаревающей информации; • полноту информации: большое значение имеет объем опубликованной информации. Так, например, анонс статьи всегда менее ценен, чем сама статья, поскольку требует обращения к дополнительной информации. РЕКОМЕНДАЦИИ • Не следует рассматривать Интернет как достаточный источник информации, хотя вероятность найти в сети общеупотребительную и востребованную информацию очень велика. • Всегда следует проводить поиск информации по нескольким направлениям, поскольку это дает лучший результат. • Не следует пренебрегать средствами автоматического поиска информации (поисковые системы, поиск по сайту), уменьшающими время поиска. (Продолжение следует)

Автор: Алексей МАКАРЕНКО
Дата: 12.11.2001
Журнал Стройпрофиль №10
Рубрика: ***

Внимание: Публикация является архивной и на текущий момент может быть не достоверной.




«« назад