Где хранится вся информация в интернете. Хранение данных в сети Internet Где хранится вся информация в интернете: уникальные по своей грандиозности и мощи дата-центры

В дата-центре хранится абсолютно вся информация, выкладываемая в сеть. Это ваши личные фотографии, загруженные документы, записи разговоров по Скайпу, комментарии в блогах и прочие важные и неважные данные. По сути, дата-центр – это такой большой банк, хранилище контента. Создавая такие хранилища, разработчики преследовали несколько целей: круглосуточную доступность, защиту доступа, сохранение информации и целостности файлов.

Поскольку ценная информация существует, то обязательно найдутся те, кто захочет ее похитить. За безопасность дата-центров отвечают не военные или солдаты, а высокоинтеллектуальные hight-tech охранники, работающие под прицелом видеонаблюдения и систем контроля. Обязанность охранников заключается в том, чтобы обеспечить конфиденциальность и полную неприкосновенность контента.

Технические условия работы дата-центра

Существуют жесткие правила, регламентирующие работу дата-центров. Предприятия должны обеспечиваться электроэнергией бесперебойно. Дата-центры уровня Tier4 (четвертого уровня) получают сразу от двух электростанций. Такая двойная подстраховка нужна для того, чтобы исключить вероятность отключения от электроэнергии в случае выхода из строя одной из электростанций.

Дата-центры оборудуются современными системами газового тушения пожара. Газовые системы пожаротушения предусматривают засыпание порошком углекислоты источника возгорания во избежание порчи остального оборудования. Порошок углекислоты традиционно используется в огнетушителях для тушения подключенного к электроэнергии оборудования.

Большое внимание уделяется климат-контролю. Во время работы жесткие диски и серверы выделяют тепло, которое удаляется при помощи систем кондиционирования и вентиляции. Летом по ночам используется прохладный фильтрованный воздух улицы, зимой морозный воздух смешивается с теплым внутренним.

На чем зарабатывают «хранители информации»

Дата-центры работают на коммерческой основе. Они сдают в аренду места в сетевых хранилищах или на жестких дисках. При желании можно взять в аренду целый сервер, место в стойке под собственный сервер или арендовать бокс. В последнем случае к стоимости аренды добавляется стоимость электроэнергии (с небольшой наценкой).

В последнее время приобрела популярность такая услуга, как аренда части программного обеспечения. Дата-центры покупают лицензионные программы, устанавливают их на своих серверах и сдают частями в аренду. Еще одна популярная услуга – аренда виртуального сервера, то есть определенной доли ресурса сервера.

Вот список известных мне сервисов хранения информации в интернете:

Есть возможность синхронизации папки с сервером и разными компьютерами, что удобно при использовании нескольких компьютеров. Для синхронизации нужно установить программу Яндекс.Диска себе на компьютер – она создаст папку, которая будет синхронизироваться. Плюс, установка этой программы даёт увеличение первоначального объема Диска, но потом её можно удалить и он станет вашим внешним хранилищем файлов. Кстати, если вы сделаете себе Диск по моим ссылкам, то получите дополнительный объем в 1 Гб, а я 0.5 Гб (при условии установки программы на свой компьютер ) – так Яндекс раскручивает своё хранилище. Я уже пользуюсь этим сервисом – очень удобно, рекомендую !

3. Файлы QIP – http://file.qip.ru. Бесплатно дается для хранения 2 Гб свободного места на файлы абсолютно любого типа на срок 30 суток. Для продления срока нужно файл скачать хоть один раз. Для увеличения сроков и объемов сохраняемой информации существуют платные премиум-аккаунты, в которых вам за 25$ дадут 100 Гб места. Для доступа к сервису нужно иметь аккаунт QIP, а для непосредственной загрузки из своего QIP-клиента нужно установить себе QIP-Infium. Тоже удобная возможность удаленного доступа к информации из любой точки мира. Сервис прекратил свою работу

4. Файлы ex.ua – украинский БЕСПЛАТНЫЙ сервис хранения НЕОГРАНИЧЕННОГО ОБЪЕМА информации. Файлы могут быть ЛЮБОГО размера и ЛЮБОГО формата. Для доступа просто зайдите на страницу сервиса и нажмите кнопку Создать, загрузите ваши данные и запишите ключ и ссылку доступа к вашим данным. Система сама запоминает ваш компьютер и в последствии только с него можно редактировать или удалить вашу информацию. Имея ссылку доступ получите отовсюду. Срок хранения ограничен 30 сутками. Для продления просто скачайте по разу ваши файлы. Очень простой и удобный сервис!

9. – тоже способ хранения информации, причем не только бесплатный, но и приносящий прибыль. Поскольку все аккаунты файлообменников ваши, то доступ к вашей информации вы имеете всегда,в любом объеме и из любого места. Ограничения по объему, срокам и условиям в файлообменных сервисах свои, поэтому более подробно вы с ними ознакомитесь в каждом из них.

Вот так, используя просторы Сети можно хранить файлы в интернете, сохраняя свой жесткий диск в свободе и легкости.

P.S. Прочитайте ещё и у вас появится 100 25 Гб абсолютно бесплатного места для хранения файлов в Интернете от сервиса mail.ru

Если эта статья вам помогла, то помогите и вы автору – получите блога и расскажите про блог своим друзьям социальными кнопочками, вдруг, им тоже поможете!

С уважением, Алексей Гончаров.

Пройдись по кнопочкам, расскажи о статье друзьям - это к деньгам!

Каждый человек имеет хотя бы чуточку информации или данных, которые ему очень дороги. Эта информация не всегда может иметь именно материальную ценность, вспомнить те же видео, детские фото или фотографии со свадьбы – все это очень дорого. Но многие не догадываются что диск, на котором это все записано, всего за одно десятилетие может прийти в негодность и с него уже ничего не получится прочитать. Если хотите сохранить такую важную информацию как можно дольше, то эта статья для вас.

Мы поделимся опытом в работе с разными накопителями и расскажем, какие из них надежные, а на каких лучше не хранить ничего ценного. Вы узнаете, как сохранить данные в целости и сохранности, хотя бы на столетие.

Общие правила хранения ценной информации

Есть несколько правил, работающие в отношении любой информации, которую важно сохранить в целости и сохранности. Если не хотите потерять дорогие сердцу фотографии, важные документы или ценные работы, то:

  • Создайте как можно больше копий. Таким образом вы подстрахуете себя несколькими запасными копиями и в случае потери одной копии у вас еще останется парочка других экземпляров.
  • Храните данные только в самых распространенных и общепринятых форматах. Не стоит прибегать к экзотике и применять малоизвестные типы файлов, ведь в один прекрасный день, просто не сможете найти программу для его открытия (к примеру тексты лучше хранить в ODF или TXT, а не DOCX и DOC).
  • Сделав несколько копий, разместите их на разных носителях, не стоит хранить все на одном и том же жестком диске.
  • Не используйте сжатие или шифрование данных. Если такой файл даже немного повредится, уже никогда не выйдет получить к нему доступ и открыть содержимое. Для длительного хранения медиа файлов применяйте несжатые форматы. Для аудио это WAV, для изображений подходят RAW, TIFF и BMP, видео файлы – DV. Правда тут понадобится носитель достаточно большой емкости, чтобы вместить такие файлы.
  • Постоянно проверяйте целостность своей информации и создавайте дополнительные копии новыми способами и на более новых устройствах.

Такие простые правила помогут вам на долгие годы сберечь важные документы, дорогие фото и видео записи. А сейчас рассмотрим где дольше всего информация будет в целости и сохранности.

Про популярные носители и их надежность

К самым распространенным и популярным способам хранения цифровой информации относится – использование жестких дисков, Flash-носители (SSD диски, флешки и карты памяти), запись оптических дисков (CD, DVD и диски Blu-Ray). Дополнительно, существует масса облачных хранилищ для любых данных (Dropbox, Яндекс Диск, Google Drive и многие другие).

Как вы думаете, что из всего перечисленного является лучшим местом хранения важной информации? Давайте изучим каждый из этих способов.

  1. Жесткие диски – на сегодняшний день используются в большинстве настольных ПК, а также нашли применение в качестве портативных хранилищ данных. Обычно, такой носитель исправно работает в течении 3-10 лет и срок его службы зависит от множества внешних факторов и самого качества изготовления.
    Если регулярно не использовать такой диск, а лишь единожды записать на него все, что нужно и спрятать в укромный уголок какой-нибудь тумбочки, то информация аналогично будет храниться на нем в течении такого же срока. Такие диски очень плохо переносят любые внешние воздействия, их нельзя бить, встряхивать и подвергать воздействию сильных магнитных полей – все это может привести к неприятным последствиям.
  2. Флешки и SSD накопители – такие устройства, в среднем, исправно работают около пяти лет. Многие флешки могут ломаться даже намного раньше, ведь они могут не перенести скачок напряжения или статический разряд, в момент подключения к ПК.

    Если записать ценную информацию и не пользоваться носителем, то данные могут сохраняться приблизительно 7-8 лет.
  3. Оптические диски – это всем известные CD, DVD и Blu-Ray. Пожалуй, это одни, из самых долговременных способов сохранить информацию, в некоторых случаях такой диск будет надежно хранить все записанные данные более чем 100 лет. Но здесь важно учитывать множество разных моментов и далеко не все диски смогут похвастаться таким долгожительством.

    Поэтому далее им будет посвящен целый раздел в этой статье, где мы все подробно рассмотрим.
  4. Облачные сервисы – сложно говорить, насколько высока надежность таких хранилищ. Вполне возможно, в таких местах данные будут храниться до тех пор, пока это будет выгодно в коммерческом плане. Если вы прочитаете лицензионное соглашение (которое предоставляется при регистрации), то можете обратить внимание на тот момент, что подобные компании не будут нести никакой ответственности за потерю ваших данных.

    Смущает и то, что можно потерять контроль над своим хранилищем из-за мошенников и злоумышленников, которые получат к нему доступ.

Как вы поняли, среди самых доступных способов, лучше всего хранить свои данные именно на оптических дисках. Но не все из них способны справиться с течением безжалостного времени и дальше вы узнаете, какие лучше подходят для наших целей. Кроме того, хорошим решением будет использование сразу нескольких, упомянутых способов, одновременно.

Используем оптические диски правильно!

Возможно, некоторые из вас наслышаны о том, как долго можно сохранить информацию на оптических дисках типа CD или DVD. Некоторые, наверное, даже записали определенные данные на них, но через время (несколько лет) не удалось прочесть диски.

На самом деле тут нет ничего удивительного, срок хранения информации на подобных носителях тоже зависит от многих факторов. В первую очередь, важную роль играет качества самого диска и его тип. Кроме этого следует и придерживаться определенных условий хранения и процесса записи.

  • Не используйте для долговременного хранения перезаписываемые виды дисков (CD-RW, DVD-RW), они не созданы для этих целей.
  • Тестирование показало, что статистически наиболее длительный срок хранения информации именно у CD-R дисков и он превышает 15 лет. Только половина всех проверенных DVD-R показала подобные результаты. Что касается Blu-ray, то тут точную статистику найти не удалось.
  • Не стоит гнаться за дешевизной и покупать болванки которые продаются за копейки. Они имеют очень низкое качество и не подойдут для важной информации.
  • Записывайте диски на минимальной скорости и делайте все в одну сессию записи.
  • Диски должны хранится в защищенном от прямых солнечных лучей месте, со стабильной, комнатной температурой и умеренной влажностью. Не подвергайте их никаким механическим воздействиям.
  • В отдельных случаях, на саму запись влияет и качество привода, который «нарезает» болванки.

Какой стоит выбрать диск для хранения данных?

Как вы уже поняли, диски бывают разные. Все главные отличия связанны с отражающей поверхностью, типом поликарбонатной основы и качеством в целом. Даже есть брать продукцию одной и той же фирмы, но изготовленную в разных странах, то даже тут качество может различаться на порядок.

В качестве поверхности, на которую производится запись используют цианиновый, фталоцианиновый или металлизированные слои. Отражающая поверхность создается золотым, серебряным или из сплавов серебра покрытием. Наиболее качественные и долговечные диски изготавливаются именно из фталоцианина с золотым напылением (т. к. золото не подвержено окислению). Но есть диски и с другими комбинациями этих материалов, которые также могут похвастаться хорошей долговечностью.

К большому огорчению привела попытка отыскать специальные диски для хранения данных, у нас их практически не реально встретить. При желании, такие оптические носители можно заказать через интернет (далеко не всегда дешево). Среди лидеров, которые могут сохранить вашу информацию как минимум на столетие можно выделить DVD-R и CD-R Mitsui (этот производитель вообще гарантирует до 300 лет хранения), MAM-A Gold Archival, JVC Taiyu Yuden и Varbatium UltraLife Gold Archival.

К числу самых идеальных вариантов, для хранения цифровой информации можно добавить и Delkin Archival Gold, которые вообще нигде не встретились на территории нашей страны. Но как уже было сказано, все перечисленное можно без особого труда заказать в интернет-магазинах.

Из доступных дисков, которые можно у нас встретить, самым качественными и способными обеспечить сохранность информации как минимум на десятилетие будут:

  • Verbatium, Индийского, Сингапурского, ОАЭ или Тайваньского изготовления.
  • Sony, которые создаются в том же Тайване.

Но тот факт, что эти все диски умеют долго хранить информацию еще не гарантирует, что она на долго сохранится. Поэтому не забывайте придерживаться тех правил, которые мы выделили еще в самом начале.

Взгляните на следующий график, на нем обозначена зависимость появления ошибок считывания данных, от времени нахождения оптического диска в агрессивной среде. Понятное дело, что график создан именно для маркетингового продвижения товара, но все же обратите внимание, что на нем есть очень любопытная Millenniata, на дисках которой вообще не появляются ошибки. Сейчас мы о ней узнаем больше.

Среди продукции этой компании есть диски серии M-Disk DVD-R и M-Disk Blu-Ray способные хранить важные данные сроком до 1000 лет. Такая потрясающая надежность достигается использованием в основе дисков неорганического стеклоуглерода, который в отличии от остальных дисков, где используются органические материалы, не подвержен окислению, разложению под действием света и тепла. Такие диски легко будут переносить попадание кислот, щелочей и растворителей, а также могут похвастаться более высокой стойкостью к механическим воздействиям.

Во время записи, на поверхности, в прямом смысле слово прожигаются небольшие окошки (на обычных дисках происходит пигментация пленки). Основа диска аналогично рассчитана на более серьезные испытания и способна сохранять свою структуру даже под воздействием высоких температур.

У нас не удалось найти такие диски в продаже, но в сети их можно свободно заказать по вполне доступной цене. Оптические диски этой серии прекрасно читаются любыми современными приводами. Вполне возможно, со временем они и у нас начнут появляться в свободной продаже.

Несмотря на то, что подобные носители могут быть прочитаны любым приводом для того, чтобы записать DVD-R нужен особый привод, который сертифицирован и имеет эмблему M-Disk. Это связанно с необходимостью использования более мощного лазера. Чтобы записывать такие Blu-Ray диски, можно использовать любые приводы, способные выполнять запись подобных типов оптических носителей.

Как вы поняли, необходимость использования специального привода (который тоже у нас редкость), является серьезным минусом. Но с другой стороны, иногда ценные фото, видео и другая информация намного более важны и для этих вещей можно раздобыть и привод.

В любом случае, при хранении важной информации придерживайтесь упомянутых правил и тогда вы сможете надолго сохранить воспоминания о каком-либо событии, и сберечь архив важных документов.

Под гипертекстовым документом понимают документ, содержащий так называемые ссылки на другой документ. Реализовано все это через протокол передачи гипертекста HTTP (HyperText Transfer Protocol).

Информация в документах Web может быть найдена по ключевым словам. Это означает, что каждый обозреватель Web содержит определенные ссылки, через которые образуются так называемые гиперсвязи, позволяющие миллионам пользователей Internet вести поиск информации по всему миру.

Гипертекстовые документы создаются на базе языка HTML (HyperText Markup Language). Этот язык весьма прост, управляющие коды его, которые, собственно, и компилируются обозревателем для отображения на экране, состоят из текста ASCII. Ссылки, списки, заголовки, картинки и формы называются элементами языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа.

Существует два способа создания гипертекстовых документов. Можно воспользоваться одним из WYSIWYG HTML-редакторов (например, Netscape Composer, основы работы в котором рассмотрены в разделе "Обработка текста на ЭВМ", Microsoft FrontPage, HotDog, или др.), для работы с которыми не требуется специальных знаний о внутренней структуре создаваемого документа. Этот способ позволяет создавать документы для WWW без знания языка HTML. HTML-редакторы автоматизируют создание гипертекстовых документов, избавляют от рутинной работы. Однако их возможности ограничены, они сильно увеличивают размер получаемого файла и не всегда полученный с их помощью результат соответствует ожиданиям разработчика. Но, безусловно, этот способ незаменим для новичков в деле подготовки гипертекстовых документов.

Альтернативой служит создание и разметка документа при помощи обычного редактора plain-текста (таких, как emacs или NotePad). При этом способе в текст вручную вставляются команды языка HTML. Создавая документы таким способом, вы точно знаете, что делаете.

Как уже отмечалось, HTML-документ содержит символьную информацию. Одна ее часть - собственно текст, т.е. данные, составляющие содержимое документа. Другая - теги (markup tags), называемые также флагами разметки, - специальные конструкции языка HTML, используемые для разметки документа и управляющие его отображением. Именно теги языка HTML определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ. Графическая и звуковая информация, включаемая в HTML-документ, хранится в отдельных файлах. Программы просмотра HTML-документов (браузеры) интерпретируют флаги разметки и располагают текст и графику на экране соответствующим образом. Для файлов, содержащие HTML-документы, приняты расширения.htm или.html.

Прописные и строчные буквы при записи тегов не различаются. В большинстве случаев теги используются парами. Пара состоит из открывающего (start tag) и закрывающего (end tag) тегов. Синтаксис открывающего тега: <имя_тега [атрибуты]>

Прямые скобки, используемые в описании синтаксиса, означают, что данный элемент может отсутствовать. Имя закрывающего тега отличается от имени открывающего лишь тем, что перед ним ставится наклонная черта:

Атрибуты тега записываются в следующем формате: имя [= "значение"]

Кавычки при задании значения аргумента не обязательны и могут быть опущены. Для некоторых атрибутов значение может не указываться. У закрывающего тега атрибутов не бывает.

Действие любого парного тега начинается с того места, где встретился открывающий тег и заканчивается при встрече соответствующего закрывающего тега. Часто пару, состоящую из открывающего и закрывающего тегов, называют контейнером, а часть текста, окаймленную открывающим и закрывающим тегом, - элементом.

Последовательность символов, составляющая текст, может состоять из пробелов, табуляций, символов перехода на новую строку, символов возврата каретки, букв, знаков препинания, цифр, и специальных символов (например, +, #, $, @), за исключением следующих четырех символов, имеющих в HTML специальный смысл: < (меньше), > (больше), & (амперсенд) и " (двойная кавычка). Если необходимо включить в текст какой-либо из этих символов, то следует закодировать его особой последовательностью символов.

К специальным символам можно отнести и неразрывный пробел. Использование этого символа - один из способов увеличить расстояние между некоторыми словами в тексте. Обычные пробелы использовать для этих целей нельзя, так как группа подряд идущих пробелов интерпретируется браузером как один.

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

«ТАГАНРОГСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ имени А.П. Чехова »

Факультет информатики

Кафедра информатики и управления

Курсовая работа

Организация хранения и поиска информации в сети Internet

Студентки 4 курса

Шеверда М.А.

Информатика с доп. спец. Иностр.яз.

Научный руководитель

К.Т.Н. Доц. Тюшнякова И.А.

Таганрог

Введение

Основные понятия информационного поиска

Инфаструктура сети

История появления поисковых систем

1 История создания поисковой системы Google

2 Принцип работы поисковой системы Google

3 Поисковая система Yandex

4 Поисковая система Rambler

5 Поисковая система Yahoo

6 Поиск по адресам URL

Поиск информации в сети Internet

Сохранение информации в сети Internet

Заключение

Список литературы

Введение

Интернет - это глобальная компьютерная сеть, в которой размещены различные службы или сервисы (E-mail, Word Wide Web, FTP, Usenet, Telnet и т.д.). Компьютерные сети предназначены для передачи данных, а телефонные сети и радиосети - для передачи голоса, телевизионные сети - для передачи изображения.

В зависимости от расстояний между ПК различают локальные, территориальные и корпоративные вычислительные сети. Конвергенция телекоммуникационных сетей (компьютерных, радио, телефонных и телевизионных сетей) обеспечивает возможность качественной передачи данных, голоса и изображения по единым (мультисервисным) сетям нового поколения (сетям Internet).

Интернет давно уже стал не только средством общения, но и полем для серьезной коммерческой деятельности. Практически каждая зарубежная фирма имеет в Сети свое представительство, виртуальный офис. Суммарный оборот компаний, ведущих торговлю в Интернет, достигает миллиардов долларов. В России также все большее число компаний использует Интернет для продвижения своих товаров и услуг. В этом легко убедиться, просмотрев рекламные издания. Рядом с привычными номерами телефонов и факсов все чаще и чаще встречаются адреса электронной почты и Web-сайтов. Скоро отсутствие адреса в Интернет будет затруднять работу так же, как отсутствие факса.

Поэтому все больше и больше людей обращаются в Интернет, чтобы получить самую свежую информацию: об услугах и ценах, погоде, курсах валют, просто новости. На Web-сайте можно менять информацию несколько раз в день. В печатных изданиях надо заказывать рекламу минимум за неделю, а то и больше. А в Интернет все оперативно: новые товары или услуги, новая скидка или новый поставщик - завтра об этом узнают клиенты. Нет необходимости ждать, пока выйдет очередной выпуск печатной рекламы. Информация на сайте будет всегда актуальной, самой свежей. Именно это ценят, именно это привлекает в Интернет миллионы пользователей.

Важнейшим условием и ведущим фактором, определяющим успешность учебной деятельности с использованием компьютерных технологий, является готовность учащихся к продуктивной деятельности в дидактической компьютерной среде.

Большинство исследователей в области педагогической информатики отмечают существование противоречия между представлениями современной гуманитарно-личностной парадигмы образования и существующей системой обучения с узкопредметной ориентацией, не обеспечивающей готовность учащегося к учебной деятельности с использованием компьютерных методов получения и преобразования информации. Становится очевидным, что концепции использования в учебном процессе информационных технологий эволюционируют от технократических парадигм в направлении усиления роли социокультурных факторов, учета нравственного и интеллектуального потенциала личности.

Овладение эффективными методами и средствами поиска, обработки и использования учебной информации дает возможность не только интенсифицировать образовательные процессы, но и развивать познавательные интересы учащихся, стремление к продуктивной, творческой деятельности.

Цель курсовой работы:

Исследовать существующие системы и механизмы поиска информации в сети.

Задачи курсовой работы:

1. Изучить соответствующую данной теме специализированную литературу.

На основе полученных из данной литературы знаний, выяснить каким образом устроены процессы хранения и поиска информации в глобальной сети

Найти сходства и различия поисковых машин.

1.
Основные понятия информационного поиска

Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации - текстов (документов) или данных (фактов). Информационно-поисковыми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное - это целевая функция: хранение и поиск информации.

В зависимости от объекта хранения и типа запроса различают два вида информационного поиска: документальный и фактографический - и, соответственно, два типа ИПС - документальные и фактографические.

Документальными называются ИПС, в которых реализуется поиск по тематическим запросам в массиве документов или текстов с последующим предоставлением пользователю подмножества этих документов или их копий. Понятие документа может меняться от системы к системе. В общем случае это некий информационный объект, зафиксированный (обычно посредством некоторой знаковой системы) на каком-то материальном носителе (бумага, фото- и кинопленка и т.п.) и предназначенный для передачи в пространстве и времени в системе социальных коммуникаций.

Фактографические ИПС реализуют хранение, поиск и выдачу непосредственно фактических данных (научных, технических, экономических характеристик и свойств объектов, процессов, явлений, адресов, наименований, количественных данных и т.п.).

Главное, различие между документальным и фактографическим поиском заключается в подходе к семантике документов. В документальных системах описывается смысл документов в целом с точки зрения их тематического, предметного содержания. В этом случае важно выявить и назвать (перечислить) основные темы и объекты, которым посвящен документ. В фактографических системах описываются объекты, фиксируются их признаки и значения этих признаков. Отсюда различия в языках описания и способах хранения описаний в системе. Соответственно, для каждого вида поиска существуют свои поисковые средства.

Фактографические системы предполагают накопление и поиск в массиве документов со строго регламентированной структурой. Такая структура является или результатом предварительной интеллектуальной обработки документов при вводе информации в систему, или наличием таких документов в готовом виде в конкретных сферах человеческой деятельности, например, учетные формы, бланки, справочники, расписания и т.п. Существуют фактографические ИПС, которые обеспечивают накопление информации и поиск только по одному типу объектов и только по одному типу запросов. Существуют и более развитые фактографические системы, обеспечивающие хранение и поиск данных, разнообразных по содержанию и структуре, но это разнообразие всегда конечно.

В то же время между документальными и фактографическими системами нет непреодолимой разницы. Нередко реальные ИПС представляют собой пример смешанных систем, в которых фактографическая информация используется как дополнительное средство документального поиска, и наоборот. В документальных системах тексты (документы) также могут быть структурированы, разбиты на фрагменты или поля, и обработка и выдача документальной информации может вестись на уровне отдельных полей.

Выделяют еще и третий тип систем, которые называют информационно-логическими. Это системы, отвечающие на запросы, на которые в информационной базе в явном виде ответа нет. Получить ответ помогает экстралингвистическая база знаний и информация, порождаемая алгоритмически из уже имеющейся (документальной или фактографической). Эта новая информация или выдается как ответ на запрос, или дополнительно используется для поиска.

Информационно-поисковая система документального типа представляет собой упорядоченную совокупность документов, а также совокупность средств и методов, предназначенных для хранения, поиска и выдачи по запросам документальной информации. Документальная ИПС выдает документы, соответствующие запросу по теме, по предмету.

большинство работающих ИПС относится к классу вербальных систем бестезаурусного типа, когда индексационные термины выбираются непосредственно из текстов документов. Лавинообразный рост объемов электронной документальной информации, ее видовое, тематическое и языковое разнообразие являются как причиной кризиса современного информационного поиска, так и стимулом его совершенствования.

Проблема поиска ресурсов в сети Интернет была осознана достаточно скоро, и в ответ появились различные системы и программные инструменты для поиска, среди которых следует назвать системы Gopher, Archie, Veronica, WAIS, WHOIS и др. В последнее время на смену этим инструментам пришли «клиенты» и «серверы» всемирной паутины WWW.

Если попытаться дать классификацию ИПС сети Интернет, то можно выделить следующие основные типы:

ИПС вербального типа (поисковые системы - search engines)

Классификационные ИПС (каталоги - directories)

Электронные справочники («желтые» страницы и т.п.)

Специализированные ИПС по отдельным видам ресурсов

Интеллектуальные агенты.

Глобальный учет всех ресурсов Интернета обеспечивается вербальными и отчасти классификационными системами.

2. Инфраструктура сети (структура и принципы построения сети Интернет)

Всемирная информационная компьютерная сеть, представляющая собой объединение множества региональных компьютерных сетей и компьютеров, обменивающих друг с другом информацией по каналам общественных телекоммуникаций (выделенным телефонным аналоговым и цифровым линиям, оптическим каналам связи и радиоканалам, в том числе спутниковым линиям связи).

Информация в Internet хранится на серверах. Серверы имеют свои адреса и управляются специализированными программами. Они позволяют пересылать почту и файлы, производить поиск в базах данных и выполнять другие задачи.

Обмен информацией между серверами сети выполняется по высокоскоростным каналам связи (выделенным телефонным линиям, оптоволоконным и спутниковым каналам связи). Доступ отдельных пользователей к информационным ресурсам Internet обычно осуществляется через провайдера или корпоративную сеть.

Провайдер - поставщик сетевых услуг - лицо или организация предоставляющие услуги по подключению к компьютерным сетям. В качестве провайдера выступает некоторая организация, имеющая модемный пул для соединения с клиентами и выхода во всемирную сеть.

Основными ячейками глобальной сети являются локальные вычислительные сети. Если некоторая локальная сеть непосредственно подключена к глобальной, то и каждая рабочая станция этой сети может быть подключена к ней. Существуют также компьютеры, которые непосредственно подключены к глобальной сети. Они называются хост - компьютерами (host - хозяин). Хост - это любой компьютер, являющийся постоянной частью Internet, т.е. соединенный по Internet - протоколу с другим хостом, который в свою очередь, соединен с другим, и так далее.

Рис. 1. Структура глобальной сети Internet

Для подсоединения линий связи к компьютерам используются специальные электронные устройства, которые называются сетевыми платами, сетевыми адаптерами, модемами и т.д..

Практически все услуги Internet построены на принципе клиент-сервер. Вся информация в Интернет хранится на серверах. Обмен информацией между серверами осуществляется по высокоскоростным каналам связи или магистралям. Серверы, объединенные высокоскоростными магистралями, составляют базовую часть сети Интернет.

Передача информации в Интернет обеспечивается благодаря тому, что каждый компьютер в сети имеет уникальный адрес (IP-адрес), а сетевые протоколы обеспечивают взаимодействие разнотипных компьютеров, работающих под управлением различных операционных систем.

В основном в Интернет используется семейство сетевых протоколов (стек) TCP/IP. На канальном и физическом уровне стек TCP/IP поддерживает технологию Ethernet, FDDI и другие технологии. Основой семейство протоколов TCP/IP является сетевой уровень, представленный протоколом IP, а также различными протоколами маршрутизации. Этот уровень обеспечивает перемещение пакетов в сети и управляет их машрутизацией. Размер пакета, параметры передачи, контроль целостности осуществляется на транспортном уровне TCP.

Прикладной уровень объединяет все службы, которые система предоставляет пользователю. К основным прикладным протоколам относятся: протокол удаленного доступа telnet, протокол передачи файлов FTP, протокол передачи гипертекста HTTP, протоколы электронной почты: SMTP, POP, IMAP, MIME.

3. История появления поисковых систем

Сравнительный обзор поисковых систем

С развитием Интернет в мире, на первое место вышла проблема поиска информации в сети. Эту нишу сразу попытались занять несколько различных крупных фирм, таких как Altavista, Lycos, AOL. Естественно, что каждая из них разработала свои собственные методы для нахождения информации. Это и ручной метод в каталогах, и метод автоматического поиска сайтов в Интернет, и индексации их при помощи специально разработанных для этого "spider"-ов. Их целью было, начиная с нескольких крупных web-узлов, по имеющимся на них ссылкам, группам новостей, проиндексировать весь интернет. Но поскольку, ждать пока такой спайдер доберется до вашего сайта, приходилось очень долго, было принято решение о ручном добавлении сторонними web-мастерами к базе спайдера ссылок, следуя по которым спайдер мог быстро проиндексировать ресурс.

Почти аналогично началось появление подобных систем в СНГ. К ним можно, например, отнести Russian Express, Rambler, Aport и Yandex - так как они тоже используют спайдеров для поиска новых сайтов. Одним из отличий поисковых систем СНГ можно считать то, что они индексируют только сайты СНГ, или проверяют кодировку (язык) текста - как Aport. Вот выдержка из FAQ Yandex:

Яndex ранжирует документы по вычисляемому параметру "релевантность". Релевантность документа зависит не только от числа слов запроса, найденных в документе, но и от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Заголовки типа "type_Document_Title_here", или "Web Page Title Here", или "Insert Page Title Here", или "Put_Your_Title_Here", или "Заголовок" не украшают ни страницу, ни ее Web-мастера. Помимо этого, многие поисковые системы, в том числе и Yandex, обращают особое внимание на слова, содержащиеся в заголовке. Не стоит брать первые 10 самых поисковых слов из какого-нибудь Top100 и вписывать их в заголовки, комментарии, и просто в текст белым по белому. Во-первых, это не добавляет славы создателю и вызывает естественное раздражение пользователей. Во-вторых, поисковые системы, и Яndex тоже, начинают с этим бороться. Кроме этого, спам увеличивает размер документа и, следовательно, уменьшает контрастность слов в нем.

Но кстати, спама избегать тоже необходимо. Более 30 раз повторенное слово на 1-ой страничке, существенно понизит релевантность страницы в целом. И еще, русские поисковые системы не поддерживают мета тэги, поэтому создавая web-страницу на русском языке, позаботьтесь о том, чтобы в title и находились релевантные фразы, а так же чтобы они присутствовали вверху текста.

3.1 История создания поисковой системы GOOGLE

В 1995 г. двое студентов докторантуры Стэнфордского университета - Ларри Пейдж (Larry Page) и Сергей Брин - занимались различными аспектами управления данными. Именно Пейдж в далеком 1996 начал активно использовать Internet для своих исследовательских проектов в области data mining - тогда Web представлял для Пейджа только лишь источник случайно подобранной информации для его разработок. Оба студента входили в рабочую группу MIDAS (Mining Data at Stanford). Немного позже под управлением Раджива Мотвани (Rajeev Motwani), доцента кафедры информатики и вычислительной техники (Computer Science), Пейдж и уроженец Москвы Брин начали разработку собственной поисковой системы. Уже в то время на Internet - рынке присутствовали различные компании, предоставляющие услуги поиска, однако для будущих докторов наук проект был сродни академической забаве - никто и не думал о быстрой капитализации и создании бизнес - плана. Идея, которая легла в основу поисковой машины, была описана в нескольких научных работах и в то же время довольно проста для понимания.

Сеть содержит огромное количество информации, и определить релевантность отдельно взятой странички большинство поисковиков пытаются по наличию в HTML - файле ключевых слов, которые пользователь ввел в форму поиска. Google же индексирует ссылки, исходящие со страницы, считая каждую ссылку на определенный сайт "голосом", увеличивающим ценность сайта, на который ссылаются. Логично предположить, что на сайт популярный и содержащий полезную информацию ссылаться будут чаще, чем на ресурс бесполезный и неинтересный.

Однако этим определение релевантности сайта не исчерпывается. Полученный результат - условный рейтинг популярности ресурсов - также можно использовать и как источник информации о сайтах, на которые эти самые качественные ресурсы указывают. Таким образом, одна ссылка на вашу страницу с сервера Yahoo! или About.com может оказаться более ценной, чем сотни ссылок с неизвестных домашних страничек - в этом случае Yahoo! и About.com рассматриваются как авторитетные источники и, следовательно, содержат ссылки на высококачественные сайты.

В 1998 г. Google запущен на сервере Стэндфордского университета, и его можно найти по адресу google.Stanford.edu. В то время когда другие стартапы получали финансирование, еще не написав бизнес - плана и не разработав собственного продукта, отцы - основатели Google посчитали, что дополнительные исследования работе поисковой машины никак не помешают, и к моменту основания компании поисковый сервер на основе технологии Page Rank уже проработал больше чем два года. Еще в 1996 г. студенты отметили, что их разработка во многих случаях предоставляла более точные результаты, чем остальные поисковики, а в 1997 Google стал внутренним поисковиком Стэндфордского университета. В том же году Пейдж и Брин идут на первые расходы, связанные с дальнейшим развитием Google, они покупают жесткие диски суммарным объемом в 1 ТВ, что обходится им в 15 тыс. долл. Все растраты пока приходится покрывать собственными кредитными карточками.

В сентябре 1998 г. становится понятно, что для того чтобы развивать технологию и дальше, а также начать лицензировать ее заинтересованным сторонам, необходимо создать компанию. Пейдж и Брин за полгода до защиты докторской диссертации уходят из Стэнфорда и забирают с собой Крега Сильверштейна (Craig Silverstein), который назначается техническим директором. В какой-то момент энтузиасты встречают одного из основателей Sun Microsystems Энди Бехтольшайма (Andy Bechtolsheim), и тот после расспросов о дальнейших планах предприятия тут же выписывает экс - студентам чек на 100 тыс. долл. Тот же 1998 г. обозначился в истории развития Internet резким ростом медиа - компаний. Все поисковые машины, которые до этого предлагали своим пользователям возможность найти необходимую информацию в Сети, внезапно решили заняться предоставлением Internet - услуг: бесплатной почты, биржевых котировок, и прочих атрибутов портала. Когда Пейдж встречается с Джорджем Беллом (George Bell), генеральным директором Excite, тот не высказывает заинтересованности в уникальной поисковой технологии. "Пока наша поисковая система находится в более или менее приличном состоянии, нас это устраивает", утверждает Белл, намекая, что собственно поиск перестает быть объектом интереса для порталов.

И Google пришлось идти своим путем. Вместо того чтобы заняться агрессивным маркетингом и продвижением своего проекта, Пейдж и Брин предпочитают нанять на работу около 150 сотрудников, 20 из которых - доктора наук. Компания не рекламирует себя, закупая миллионы баннеров, не заботится о брендинге и рыночном становлении проекта, не собирается зарабатывать деньги путем показа баннерной рекламы на собственном сайте. Несмотря на такую пассивность с точки зрения маркетолога, известность поисковика продолжает расти, и многие пользователи, привыкшие к обращению к нескольким поисковым системам одновременно, выбирают Google, каждый по каким - либо своим субъективным причинам. Кому-то нравится неброский интерфейс и простота использования, кому-то - скорость работы и не перегруженность сайта рекламой, кому-то - качество результатов поиска.

Известный в США эксперт по usability Джейкоб Нильсен (Jacob Nielsen), который входит в Совет директоров Google, как-то, вспоминая о поисковике, говорит: "Их я считаю своими лучшими клиентами. У них вся компания одержима идеей удобства и простоты использования". Более того, убедившись в благосклонности пользователей к поисковикам с простым интерфейсом, компания Altavista выпускает новую оболочку для своей поисковой машины, заявив о Raging Search (#"607685.files/image002.gif">

Рис. 1. Поисковая оптимизация влияет только на основные результаты поиска и не касается платных ссылок, например контекстной рекламы AdWords

Оптимизация сайта должна быть рассчитана на пользователей. Они являются целевой аудиторией сайта, используя поисковые системы для того, чтобы найти его. Излишняя увлеченность специфическими трюками для достижения максимума в топе может не принести желаемых результатов. Оптимизация для поисковых систем - это всего лишь способ быть немного впереди тогда, когда дело касается видимости для поисковых робот.

Название основной страницы сайта может содержать имя сайта или организации, а так же другую полезную информацию, например адрес и краткое описание тематики или услуг.

Рис. 3. Пользователь отправляет запрос [поздравительные открытки]

Рис.4. страница появляется в результатах поиска, название в котором будет первой строкой (заметьте, что слова из поискового запроса выделены жирным)

Рис. 5. Если пользователь решит перейти на другую страницу, ее название появится в заголовке окна браузера

Названия других страниц сайта также должны точно описывать их содержание, и могут содержать название сайта или компании.

Рис. 6. Пользователь отправляет запрос [поздравительные открытки с новым годом]

Рис. 7. В поисковой выдаче появляется релевантная страница нашего сайта (ее название описывает ее содержимое)

3.3 Поисковая система - Yandex

Рис.8. Поисковая система Yandex

Официально поисковая машина Yandex.ru была анонсирована 23 сентября 1997 года на выставке Soft tool. Основными отличительными чертами Yandex.ru на тот момент были проверка уникальности документов. Также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка, поиск с учетом расстояния. Тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе. Чуть позже в разделе «Сказки» появилась первая сказка Рунета - «Web - гуманизм или чернуха?». А в разделе «Числа» - первая оценка объема Рунета, 5 тысяч серверов и 4Гб текстов.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex.ru можно обращаться просто «по-русски», задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы. Средняя длина запроса в Yandex.ru сейчас - 2,7 слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были приучены к телеграфному стилю. В 1998 году на Yandex.ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За этот год «объем» Русского Интернета удвоился, что привело к необходимости оптимизации поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость поиска на Yandex.ru - доли секунды. За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве пользователей. Это был год бурного развития и для Yandex.ru. Новый поисковый робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня поисковая база Yandex.ru вдвое больше, чем у ближайших конкурентов. Новый робот позволил предоставить пользователям новые возможности - поиск по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и изображениям, а также выделять документы на русском языке. Появился поиск в категориях каталога, и впервые в Рунете было введено понятие «индекс цитирования» - количество ресурсов, ссылающихся на данный.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. При этом поиск не ограничен лишь словами или фразами. Яндекс отыщет по названию web-страницу компании или файл с нужной картинкой.

3.4 Поисковая система - Rambler

Рис. 9. Поисковая система Rambler

В 1991 году в городе Пущино появилась группа единомышленников, вдохновленных только что появившейся коммуникационной средой Интернет. Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов. Будущие создатели Рамблера поначалу обслуживали радиотехнические приборы в Институте биохимии и физиологии микроорганизмов РАН. Нормальный, оперативный и эффективный обмен данными был необходим для реализации научных целей. В 1992 году компания запускает собственные ftp- и mail-серверы. Через два года - свой первый www-сервер.

год - ключевой для развития русского киберпространства. Именно в этот год Сергей Лысаков и Дмитрий Крюков принимают решение разработать первую русскую поисковую систему для Интернета.

В тот момент в Рунете уже существовало две-три поисковых машины - но они не выдержали проверки временем и быстро исчезли. А Рамблер развивался, эволюционировал.

Рис. 10. Поисковая система Rambler Top 100

Весной 1997 года появляется Rambler Top100 - уникальный рейтинг-классификатор, который не только оценивает на основе объективных данных популярность российских ресурсов, но и позволяет одним "кликом" попасть на них. Веб - мастера стали более тщательно и вдумчиво работать над своими сайтами, стремясь занять в Топ100 более высокие строчки. Rambler Top100 быстро стал универсальным барометром сети, общим стандартом медиа измерений.

Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых запросов, сканируя 48 тысяч web-серверов и используя несколько одновременно работающих программ-роботов.

Запрос может состоять из одного или нескольких слов, разделенных пробелами. Могут быть использованы как русские, так и английские слова и словосочетания. По умолчанию находятся только те документы, в которых встретились все введенные Вами слова. Чтобы найти документы, содержащие хотя бы одно слово из запроса, используйте логическую связку Or или выберите на странице детального запроса: "Слова запроса: любое". Чтобы исключить документы, содержащие те или иные слова, укажите на странице детального запроса: "Исключить документы, содержащие следующие слова...".

Рамблер умеет искать слова во всех формах (например, аминокислота, аминокислоты, аминокислотой и т. д.). Чтобы слово находилось во всех формах, перед ним надо поставить служебный символ "#" . В меню детального запроса такой режим может быть включен для всех слов: "Расширение запроса: все формы слов". Служебный символ "@" перед словом позволяет находить не только само это слово, но и однокоренные слова. В меню детального запроса символу "@" соответствует режим "Расширение запроса: все однокоренные".

По умолчанию наша система ищет слова запроса так, как Вы их ввели, чтобы уменьшить "шум" в найденных документах. Если Вы не помните, как пишется слово, или хотите расширить запрос, можно использовать метасимволы "*" и "?" для обозначения произвольной части слова и произвольного символа.

Ограничить поиск частями документов, такими как название документа, его заголовок, URL и т.п., можно через меню детального запроса "Искать в...".

Можно ограничить поиск документами только на русском или только на английском языке. Для этого надо выбрать соответствующий режим в меню детального запроса "Язык документа...". По умолчанию поиск выполняется по документам на всех языках.

По умолчанию найденные документы сортируются по релевантности. Однако Вы можете потребовать, чтобы вместо этого в начало списка были помещены самые свежие. Для этого надо выбрать соответствующую установку в меню "Сортировать по..." на странице детального запроса.

Вы можете также ограничить поиск документами, созданными в определенный период времени: для этого необходимо на странице детального запроса указать "От даты... до даты...". Можно потребовать, чтобы Рамблер возвращал только те документы, где слова из запроса находятся на минимальном расстоянии друг от друга. Режим "Ограничить расстояние между словами" может быть включен в детальном запросе. Все перечисленные выше правила могут быть использованы совместно друг с другом в необходимой Вам последовательности. По умолчанию результаты поиска выдаются порциями по 15 документов. Меню "Выдавать по..." на странице детального запроса позволяет увеличить это число до 30 или 50. Меню "Форма вывода..." позволяет получать описания документов с увеличенной или уменьшенной подробностью.

3.5 Поисковая система - Yahoo

Рис. 11. Поисковая система Yahoo

Yahoo! - самая известная поисковая машина. Её сайты разбиты по категориям и ключевым словам. Она содержит полезную информацию на своей домашней странице. Может подключаться к другим поисковым машинам.

В ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса.

Основная директория содержит: адреса (URL) для Internet-ресурсов и краткое описание для этих связей. Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а также поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Если Yahoo! не может установить связь достаточно быстро с AltaVista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие “tip search”(TS) - поиск с помощью “намека”: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.

3.6 Поиск по адресам (по URL)

Вы можете искать документы не только по всему русскоязычному Интернету, но и по его части. Самый простой случай - поиск по определенному серверу. Например: url=www.intel.ru собака.

По данному запросу будут найдены все документы на сервере www.intel.ru, содержащие слово "собака". Возможно, вам интересно, а что будет, если написать просто: url=www.intel.ru.

В этом случае вы получите список всех документов, расположенных на указанном вами сервере. Вы можете ограничивать поиск и сильнее - одним из каталогов сервера. Например: url=www.intel.ru/sobaki/ сенбернар.

По данному запросу документы, содержащие слово "сенбернар", будут искаться только в каталоге /sobaki (и его подкаталогах) московского сервера корпорации Intel.

Основные характеристики российских поисковых систем


www.rambler.ru <#"607685.files/image012.gif">

Рис.13. Поисковая система Google

Для начала, нужно решить точно, что вы хотите найти. Например, по слову валенки найдется 131 000 тысяча страниц. По запросу, купить оптом валенки в Суздале, всего 259 страниц. Если вы ищете фразу или цитату, напишите ее в кавычках. Вы можете не набирать запрос целиком, а выбрать его уже из появившихся подсказок

Рис. 14.

Чтобы увидеть ответ прямо в результатах поиска, сразу составляйте вопрос в виде ответа. Например, население санкт-петербурга:

Или Екатерина Великая родилась:


Можно искать не только тексты, но и картинки:

Так же можно искать видео, карты, новости,… В меню расширенного поиска можно задать поиск информации только на определенном языке:

В определенном формате, например, только презентации или же на конкретном сайте.

5. Сохранение информации в сети интернет

Сеть Интернет - как огромная библиотека. Она содержит множество Интернет-сайтов, которые состоят из страниц.

При помощи компьютера и установленных на нем программ, возможно подключиться к Интернету, чтобы просматривать хранящуюся в нем информацию: тексты, картинки, фотографии, музыку, фильмы, а также сохранять их к себе на диск.

Страницы Интернета хранятся не на Вашем компьютере. Он - лишь «окошко», с помощью которого Вы просматриваете сайты.

Если возникают ошибки при вводе информации - это не страшно. Невозможно испортить или изменить что-либо в интернете со своего компьютера. Если закрыть нужную страницу - всегда можно открыть ее заново в прежнем виде, нажав на кнопку «Назад» или повторно набрав ее адрес.

С одной страницы можно переходить на другие при помощи ссылок - обычно ссылки подчеркнуты и выделены цветом.

Когда указатель мышки превращается из стрелочки в значок руки, это значит, что навели его на ссылку. Иногда ссылкой является картинка. Достаточно один раз нажать на ссылку левой кнопкой мыши, и откроется новая страница.

С некоторых сайтов можно также отправлять электронные письма и мгновенные сообщения, размещать на них фотографии и вести дневники.

Интернет - это самый легкий путь для общения с друзьями и коллегами в любой точке мира.

Интернет содержит множество сайтов на самые разные темы.

Заключение

С развитием INTERNET появилась возможность быстрого и удобного поиска необходимой документальной информации. Теперь можно не заниматься подбором и изучением огромного количества литературы в книжных магазинах и библиотеках.

Информацию можно получить, не выходя из дома или офиса. Для этого нужен только непосредственно сам компьютер, подключенный к INTERNET с установленной специальной программой - браузером, предназначеной для просмотра содержимого Web-страниц.

Благодаря разнообразию поисковых систем, специально разработанным для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.

Завершая курсовую работу, можно прийти к выводу, что в сети Интернет хранится очень большой объем как учебной информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио- и видео-файлов так и многого другого.

Существуют разные методы поиска учебной информации в сети Интернет: поиск с использованием гипертекстовых ссылок, использование поисковых машин, поиск с применением специальных средств, анализ новых ресурсов.

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

Простота в использовании

Чётко организованный и обновляемый индекс.

Быстрый поиск в базе данных и быстрое реагирование.

Надёжность и точность результатов поиска.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление, лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные виды деятельности и наиболее бурно развивающиеся отрасли индустрии информационных технологий.

Список использованной литературы

1. Практикум по информатике: Учеб. пособие / Под ред. Курносова А.П. - Воронеж: ВГАУ, 2004. -239 с.

Крупник А.Б. Поиск в Интернете: самоучитель. - 2-е изд. - СПБ.: Питер, 2004. - 572 с.

Орлов А.А. Нужные программы для Интернета - СПб.: Питер, 2006. - 127 с.

Солоницын Ю.А., Холмогоров В. Интернет. Энциклопедия. - 3-е из. - СПб.: Питер, 2003. - 592 с.

Компьютерные сети и средства защиты информации: Учеб. пособие / Камалян А.К., Кулев С.А., Назаренко К.Н. и др. - Воронеж: ВГАУ, 2003. - 119 с.

Попов В. Практикум по Интернет - технологиям: Учебный курс / В. Попов.-СПб.; М.; Харьков; Минск: Питер, 2002. - 476 с.:ил.

Компьютерные сети и средства защиты информации: Учебное пособие / Камалян А.К., Кулев С.А., Назаренко К.Н. и др.-Воронеж: ВГАУ, 2003.-119 с.

Основы современных компьютерных технологий. Под ред. Хомоненко А.Д. - Корона-принт, СПб 1998.

Персональные компьютеры в сетях TCP/IP. Крейг Хант; перев. С англ. - BHV-Киев, 1997.

Павел Храмцов "Поиск и навигация в Internet".://www.osp.ru/cw/1996/20/31.htm

Обучение Интернет - профессиям. Search engine Expert.://searchengine.narod.ru/archiv/se_2_250500.htm

Андрей Аликберов "Несколько слов о том, как работают роботы поисковых машин".://www.citforum.ru/internet/search/art_1.shtml