Архив Интернета
Архи́в Интерне́та (сокр. АИ; англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско американским программистом Брюстером Кейлом. Главной заявленной целью Архива является предоставление всеобщего доступа к накопленной в Интернете информации. Коллекция АИ состоит из множества подколлекций архивированных веб-сайтов, оцифрованных книг, аудио- и видеофайлов, игр, программного обеспечения.
| Internet Archive | |
|---|---|
| |
| |
| URL | archive.org |
| Коммерческий | нет |
| Тип сайта | универсальная электронная библиотека |
| Язык (-и) | английский |
| Расположение сервера | |
| Владелец | Internet Archive |
| Создатель | Брюстер Кейл |
| Начало работы | 24 января 1996 года |
| Текущий статус | Работает |
| Оборот |
|
| Чистая прибыль |
|
| Число сотрудников |
|
| Слоган | universal access to all knowledge |
| Страна |
|
К крупнейшим проектам Архива относят запущенный в 2001 году сервис Wayback Machine, который архивирует и предоставляет доступ к бо́льшей части «открытого» интернета. Пользователи Wayback Machine могут отследить происходящие на выбранных сайтах изменения и сравнивать разные версии правок. Другой крупной инициативой АИ является Open Library — открытая онлайн-библиотека, через которую пользователи могут брать на 2 недели оцифрованные версии книг. Также по инициативе Архива был создан сервис Archive It — служба веб-архивирования, помогающая организациям и частным лицам собирать, создавать и сохранять коллекции цифрового контента. На начало мая 2022 года коллекция Архива Интернета состояла из более чем 35 млн книг, 7,9 млн фильмов, видео и телепередач, 842 тыс. программ, 14 млн аудиофайлов, 4 млн изображений, 2,4 млн телеклипов, 237 тыс. концертов и более 682 млрд веб-страниц в Wayback Machine.
Для долгосрочного хранения данных «Архив» использует систему зеркальных сайтов, расположенных в географически отдалённых друг от друга местах. Копии Wayback Machine существуют в Сан-Франциско, Ричмонде, Александрии, Амстердаме. Для эффективного хранения файлов «Архив» использует формат файла (WARC), позволяющий сохранять файлы без потерь при архивировании.
В октябре 2024 года сайт Архива подвергся хакерской атаке, в результате чего приостановил свою деятельность. Руководство архива дало обещание вернуть сайт к работе. 29 октября руководства архива восстановило работу сайта, и продолжило работу над безопасностью.
История
Создание

Главную роль в создании «Архива Интернета» сыграл выпускник Массачусетского технологического института Брюстер Кейл. Во время учёбы Кейл и его одногруппники имели доступ к прототипу интернета — сети ARPANET. Однажды они решили посмотреть, что произойдёт, если поместить отдельные сообщества (на тот момент — небольшие списки рассылок и группы Usenet) в общее виртуальное пространство — единый список рассылки. Как позже вспоминал программист: «Это был хаос, анархия и дезинформация — это было ужасно!». Однако именно тогда Кейл осознал потенциал сети в предоставлении людям из разных учреждений возможности общаться друг с другом без задержек и трений. Благодаря экспериментам с ARPANET у программиста появилась идея создать первое цифровое хранилище.
Начиная с 1980-х годов Кейл участвовал в создании компании по производству мини-суперкомпьютеров Thinking Machines Corporation, а в 1989 году программист основал первую сетевую информационную поисковую систему WAIS и одноимённую компанию, которую он продал в 1995 году America Online за 15 млн $. Впоследствии WAIS стала прообразом современных поисковых систем и одной из первых программ, индексирующих большое количество информации. Одновременно с этим Брюстер переехал из Бостона в Сан-Франциско — город, который в то время только начал становиться центром Кремниевой долины.
В этот период Кейл заинтересовался вопросом архивирования всего интернета. Для этих целей он создал в 1996 году две взаимосвязанные организации — НКО Internet Archive и коммерческую систему веб-архивирования Alexa Internet, которая была создана совместно с [англ.] и получила название в честь Александрийской библиотеки. Задачей Alexa Internet стало финансирование некоммерческого проекта за счёт средств, вырученных от веб-архивирования. Помимо этого, все архивированные через Alexa данные также автоматически сохранялись в коллекцию. Начальные инвестиции в проект Alexa Internet составили около 1 млн $. Уже спустя год после создания «Архив Интернета» и Alexa совместно разработали браузерный плагин — программа автоматически определяла и сохраняла «ценные» веб-страницы, ранжируя их по количеству посещений и перекрёстных ссылок и кликов. Цикл создания и архивирования страниц составлял восемь недель, после чего процесс сканирования запускали заново. Встроенная в браузер панель инструментов Alexa помогала пользователям в навигации по интернету и одновременно занималась его каталогизацией, собирая метаданные о том, как страницы связаны друг с другом. Первое время для хранения данных использовали магнитную ленту — несмотря на то, что только появившиеся дисковые хранилища выигрывали в вопросе экономии пространства и удобства, ленты были примерно в 10 раз дешевле.
Целью «Архива Интернета» стала борьба с вымиранием ссылок — большинство создававшихся веб-страниц не было долговечным. Все собранные данные сохранялись в коллекцию «Архива Интернета». Так, 72 % опубликованных в 1998 году ссылок стали «мёртвыми» к 2021 году. Чтобы продемонстрировать важность сканирования и сохранения копий веб-страниц, «Архив» инициировал совместный проект со Смитсоновским институтом в Вашингтоне по сбору скриншотов веб-сайтов всех кандидатов в президенты 1996 года. Впоследствии эти данные были включены в архив института о партиях и кандидатах, собирающий данные по политическим партиям США и всем кандидатам в президенты.
1997—1999-й год
В 1998 году Alexa Internet передала Библиотеке Конгресса 2 терабайта заархивированного за два года контента или 500 000 веб-сайтов. Тогда Брюстер Кейл упомянул, что надеется вдохновить Библиотеку Конгресса и другие исследовательские библиотеки сохранять знания не только в печатном, но и в онлайновом виде.
В 1998—1999 годах «Архив Интернета» и Alexa заключили контракт с Microsoft и Netscape Communications на включение своего программного обеспечения в браузеры Internet Explorer и Netscape Navigator. Соглашения позволили значительно расширить инфраструктуру «Архива» — Alexa была внедрена на 90 % персональных компьютеров того времени. К концу 1998 года руководство «Архива» решило перейти с магнитной ленты на жёсткие диски. В 1999 году Брюс Кейл получил предложение от компании Amazon продать ей коммерческий успешный Alexa Internet за $250 млн, на что создатель ответил согласием. После покупки Alexa по-прежнему продолжила отправку данных в «Архив Интернета». В этом же году Энди Джуэл создал новый веб-краулер, позволяющий параллельно совершать сразу несколько сканирований и сохранять результаты в формате ARC. В этом же году НКО внедрило разработанный Джуэлом новый краулер, который позволил собирать не только веб-страницы, но и другие виды данных, например, анимацию. Благодаря партнёрству с [англ.] из [англ.] был реализован проект по оцифровке 1000 фильмов (общей стоимостью в $160 000) и по архивированию телевизионных новостных трансляций. В 2005 году Библиотека Конгресса приобрела Prelinger Archives, доступ к материалам по-прежнему осуществляется через «Архив».
2000—2010 годы

В период за 2000—2001 год размер архива увеличился втрое и составил около 40 терабайт. Одновременно с этим перед руководством встал вопрос о предоставлении доступа к собранной коллекции. Отдельные данные были доступны широкой публике, но требовали от пользователя знания Unix. Чтобы открыть доступ к информации, программисты Alexa создали Wayback Machine — онлайн-сервис, через который пользователи могли осуществить поиск по вводимому URL-адресу. Сервис был запущен 24 октября 2001 года и предлагал доступ к более чем 10 млрд заархивированных веб-страниц и 100 ТБ данных. В то время данные хранились на серверах Hewlett-Packard и uslab.com под управлением операционных систем FreeBSD и Linux. На каждом сервере было около 512 МБ оперативной памяти и чуть более 300 ГБ на жёстких дисках. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру. С технической точки зрения WM не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ.
В связи с президентскими выборами в США 2000 года «Архив Интернета» инициировал совместный с Библиотекой Конгресса проект по сбору информации о политических кампаниях кандидатов. Другим крупным проектом того периода стал «Архив 11 сентября», посвященный событиям 11 сентября 2001 года. Работая с Библиотекой Конгресса, «Архив» собрал изображения с более 30 000 избранных веб-сайтов в период по 1 декабря 2001 года включительно, а также сотни часов телетрансляций.
В 2002 году «Архив» реализовал сразу несколько крупных проектов, значительно расширивших его коллекцию. Первым и самым крупным из них стал зеркальный сайт библиотеки в городе Александрия. Всего в Египет было отправлено серверов с более чем 100 ТБ данных, общей стоимостью около $5 млн. Также «Архив Интернета» передал в Библиотеку Александрина 10 млрд веб-страниц, собранных с 1996 по 2001 год, 2000 часов записей передач египетского и американского телевидения и 1000 старых фильмов.
Летом 2002 года «Архив Интернета» сотрудничал с центром Карнеги-Меллона в проекте «[англ.]» (MBP) по оцифровке более одного миллиона книг и размещению их для бесплатного чтения в интернете. Проект осуществляли при полноправном участии других американских университетов и цифровых собраний Индии, Китая, Египта. Деньги на MBP выделили Национальный научный фонд США ($3,63 млн), правительство Индии (25 млн), а также Министерство образования КНР (8,46 млн). В свою очередь, «Архив Интернета» предоставил оборудование, персонал и денежные средства для оцифровки необходимых документов. Впоследствии собранная коллекция была доступна через зеркальные сайты Индии, Китая, порталов Университета Карнеги-Меллона и «Архива Интернета». В декабре 2004 года АИ объявил о новом сотрудничестве с несколькими международными библиотеками по помещению оцифрованных книг в архивы с открытым доступом. Вторым крупным проектом этого периода стал «Букбомбиль» — передвижная библиотека, по желанию печатающая работы из коллекции архива. Букмобиль передвигался по Сан-Франциско и, по заказу пользователей, мог печатать около 20 страниц в минуту, после чего волонтёры проекта собирали их вручную, помещали в обложку и переплетали с помощью нагревающего клей устройства, нанесённого на корешок страниц. Для обрезки книги использовали гильотинный резак для бумаги.
В 2003 году «Архив» продолжил сотрудничать с национальными библиотеками. В июле АИ принял участие в создании [англ.] — группы из 12 национальных библиотек США, согласившихся объединиться для разработки стандартов, инструментов и практик по приобретению, сохранению и созданию доступного знания и информации из интернета. Для достижения этой цели консорциум собирает интернет-контент со всего мира, таким образом, чтобы его можно было заархивировать и защитить, а также содействует разработке и использованию общих инструментов, методов и способов поощрения развития национальных библиотек. В этом же году «Архив Интернета» запустил [англ.] — веб-краулер с открытым исходным кодом на основе Java, который впоследствии был внедрён многими учреждениями по всему миру.
В 2004 году «Архив Интернета» начал перенос данных на оборудование третьего поколения — [англ.]. PetaBox основан на операционной системе Linux и представляет RAID-хранилище по цене примерно $2000 за терабайт или $2 млн за петабайт. Первым новое оборудование установили в Амстердамском отделении «Архива» — EU Web archive, которое собирает документы в странах Европейского союза и также служит зеркалом основной коллекции.
«Архив Интернета» ставит перед собой цель предоставить универсальный доступ ко всему человеческому знанию и стать масштабной интернет-библиотекой. В июне 2007 года штат Калифорния присвоил «Архиву Интернета» статус библиотеки, таким образом сделав его доступным для федерального финансирования и включив его в сеть организаций, занимающихся сохранением открытого доступа к информации.
В начале 2000-х годов руководство Архива выкупило старую христианскую церковь в Сан-Франциско и переоборудовало её под библиотеку. На 2009-й в организации было задействовано меньше пяти сотрудников, занятых эксплуатацией и техническим обслуживанием сайтов.
|
2010—2020-е
К 2012 году коллекция «Архива» увеличилась до 10 петабайт, с более чем 1,5 млн аудиофайлов и более миллиона видео в открытом доступе. Уже к 2014-му «Архив» обслуживал от двух до трёх млн посетителей в день, а коллекция составляла более 7 млн текстов, 2,1 млн аудиозаписей и 1,8 млн видео. В 2016 году «Архив» отпраздновал 20-летие со дня основания. К этому моменту в коллекции архива было 370 млн веб-сайтов и 273 млрд веб-страниц.
В 2013 году в офисе «Архива» произошёл пожар, уничтоживший часть оборудования, однако коллекция не пострадала. В этом же году, в ответ на разоблачения Эдварда Сноудена Агентства национальной безопасности, «Архив Интернета» ввёл шифрование веб-трафика читателей.
После победы Дональда Трампа на президентских выборах США 2016 года «Архив» принял решение создать копию своей коллекции в Канаде на тот случай, если Трамп решит ужесточить закон о цензуре или закон о клевете — Брюстер Кейл в своём блоге призвал сторонников финансово помочь в закупке необходимого оборудования, поскольку переезд будет стоить несколько миллионов долларов.
В 2019 году Google заявил, что вскоре удалит информацию закрывшейся социальной сети Google+, однако «Архив Интернета» и Archive Team подписали соглашение о сохранении публичных постов на своих платформах — только за первые четыре недели архивации было собрано 1,56 петабайта данных.
В 2018—2019 годах «Архив» осуществил ряд совместных проектов с Википедией. В 2018 году «Архив» заменил ряд мёртвых ссылок в энциклопедии на те, которые уже были архивированы в Wayback Machine — специальный бот вычислял мёртвые ссылки, впоследствии копируя и обновляя их, ссылаясь на архивированные копии. За первый год проекта было восстановлена работоспособность 9 млн ссылок. В 2019 году «Архив» инициировал проект по улучшению работы Википедии — портал предоставлял предпросмотр книг, на которые ссылались в статьях. Для этого пользователи могли кликнуть на название книги и посмотреть двухстраничный материал. В первый год существования сервиса «Архив» превратил 130 000 ссылок в статьях энциклопедии в прямые ссылки на 50 000 книг, которые организация отсканировала и сделала доступными для широкой публики. В конечном итоге АИ надеется позволить пользователям просматривать и брать взаймы все книги, цитируемые Википедией. Чтобы сервис корректно отображал книгу, редакторам энциклопедии необходимо правильно оформлять сноски, с указанием номеров страниц.
В 2020 году «Архив Интернета» запустил кооперацию с Brave — теперь браузер может автоматически определять недоступность веб-страницы и взамен предлагать резервную копию через сервис Wayback Machine. Функция доступна для ошибок: 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525 и 526. В этом же году была объявлена кооперация с компанией Cloudflare, предлагающей функцию Always On, которая кэширует статические версии сайтов. Партнёрство позволило Wayback Machine находить ещё больше веб-сайтов для сканирования.
Пандемия COVID-19 и борьба с дезинформацией
«Архив Интернета» активно выступает за борьбу с дезинформацией. В 2019 году организация вместе с [англ.], Фондом Викимедиа, Samuelson Law, Technology and Public Policy Clinic провели конференцию для обмена опытом по практикам борьбы с заведомо ложной информацией. С началом пандемии COVID-19 в марте 2020 года сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе. Например, в Medium была опубликована статья, в которой утверждалось, что от COVID-19 в Китае скончалось 21 млн человек. После того как эту статью начали широко распространять в Facebook, социальная сеть заблокировала ссылку. Однако статья сохранилась в «Архиве» и пользователи начали распространять её через Wayback Machine. В качестве контрмер в ноябре 2020 года «Архив Интернета» внедрил в Wayback Machine инструменты проверки информации на достоверность. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При наличии подозрений, что веб-страница задействована в кампании по дезинформации, Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, а также ссылку на её отчёт. Сервис проверки фактов позволяет пользователям лучше понять причины удаления или изменения определённых страниц в какой-то момент. В число участников проверки фактов, представляемых на Wayback Machine, входят [англ.], [англ.], Graphika, Stanford Internet Observatory и другие. «Архив Интернета» объяснил причины добавления проверки фактов на эти страницы, заявив: «Мы пытаемся сохранить нашу цифровую историю, но признаём проблемы, связанные с предоставлением доступа к ложной и вводящей в заблуждение информации, поступающей из разных источников».
Хранение

Во второй половине 1990-х годов решения для хранения данных были дорогостоящими. Для решения этой проблемы «Архив Интернета» в первом поколении инфраструктуры использовал магнитные ленты. В 2004 году «Архив» разработал недорогую и мощную систему хранения больших объёмов данных — PetaBox, вмещающую один петабайт, или тысячу терабайт данных. Для долгосрочного хранения «Архив» использует систему зеркальных сайтов, расположенных в географически отдалённых друг от друга местах. Копии Wayback Machine существуют в Сан-Франциско, Ричмонде, Александрии, Амстердаме. Файлы сохраняются в формате ARC. Каждый документ формата ARC размером около 100 МБ и содержит несколько файлов, полученных во время сканирования. Каждый вложенный элемент содержит метаданных о файле и его поиске: имя файла (его URL), его размер, тип содержимого, дату и время извлечения и название организации, которая его получила. Из ценовых соображений «Архив» хранит данные на дисках ATA, расположенных в [англ.], вмещающих четыре диска, из которых один является загрузочным диском ОС Linux, а другие хранят данные, настроенные под JBOD. В каждой стойке действуют 40 узлов хранения. В конце 2000-х только кластер Сан-Франциско вмещал около 36 стоек.
Веб-архивирование

Коллекция Архива состоит из множества подколлекций, созданных различными организациями, каждая из которых имеет разный подход к веб-архивированию. Некоторые данные напрямую управляются «Архивом», а другие — многочисленными партнёрами организации. Первые годы основным источником получения регулярных данных был веб-краулер Alexa Internet. Однако с увеличением объёма обрабатываемого трафика руководство НКО осознало необходимость внедрения масштабного и легко настраиваемого поискового робота. Но существовавшие на рынке программы не обладали достаточной мощностью и возможностями для широкого и глубокого сканирования интернета. Принципиальным моментом была открытость программного обеспечения, что способствовало бы развитию кооперации между учреждениями, заинтересованными в архивировании интернета. В первой половине 2003 года «Архив» начал работу над разработкой нового поискового робота с открытым исходным кодом под названием [англ.]. Краулер был написан на основе Java, в его разработке принимали участие Международный консорциум по сохранению Интернета и другие партнёрские библиотеки и учреждения. К Heritrix выдвигались те же требования, что и к краулеру Alexa Internet — робот должен подчиняться всем инструкциям по сканированию, заложенным в файл robots.txt сайта, и избегать агрессивного архивирования, которое может затруднить работу портала. Помимо этого, все захваченные сканером файлы должны объединяться в более крупные файлы для простоты управления и доступа. Сканер начинает фиксировать страницы, начиная с уже известных URL-адресов и далее передвигается по ссылкам внутри каждого сайта. Робот анализирует и переходит по встроенным ссылкам и затем добавляет все URL-адреса в список файлов для извлечения. Затем он повторяет этот процесс со следующими ссылками и проверяет, чтобы все сохранённые сайты были «захвачены». Heritrix обладает рядом ограничений — он не может сканировать глубокую сеть или какие-либо материалы в базах данных или на страницах, требующих аутентификацию для доступа. Робот также не будет сканировать защищённые паролем сайты и будет подчиняться исключениям, описанным в robot.txt. Также сканирование с большими трудностями обрабатывает элементы JavaScript, потоковое мультимедиа, карты изображений.
Alexa Internet использует собственные алгоритмы для сканирования сети, чаще всего анализируя сайты по статистике посещения и количеству ведущих на них ссылок. Поэтому если пользователи хотят отдельно сохранить собственный сайт, они могут сохранить страницу через специальную панель инструментов, внедрённую в Alexa. Начиная с 2010 года «Архив Интернета» выполняет Worldwide Web Crawling по глобальной сети, собирая веб-элементы, страницы, сайты и части сайтов по всему интернету. С марта по декабрь 2011 года Worldwide Web Crawling захватил 2,7 млрд снимков и 2,3 млрд уникальных URL-адресов с 29 млн веб-сайтами. Каждое сканирование начинается со списка определённых URL-адресов, известных как «списки исходных адресов», а также подчиняется отдельному алгоритму, который определяет глубину сканирования. Большинство сайтов будет захвачено только один раз, однако, отдельные порталы (такие, как новостные сайты) могут быть заархивированы чаще за счёт других обходов.
В 2013 году «Архив Интернета» совместно с Википедией и WordPress инициировал программу Archive No More 404, постоянно мониторящую порталы на предмет мёртвых ссылок. Впоследствии к программе присоединился [англ.]. В рамках этого проекта в 2016 году «Архив» вместе с Mozilla Firefox создал плагин, позволяющий пользователям просматривать «мёртвые» страницы, если они были заархивированы. Подобное сотрудничество значительно расширило коллекцию статьями и материалами о текущих событиях. Также в «Архиве» сохраняются данные о веб-страницах, отсканированных Фондом Альфреда Слоуна и Alexa, NARA и [англ.], реестрами DNS, содержащими более 2,5 млрд записей с 2013 года. Также многие специализированные архивы сохраняют в коллекцию «Архива Интернета» окончательные скриншоты своих страниц. Например, к ним относят GeoCities и Wretch.
Обходы могут быть нацелены как на единовременный «захват» сайта, чтобы гарантировать сохранение хотя бы одной копии портала, так и предназначаться для частого повторного сканирования небольшого подмножества выбранных вручную сайтов с регулярным интервалом — частота сканирования напрямую зависит от того, насколько популярен сайт.
Wayback Machine
Wayback Machine является бесплатным онлайн-сервисом, обеспечивающим доступ к веб-архивам «Архива Интернета». Сервис стал доступен для общественности только в 2001 году. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-сайтов. Архивные снимки поддерживают страницы с HTML, JavaScript и CSS. Через Wayback Machine пользователи могут отслеживать изменения сайтов и сравнивать разные версии правок. На май 2022 года Wayback Machine предоставлял доступ к более чем 682 млрд сохранённых веб-страниц. В 2017 году «Архив Интернета» представил модернизированную версию Wayback Machine. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ. Функционирование платформы осуществляется за счёт веб-краулеров и пользователей, добавляющих собственные сайты через ввод URL интересующего портала.
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице. Согласно исследованию 2014 года, большинство пользователей «Архива» заходят на Wayback Machine в поисках англоязычных материалов, которые не могут найти в «живом» сегменте интернета.
Archive It
В 2006 году «Архив» представил сервис под названием Archive It — службу веб-архивирования, помогающую организациям и частным лицам собирать, создавать и сохранять собственные коллекции цифровых данных. Archive It предоставляет возможности для веб-сканирования сайтов, организацию и управление данными, техническими отчётами для мониторинга краулинга, интерфейс для ввода метаданных сайта и полнотекстовый поиск. Служба работает на программном обеспечении с открытым исходным кодом Heritrix.
Весь контент размещён в дата-центрах «Архива Интернета». Для пользователей доступны более 200 коллекций, связанных с историей, культурой, наукой, правами человека и другими общественно важными темами.
Human Rights Web Archive
Human Rights Web Archive (HRWA) — это коллекция архивных копий веб-сайтов более 600 неправительственных организаций, национальных институтов по правам человека и блогов, так или иначе освещающих тему прав человека. HRWA была собрана различными неправительственными организациями, национальными правозащитными учреждениями и отдельными лицами. Создание HRWA было инициировано библиотеками и информационными службами Колумбийского университета и его Центра документации и исследований в области прав человека (CHRDR) при поддержке [англ.]Эндрю У. Меллона. Сбор данных начался в 2008 году, идентификацией необходимых порталов занимались специалисты в области прав человека из различных регионов мира. По состоянию на 2022-й коллекция регулярно обновлялась. Сайты межправительственных организаций, такие как ООН, не были включены в сборник. Коллекция включает более 711 веб-сайтов, из которых более 50 млн доступны для поиска. Сбор данных начался с пилотного проекта в 2008 году, веб-сайты сканировались ежеквартально с помощью службы Archive It. Копии коллекций хранятся в «Архиве Интернета» и Библиотеке Колумбийского университета. На 2022-й HRWA включал более тысячи сайтов и 50 млн документов.
Захвати Уолл-стрит
С началом в 2011 году серии протестов в Нью-Йорке под названием «Захвати Уолл-стрит», призывающих к социальному и экономическому равенству, члены команды Archive It и представители онлайн-сообщества добровольно выявляли и фиксировали все связанные с движением ресурсы. Коллекция включает в себя веб-сайты, блоги, социальные порталы и новостные статьи из традиционных или альтернативных СМИ. Информацию о протестах за пределами Нью-Йорка собирал [англ.] при Университете Джорджа Мейсона.
Книжная коллекция
| Количество всех текстов (17 мая, 2022) | 34 739 370 |
|---|
| Язык | Количество текстов |
|---|---|
| Английский | 25 779 040 |
| Французский | 740 679 |
| Немецкий | 727 010 |
| Нидерландский | 722 451 |
| Китайский | 568 727 |
| Арабский | 475 878 |
| Итальянский | 396 364 |
| Испанский | 311 750 |
| Японский | 154 282 |
| Греческий | 144 773 |
| Латинский | 136 532 |
| Урду | 98 953 |
| Русский | 76 979 |
| Португальский | 71 961 |

Open Content Alliance

В 2005 году «Архив» инициировал создание Open Content Alliance (ОСА) — консорциума организаций и компаний, совместно занимающихся оцифровкой библиотечных фондов и размещением их в открытом доступе. В проекте участвовали, кроме «Архива Интернета», Yahoo, Калифорнийский университет, Торонтский университет, Национальный архив Великобритании и другие. В OCA входил и Microsoft, однако в 2008 году компания объявила, что сокращает свои инвестиции в проект по оцифровке книг. При этом Microsoft снял все договорные ограничения на книги, являющиеся общественным достоянием, и позволил «Архиву» оставить себе всё необходимое оборудование. Решение Microsoft заставило «Архив» искать новые источники финансирования.
На май 2022 года «Архив» предлагал более 35 000 000 книг и текстов в открытом доступе. Существует также коллекция из 2,3 млн современных электронных книг, доступных всем зарегистрированным пользователям. Пользователи могут осуществлять поиск по контенту, виду медиа, году, теме и предметам. На главной странице раздела книги также перечислены коллекции, сортированные по просмотрам, названию, дате публикации и автору. Для создания книжной коллекции «Архив» сотрудничал с более чем 1100 библиотечными учреждениями, такими как Бостонская публичная библиотека, Библиотека Конгресса и другие. В ходе партнёрства были оцифрованы разные типы носителей, в том числе микрофильмы, журналы и серийные публикации, в основном на английском, нидерландском, немецком, французском, арабском, итальянском. В день сканировали около 3 500 книг в 18 местах по всему миру. Книги, изданные более 95 лет назад, доступны для скачивания. Подобный механизм цифрового распространения использует те же технологии защиты, которые издатели используют для своих печатных электронных книг, распространяемых коммерческими предприятиями, такими как [англ.] и Google Книги.
Open Library

«Архив Интернета» функционирует как онлайн-библиотека и выдаёт цифровые копии пользователям при условии, что одновременно в обращении находится не более одной цифровой копии книги. В 2006 году был запущен Open Library — онлайн-сервис, позволяющий пользователям читать электронные копии книг в соответствии с «контролируемой цифровой выдачей» (или CDL), ограничивающим количество одновременных заимствований одного отсканированного изображения. «Архив Интернета» обходит традиционные формы лицензионных ограничений — копии снимаются с физических копий, а не приобретаются в цифровой форме, поэтому проект никогда не заключает лицензионное соглашение с издателем.
- Количество текстов по десятилетиям
|
|
|
Медиа
| Количество аудиофайлов (Май 17, 2022) | 14 099 859 |
|---|
| Количество изображений (Май 17, 2022) | 4 301 137 |
|---|
| Количество видеофайлов (Май 17, 2022) | 7 930 236 |
|---|


Аудио
В 2017 году «Архив» инициировал проект The Great 78 Project, посвящённый сохранению тысяч виниловых пластинок, работающих со скоростью 78 об/мин, некоторые из которых были сделаны в начале 1900-х. Помимо «Архива», в проекте принимают участие [англ.] и George Blood Audio. The Great 78 Project ставит перед собой цель найти, очистить, оцифровать и архивировать около тысячи записей со старых проигрывателей в день. Для этого каждая пластинка очищается на специальной машине, которая распыляет на её поверхность дистиллированную воду. Впоследствии небольшой пылесос всасывает воду вместе с грязью, накопившейся в пластинках за эти годы. Затем диски фотографируют и на основе этих фотографий изготавливают этикетки для добавления в общую базу данных архива. Большая часть всех обработанных записей принадлежит крупным звукозаписывающим компаниям, таким как Columbia Records, RCA Records и Capitol Studios, однако в коллекцию вошли и около 1700 других лейблов. Только за первый год работы было размещено около 50 000 оцифрованных дисков. В рамках проекта «Архив Интернета» планирует оцифровать более 200 000 физических записей, большинство из которых относится к 1950-м годам и ранее.
Значительную часть аудиоколлекции «Архива Интернета» составляет Live Music Archive — коллекция более чем 220 000 концертных записей, сжатых без потерь. Часть этой коллекции досталась от музыкального сообщества [англ.], распространяющего записи живых концертов. «Архив» содержит записи живых выступлений различных артистов, включая Grateful Dead, Джона Мейера, Эллиотта Смита, The Smashing Pumpkins.
Фото
На 2022 год фото коллекция «Архива» состояла из 4,3 млн изображений. Одной из крупнейших подколлекций являются полученные с 2007-го в сотрудничестве с NASA. Организации совместно сканировали и архивировали фотографии, исторические фильмы и видео из архива агентства. Благодаря этому партнёрству коллекции доступны в едином архиве снимков NASA на сайте «Архива».
В 2014 году исследователь [англ.] из Университета Джорджа Вашингтона выгрузил 2,6 млн фотографий из находящихся в открытом доступе книг из «Архива». Впоследствии он добавил все изображения на сервис Flickr, заранее добавив тэги ко всем картинкам, чтобы пользователям был доступен поиск по материалам.
Видео и игры
Видеоколлекция «Архива» состоит из множества подколлекций, включая более 3 млн часов записанных новостных телетрансляций. Проект по записи и хранению новостных репортажей был инициирован Philly Political Media Watch Project — программой, созданной [англ.], [англ.], Консорциумом лингвистических данных при Пенсильванском университете и Центром общественных исследований и обслуживания Делавэрского университета. Благодаря проекту на сайте «Архива» доступны сотни тысяч новостных репортажей и сохранённых политических реклам.
В 2019 году «Архив» пополнил коллекцию 2,5 тысячами старых игр, написанных под систему DOS. Это произошло по результатам проекта eXoDOS, в рамках которого старые игры анализировались и оптимизировались для работы на современных компьютерах. В 2021 году компания Adobe заявила о прекращении работы Flash Player. В ответ «Архив» опубликовал на сайте коллекцию из несколько сотен игр и флеш-анимации.
Операционные системы
В 2016 году «Архив Интернета» опубликовал крупную коллекцию программ для семейства операционных систем Windows 3.x. Всего в разделе The Windows 3.x Showcase размещено 1523 программы, работа которых возможна благодаря встроенному эмулятору Windows 3.1 на JavaScript. Помимо этого в коллекцию входят программы, игры и демонстрационная версия Windows 95. Для защищённых авторским правом файлов сотрудники «Архива» опубликовали бесплатные аналоги.
Авторское право
Контролируемая цифровая выдача
Для предоставления доступа к книжным работам через сервис Open Library руководство «Архива» следует принципам контролируемой цифровой выдачи — интерпретации закона об авторском праве, согласно которому библиотеки могут одалживать оцифрованные печатные книги по тому же принципу, что и печатные — количество выданных цифровых изданий должно соответствовать тем копиям, которыми владеет библиотека. «Архив» приобретает все книги из своей коллекции, либо в печатном, либо в электронном виде. Затем он сканирует их для создания собственных цифровых файлов, которые впоследствии делает доступным для читателей. Поэтому проект никогда не заключает лицензионное соглашение с издателем. Все выдаваемые онлайн-файлы имеют встроенный код, благодаря которому доступ к работе может получить только один пользователь через электронную очередь. Подобная модель позволяет библиотекам делать свои книги доступными в цифровом виде, но также позволяет издателям и авторам расширений получать оплату за свою работу без потери продаж. Когда печатная библиотечная книга очень популярна, библиотеки, как правило, покупают больше экземпляров. Читатели не имеют права на копирование или распространение материалов. Таким образом система CDL позволяет обходить часть ограничений, заложенных в законодательство по авторскому праву.
Веб-архивирование
«Архив» удаляет данные из Wayback Machine по просьбам правообладателей, которые могут доказать авторские права, предоставить описание материала, контактные данные заявителя и подписанное заявление.
Влияние
Деятельность «Архива Интернета» оказала существенное влияние на развитие практик веб-архивирования по всему миру. По примеру АИ было создано множество масштабных программ и порталов веб-архивирования, часто — национальных. Одними из первых начали сохранять онлайн-контент крупные международные библиотеки — Библиотека Конгресса, Национальная библиотека Австралии, Национальная библиотека Швеции, Национальная библиотека Норвегии и Национальная библиотека Новой Зеландии. В 2013 году стартовал проект EU web archive, занимающийся сканированием и архивированием веб-сайтов Европейского союза для сохранения европейского веб-контента в долгосрочной перспективе и в открытом доступе. В 2000 году Чехия инициировала проект [англ.] по веб-архивации национальных сайтов. Позже аналогичные инициативы были реализованы в Хорватии, Венгрии, Ирландии, Бельгии и других странах. В большинстве случаев архивирование осуществлялось созданным «Архивом» веб-краулером Heritrix. Также «Архив Интернета» предоставляет бо́льшую часть техники, которая используется другими учреждениями для создания приложений по архивированию.
Коллекции «Архива» часто используют исследователи из различных областей науки. Так, данные анализируют на предмет изменений лингвистических и социальных практик, поведения компаний, стратегий продаж. Помимо этого, учёные могут использовать архивированные материалы для установления права на открытие или публикацию, а также чтобы получить доступ к журналам открытого доступа — согласно исследованиям 2020 года, с начала 2000-х из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным.
Правовые споры и блокировки
Церковь Саентологии
В 2002 году юристы Церкви Саентологии потребовали от «Архива Интернета» удалить из Wayback Machine архивные копии страницы портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Причиной послужило наличие выдержек из документов Церкви на портале Хельдала-Лунду. Однако в ответ «Архив» удалил не только страницы сайта с выдержками, но и закрыл доступ к всему порталу Xenu.net. Решение «Архива» вызвала масштабные публичные споры об этике и свободе слова.
National Emergency Library
Из-за пандемии COVID-19 и вынужденной изоляции многих людей в 2020 году «Архив» запустил временную службу «Национальная библиотека на случай чрезвычайных ситуаций», выложив в открытый доступ копии 1,4 млн книг для тех людей, которые не могли попасть в библиотеки. В отличие от традиционной работы сервиса Open Library, пользователи Библиотеки на случай чрезвычайных ситуаций могли одолжить тексты без очереди. В ответ американское объединение авторов [англ.] выпустило открытое письмо, в котором обвинило организацию в «фактическом воровстве» — проект нарушил ряд положений CDL, разрешив более чем одному пользователю доступ к текстам. В ответ на нарушения на «Архив Интернета» четыре коммерческих издательства — Hachette, Penguin Random House, Wiley — подали иск, обвинив портал в пиратстве. По этой причине «Архив Интернета» завершил свою программу раньше, чем планировалось, − 16 июня 2020 года, вместо 30 июня. Иск был направлен на запрет функционирования Open Library как схемы, которая оцифровывает и выдаёт охраняемые авторским правом работы.
25 марта 2023 года суд признал виновным «Архив Интернета» в нарушении авторских прав четырёх издателей. По мнению суда, организация должна была получить разрешение на распространение литературы у правообладателей книг. «Архив Интернета» заявил о решении подать апелляцию.
4 сентября 2024 года Апелляционный суд США по второму округу оставил в силе решение окружного суда, назвав аргумент Internet Archive о том, что они были защищены доктриной добросовестного использования, «неубедительным».
Страны СНГ
В 2014 году Роскомнадзор внёс «Архив Интернета» в реестр запрещённых сайтов за наличие копии документального фильма «Звон мечей», выпущенного Исламским государством. Через год Прокуратура Российской Федерации вынесла решение о блокировке сайта «Архива Интернета» на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации». Причиной для блокировки портала послужила архивированная статья «Одиночный джихад в России», которая, согласно прокуратуре, содержала призывы к массовым беспорядкам и осуществлению экстремистской деятельности. После удаления ресурсом всех ссылок на запрещённые в России сайты доступ к порталу был восстановлен.
В 2015 году портал «Архив Интернета» попал в список нежелательных сайтов, заблокированных в Казахстане.
6 июня 2017 года Октябрьский суд Бишкека заблокировал сайт в Кыргызстане из-за материалов «экстремистского содержания».
В 2019 году Ассоциация по защите авторских прав в интернете (АЗАПИ) выступила за блокировку «Архива Интернета» в России. Причиной для этого послужило присутствие в коллекции библиотеки копий аудиокниг российских писателей — Дмитрия Глуховского и Дарьи Донцовой. Иск по делу был подан 13 марта 2019 года, рассмотрение Мосгорсудом состоялось 13 мая 2019 года в экстренном порядке. Согласно решению суда «Архиву Интернета» запретили создавать технические условия для размещения аудиокниг.
12 мая 2022 года Роскомнадзор подал иск против «Архива Интернета» по статье 13.41 КоАП РФ («Неудаление информации, признанной в РФ запрещённой»). Причиной стало архивированное сервисом видео, в котором показывалось как изготовить коктейль Молотова. Судебное заседание прошло 28 июня 2022 года, по его результатам «Архив Интернета» оштрафовали на 800 тысяч рублей.
В 2022 году общественный фонд «Digital Paradigm» совместно с юридической фирмой Digital Rights Center Qazaqstan провёл успешную работу по разблокировке доступа к сайту «Архив Интернета» в Казахстане. Министерство информации и общественного развития Республики Казахстан внесло более 30 URL-ссылок в реестр запрещённых интернет-ресурсов, что привело к блокировке всего сайта, поскольку доступ к нему осуществляется через HTTPS. Запрет был наложен как самим Министерством, так и судами Есильского района города Астаны и Алатауского района. Благодаря активным переговорам с Министерством и администраторами «Архива Интернета», был достигнут компромисс, и доступ к сайту был восстановлен для всех пользователей в Казахстане.
Турция
9 октября 2016 года «Архив» был временно заблокирован в Турции после того, как он был использован хакерами для размещения 17 ГБ правительственных электронных писем.
Индия
В 2017 году сайт сервиса WayBackMachine был заблокирован в Индии по решению суда Мадраса в ответ на иск болливудских правообладателей, указавших на наличие на портале нескольких тысяч ссылок на пиратские копии фильмов. После блокировки индийское правительство обвинили в цензуре.
См. также
- История Интернета
- Архивирование веб-сайтов
- Archive.today
- Open Library
- WebCite
Примечания
- Internet Archive: Bios (англ.)
- https://projects.propublica.org/nonprofits/organizations/943242767
- Nonprofit Explorer: Research Tax-Exempt Organizations
- https://projects.propublica.org/nonprofits/organizations/943242767/202233199349312193/full
- https://www.youtube.com/watch?v=8YYJPtCXf4I
- Global Research Identifier Database (англ.) — 2015.
- Wayback Machine. Wayback Machine. Дата обращения: 7 июня 2021.
- eBooks and Texts. Internet Archive. Дата обращения: 16 мая 2022.
- Rackley, 2010, с. 2966—2976.
- The world’s largest internet archive is under siege — and fighting back. Дата обращения: 18 октября 2024. Архивировано 4 ноября 2024 года.
- Архив интернета возобновил работу после атаки, но пока в режиме «только для чтения». Дата обращения: 18 октября 2024. Архивировано 4 ноября 2024 года.
- Login coming soon! Still working on security improvements. Archive.org. Дата обращения: 13 ноября 2024. Архивировано 14 декабря 2024 года.
- Joel Khalili. The story of the fight to archive the internet (англ.). TechRadar. Дата обращения: 23 декабря 2021. Архивировано 22 декабря 2021 года.
- Recode Staff. Full transcript: Internet Archive founder Brewster Kahle on Recode Decode. Vox. Recode (8 марта 2017). Дата обращения: 12 июня 2021. Архивировано 2 июня 2021 года.
- Brewster Kahle. Harvard University. Дата обращения: 12 июня 2021. Архивировано 25 октября 2021 года.
- Timeline. Internet. Hall of Fame. Дата обращения: 12 июня 2021. Архивировано 21 июня 2021 года.
- Quentin Hardy. The Big Deal: Brewster Kahle. Forbes (27 ноября 2009). Дата обращения: 12 июня 2021. Архивировано 25 октября 2021 года.
- Kimpton, 2006.
- Brewster Kahle, 2008, с. 265—280.
- Kara Swisher. Ideas of Web's 'Librarian' Pave a Path to a Fortune. The Wall Street Journal (20 мая 1999). Дата обращения: 12 июня 2021. Архивировано 25 октября 2021 года.
- Carolyn Said. Archiving the Internet / Brewster Kahle makes digital snapshots of Web. SF Gate (7 мая 1998). Дата обращения: 12 июня 2021. Архивировано 2 апреля 2019 года.
- Mitchell Clark. New research shows how many important links on the web get lost to time. The Verge (21 мая 2021). Дата обращения: 13 июня 2021. Архивировано 20 июня 2021 года.
- Цифра дня: Сколько интернет-ссылок с 1998 года уже «мертвы»? Ferra (22 мая 2021). Дата обращения: 13 июня 2021. Архивировано 22 мая 2021 года.
- Barbara Quint. A "Gift of the Web' for the Library of Congress from Alexa Internet. Information Today (19 октября 1998). Дата обращения: 13 июня 2021. Архивировано 31 марта 2019 года.
- John Alderman. Alexa's Gift to the Government. Wired (14 октября 1998). Дата обращения: 12 июня 2021. Архивировано 25 октября 2021 года.
- David BankStaff. Microsoft Releases New Browser, Announces Deal With RealNetworks. The Wall Street Journal (17 марта 1999). Дата обращения: 13 июня 2021. Архивировано 19 мая 2021 года.
- Jon Christian. Why does Amazon have two completely different products called Alexa? The Outline (июнь 2017). Дата обращения: 13 июня 2021. Архивировано 1 июня 2021 года.
- Rick Prelinger. Creative Commons (1 октября 2005). Дата обращения: 13 июня 2021. Архивировано 24 ноября 2020 года.
- Arora, 2015.
- Bowyer, 2021, с. 43—57.
- Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard. Vox (23 января 2020). Дата обращения: 12 июня 2021. Архивировано 18 августа 2021 года.
- The events of September 11th, 2001 affected the entire world. Internet Archive. Дата обращения: 13 июня 2021.
- Lucas Mearian. Online archive chronicles 3,000 hours of 9/11 TV coverage. Computer world (10 сентября 2011). Дата обращения: 13 июня 2021. Архивировано 25 октября 2021 года.
- Bibliotheca Alexandrina. Internet Archive. Дата обращения: 13 июня 2021.
- Alexandria 2.0: One Millionaire's Quest to Build the Biggest Library on Earth. Wired (20 августа 2012). Дата обращения: 13 июня 2021. Архивировано 7 марта 2021 года.
- Савицкая, 2019, с. 67—76.
- Witten, 2007, с. 29—59.
- Steve Cisler. Letter from San Francisco. The Internet Bookmobile. Journal of the Internet. Дата обращения: 13 июня 2021. Архивировано 25 октября 2021 года.
- Mohr, 2004.
- EU web archive. Publications Office of the European Union. Дата обращения: 17 июня 2021. Архивировано 19 июня 2021 года.
- Jaffe, 2009.
- Aaron Souppouris. The Internet Archive is now home to 10 petabytes of data. The Verge (27 октября 2012). Дата обращения: 12 июня 2021. Архивировано 11 апреля 2021 года.
- David Streitfeld. The Internet Archive, Trying to Encompass All Creation. New York Times (31 октября 2014). Дата обращения: 13 июня 2021. Архивировано 10 мая 2021 года.
- Benny Evangelista. Internet Archive, repository of modern culture, turns 20. San Francisco Chronicle (28 октября 2016). Дата обращения: 12 июня 2021. Архивировано 20 мая 2021 года.
- Kurtis Alexander. Internet Archive's S.F. office damaged in fire. SF gate (6 ноября 2013). Дата обращения: 13 июня 2021. Архивировано 15 мая 2021 года.
- David Streitfeld. Internet Archive Will Shield Visitors. New York Times (24 октября 2013). Дата обращения: 13 июня 2021. Архивировано 26 октября 2021 года.
- Крупнейший в мире архив интернета бежит из США из-за Трампа. C News (30 ноября 2016). Дата обращения: 11 июня 2021. Архивировано 15 апреля 2021 года.
- Andrew Liptak. The Internet Archive is working to preserve public Google+ posts before it shuts down. The Verge (17 марта 2019). Дата обращения: 12 июня 2021. Архивировано 29 августа 2021 года.
- Mark Hill. Meet The Activist Archivists Saving The Internet From The Digital Dustbin. Discover (13 мая 2021). Дата обращения: 13 июня 2021. Архивировано 8 июня 2021 года.
- Wikipedia's broken links fixed by the Internet Archive. BBC News (3 октября 2018). Дата обращения: 13 июня 2021. Архивировано 9 июля 2021 года.
- Klint Finley. The Internet Archive Is Making Wikipedia More Reliable. Wired (11 марта 2019). Дата обращения: 13 июня 2021. Архивировано 24 ноября 2019 года.
- Jon Porter. The Internet Archive is adding digital previews of book sources to Wikipedia articles. The Verge (4 ноября 2019). Дата обращения: 12 июня 2021. Архивировано 25 февраля 2021 года.
- Adam Smith. The Internet Archive is linking digital books to Wikipedia citations. PC Mag (4 ноября 2019). Дата обращения: 13 июня 2021. Архивировано 7 марта 2021 года.
- Jon Porter. Brave browser now automatically points to Wayback Machine on 404. The Verge (26 февраля 2020). Дата обращения: 12 июня 2021. Архивировано 22 июня 2021 года.
- Lily Hay Newman. The Wayback Machine and Cloudflare Want to Backstop the Web. Wired (17 сентября 2020). Дата обращения: 13 июня 2021. Архивировано 18 мая 2021 года.
- Lila Bailey. Fighting Misinformation Online. Internet Archive Blogs (30 октября 2019). Дата обращения: 13 июня 2021.
- Acker, 2020.
- Elizabeth Dwoskin. Misinformation about coronavirus finds new avenues on unexpected sites. Washington Post (20 июня 2020). Дата обращения: 13 июня 2021. Архивировано 16 июня 2021 года.
- Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц. Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021. Архивировано 28 июня 2021 года.
- Adi Robertson. The Internet Archive is warning users about debunked ‘zombie’ coronavirus misinformation. The Verge (12 мая 2020). Дата обращения: 12 июня 2021. Архивировано 20 мая 2021 года.
- J. Fingas. Internet Archive adds fact checks to explain web page takedowns. Engadget (1 ноября 2020). Дата обращения: 13 июня 2021. Архивировано 23 июля 2021 года.
- Victor Barreiro. Internet Archive adds fact checks to pages on Wayback Machine. Rappler (2 ноября 2020). Дата обращения: 13 июня 2021. Архивировано 26 октября 2021 года.
- Schwarz, 2006.
- Toyoda, 2012, с. 1441—1443.
- Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web. Forbes (11 июня 2021). Дата обращения: 12 июня 2021. Архивировано 26 октября 2021 года.
- Simon, 2006.
- Archiving the World: GDELT Joins the Internet Archive’s “No More 404” Initiative. GDELT Project. Дата обращения: 20 июня 2021. Архивировано 8 марта 2021 года.
- Mark Graham. No More 404s! Resurrect dead web pages with our new Firefox add-on. Archive.org (9 августа 2016). Дата обращения: 20 июня 2021.
- Lerner, 2017, с. 1741—1755.
- Michael Bryant. What is the Wayback Machine and Why is it Useful? Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. Архивировано 18 мая 2021 года.
- Fernando, 2016, с. 109—112.
- Chris Welch. The Internet Archive will launch a modernized Wayback Machine in 2017. The Verge (22 октября 2015). Дата обращения: 12 июня 2021. Архивировано 11 апреля 2021 года.
- Rogers, 2017, с. 160—172.
- Laura Bohannon. Wayback Machine archives websites for over 20 years. Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- O'Connor, 2008, с. 64.
- Maemura, 2018.
- Notess, 2002.
- Антон Благовещенский. Вперёд в прошлое. Российская газета (7 марта 2012). Дата обращения: 12 июня 2021. Архивировано 26 октября 2021 года.
- Mark Graham. Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation. Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021. Архивировано 29 мая 2021 года.
- AlNoamany, 2014.
- Jones, 2018.
- Graham, 2019, с. 103—110.
- Human Rights Web Archive-Archived Index. Columbia University Libraries. Дата обращения: 16 мая 2022. Архивировано 11 мая 2021 года.
- Jennifer Schuessler. Occupy Wall Street: From the Streets to the Archives. New York Times (2 мая 2012). Дата обращения: 13 июня 2021. Архивировано 28 октября 2021 года.
- Occupy Movement 2011/2012. Archive it (ноябрь 2011). Дата обращения: 15 июня 2021. Архивировано 3 июня 2021 года.
- Lischer-Katz, 2013.
- Search. Internet Archive. Internet Archive. Дата обращения: 17 мая 2022.
- Katie Hafner. In Challenge to Google, Yahoo Will Scan Books. The New York Times (3 октября 2005). Дата обращения: 16 июня 2021. Архивировано 1 сентября 2021 года.
- Microsoft to Offer Online Book-Content Searches. The New York Times (26 октября 2005). Дата обращения: 16 июня 2021. Архивировано 1 сентября 2021 года.
- Books Scanning to be Publicly Funded. Internet Archive. Дата обращения: 15 июня 2021.
- Nate Anderson. Why killing Live Book Search is good for the future of books. Ars Technica (26 мая 2008). Дата обращения: 15 июня 2021. Архивировано 1 сентября 2021 года.
- Miguel Helft. Microsoft Will Shut Down Book Search Program. The New York Times (24 мая 2008). Дата обращения: 15 июня 2021. Архивировано 12 декабря 2020 года.
- Michael Bryant. What is the Internet Archive and What Can I Find on It? G Post (22 апреля 2021). Дата обращения: 15 июня 2021. Архивировано 16 июня 2021 года.
- Brewster Kahle. Transforming Our Libraries from Analog to Digital: A 2020 Vision. Educause review (13 марта 2017). Дата обращения: 15 июня 2021. Архивировано 2 августа 2021 года.
- Russell Brandom. Publishers sue Internet Archive over Open Library ebook lending. The Verge (1 июня 2020). Дата обращения: 12 июня 2021. Архивировано 1 июня 2020 года.
- Search. Internet Archive. Дата обращения: 16 июня 2021.
- Search. Internet Archive. Internet Archive. Дата обращения: 17 мая 2022.
- Search. Internet Archive. Internet Archive. Дата обращения: 17 мая 2022.
- Search. Internet Archive. Internet Archive. Дата обращения: 17 мая 2022.
- Will Pritchard. How The Great 78 Project is saving half a million songs from obscurity. The Vinyl Factory (18 августа 2017). Дата обращения: 16 июня 2021. Архивировано 7 ноября 2017 года.
- Kait Sanchez. Here’s how the Internet Archive digitizes 78rpm records. The Verge (26 апреля 2021). Дата обращения: 12 июня 2021. Архивировано 25 мая 2021 года.
- Dani Deahl. Over 50,000 digitized pieces of vinyl can now be listened to on Internet Archive. The Verge (12 августа 2017). Дата обращения: 12 июня 2021. Архивировано 12 июля 2021 года.
- Jake Coyle. On the Net: Concerts on the Web. Taiwan News. Дата обращения: 16 июня 2021. Архивировано 28 октября 2021 года.
- Verge Staff. The Verge’s favorite music streaming services. The Verge (13 апреля 2021). Дата обращения: 16 июня 2021. Архивировано 20 апреля 2021 года.
- Images. Internet Archive. Дата обращения: 16 июня 2021.
- Bob Jacobs, Paul Hickman. NASA and Internet Archive Team to Digitize Space Imagery. NASA. Дата обращения: 16 июня 2021. Архивировано 28 августа 2021 года.
- Leo Kelion. Millions of historical images posted to Flickr. BBC News (29 августа 2014). Дата обращения: 16 июня 2021. Архивировано 5 августа 2021 года.
- Василий Парфенов. В «Архиве интернета» появилось 2500 причин установить DOS. Популярная Механика (17 октября 2019). Дата обращения: 12 июня 2021. Архивировано 28 октября 2021 года.
- Александр Абрамов. «Архив Интернета» сохранит проекты на базе Flash. SpB IT (23 ноября 2020). Дата обращения: 12 июня 2021. Архивировано 28 января 2021 года.
- Ian Carlos Campbell. The Internet Archive is now preserving Flash games and animations. The Verge (19 ноября 2020). Дата обращения: 12 июня 2021. Архивировано 20 ноября 2020 года.
- Опубликован архив из 1500 запускаемых в браузере программ для Windows 3.x. N+1 (15 февраля 2016). Дата обращения: 12 июня 2021. Архивировано 28 октября 2021 года.
- Ojala, 2021.
- Constance Grady. Why authors are so angry about the Internet Archive’s Emergency Library. Vox (2 апреля 2020). Дата обращения: 12 июня 2021. Архивировано 4 апреля 2020 года.
- Berčič, 2005, с. 17—24.
- Holub, 2014.
- Webarchiv: 20 Years of Web Archiving in the Czech Republic. International Internet Preservation Consortium (8 декабря 2020). Дата обращения: 17 июня 2021. Архивировано 4 июля 2021 года.
- From pilot to portal: a year of web archiving in Hungar. International Internet Preservation Consortium (26 июня 2020). Дата обращения: 17 июня 2021. Архивировано 4 июля 2021 года.
- National Library of Ireland Collections 2011-2018. Archive It. Дата обращения: 17 июня 2021. Архивировано 2 июля 2021 года.
- Brügger, 2019.
- Harrison, 2005.
- Milligan, 2016.
- Pearce, 2009, с. 875.
- Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them. Science (8 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 15 октября 2020 года.
- Diana Kwon. More than 100 scientific journals have disappeared from the Internet. Nature (10 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 3 октября 2020 года.
- avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил. Хабр (10 сентября 2020). Дата обращения: 5 июня 2021. Архивировано 29 октября 2021 года.
- Lisa M. Bowman. Net archive silences Scientology critic. CNet (24 сентября 2002). Дата обращения: 10 июня 2021. Архивировано 15 мая 2012 года.
- Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology. LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021. Архивировано 16 ноября 2012 года.
- Дмитрий Кинский. «Архив Интернета» выложил в открытый доступ больше миллиона редких книг. Мир Фантастики (3 апреля 2020). Дата обращения: 12 июня 2021. Архивировано 4 ноября 2021 года.
- Американские издатели книг подали в суд на Internet Archive. Ведомости (2 июня 2020). Дата обращения: 12 июня 2021. Архивировано 30 июня 2021 года.
- Западные книжные издательства сживают со света «машину времени» интернета. CNews (2 июня 2020). Дата обращения: 12 июня 2021. Архивировано 1 сентября 2021 года.
- Kim Lyons. The Internet Archive has ended its ‘emergency library’ early. The Verge (14 июня 2020). Дата обращения: 12 июня 2021. Архивировано 9 июля 2021 года.
- Elizabeth A. Harris. Publishers Sue Internet Archive Over Free E-Books. New York Times (1 июня 2020). Дата обращения: 13 июня 2021.
- Andrew Albanese. Judge Sets Tentative Schedule for Internet Archive Copyright Case. Publishers Weekly (1 сентября 2020). Дата обращения: 18 июня 2021. Архивировано 8 сентября 2020 года.
- Anna Lovine. Internet Archive loses first ruling in copyright lawsuit. Mashable (25 марта 2023). Дата обращения: 4 апреля 2023. Архивировано 6 апреля 2023 года.
- Paul Hill. Court rules against Internet Archive in favour of book publishers on digital lending. NeoWin (25 марта 2023). Дата обращения: 4 апреля 2023. Архивировано 2 апреля 2023 года.
- Jay Peters and Sean Hollister. The Internet Archive has lost its first fight to scan and lend e-books like a library. The Verge (23 мая 2023). Дата обращения: 7 апреля 2023. Архивировано 25 марта 2023 года.
- Internet Archive Loses Lawsuit Over E-Book Copyright Infringement. Here’s What to Know. Time (31 марта 2023). Дата обращения: 7 апреля 2023. Архивировано 7 апреля 2023 года.
- Kate Knibbs. The Internet Archive Loses Its Appeal of a Major Copyright Case (англ.) // Wired. — ISSN 1059-1028. Архивировано 18 сентября 2024 года.
- Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов. Meduza (25 октября 2014). Дата обращения: 18 июня 2021. Архивировано 15 июня 2021 года.
- Георгий Перемитин. Роскомнадзор заблокировал архив интернета. РБК (25 июня 2015). Дата обращения: 12 июня 2021. Архивировано 21 августа 2021 года.
- "Архив интернета" внесли в список запрещённых сайтов. Москва 24 (1 сентября 2015). Дата обращения: 12 июня 2021. Архивировано 27 ноября 2021 года.
- Дмитрий Шестоперов, Анастасия Евтушенко. «Архив интернета» снова в сети. Газета.ru (18 апреля 2016). Дата обращения: 13 июня 2021. Архивировано 3 мая 2021 года.
- Experts explain reason for websites blocking in Kazakhstan. Kaz Pravda (21 октября 2015). Дата обращения: 18 июня 2021. Архивировано 3 октября 2021 года.
- Наталия Козина. Власти Кыргызстана заблокировали «Архив интернета» из-за «экстремистских материалов». Kloop (18 июля 2017). Дата обращения: 12 июня 2021. Архивировано 28 июня 2021 года.
- «Архив интернета» могут навечно заблокировать в России. C News (23 августа 2019). Дата обращения: 12 июня 2021. Архивировано 24 июня 2021 года.
- В России завели дело против «архива всего интернета». РБК (12 мая 2022). Дата обращения: 13 мая 2022. Архивировано 12 мая 2022 года.
- Internet Archive грозит 4 млн рублей штрафа из-за неудаления запрещённого контента. Интерфакс (12 мая 2022). Дата обращения: 17 мая 2022. Архивировано 16 мая 2022 года.
- Валерий Романов. Российский суд оштрафовал Архив интернета за коктейль Молотова. газета.ru (29 июня 2022). Дата обращения: 1 июля 2022. Архивировано 1 июля 2022 года.
- Архив интернета разблокирован в Казахстане. Internet Freedom. Дата обращения: 9 августа 2024.
- Turkey restores access to Google Drive after blocking cloud storage services. Daily News (10 октября 2016). Дата обращения: 18 июня 2021. Архивировано 14 апреля 2021 года.
- В Индии заблокировали архив интернета. Nag (16 августа 2017). Дата обращения: 12 июня 2021. Архивировано 29 октября 2021 года.
- Colm Gorey. India accused of censorship as Internet Archive is blocked unexpectedly. Silicon Republic (9 августа 2017). Дата обращения: 18 июня 2021. Архивировано 2 марта 2021 года.
- Leo Kelion. 'Bollywood blocks the Internet Archive'. BBC. Дата обращения: 18 июня 2021. Архивировано 6 августа 2018 года.
Литература
- Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi:10.37016/mr-2020-41.
- Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67, вып. 8. — С. 1904—1915. — doi:10.1002/asi.23503.
- AlNoamany Y., AlSum A., Weigle M., Nelson M. Who and what links to the Internet Archive // Int J Digit Libr. — 2014. — Вып. 14. — С. 101—115. — doi:10.1007/s00799-014-0111-5.
- Berčič B. Protection of Personal Data and Copyrighted Material on the Web: The Cases of Google and Internet Archive // Communications Technology Law. — 2005. — Т. 14, вып. 1. — С. 17—24. — doi:10.1080/1360083042000325283.
- Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21. — С. 43—57.
- Fernando Z., Marenzi I., Nejdl W., Kalyani R. ArchiveWeb: Collaboratively Extending and Exploring Web Archive Collections // Research and Advanced Technology for Digital Libraries. — 2016. — С. 107—121.
- Harrison T. The Internet Archive and Content Analysis // Qualitative Social Research on ICT. — 2005.
- Graham P. Guest Editorial: Reflections on the Ethics of Web Archiving // Journal of Archival Organization. — 2019. — С. 103—110. — doi:10.1080/15332748.2018.1517589.
- Jaffe E., Kirkpatrick S. Architecture of The Internet Archive // Proceedings of of SYSTOR 2009: The Israeli Experimental Systems Conference 2009, Haifa, Israel, May 4-6, 2009. — 2009. — doi:10.1145/1534530.1534545.
- Kahle B. Brewster Kahle. Founder,WAIS, Internet Archive, Alexa Internet // Founders at Work. Stories of Startups' Early Days. — 2008. — С. 265—280.
- Karolina Holub. Croatian Web Archive: An Overview // Преглед НЦД. — 2014. — Вып. 25. — С. 11—16.
- Kimpton M., Ubois J. Year-by-Year: From an Archive of the Internet to an Archive on the Internet // Web Archiving. — 2006. — С. 201—212.
- Lischer-Katz Z. Conceptualizing emergent archival forms: A case study of the occupy wall street “archive” // Association for Information Science & Technology. — 2013. — doi:10.1002/meet.14504901275.
- Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
- Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69, вып. 10. — С. 1223—1233.
- Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. — 2016.
- Mohr G., Stack M.,Ranitovic I.,Avery D., Kimpton M. An Introduction to Heritrix // 4th International Web Archiving Workshop (2004). — 2004.
- Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. — 2008. — Вып. 13. — С. 60—75.
- Niels Brügger, Ditte Laursen. The Historical Web and Digital Humanities. The Case of National Web Domain. — Routledge. — 2019. — 206 с. — ISBN 9780367671181.
- Notess G. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26, вып. 2.
- Ojala M. Controlled Digital Lending: Legal Lending or Piracy? // Information Today. — 2021. — Т. 45, вып. 1.
- Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875.
- Rackley M. Internet Archive // Encyclopedia of Library and Information Sciences. — 2010. — Т. 1, вып. 1. — С. 2966—2976.
- Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1, вып. 1—2. — С. 160—172. — doi:10.1080/24701475.2017.1307542.
- Simon J. Center for Research Libraries Middle Eastern Political Parties Web Harvesting and other efforts // "International Collections Development Workshop". — 2006.
- Shawn M. Jones, Michele C. Weigle, Alexander Nwala, Michael L. Nelson. The Many Shapes of Archive-It. Characteristics of Archive-It Collections // ArXiv.org. — 2018.
- Schwarz T., Baker M., Bassi S., Baumgart B., Flagg W., Ingen C., Joste K., Manasse M., Shah M. Disk Failure Investigations at the Internet Archive // NASA/IEEE Conference on Mass Storage Systems and Technologies. — 2006.
- Toyoda M., Kitsuregawa M. The History of Web Archiving // Proceedings of the IEEE. — 2012. — Т. 100. — С. 1441—1443.
- Witten I.,Gori M., Numerico T. Literature and the web // Web Dragons. — 2007. — С. 29—59.
- Савицкая Т. Е. Проект "Миллион книг" // Библиотековедение. — 2019. — Т. 68, вып. 1. — С. 67—76.
Ссылки
- Официальный сайт
- EU Web Archive Архивная копия от 19 июня 2021 на Wayback Machine
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Архив Интернета, Что такое Архив Интернета? Что означает Архив Интернета?
Ne sleduet putat s arXiv org krupnejshim arhivom elektronnyh publikacij po tochnym i estestvennym naukam Arhi v Interne ta sokr AI angl Internet Archive nekommercheskaya organizaciya osnovannaya v 1996 godu v San Francisko amerikanskim programmistom Bryusterom Kejlom Glavnoj zayavlennoj celyu Arhiva yavlyaetsya predostavlenie vseobshego dostupa k nakoplennoj v Internete informacii Kollekciya AI sostoit iz mnozhestva podkollekcij arhivirovannyh veb sajtov ocifrovannyh knig audio i videofajlov igr programmnogo obespecheniya Internet ArchiveURL archive orgKommercheskij netTip sajta universalnaya elektronnaya bibliotekaYazyk i anglijskijRaspolozhenie servera SShA Egipet NiderlandyVladelec Internet ArchiveSozdatel Bryuster KejlNachalo raboty 24 yanvarya 1996 godaTekushij status RabotaetOborot 30 5 mln dekabr 2022 2022 Chistaya pribyl 4 09 mln 2021 Chislo sotrudnikov 122 chel 2021 Slogan universal access to all knowledgeStrana SShA Mediafajly na Vikisklade K krupnejshim proektam Arhiva otnosyat zapushennyj v 2001 godu servis Wayback Machine kotoryj arhiviruet i predostavlyaet dostup k bo lshej chasti otkrytogo interneta Polzovateli Wayback Machine mogut otsledit proishodyashie na vybrannyh sajtah izmeneniya i sravnivat raznye versii pravok Drugoj krupnoj iniciativoj AI yavlyaetsya Open Library otkrytaya onlajn biblioteka cherez kotoruyu polzovateli mogut brat na 2 nedeli ocifrovannye versii knig Takzhe po iniciative Arhiva byl sozdan servis Archive It sluzhba veb arhivirovaniya pomogayushaya organizaciyam i chastnym licam sobirat sozdavat i sohranyat kollekcii cifrovogo kontenta Na nachalo maya 2022 goda kollekciya Arhiva Interneta sostoyala iz bolee chem 35 mln knig 7 9 mln filmov video i teleperedach 842 tys programm 14 mln audiofajlov 4 mln izobrazhenij 2 4 mln teleklipov 237 tys koncertov i bolee 682 mlrd veb stranic v Wayback Machine Dlya dolgosrochnogo hraneniya dannyh Arhiv ispolzuet sistemu zerkalnyh sajtov raspolozhennyh v geograficheski otdalyonnyh drug ot druga mestah Kopii Wayback Machine sushestvuyut v San Francisko Richmonde Aleksandrii Amsterdame Dlya effektivnogo hraneniya fajlov Arhiv ispolzuet format fajla WARC pozvolyayushij sohranyat fajly bez poter pri arhivirovanii V oktyabre 2024 goda sajt Arhiva podvergsya hakerskoj atake v rezultate chego priostanovil svoyu deyatelnost Rukovodstvo arhiva dalo obeshanie vernut sajt k rabote 29 oktyabrya rukovodstva arhiva vosstanovilo rabotu sajta i prodolzhilo rabotu nad bezopasnostyu IstoriyaSozdanie Bryuster Kejl v 2009 godu Glavnuyu rol v sozdanii Arhiva Interneta sygral vypusknik Massachusetskogo tehnologicheskogo instituta Bryuster Kejl Vo vremya uchyoby Kejl i ego odnogruppniki imeli dostup k prototipu interneta seti ARPANET Odnazhdy oni reshili posmotret chto proizojdyot esli pomestit otdelnye soobshestva na tot moment nebolshie spiski rassylok i gruppy Usenet v obshee virtualnoe prostranstvo edinyj spisok rassylki Kak pozzhe vspominal programmist Eto byl haos anarhiya i dezinformaciya eto bylo uzhasno Odnako imenno togda Kejl osoznal potencial seti v predostavlenii lyudyam iz raznyh uchrezhdenij vozmozhnosti obshatsya drug s drugom bez zaderzhek i trenij Blagodarya eksperimentam s ARPANET u programmista poyavilas ideya sozdat pervoe cifrovoe hranilishe Nachinaya s 1980 h godov Kejl uchastvoval v sozdanii kompanii po proizvodstvu mini superkompyuterov Thinking Machines Corporation a v 1989 godu programmist osnoval pervuyu setevuyu informacionnuyu poiskovuyu sistemu WAIS i odnoimyonnuyu kompaniyu kotoruyu on prodal v 1995 godu America Online za 15 mln Vposledstvii WAIS stala proobrazom sovremennyh poiskovyh sistem i odnoj iz pervyh programm indeksiruyushih bolshoe kolichestvo informacii Odnovremenno s etim Bryuster pereehal iz Bostona v San Francisko gorod kotoryj v to vremya tolko nachal stanovitsya centrom Kremnievoj doliny V etot period Kejl zainteresovalsya voprosom arhivirovaniya vsego interneta Dlya etih celej on sozdal v 1996 godu dve vzaimosvyazannye organizacii NKO Internet Archive i kommercheskuyu sistemu veb arhivirovaniya Alexa Internet kotoraya byla sozdana sovmestno s angl i poluchila nazvanie v chest Aleksandrijskoj biblioteki Zadachej Alexa Internet stalo finansirovanie nekommercheskogo proekta za schyot sredstv vyruchennyh ot veb arhivirovaniya Pomimo etogo vse arhivirovannye cherez Alexa dannye takzhe avtomaticheski sohranyalis v kollekciyu Nachalnye investicii v proekt Alexa Internet sostavili okolo 1 mln Uzhe spustya god posle sozdaniya Arhiv Interneta i Alexa sovmestno razrabotali brauzernyj plagin programma avtomaticheski opredelyala i sohranyala cennye veb stranicy ranzhiruya ih po kolichestvu poseshenij i perekryostnyh ssylok i klikov Cikl sozdaniya i arhivirovaniya stranic sostavlyal vosem nedel posle chego process skanirovaniya zapuskali zanovo Vstroennaya v brauzer panel instrumentov Alexa pomogala polzovatelyam v navigacii po internetu i odnovremenno zanimalas ego katalogizaciej sobiraya metadannye o tom kak stranicy svyazany drug s drugom Pervoe vremya dlya hraneniya dannyh ispolzovali magnitnuyu lentu nesmotrya na to chto tolko poyavivshiesya diskovye hranilisha vyigryvali v voprose ekonomii prostranstva i udobstva lenty byli primerno v 10 raz deshevle Celyu Arhiva Interneta stala borba s vymiraniem ssylok bolshinstvo sozdavavshihsya veb stranic ne bylo dolgovechnym Vse sobrannye dannye sohranyalis v kollekciyu Arhiva Interneta Tak 72 opublikovannyh v 1998 godu ssylok stali myortvymi k 2021 godu Chtoby prodemonstrirovat vazhnost skanirovaniya i sohraneniya kopij veb stranic Arhiv iniciiroval sovmestnyj proekt so Smitsonovskim institutom v Vashingtone po sboru skrinshotov veb sajtov vseh kandidatov v prezidenty 1996 goda Vposledstvii eti dannye byli vklyucheny v arhiv instituta o partiyah i kandidatah sobirayushij dannye po politicheskim partiyam SShA i vsem kandidatam v prezidenty 1997 1999 j god V 1998 godu Alexa Internet peredala Biblioteke Kongressa 2 terabajta zaarhivirovannogo za dva goda kontenta ili 500 000 veb sajtov Togda Bryuster Kejl upomyanul chto nadeetsya vdohnovit Biblioteku Kongressa i drugie issledovatelskie biblioteki sohranyat znaniya ne tolko v pechatnom no i v onlajnovom vide V 1998 1999 godah Arhiv Interneta i Alexa zaklyuchili kontrakt s Microsoft i Netscape Communications na vklyuchenie svoego programmnogo obespecheniya v brauzery Internet Explorer i Netscape Navigator Soglasheniya pozvolili znachitelno rasshirit infrastrukturu Arhiva Alexa byla vnedrena na 90 personalnyh kompyuterov togo vremeni K koncu 1998 goda rukovodstvo Arhiva reshilo perejti s magnitnoj lenty na zhyostkie diski V 1999 godu Bryus Kejl poluchil predlozhenie ot kompanii Amazon prodat ej kommercheskij uspeshnyj Alexa Internet za 250 mln na chto sozdatel otvetil soglasiem Posle pokupki Alexa po prezhnemu prodolzhila otpravku dannyh v Arhiv Interneta V etom zhe godu Endi Dzhuel sozdal novyj veb krauler pozvolyayushij parallelno sovershat srazu neskolko skanirovanij i sohranyat rezultaty v formate ARC V etom zhe godu NKO vnedrilo razrabotannyj Dzhuelom novyj krauler kotoryj pozvolil sobirat ne tolko veb stranicy no i drugie vidy dannyh naprimer animaciyu Blagodarya partnyorstvu s angl iz angl byl realizovan proekt po ocifrovke 1000 filmov obshej stoimostyu v 160 000 i po arhivirovaniyu televizionnyh novostnyh translyacij V 2005 godu Biblioteka Kongressa priobrela Prelinger Archives dostup k materialam po prezhnemu osushestvlyaetsya cherez Arhiv 2000 2010 gody S 2009 goda glavnyj ofis Arhiva raspolagaetsya v byvshej angl V period za 2000 2001 god razmer arhiva uvelichilsya vtroe i sostavil okolo 40 terabajt Odnovremenno s etim pered rukovodstvom vstal vopros o predostavlenii dostupa k sobrannoj kollekcii Otdelnye dannye byli dostupny shirokoj publike no trebovali ot polzovatelya znaniya Unix Chtoby otkryt dostup k informacii programmisty Alexa sozdali Wayback Machine onlajn servis cherez kotoryj polzovateli mogli osushestvit poisk po vvodimomu URL adresu Servis byl zapushen 24 oktyabrya 2001 goda i predlagal dostup k bolee chem 10 mlrd zaarhivirovannyh veb stranic i 100 TB dannyh V to vremya dannye hranilis na serverah Hewlett Packard i uslab com pod upravleniem operacionnyh sistem FreeBSD i Linux Na kazhdom servere bylo okolo 512 MB operativnoj pamyati i chut bolee 300 GB na zhyostkih diskah K dekabryu 2014 goda rukovodstvo Wayback Machine soobshilo chto sohranilo 435 mlrd veb stranic po vsemu miru S tehnicheskoj tochki zreniya WM ne yavlyaetsya arhivom a skoree obshedostupnym interfejsom k ogranichennomu podmnozhestvu vseh hranilish V svyazi s prezidentskimi vyborami v SShA 2000 goda Arhiv Interneta iniciiroval sovmestnyj s Bibliotekoj Kongressa proekt po sboru informacii o politicheskih kampaniyah kandidatov Drugim krupnym proektom togo perioda stal Arhiv 11 sentyabrya posvyashennyj sobytiyam 11 sentyabrya 2001 goda Rabotaya s Bibliotekoj Kongressa Arhiv sobral izobrazheniya s bolee 30 000 izbrannyh veb sajtov v period po 1 dekabrya 2001 goda vklyuchitelno a takzhe sotni chasov teletranslyacij V 2002 godu Arhiv realizoval srazu neskolko krupnyh proektov znachitelno rasshirivshih ego kollekciyu Pervym i samym krupnym iz nih stal zerkalnyj sajt biblioteki v gorode Aleksandriya Vsego v Egipet bylo otpravleno serverov s bolee chem 100 TB dannyh obshej stoimostyu okolo 5 mln Takzhe Arhiv Interneta peredal v Biblioteku Aleksandrina 10 mlrd veb stranic sobrannyh s 1996 po 2001 god 2000 chasov zapisej peredach egipetskogo i amerikanskogo televideniya i 1000 staryh filmov Letom 2002 goda Arhiv Interneta sotrudnichal s centrom Karnegi Mellona v proekte angl MBP po ocifrovke bolee odnogo milliona knig i razmesheniyu ih dlya besplatnogo chteniya v internete Proekt osushestvlyali pri polnopravnom uchastii drugih amerikanskih universitetov i cifrovyh sobranij Indii Kitaya Egipta Dengi na MBP vydelili Nacionalnyj nauchnyj fond SShA 3 63 mln pravitelstvo Indii 25 mln a takzhe Ministerstvo obrazovaniya KNR 8 46 mln V svoyu ochered Arhiv Interneta predostavil oborudovanie personal i denezhnye sredstva dlya ocifrovki neobhodimyh dokumentov Vposledstvii sobrannaya kollekciya byla dostupna cherez zerkalnye sajty Indii Kitaya portalov Universiteta Karnegi Mellona i Arhiva Interneta V dekabre 2004 goda AI obyavil o novom sotrudnichestve s neskolkimi mezhdunarodnymi bibliotekami po pomesheniyu ocifrovannyh knig v arhivy s otkrytym dostupom Vtorym krupnym proektom etogo perioda stal Bukbombil peredvizhnaya biblioteka po zhelaniyu pechatayushaya raboty iz kollekcii arhiva Bukmobil peredvigalsya po San Francisko i po zakazu polzovatelej mog pechatat okolo 20 stranic v minutu posle chego volontyory proekta sobirali ih vruchnuyu pomeshali v oblozhku i perepletali s pomoshyu nagrevayushego klej ustrojstva nanesyonnogo na koreshok stranic Dlya obrezki knigi ispolzovali gilotinnyj rezak dlya bumagi V 2003 godu Arhiv prodolzhil sotrudnichat s nacionalnymi bibliotekami V iyule AI prinyal uchastie v sozdanii angl gruppy iz 12 nacionalnyh bibliotek SShA soglasivshihsya obedinitsya dlya razrabotki standartov instrumentov i praktik po priobreteniyu sohraneniyu i sozdaniyu dostupnogo znaniya i informacii iz interneta Dlya dostizheniya etoj celi konsorcium sobiraet internet kontent so vsego mira takim obrazom chtoby ego mozhno bylo zaarhivirovat i zashitit a takzhe sodejstvuet razrabotke i ispolzovaniyu obshih instrumentov metodov i sposobov pooshreniya razvitiya nacionalnyh bibliotek V etom zhe godu Arhiv Interneta zapustil angl veb krauler s otkrytym ishodnym kodom na osnove Java kotoryj vposledstvii byl vnedryon mnogimi uchrezhdeniyami po vsemu miru V 2004 godu Arhiv Interneta nachal perenos dannyh na oborudovanie tretego pokoleniya angl PetaBox osnovan na operacionnoj sisteme Linux i predstavlyaet RAID hranilishe po cene primerno 2000 za terabajt ili 2 mln za petabajt Pervym novoe oborudovanie ustanovili v Amsterdamskom otdelenii Arhiva EU Web archive kotoroe sobiraet dokumenty v stranah Evropejskogo soyuza i takzhe sluzhit zerkalom osnovnoj kollekcii Arhiv Interneta stavit pered soboj cel predostavit universalnyj dostup ko vsemu chelovecheskomu znaniyu i stat masshtabnoj internet bibliotekoj V iyune 2007 goda shtat Kaliforniya prisvoil Arhivu Interneta status biblioteki takim obrazom sdelav ego dostupnym dlya federalnogo finansirovaniya i vklyuchiv ego v set organizacij zanimayushihsya sohraneniem otkrytogo dostupa k informacii V nachale 2000 h godov rukovodstvo Arhiva vykupilo staruyu hristianskuyu cerkov v San Francisko i pereoborudovalo eyo pod biblioteku Na 2009 j v organizacii bylo zadejstvovano menshe pyati sotrudnikov zanyatyh ekspluataciej i tehnicheskim obsluzhivaniem sajtov Ofis Arhiva Interneta v San Francisko2010 2020 e K 2012 godu kollekciya Arhiva uvelichilas do 10 petabajt s bolee chem 1 5 mln audiofajlov i bolee milliona video v otkrytom dostupe Uzhe k 2014 mu Arhiv obsluzhival ot dvuh do tryoh mln posetitelej v den a kollekciya sostavlyala bolee 7 mln tekstov 2 1 mln audiozapisej i 1 8 mln video V 2016 godu Arhiv otprazdnoval 20 letie so dnya osnovaniya K etomu momentu v kollekcii arhiva bylo 370 mln veb sajtov i 273 mlrd veb stranic V 2013 godu v ofise Arhiva proizoshyol pozhar unichtozhivshij chast oborudovaniya odnako kollekciya ne postradala V etom zhe godu v otvet na razoblacheniya Edvarda Snoudena Agentstva nacionalnoj bezopasnosti Arhiv Interneta vvyol shifrovanie veb trafika chitatelej Posle pobedy Donalda Trampa na prezidentskih vyborah SShA 2016 goda Arhiv prinyal reshenie sozdat kopiyu svoej kollekcii v Kanade na tot sluchaj esli Tramp reshit uzhestochit zakon o cenzure ili zakon o klevete Bryuster Kejl v svoyom bloge prizval storonnikov finansovo pomoch v zakupke neobhodimogo oborudovaniya poskolku pereezd budet stoit neskolko millionov dollarov V 2019 godu Google zayavil chto vskore udalit informaciyu zakryvshejsya socialnoj seti Google odnako Arhiv Interneta i Archive Team podpisali soglashenie o sohranenii publichnyh postov na svoih platformah tolko za pervye chetyre nedeli arhivacii bylo sobrano 1 56 petabajta dannyh V 2018 2019 godah Arhiv osushestvil ryad sovmestnyh proektov s Vikipediej V 2018 godu Arhiv zamenil ryad myortvyh ssylok v enciklopedii na te kotorye uzhe byli arhivirovany v Wayback Machine specialnyj bot vychislyal myortvye ssylki vposledstvii kopiruya i obnovlyaya ih ssylayas na arhivirovannye kopii Za pervyj god proekta bylo vosstanovlena rabotosposobnost 9 mln ssylok V 2019 godu Arhiv iniciiroval proekt po uluchsheniyu raboty Vikipedii portal predostavlyal predprosmotr knig na kotorye ssylalis v statyah Dlya etogo polzovateli mogli kliknut na nazvanie knigi i posmotret dvuhstranichnyj material V pervyj god sushestvovaniya servisa Arhiv prevratil 130 000 ssylok v statyah enciklopedii v pryamye ssylki na 50 000 knig kotorye organizaciya otskanirovala i sdelala dostupnymi dlya shirokoj publiki V konechnom itoge AI nadeetsya pozvolit polzovatelyam prosmatrivat i brat vzajmy vse knigi citiruemye Vikipediej Chtoby servis korrektno otobrazhal knigu redaktoram enciklopedii neobhodimo pravilno oformlyat snoski s ukazaniem nomerov stranic V 2020 godu Arhiv Interneta zapustil kooperaciyu s Brave teper brauzer mozhet avtomaticheski opredelyat nedostupnost veb stranicy i vzamen predlagat rezervnuyu kopiyu cherez servis Wayback Machine Funkciya dostupna dlya oshibok 404 408 410 451 500 502 503 504 509 520 521 523 524 525 i 526 V etom zhe godu byla obyavlena kooperaciya s kompaniej Cloudflare predlagayushej funkciyu Always On kotoraya keshiruet staticheskie versii sajtov Partnyorstvo pozvolilo Wayback Machine nahodit eshyo bolshe veb sajtov dlya skanirovaniya Pandemiya COVID 19 i borba s dezinformaciej Arhiv Interneta aktivno vystupaet za borbu s dezinformaciej V 2019 godu organizaciya vmeste s angl Fondom Vikimedia Samuelson Law Technology and Public Policy Clinic proveli konferenciyu dlya obmena opytom po praktikam borby s zavedomo lozhnoj informaciej S nachalom pandemii COVID 19 v marte 2020 goda storonniki konspirativnyh teorij ispolzovali sohranyonnye portalom skrinshoty dlya rasprostraneniya lozhnoj informacii o koronaviruse Naprimer v Medium byla opublikovana statya v kotoroj utverzhdalos chto ot COVID 19 v Kitae skonchalos 21 mln chelovek Posle togo kak etu statyu nachali shiroko rasprostranyat v Facebook socialnaya set zablokirovala ssylku Odnako statya sohranilas v Arhive i polzovateli nachali rasprostranyat eyo cherez Wayback Machine V kachestve kontrmer v noyabre 2020 goda Arhiv Interneta vnedril v Wayback Machine instrumenty proverki informacii na dostovernost Pri otkrytii zaarhivirovannoj versii sajta Wayback Machine predostavlyaet polzovatelyam svedeniya o prichine eyo udaleniya v vide zhyoltogo bannera vverhu ekrana Pri nalichii podozrenij chto veb stranica zadejstvovana v kampanii po dezinformacii Wayback Machine predostavlyaet dannye ob organizacii provodivshej proverku na dostovernost a takzhe ssylku na eyo otchyot Servis proverki faktov pozvolyaet polzovatelyam luchshe ponyat prichiny udaleniya ili izmeneniya opredelyonnyh stranic v kakoj to moment V chislo uchastnikov proverki faktov predstavlyaemyh na Wayback Machine vhodyat angl angl Graphika Stanford Internet Observatory i drugie Arhiv Interneta obyasnil prichiny dobavleniya proverki faktov na eti stranicy zayaviv My pytaemsya sohranit nashu cifrovuyu istoriyu no priznayom problemy svyazannye s predostavleniem dostupa k lozhnoj i vvodyashej v zabluzhdenie informacii postupayushej iz raznyh istochnikov HraneniePetaBox v Arhive Interneta 2011 god Vo vtoroj polovine 1990 h godov resheniya dlya hraneniya dannyh byli dorogostoyashimi Dlya resheniya etoj problemy Arhiv Interneta v pervom pokolenii infrastruktury ispolzoval magnitnye lenty V 2004 godu Arhiv razrabotal nedoroguyu i moshnuyu sistemu hraneniya bolshih obyomov dannyh PetaBox vmeshayushuyu odin petabajt ili tysyachu terabajt dannyh Dlya dolgosrochnogo hraneniya Arhiv ispolzuet sistemu zerkalnyh sajtov raspolozhennyh v geograficheski otdalyonnyh drug ot druga mestah Kopii Wayback Machine sushestvuyut v San Francisko Richmonde Aleksandrii Amsterdame Fajly sohranyayutsya v formate ARC Kazhdyj dokument formata ARC razmerom okolo 100 MB i soderzhit neskolko fajlov poluchennyh vo vremya skanirovaniya Kazhdyj vlozhennyj element soderzhit metadannyh o fajle i ego poiske imya fajla ego URL ego razmer tip soderzhimogo datu i vremya izvlecheniya i nazvanie organizacii kotoraya ego poluchila Iz cenovyh soobrazhenij Arhiv hranit dannye na diskah ATA raspolozhennyh v angl vmeshayushih chetyre diska iz kotoryh odin yavlyaetsya zagruzochnym diskom OS Linux a drugie hranyat dannye nastroennye pod JBOD V kazhdoj stojke dejstvuyut 40 uzlov hraneniya V konce 2000 h tolko klaster San Francisko vmeshal okolo 36 stoek Veb arhivirovanieSoobshenie o tom chto poiskovyj robot servisa Wayback Machine ne mozhet skanirovat sajt i sohranit materialy sajta v Arhive Interneta iz za soderzhimogo fajla robots txt zapreshayushego skanirovanie Kollekciya Arhiva sostoit iz mnozhestva podkollekcij sozdannyh razlichnymi organizaciyami kazhdaya iz kotoryh imeet raznyj podhod k veb arhivirovaniyu Nekotorye dannye napryamuyu upravlyayutsya Arhivom a drugie mnogochislennymi partnyorami organizacii Pervye gody osnovnym istochnikom polucheniya regulyarnyh dannyh byl veb krauler Alexa Internet Odnako s uvelicheniem obyoma obrabatyvaemogo trafika rukovodstvo NKO osoznalo neobhodimost vnedreniya masshtabnogo i legko nastraivaemogo poiskovogo robota No sushestvovavshie na rynke programmy ne obladali dostatochnoj moshnostyu i vozmozhnostyami dlya shirokogo i glubokogo skanirovaniya interneta Principialnym momentom byla otkrytost programmnogo obespecheniya chto sposobstvovalo by razvitiyu kooperacii mezhdu uchrezhdeniyami zainteresovannymi v arhivirovanii interneta V pervoj polovine 2003 goda Arhiv nachal rabotu nad razrabotkoj novogo poiskovogo robota s otkrytym ishodnym kodom pod nazvaniem angl Krauler byl napisan na osnove Java v ego razrabotke prinimali uchastie Mezhdunarodnyj konsorcium po sohraneniyu Interneta i drugie partnyorskie biblioteki i uchrezhdeniya K Heritrix vydvigalis te zhe trebovaniya chto i k krauleru Alexa Internet robot dolzhen podchinyatsya vsem instrukciyam po skanirovaniyu zalozhennym v fajl robots txt sajta i izbegat agressivnogo arhivirovaniya kotoroe mozhet zatrudnit rabotu portala Pomimo etogo vse zahvachennye skanerom fajly dolzhny obedinyatsya v bolee krupnye fajly dlya prostoty upravleniya i dostupa Skaner nachinaet fiksirovat stranicy nachinaya s uzhe izvestnyh URL adresov i dalee peredvigaetsya po ssylkam vnutri kazhdogo sajta Robot analiziruet i perehodit po vstroennym ssylkam i zatem dobavlyaet vse URL adresa v spisok fajlov dlya izvlecheniya Zatem on povtoryaet etot process so sleduyushimi ssylkami i proveryaet chtoby vse sohranyonnye sajty byli zahvacheny Heritrix obladaet ryadom ogranichenij on ne mozhet skanirovat glubokuyu set ili kakie libo materialy v bazah dannyh ili na stranicah trebuyushih autentifikaciyu dlya dostupa Robot takzhe ne budet skanirovat zashishyonnye parolem sajty i budet podchinyatsya isklyucheniyam opisannym v robot txt Takzhe skanirovanie s bolshimi trudnostyami obrabatyvaet elementy JavaScript potokovoe multimedia karty izobrazhenij Alexa Internet ispolzuet sobstvennye algoritmy dlya skanirovaniya seti chashe vsego analiziruya sajty po statistike posesheniya i kolichestvu vedushih na nih ssylok Poetomu esli polzovateli hotyat otdelno sohranit sobstvennyj sajt oni mogut sohranit stranicu cherez specialnuyu panel instrumentov vnedryonnuyu v Alexa Nachinaya s 2010 goda Arhiv Interneta vypolnyaet Worldwide Web Crawling po globalnoj seti sobiraya veb elementy stranicy sajty i chasti sajtov po vsemu internetu S marta po dekabr 2011 goda Worldwide Web Crawling zahvatil 2 7 mlrd snimkov i 2 3 mlrd unikalnyh URL adresov s 29 mln veb sajtami Kazhdoe skanirovanie nachinaetsya so spiska opredelyonnyh URL adresov izvestnyh kak spiski ishodnyh adresov a takzhe podchinyaetsya otdelnomu algoritmu kotoryj opredelyaet glubinu skanirovaniya Bolshinstvo sajtov budet zahvacheno tolko odin raz odnako otdelnye portaly takie kak novostnye sajty mogut byt zaarhivirovany chashe za schyot drugih obhodov V 2013 godu Arhiv Interneta sovmestno s Vikipediej i WordPress iniciiroval programmu Archive No More 404 postoyanno monitoryashuyu portaly na predmet myortvyh ssylok Vposledstvii k programme prisoedinilsya angl V ramkah etogo proekta v 2016 godu Arhiv vmeste s Mozilla Firefox sozdal plagin pozvolyayushij polzovatelyam prosmatrivat myortvye stranicy esli oni byli zaarhivirovany Podobnoe sotrudnichestvo znachitelno rasshirilo kollekciyu statyami i materialami o tekushih sobytiyah Takzhe v Arhive sohranyayutsya dannye o veb stranicah otskanirovannyh Fondom Alfreda Slouna i Alexa NARA i angl reestrami DNS soderzhashimi bolee 2 5 mlrd zapisej s 2013 goda Takzhe mnogie specializirovannye arhivy sohranyayut v kollekciyu Arhiva Interneta okonchatelnye skrinshoty svoih stranic Naprimer k nim otnosyat GeoCities i Wretch Obhody mogut byt naceleny kak na edinovremennyj zahvat sajta chtoby garantirovat sohranenie hotya by odnoj kopii portala tak i prednaznachatsya dlya chastogo povtornogo skanirovaniya nebolshogo podmnozhestva vybrannyh vruchnuyu sajtov s regulyarnym intervalom chastota skanirovaniya napryamuyu zavisit ot togo naskolko populyaren sajt Wayback Machine Osnovnaya statya Wayback Machine Wayback Machine yavlyaetsya besplatnym onlajn servisom obespechivayushim dostup k veb arhivam Arhiva Interneta Servis stal dostupen dlya obshestvennosti tolko v 2001 godu Za pervye 20 let sushestvovaniya Wayback Machine katalogiziroval i sohranil kollekciyu iz bolee chem 286 mlrd veb sajtov Arhivnye snimki podderzhivayut stranicy s HTML JavaScript i CSS Cherez Wayback Machine polzovateli mogut otslezhivat izmeneniya sajtov i sravnivat raznye versii pravok Na maj 2022 goda Wayback Machine predostavlyal dostup k bolee chem 682 mlrd sohranyonnyh veb stranic V 2017 godu Arhiv Interneta predstavil modernizirovannuyu versiyu Wayback Machine S tehnicheskoj tochki zreniya programmnoe obespechenie Wayback Machine ne yavlyaetsya arhivom a skoree obshedostupnym interfejsom k ogranichennomu podmnozhestvu vseh hranilish Funkcionirovanie platformy osushestvlyaetsya za schyot veb kraulerov i polzovatelej dobavlyayushih sobstvennye sajty cherez vvod URL interesuyushego portala Lyuboj polzovatel mozhet sohranit URL adresa dlya arhivirovaniya a s besplatnoj uchyotnoj zapisyu v arhive mozhno sozdat i zaarhivirovat lyubye ishodyashie ili vneshnie ssylki na ishodnoj stranice Soglasno issledovaniyu 2014 goda bolshinstvo polzovatelej Arhiva zahodyat na Wayback Machine v poiskah angloyazychnyh materialov kotorye ne mogut najti v zhivom segmente interneta Archive It V 2006 godu Arhiv predstavil servis pod nazvaniem Archive It sluzhbu veb arhivirovaniya pomogayushuyu organizaciyam i chastnym licam sobirat sozdavat i sohranyat sobstvennye kollekcii cifrovyh dannyh Archive It predostavlyaet vozmozhnosti dlya veb skanirovaniya sajtov organizaciyu i upravlenie dannymi tehnicheskimi otchyotami dlya monitoringa kraulinga interfejs dlya vvoda metadannyh sajta i polnotekstovyj poisk Sluzhba rabotaet na programmnom obespechenii s otkrytym ishodnym kodom Heritrix Ves kontent razmeshyon v data centrah Arhiva Interneta Dlya polzovatelej dostupny bolee 200 kollekcij svyazannyh s istoriej kulturoj naukoj pravami cheloveka i drugimi obshestvenno vazhnymi temami Human Rights Web Archive Human Rights Web Archive HRWA eto kollekciya arhivnyh kopij veb sajtov bolee 600 nepravitelstvennyh organizacij nacionalnyh institutov po pravam cheloveka i blogov tak ili inache osveshayushih temu prav cheloveka HRWA byla sobrana razlichnymi nepravitelstvennymi organizaciyami nacionalnymi pravozashitnymi uchrezhdeniyami i otdelnymi licami Sozdanie HRWA bylo iniciirovano bibliotekami i informacionnymi sluzhbami Kolumbijskogo universiteta i ego Centra dokumentacii i issledovanij v oblasti prav cheloveka CHRDR pri podderzhke angl Endryu U Mellona Sbor dannyh nachalsya v 2008 godu identifikaciej neobhodimyh portalov zanimalis specialisty v oblasti prav cheloveka iz razlichnyh regionov mira Po sostoyaniyu na 2022 j kollekciya regulyarno obnovlyalas Sajty mezhpravitelstvennyh organizacij takie kak OON ne byli vklyucheny v sbornik Kollekciya vklyuchaet bolee 711 veb sajtov iz kotoryh bolee 50 mln dostupny dlya poiska Sbor dannyh nachalsya s pilotnogo proekta v 2008 godu veb sajty skanirovalis ezhekvartalno s pomoshyu sluzhby Archive It Kopii kollekcij hranyatsya v Arhive Interneta i Biblioteke Kolumbijskogo universiteta Na 2022 j HRWA vklyuchal bolee tysyachi sajtov i 50 mln dokumentov Zahvati Uoll strit S nachalom v 2011 godu serii protestov v Nyu Jorke pod nazvaniem Zahvati Uoll strit prizyvayushih k socialnomu i ekonomicheskomu ravenstvu chleny komandy Archive It i predstaviteli onlajn soobshestva dobrovolno vyyavlyali i fiksirovali vse svyazannye s dvizheniem resursy Kollekciya vklyuchaet v sebya veb sajty blogi socialnye portaly i novostnye stati iz tradicionnyh ili alternativnyh SMI Informaciyu o protestah za predelami Nyu Jorka sobiral angl pri Universitete Dzhordzha Mejsona Knizhnaya kollekciyaKolichestvo vseh tekstov 17 maya 2022 34 739 370Yazyk Kolichestvo tekstovAnglijskij 25 779 040Francuzskij 740 679Nemeckij 727 010Niderlandskij 722 451Kitajskij 568 727Arabskij 475 878Italyanskij 396 364Ispanskij 311 750Yaponskij 154 282Grecheskij 144 773Latinskij 136 532Urdu 98 953Russkij 76 979Portugalskij 71 961Logotip Open Library 2020 godOpen Content Alliance Osnovnaya statya Open Content Alliance Process skanirovaniya 2011 V 2005 godu Arhiv iniciiroval sozdanie Open Content Alliance OSA konsorciuma organizacij i kompanij sovmestno zanimayushihsya ocifrovkoj bibliotechnyh fondov i razmesheniem ih v otkrytom dostupe V proekte uchastvovali krome Arhiva Interneta Yahoo Kalifornijskij universitet Torontskij universitet Nacionalnyj arhiv Velikobritanii i drugie V OCA vhodil i Microsoft odnako v 2008 godu kompaniya obyavila chto sokrashaet svoi investicii v proekt po ocifrovke knig Pri etom Microsoft snyal vse dogovornye ogranicheniya na knigi yavlyayushiesya obshestvennym dostoyaniem i pozvolil Arhivu ostavit sebe vsyo neobhodimoe oborudovanie Reshenie Microsoft zastavilo Arhiv iskat novye istochniki finansirovaniya Na maj 2022 goda Arhiv predlagal bolee 35 000 000 knig i tekstov v otkrytom dostupe Sushestvuet takzhe kollekciya iz 2 3 mln sovremennyh elektronnyh knig dostupnyh vsem zaregistrirovannym polzovatelyam Polzovateli mogut osushestvlyat poisk po kontentu vidu media godu teme i predmetam Na glavnoj stranice razdela knigi takzhe perechisleny kollekcii sortirovannye po prosmotram nazvaniyu date publikacii i avtoru Dlya sozdaniya knizhnoj kollekcii Arhiv sotrudnichal s bolee chem 1100 bibliotechnymi uchrezhdeniyami takimi kak Bostonskaya publichnaya biblioteka Biblioteka Kongressa i drugie V hode partnyorstva byli ocifrovany raznye tipy nositelej v tom chisle mikrofilmy zhurnaly i serijnye publikacii v osnovnom na anglijskom niderlandskom nemeckom francuzskom arabskom italyanskom V den skanirovali okolo 3 500 knig v 18 mestah po vsemu miru Knigi izdannye bolee 95 let nazad dostupny dlya skachivaniya Podobnyj mehanizm cifrovogo rasprostraneniya ispolzuet te zhe tehnologii zashity kotorye izdateli ispolzuyut dlya svoih pechatnyh elektronnyh knig rasprostranyaemyh kommercheskimi predpriyatiyami takimi kak angl i Google Knigi Open Library Stanciya skanirovaniya knig 2012 godOsnovnaya statya Open Library Arhiv Interneta funkcioniruet kak onlajn biblioteka i vydayot cifrovye kopii polzovatelyam pri uslovii chto odnovremenno v obrashenii nahoditsya ne bolee odnoj cifrovoj kopii knigi V 2006 godu byl zapushen Open Library onlajn servis pozvolyayushij polzovatelyam chitat elektronnye kopii knig v sootvetstvii s kontroliruemoj cifrovoj vydachej ili CDL ogranichivayushim kolichestvo odnovremennyh zaimstvovanij odnogo otskanirovannogo izobrazheniya Arhiv Interneta obhodit tradicionnye formy licenzionnyh ogranichenij kopii snimayutsya s fizicheskih kopij a ne priobretayutsya v cifrovoj forme poetomu proekt nikogda ne zaklyuchaet licenzionnoe soglashenie s izdatelem Kolichestvo tekstov po desyatiletiyamXIX vek Desyatiletie Kolichestvo tekstov Maj 17 2022 1800 e 90 2061810 e 111 2121820 e 177 3611830 e 230 7171840 e 269 6391850 e 333 9561860 e 352 2041870 e 377 6781880 e 496 8781890 e 632 531 XX vek Desyatiletie Kolichestvo tekstov Maj 17 2022 1900 e 836 6461910 e 849 5191920 e 623 5781930 e 557 5521940 e 631 9791950 e 671 7951960 e 806 7891970 e 2 672 1011980 e 1 320 6361990 e 1 645 563 XXI vek Desyatiletie Kolichestvo tekstov Maj 17 2022 2000 e 2 033 2262010 e 3 543 643MediaKolichestvo audiofajlov Maj 17 2022 14 099 859Kolichestvo izobrazhenij Maj 17 2022 4 301 137Kolichestvo videofajlov Maj 17 2022 7 930 236Videokassety i VCR 2013 godMikrofilmy iz kollekcii Arhiva 2011 godAudio V 2017 godu Arhiv iniciiroval proekt The Great 78 Project posvyashyonnyj sohraneniyu tysyach vinilovyh plastinok rabotayushih so skorostyu 78 ob min nekotorye iz kotoryh byli sdelany v nachale 1900 h Pomimo Arhiva v proekte prinimayut uchastie angl i George Blood Audio The Great 78 Project stavit pered soboj cel najti ochistit ocifrovat i arhivirovat okolo tysyachi zapisej so staryh proigryvatelej v den Dlya etogo kazhdaya plastinka ochishaetsya na specialnoj mashine kotoraya raspylyaet na eyo poverhnost distillirovannuyu vodu Vposledstvii nebolshoj pylesos vsasyvaet vodu vmeste s gryazyu nakopivshejsya v plastinkah za eti gody Zatem diski fotografiruyut i na osnove etih fotografij izgotavlivayut etiketki dlya dobavleniya v obshuyu bazu dannyh arhiva Bolshaya chast vseh obrabotannyh zapisej prinadlezhit krupnym zvukozapisyvayushim kompaniyam takim kak Columbia Records RCA Records i Capitol Studios odnako v kollekciyu voshli i okolo 1700 drugih lejblov Tolko za pervyj god raboty bylo razmesheno okolo 50 000 ocifrovannyh diskov V ramkah proekta Arhiv Interneta planiruet ocifrovat bolee 200 000 fizicheskih zapisej bolshinstvo iz kotoryh otnositsya k 1950 m godam i ranee Znachitelnuyu chast audiokollekcii Arhiva Interneta sostavlyaet Live Music Archive kollekciya bolee chem 220 000 koncertnyh zapisej szhatyh bez poter Chast etoj kollekcii dostalas ot muzykalnogo soobshestva angl rasprostranyayushego zapisi zhivyh koncertov Arhiv soderzhit zapisi zhivyh vystuplenij razlichnyh artistov vklyuchaya Grateful Dead Dzhona Mejera Elliotta Smita The Smashing Pumpkins Foto Na 2022 god foto kollekciya Arhiva sostoyala iz 4 3 mln izobrazhenij Odnoj iz krupnejshih podkollekcij yavlyayutsya poluchennye s 2007 go v sotrudnichestve s NASA Organizacii sovmestno skanirovali i arhivirovali fotografii istoricheskie filmy i video iz arhiva agentstva Blagodarya etomu partnyorstvu kollekcii dostupny v edinom arhive snimkov NASA na sajte Arhiva V 2014 godu issledovatel angl iz Universiteta Dzhordzha Vashingtona vygruzil 2 6 mln fotografij iz nahodyashihsya v otkrytom dostupe knig iz Arhiva Vposledstvii on dobavil vse izobrazheniya na servis Flickr zaranee dobaviv tegi ko vsem kartinkam chtoby polzovatelyam byl dostupen poisk po materialam Video i igry Videokollekciya Arhiva sostoit iz mnozhestva podkollekcij vklyuchaya bolee 3 mln chasov zapisannyh novostnyh teletranslyacij Proekt po zapisi i hraneniyu novostnyh reportazhej byl iniciirovan Philly Political Media Watch Project programmoj sozdannoj angl angl Konsorciumom lingvisticheskih dannyh pri Pensilvanskom universitete i Centrom obshestvennyh issledovanij i obsluzhivaniya Delaverskogo universiteta Blagodarya proektu na sajte Arhiva dostupny sotni tysyach novostnyh reportazhej i sohranyonnyh politicheskih reklam V 2019 godu Arhiv popolnil kollekciyu 2 5 tysyachami staryh igr napisannyh pod sistemu DOS Eto proizoshlo po rezultatam proekta eXoDOS v ramkah kotorogo starye igry analizirovalis i optimizirovalis dlya raboty na sovremennyh kompyuterah V 2021 godu kompaniya Adobe zayavila o prekrashenii raboty Flash Player V otvet Arhiv opublikoval na sajte kollekciyu iz neskolko soten igr i flesh animacii Operacionnye sistemy V 2016 godu Arhiv Interneta opublikoval krupnuyu kollekciyu programm dlya semejstva operacionnyh sistem Windows 3 x Vsego v razdele The Windows 3 x Showcase razmesheno 1523 programmy rabota kotoryh vozmozhna blagodarya vstroennomu emulyatoru Windows 3 1 na JavaScript Pomimo etogo v kollekciyu vhodyat programmy igry i demonstracionnaya versiya Windows 95 Dlya zashishyonnyh avtorskim pravom fajlov sotrudniki Arhiva opublikovali besplatnye analogi Avtorskoe pravoKontroliruemaya cifrovaya vydacha Dlya predostavleniya dostupa k knizhnym rabotam cherez servis Open Library rukovodstvo Arhiva sleduet principam kontroliruemoj cifrovoj vydachi interpretacii zakona ob avtorskom prave soglasno kotoromu biblioteki mogut odalzhivat ocifrovannye pechatnye knigi po tomu zhe principu chto i pechatnye kolichestvo vydannyh cifrovyh izdanij dolzhno sootvetstvovat tem kopiyam kotorymi vladeet biblioteka Arhiv priobretaet vse knigi iz svoej kollekcii libo v pechatnom libo v elektronnom vide Zatem on skaniruet ih dlya sozdaniya sobstvennyh cifrovyh fajlov kotorye vposledstvii delaet dostupnym dlya chitatelej Poetomu proekt nikogda ne zaklyuchaet licenzionnoe soglashenie s izdatelem Vse vydavaemye onlajn fajly imeyut vstroennyj kod blagodarya kotoromu dostup k rabote mozhet poluchit tolko odin polzovatel cherez elektronnuyu ochered Podobnaya model pozvolyaet bibliotekam delat svoi knigi dostupnymi v cifrovom vide no takzhe pozvolyaet izdatelyam i avtoram rasshirenij poluchat oplatu za svoyu rabotu bez poteri prodazh Kogda pechatnaya bibliotechnaya kniga ochen populyarna biblioteki kak pravilo pokupayut bolshe ekzemplyarov Chitateli ne imeyut prava na kopirovanie ili rasprostranenie materialov Takim obrazom sistema CDL pozvolyaet obhodit chast ogranichenij zalozhennyh v zakonodatelstvo po avtorskomu pravu Veb arhivirovanie Arhiv udalyaet dannye iz Wayback Machine po prosbam pravoobladatelej kotorye mogut dokazat avtorskie prava predostavit opisanie materiala kontaktnye dannye zayavitelya i podpisannoe zayavlenie VliyanieDeyatelnost Arhiva Interneta okazala sushestvennoe vliyanie na razvitie praktik veb arhivirovaniya po vsemu miru Po primeru AI bylo sozdano mnozhestvo masshtabnyh programm i portalov veb arhivirovaniya chasto nacionalnyh Odnimi iz pervyh nachali sohranyat onlajn kontent krupnye mezhdunarodnye biblioteki Biblioteka Kongressa Nacionalnaya biblioteka Avstralii Nacionalnaya biblioteka Shvecii Nacionalnaya biblioteka Norvegii i Nacionalnaya biblioteka Novoj Zelandii V 2013 godu startoval proekt EU web archive zanimayushijsya skanirovaniem i arhivirovaniem veb sajtov Evropejskogo soyuza dlya sohraneniya evropejskogo veb kontenta v dolgosrochnoj perspektive i v otkrytom dostupe V 2000 godu Chehiya iniciirovala proekt angl po veb arhivacii nacionalnyh sajtov Pozzhe analogichnye iniciativy byli realizovany v Horvatii Vengrii Irlandii Belgii i drugih stranah V bolshinstve sluchaev arhivirovanie osushestvlyalos sozdannym Arhivom veb kraulerom Heritrix Takzhe Arhiv Interneta predostavlyaet bo lshuyu chast tehniki kotoraya ispolzuetsya drugimi uchrezhdeniyami dlya sozdaniya prilozhenij po arhivirovaniyu Kollekcii Arhiva chasto ispolzuyut issledovateli iz razlichnyh oblastej nauki Tak dannye analiziruyut na predmet izmenenij lingvisticheskih i socialnyh praktik povedeniya kompanij strategij prodazh Pomimo etogo uchyonye mogut ispolzovat arhivirovannye materialy dlya ustanovleniya prava na otkrytie ili publikaciyu a takzhe chtoby poluchit dostup k zhurnalam otkrytogo dostupa soglasno issledovaniyam 2020 goda s nachala 2000 h iz interneta ischezlo 84 zhurnala OD po estestvennym naukam i eshyo okolo 100 po socialnym i gumanitarnym Pravovye spory i blokirovkiCerkov Saentologii V 2002 godu yuristy Cerkvi Saentologii potrebovali ot Arhiva Interneta udalit iz Wayback Machine arhivnye kopii stranicy portala Xenu net prinadlezhashego kritiku cerkvi Andreasu Heldal Lundu Prichinoj posluzhilo nalichie vyderzhek iz dokumentov Cerkvi na portale Heldala Lundu Odnako v otvet Arhiv udalil ne tolko stranicy sajta s vyderzhkami no i zakryl dostup k vsemu portalu Xenu net Reshenie Arhiva vyzvala masshtabnye publichnye spory ob etike i svobode slova National Emergency Library Iz za pandemii COVID 19 i vynuzhdennoj izolyacii mnogih lyudej v 2020 godu Arhiv zapustil vremennuyu sluzhbu Nacionalnaya biblioteka na sluchaj chrezvychajnyh situacij vylozhiv v otkrytyj dostup kopii 1 4 mln knig dlya teh lyudej kotorye ne mogli popast v biblioteki V otlichie ot tradicionnoj raboty servisa Open Library polzovateli Biblioteki na sluchaj chrezvychajnyh situacij mogli odolzhit teksty bez ocheredi V otvet amerikanskoe obedinenie avtorov angl vypustilo otkrytoe pismo v kotorom obvinilo organizaciyu v fakticheskom vorovstve proekt narushil ryad polozhenij CDL razreshiv bolee chem odnomu polzovatelyu dostup k tekstam V otvet na narusheniya na Arhiv Interneta chetyre kommercheskih izdatelstva Hachette Penguin Random House Wiley podali isk obviniv portal v piratstve Po etoj prichine Arhiv Interneta zavershil svoyu programmu ranshe chem planirovalos 16 iyunya 2020 goda vmesto 30 iyunya Isk byl napravlen na zapret funkcionirovaniya Open Library kak shemy kotoraya ocifrovyvaet i vydayot ohranyaemye avtorskim pravom raboty 25 marta 2023 goda sud priznal vinovnym Arhiv Interneta v narushenii avtorskih prav chetyryoh izdatelej Po mneniyu suda organizaciya dolzhna byla poluchit razreshenie na rasprostranenie literatury u pravoobladatelej knig Arhiv Interneta zayavil o reshenii podat apellyaciyu 4 sentyabrya 2024 goda Apellyacionnyj sud SShA po vtoromu okrugu ostavil v sile reshenie okruzhnogo suda nazvav argument Internet Archive o tom chto oni byli zashisheny doktrinoj dobrosovestnogo ispolzovaniya neubeditelnym Strany SNG V 2014 godu Roskomnadzor vnyos Arhiv Interneta v reestr zapreshyonnyh sajtov za nalichie kopii dokumentalnogo filma Zvon mechej vypushennogo Islamskim gosudarstvom Cherez god Prokuratura Rossijskoj Federacii vynesla reshenie o blokirovke sajta Arhiva Interneta na osnovanii stati 15 3 zakona Ob informacii informacionnyh tehnologiyah i o zashite informacii Prichinoj dlya blokirovki portala posluzhila arhivirovannaya statya Odinochnyj dzhihad v Rossii kotoraya soglasno prokurature soderzhala prizyvy k massovym besporyadkam i osushestvleniyu ekstremistskoj deyatelnosti Posle udaleniya resursom vseh ssylok na zapreshyonnye v Rossii sajty dostup k portalu byl vosstanovlen V 2015 godu portal Arhiv Interneta popal v spisok nezhelatelnyh sajtov zablokirovannyh v Kazahstane 6 iyunya 2017 goda Oktyabrskij sud Bishkeka zablokiroval sajt v Kyrgyzstane iz za materialov ekstremistskogo soderzhaniya V 2019 godu Associaciya po zashite avtorskih prav v internete AZAPI vystupila za blokirovku Arhiva Interneta v Rossii Prichinoj dlya etogo posluzhilo prisutstvie v kollekcii biblioteki kopij audioknig rossijskih pisatelej Dmitriya Gluhovskogo i Dari Doncovoj Isk po delu byl podan 13 marta 2019 goda rassmotrenie Mosgorsudom sostoyalos 13 maya 2019 goda v ekstrennom poryadke Soglasno resheniyu suda Arhivu Interneta zapretili sozdavat tehnicheskie usloviya dlya razmesheniya audioknig 12 maya 2022 goda Roskomnadzor podal isk protiv Arhiva Interneta po state 13 41 KoAP RF Neudalenie informacii priznannoj v RF zapreshyonnoj Prichinoj stalo arhivirovannoe servisom video v kotorom pokazyvalos kak izgotovit koktejl Molotova Sudebnoe zasedanie proshlo 28 iyunya 2022 goda po ego rezultatam Arhiv Interneta oshtrafovali na 800 tysyach rublej V 2022 godu obshestvennyj fond Digital Paradigm sovmestno s yuridicheskoj firmoj Digital Rights Center Qazaqstan provyol uspeshnuyu rabotu po razblokirovke dostupa k sajtu Arhiv Interneta v Kazahstane Ministerstvo informacii i obshestvennogo razvitiya Respubliki Kazahstan vneslo bolee 30 URL ssylok v reestr zapreshyonnyh internet resursov chto privelo k blokirovke vsego sajta poskolku dostup k nemu osushestvlyaetsya cherez HTTPS Zapret byl nalozhen kak samim Ministerstvom tak i sudami Esilskogo rajona goroda Astany i Alatauskogo rajona Blagodarya aktivnym peregovoram s Ministerstvom i administratorami Arhiva Interneta byl dostignut kompromiss i dostup k sajtu byl vosstanovlen dlya vseh polzovatelej v Kazahstane Turciya 9 oktyabrya 2016 goda Arhiv byl vremenno zablokirovan v Turcii posle togo kak on byl ispolzovan hakerami dlya razmesheniya 17 GB pravitelstvennyh elektronnyh pisem Indiya V 2017 godu sajt servisa WayBackMachine byl zablokirovan v Indii po resheniyu suda Madrasa v otvet na isk bollivudskih pravoobladatelej ukazavshih na nalichie na portale neskolkih tysyach ssylok na piratskie kopii filmov Posle blokirovki indijskoe pravitelstvo obvinili v cenzure Sm takzheIstoriya Interneta Arhivirovanie veb sajtov Archive today Open Library WebCitePrimechaniyaInternet Archive Bios angl https projects propublica org nonprofits organizations 943242767 Nonprofit Explorer Research Tax Exempt Organizations https projects propublica org nonprofits organizations 943242767 202233199349312193 full https www youtube com watch v 8YYJPtCXf4I Global Research Identifier Database angl 2015 Wayback Machine neopr Wayback Machine Data obrasheniya 7 iyunya 2021 eBooks and Texts neopr Internet Archive Data obrasheniya 16 maya 2022 Rackley 2010 s 2966 2976 The world s largest internet archive is under siege and fighting back neopr Data obrasheniya 18 oktyabrya 2024 Arhivirovano 4 noyabrya 2024 goda Arhiv interneta vozobnovil rabotu posle ataki no poka v rezhime tolko dlya chteniya neopr Data obrasheniya 18 oktyabrya 2024 Arhivirovano 4 noyabrya 2024 goda Login coming soon Still working on security improvements Archive org neopr Data obrasheniya 13 noyabrya 2024 Arhivirovano 14 dekabrya 2024 goda Joel Khalili The story of the fight to archive the internet angl TechRadar Data obrasheniya 23 dekabrya 2021 Arhivirovano 22 dekabrya 2021 goda Recode Staff Full transcript Internet Archive founder Brewster Kahle on Recode Decode neopr Vox Recode 8 marta 2017 Data obrasheniya 12 iyunya 2021 Arhivirovano 2 iyunya 2021 goda Brewster Kahle neopr Harvard University Data obrasheniya 12 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda Timeline neopr Internet Hall of Fame Data obrasheniya 12 iyunya 2021 Arhivirovano 21 iyunya 2021 goda Quentin Hardy The Big Deal Brewster Kahle neopr Forbes 27 noyabrya 2009 Data obrasheniya 12 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda Kimpton 2006 Brewster Kahle 2008 s 265 280 Kara Swisher Ideas of Web s Librarian Pave a Path to a Fortune neopr The Wall Street Journal 20 maya 1999 Data obrasheniya 12 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda Carolyn Said Archiving the Internet Brewster Kahle makes digital snapshots of Web neopr SF Gate 7 maya 1998 Data obrasheniya 12 iyunya 2021 Arhivirovano 2 aprelya 2019 goda Mitchell Clark New research shows how many important links on the web get lost to time neopr The Verge 21 maya 2021 Data obrasheniya 13 iyunya 2021 Arhivirovano 20 iyunya 2021 goda Cifra dnya Skolko internet ssylok s 1998 goda uzhe mertvy neopr Ferra 22 maya 2021 Data obrasheniya 13 iyunya 2021 Arhivirovano 22 maya 2021 goda Barbara Quint A Gift of the Web for the Library of Congress from Alexa Internet neopr Information Today 19 oktyabrya 1998 Data obrasheniya 13 iyunya 2021 Arhivirovano 31 marta 2019 goda John Alderman Alexa s Gift to the Government neopr Wired 14 oktyabrya 1998 Data obrasheniya 12 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda David BankStaff Microsoft Releases New Browser Announces Deal With RealNetworks neopr The Wall Street Journal 17 marta 1999 Data obrasheniya 13 iyunya 2021 Arhivirovano 19 maya 2021 goda Jon Christian Why does Amazon have two completely different products called Alexa neopr The Outline iyun 2017 Data obrasheniya 13 iyunya 2021 Arhivirovano 1 iyunya 2021 goda Rick Prelinger neopr Creative Commons 1 oktyabrya 2005 Data obrasheniya 13 iyunya 2021 Arhivirovano 24 noyabrya 2020 goda Arora 2015 Bowyer 2021 s 43 57 Aja Romano A lawsuit is threatening the Internet Archive but it s not as dire as you may have heard neopr Vox 23 yanvarya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 18 avgusta 2021 goda The events of September 11th 2001 affected the entire world neopr Internet Archive Data obrasheniya 13 iyunya 2021 Lucas Mearian Online archive chronicles 3 000 hours of 9 11 TV coverage neopr Computer world 10 sentyabrya 2011 Data obrasheniya 13 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda Bibliotheca Alexandrina neopr Internet Archive Data obrasheniya 13 iyunya 2021 Alexandria 2 0 One Millionaire s Quest to Build the Biggest Library on Earth neopr Wired 20 avgusta 2012 Data obrasheniya 13 iyunya 2021 Arhivirovano 7 marta 2021 goda Savickaya 2019 s 67 76 Witten 2007 s 29 59 Steve Cisler Letter from San Francisco The Internet Bookmobile neopr Journal of the Internet Data obrasheniya 13 iyunya 2021 Arhivirovano 25 oktyabrya 2021 goda Mohr 2004 EU web archive neopr Publications Office of the European Union Data obrasheniya 17 iyunya 2021 Arhivirovano 19 iyunya 2021 goda Jaffe 2009 Aaron Souppouris The Internet Archive is now home to 10 petabytes of data neopr The Verge 27 oktyabrya 2012 Data obrasheniya 12 iyunya 2021 Arhivirovano 11 aprelya 2021 goda David Streitfeld The Internet Archive Trying to Encompass All Creation neopr New York Times 31 oktyabrya 2014 Data obrasheniya 13 iyunya 2021 Arhivirovano 10 maya 2021 goda Benny Evangelista Internet Archive repository of modern culture turns 20 neopr San Francisco Chronicle 28 oktyabrya 2016 Data obrasheniya 12 iyunya 2021 Arhivirovano 20 maya 2021 goda Kurtis Alexander Internet Archive s S F office damaged in fire neopr SF gate 6 noyabrya 2013 Data obrasheniya 13 iyunya 2021 Arhivirovano 15 maya 2021 goda David Streitfeld Internet Archive Will Shield Visitors neopr New York Times 24 oktyabrya 2013 Data obrasheniya 13 iyunya 2021 Arhivirovano 26 oktyabrya 2021 goda Krupnejshij v mire arhiv interneta bezhit iz SShA iz za Trampa neopr C News 30 noyabrya 2016 Data obrasheniya 11 iyunya 2021 Arhivirovano 15 aprelya 2021 goda Andrew Liptak The Internet Archive is working to preserve public Google posts before it shuts down neopr The Verge 17 marta 2019 Data obrasheniya 12 iyunya 2021 Arhivirovano 29 avgusta 2021 goda Mark Hill Meet The Activist Archivists Saving The Internet From The Digital Dustbin neopr Discover 13 maya 2021 Data obrasheniya 13 iyunya 2021 Arhivirovano 8 iyunya 2021 goda Wikipedia s broken links fixed by the Internet Archive neopr BBC News 3 oktyabrya 2018 Data obrasheniya 13 iyunya 2021 Arhivirovano 9 iyulya 2021 goda Klint Finley The Internet Archive Is Making Wikipedia More Reliable neopr Wired 11 marta 2019 Data obrasheniya 13 iyunya 2021 Arhivirovano 24 noyabrya 2019 goda Jon Porter The Internet Archive is adding digital previews of book sources to Wikipedia articles neopr The Verge 4 noyabrya 2019 Data obrasheniya 12 iyunya 2021 Arhivirovano 25 fevralya 2021 goda Adam Smith The Internet Archive is linking digital books to Wikipedia citations neopr PC Mag 4 noyabrya 2019 Data obrasheniya 13 iyunya 2021 Arhivirovano 7 marta 2021 goda Jon Porter Brave browser now automatically points to Wayback Machine on 404 neopr The Verge 26 fevralya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 22 iyunya 2021 goda Lily Hay Newman The Wayback Machine and Cloudflare Want to Backstop the Web neopr Wired 17 sentyabrya 2020 Data obrasheniya 13 iyunya 2021 Arhivirovano 18 maya 2021 goda Lila Bailey Fighting Misinformation Online neopr Internet Archive Blogs 30 oktyabrya 2019 Data obrasheniya 13 iyunya 2021 Acker 2020 Elizabeth Dwoskin Misinformation about coronavirus finds new avenues on unexpected sites neopr Washington Post 20 iyunya 2020 Data obrasheniya 13 iyunya 2021 Arhivirovano 16 iyunya 2021 goda Wayback Machine teper proveryaet informaciyu na dostovernost dlya arhivnyh veb stranic neopr Trash Box 2 noyabrya 2020 Data obrasheniya 5 iyunya 2021 Arhivirovano 28 iyunya 2021 goda Adi Robertson The Internet Archive is warning users about debunked zombie coronavirus misinformation neopr The Verge 12 maya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 20 maya 2021 goda J Fingas Internet Archive adds fact checks to explain web page takedowns neopr Engadget 1 noyabrya 2020 Data obrasheniya 13 iyunya 2021 Arhivirovano 23 iyulya 2021 goda Victor Barreiro Internet Archive adds fact checks to pages on Wayback Machine neopr Rappler 2 noyabrya 2020 Data obrasheniya 13 iyunya 2021 Arhivirovano 26 oktyabrya 2021 goda Schwarz 2006 Toyoda 2012 s 1441 1443 Kalev Leetaru The Internet Archive Turns 20 A Behind The Scenes Look At Archiving The Web neopr Forbes 11 iyunya 2021 Data obrasheniya 12 iyunya 2021 Arhivirovano 26 oktyabrya 2021 goda Simon 2006 Archiving the World GDELT Joins the Internet Archive s No More 404 Initiative neopr GDELT Project Data obrasheniya 20 iyunya 2021 Arhivirovano 8 marta 2021 goda Mark Graham No More 404s Resurrect dead web pages with our new Firefox add on neopr Archive org 9 avgusta 2016 Data obrasheniya 20 iyunya 2021 Lerner 2017 s 1741 1755 Michael Bryant What is the Wayback Machine and Why is it Useful neopr Groovy Post 22 aprelya 2021 Data obrasheniya 29 maya 2021 Arhivirovano 18 maya 2021 goda Fernando 2016 s 109 112 Chris Welch The Internet Archive will launch a modernized Wayback Machine in 2017 neopr The Verge 22 oktyabrya 2015 Data obrasheniya 12 iyunya 2021 Arhivirovano 11 aprelya 2021 goda Rogers 2017 s 160 172 Laura Bohannon Wayback Machine archives websites for over 20 years neopr Spartan News Room 7 dekabrya 2017 Data obrasheniya 5 iyunya 2021 Arhivirovano 24 iyunya 2021 goda O Connor 2008 s 64 Maemura 2018 Notess 2002 Anton Blagoveshenskij Vperyod v proshloe neopr Rossijskaya gazeta 7 marta 2012 Data obrasheniya 12 iyunya 2021 Arhivirovano 26 oktyabrya 2021 goda Mark Graham Tips for Using the Internet Archive s Wayback Machine in Your Next Investigation neopr Global Investigative Journalism Network 5 maya 2021 Data obrasheniya 29 maya 2021 Arhivirovano 29 maya 2021 goda AlNoamany 2014 Jones 2018 Graham 2019 s 103 110 Human Rights Web Archive Archived Index neopr Columbia University Libraries Data obrasheniya 16 maya 2022 Arhivirovano 11 maya 2021 goda Jennifer Schuessler Occupy Wall Street From the Streets to the Archives neopr New York Times 2 maya 2012 Data obrasheniya 13 iyunya 2021 Arhivirovano 28 oktyabrya 2021 goda Occupy Movement 2011 2012 neopr Archive it noyabr 2011 Data obrasheniya 15 iyunya 2021 Arhivirovano 3 iyunya 2021 goda Lischer Katz 2013 Search Internet Archive neopr Internet Archive Data obrasheniya 17 maya 2022 Katie Hafner In Challenge to Google Yahoo Will Scan Books neopr The New York Times 3 oktyabrya 2005 Data obrasheniya 16 iyunya 2021 Arhivirovano 1 sentyabrya 2021 goda Microsoft to Offer Online Book Content Searches neopr The New York Times 26 oktyabrya 2005 Data obrasheniya 16 iyunya 2021 Arhivirovano 1 sentyabrya 2021 goda Books Scanning to be Publicly Funded neopr Internet Archive Data obrasheniya 15 iyunya 2021 Nate Anderson Why killing Live Book Search is good for the future of books neopr Ars Technica 26 maya 2008 Data obrasheniya 15 iyunya 2021 Arhivirovano 1 sentyabrya 2021 goda Miguel Helft Microsoft Will Shut Down Book Search Program neopr The New York Times 24 maya 2008 Data obrasheniya 15 iyunya 2021 Arhivirovano 12 dekabrya 2020 goda Michael Bryant What is the Internet Archive and What Can I Find on It neopr G Post 22 aprelya 2021 Data obrasheniya 15 iyunya 2021 Arhivirovano 16 iyunya 2021 goda Brewster Kahle Transforming Our Libraries from Analog to Digital A 2020 Vision neopr Educause review 13 marta 2017 Data obrasheniya 15 iyunya 2021 Arhivirovano 2 avgusta 2021 goda Russell Brandom Publishers sue Internet Archive over Open Library ebook lending neopr The Verge 1 iyunya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 1 iyunya 2020 goda Search neopr Internet Archive Data obrasheniya 16 iyunya 2021 Search Internet Archive neopr Internet Archive Data obrasheniya 17 maya 2022 Search Internet Archive neopr Internet Archive Data obrasheniya 17 maya 2022 Search Internet Archive neopr Internet Archive Data obrasheniya 17 maya 2022 Will Pritchard How The Great 78 Project is saving half a million songs from obscurity neopr The Vinyl Factory 18 avgusta 2017 Data obrasheniya 16 iyunya 2021 Arhivirovano 7 noyabrya 2017 goda Kait Sanchez Here s how the Internet Archive digitizes 78rpm records neopr The Verge 26 aprelya 2021 Data obrasheniya 12 iyunya 2021 Arhivirovano 25 maya 2021 goda Dani Deahl Over 50 000 digitized pieces of vinyl can now be listened to on Internet Archive neopr The Verge 12 avgusta 2017 Data obrasheniya 12 iyunya 2021 Arhivirovano 12 iyulya 2021 goda Jake Coyle On the Net Concerts on the Web neopr Taiwan News Data obrasheniya 16 iyunya 2021 Arhivirovano 28 oktyabrya 2021 goda Verge Staff The Verge s favorite music streaming services neopr The Verge 13 aprelya 2021 Data obrasheniya 16 iyunya 2021 Arhivirovano 20 aprelya 2021 goda Images neopr Internet Archive Data obrasheniya 16 iyunya 2021 Bob Jacobs Paul Hickman NASA and Internet Archive Team to Digitize Space Imagery neopr NASA Data obrasheniya 16 iyunya 2021 Arhivirovano 28 avgusta 2021 goda Leo Kelion Millions of historical images posted to Flickr neopr BBC News 29 avgusta 2014 Data obrasheniya 16 iyunya 2021 Arhivirovano 5 avgusta 2021 goda Vasilij Parfenov V Arhive interneta poyavilos 2500 prichin ustanovit DOS neopr Populyarnaya Mehanika 17 oktyabrya 2019 Data obrasheniya 12 iyunya 2021 Arhivirovano 28 oktyabrya 2021 goda Aleksandr Abramov Arhiv Interneta sohranit proekty na baze Flash neopr SpB IT 23 noyabrya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 28 yanvarya 2021 goda Ian Carlos Campbell The Internet Archive is now preserving Flash games and animations neopr The Verge 19 noyabrya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 20 noyabrya 2020 goda Opublikovan arhiv iz 1500 zapuskaemyh v brauzere programm dlya Windows 3 x neopr N 1 15 fevralya 2016 Data obrasheniya 12 iyunya 2021 Arhivirovano 28 oktyabrya 2021 goda Ojala 2021 Constance Grady Why authors are so angry about the Internet Archive s Emergency Library neopr Vox 2 aprelya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 4 aprelya 2020 goda Bercic 2005 s 17 24 Holub 2014 Webarchiv 20 Years of Web Archiving in the Czech Republic neopr International Internet Preservation Consortium 8 dekabrya 2020 Data obrasheniya 17 iyunya 2021 Arhivirovano 4 iyulya 2021 goda From pilot to portal a year of web archiving in Hungar neopr International Internet Preservation Consortium 26 iyunya 2020 Data obrasheniya 17 iyunya 2021 Arhivirovano 4 iyulya 2021 goda National Library of Ireland Collections 2011 2018 neopr Archive It Data obrasheniya 17 iyunya 2021 Arhivirovano 2 iyulya 2021 goda Brugger 2019 Harrison 2005 Milligan 2016 Pearce 2009 s 875 Jeffrey Brainard Dozens of scientific journals have vanished from the internet and no one preserved them neopr Science 8 sentyabrya 2020 Data obrasheniya 1 iyunya 2021 Arhivirovano 15 oktyabrya 2020 goda Diana Kwon More than 100 scientific journals have disappeared from the Internet neopr Nature 10 sentyabrya 2020 Data obrasheniya 1 iyunya 2021 Arhivirovano 3 oktyabrya 2020 goda avouner Desyatki nauchnyh zhurnalov ischezli iz interneta za poslednie 20 let i nikto ih ne sohranil neopr Habr 10 sentyabrya 2020 Data obrasheniya 5 iyunya 2021 Arhivirovano 29 oktyabrya 2021 goda Lisa M Bowman Net archive silences Scientology critic neopr CNet 24 sentyabrya 2002 Data obrasheniya 10 iyunya 2021 Arhivirovano 15 maya 2012 goda Ernest Miller Features Sherman Set the Wayback Machine for Scientology neopr LawMeme 24 sentyabrya 2002 Data obrasheniya 10 iyunya 2021 Arhivirovano 16 noyabrya 2012 goda Dmitrij Kinskij Arhiv Interneta vylozhil v otkrytyj dostup bolshe milliona redkih knig neopr Mir Fantastiki 3 aprelya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 4 noyabrya 2021 goda Amerikanskie izdateli knig podali v sud na Internet Archive neopr Vedomosti 2 iyunya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 30 iyunya 2021 goda Zapadnye knizhnye izdatelstva szhivayut so sveta mashinu vremeni interneta neopr CNews 2 iyunya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 1 sentyabrya 2021 goda Kim Lyons The Internet Archive has ended its emergency library early neopr The Verge 14 iyunya 2020 Data obrasheniya 12 iyunya 2021 Arhivirovano 9 iyulya 2021 goda Elizabeth A Harris Publishers Sue Internet Archive Over Free E Books neopr New York Times 1 iyunya 2020 Data obrasheniya 13 iyunya 2021 Andrew Albanese Judge Sets Tentative Schedule for Internet Archive Copyright Case neopr Publishers Weekly 1 sentyabrya 2020 Data obrasheniya 18 iyunya 2021 Arhivirovano 8 sentyabrya 2020 goda Anna Lovine Internet Archive loses first ruling in copyright lawsuit neopr Mashable 25 marta 2023 Data obrasheniya 4 aprelya 2023 Arhivirovano 6 aprelya 2023 goda Paul Hill Court rules against Internet Archive in favour of book publishers on digital lending neopr NeoWin 25 marta 2023 Data obrasheniya 4 aprelya 2023 Arhivirovano 2 aprelya 2023 goda Jay Peters and Sean Hollister The Internet Archive has lost its first fight to scan and lend e books like a library neopr The Verge 23 maya 2023 Data obrasheniya 7 aprelya 2023 Arhivirovano 25 marta 2023 goda Internet Archive Loses Lawsuit Over E Book Copyright Infringement Here s What to Know neopr Time 31 marta 2023 Data obrasheniya 7 aprelya 2023 Arhivirovano 7 aprelya 2023 goda Kate Knibbs The Internet Archive Loses Its Appeal of a Major Copyright Case angl Wired ISSN 1059 1028 Arhivirovano 18 sentyabrya 2024 goda Roskomnadzor vnyos arhiv interneta v reestr zapreshyonnyh sajtov neopr Meduza 25 oktyabrya 2014 Data obrasheniya 18 iyunya 2021 Arhivirovano 15 iyunya 2021 goda Georgij Peremitin Roskomnadzor zablokiroval arhiv interneta neopr RBK 25 iyunya 2015 Data obrasheniya 12 iyunya 2021 Arhivirovano 21 avgusta 2021 goda Arhiv interneta vnesli v spisok zapreshyonnyh sajtov neopr Moskva 24 1 sentyabrya 2015 Data obrasheniya 12 iyunya 2021 Arhivirovano 27 noyabrya 2021 goda Dmitrij Shestoperov Anastasiya Evtushenko Arhiv interneta snova v seti neopr Gazeta ru 18 aprelya 2016 Data obrasheniya 13 iyunya 2021 Arhivirovano 3 maya 2021 goda Experts explain reason for websites blocking in Kazakhstan neopr Kaz Pravda 21 oktyabrya 2015 Data obrasheniya 18 iyunya 2021 Arhivirovano 3 oktyabrya 2021 goda Nataliya Kozina Vlasti Kyrgyzstana zablokirovali Arhiv interneta iz za ekstremistskih materialov neopr Kloop 18 iyulya 2017 Data obrasheniya 12 iyunya 2021 Arhivirovano 28 iyunya 2021 goda Arhiv interneta mogut navechno zablokirovat v Rossii neopr C News 23 avgusta 2019 Data obrasheniya 12 iyunya 2021 Arhivirovano 24 iyunya 2021 goda V Rossii zaveli delo protiv arhiva vsego interneta neopr RBK 12 maya 2022 Data obrasheniya 13 maya 2022 Arhivirovano 12 maya 2022 goda Internet Archive grozit 4 mln rublej shtrafa iz za neudaleniya zapreshyonnogo kontenta neopr Interfaks 12 maya 2022 Data obrasheniya 17 maya 2022 Arhivirovano 16 maya 2022 goda Valerij Romanov Rossijskij sud oshtrafoval Arhiv interneta za koktejl Molotova neopr gazeta ru 29 iyunya 2022 Data obrasheniya 1 iyulya 2022 Arhivirovano 1 iyulya 2022 goda Arhiv interneta razblokirovan v Kazahstane rus Internet Freedom Data obrasheniya 9 avgusta 2024 Turkey restores access to Google Drive after blocking cloud storage services neopr Daily News 10 oktyabrya 2016 Data obrasheniya 18 iyunya 2021 Arhivirovano 14 aprelya 2021 goda V Indii zablokirovali arhiv interneta neopr Nag 16 avgusta 2017 Data obrasheniya 12 iyunya 2021 Arhivirovano 29 oktyabrya 2021 goda Colm Gorey India accused of censorship as Internet Archive is blocked unexpectedly neopr Silicon Republic 9 avgusta 2017 Data obrasheniya 18 iyunya 2021 Arhivirovano 2 marta 2021 goda Leo Kelion Bollywood blocks the Internet Archive neopr BBC Data obrasheniya 18 iyunya 2021 Arhivirovano 6 avgusta 2018 goda LiteraturaAcker A amp Chaiet M The weaponization of web archives Data craft and COVID 19 publics Harvard Kennedy School HKS Misinformation Review 2020 doi 10 37016 mr 2020 41 Arora S Li Y Youtie J Shapira P Using the wayback machine to mine websites in the social sciences A methodological resource 2015 T 67 vyp 8 S 1904 1915 doi 10 1002 asi 23503 AlNoamany Y AlSum A Weigle M Nelson M Who and what links to the Internet Archive Int J Digit Libr 2014 Vyp 14 S 101 115 doi 10 1007 s00799 014 0111 5 Bercic B Protection of Personal Data and Copyrighted Material on the Web The Cases of Google and Internet Archive Communications Technology Law 2005 T 14 vyp 1 S 17 24 doi 10 1080 1360083042000325283 Bowyer S The Wayback Machine notes on a re enchantment Archival Science 2021 T 21 S 43 57 Fernando Z Marenzi I Nejdl W Kalyani R ArchiveWeb Collaboratively Extending and Exploring Web Archive Collections Research and Advanced Technology for Digital Libraries 2016 S 107 121 Harrison T The Internet Archive and Content Analysis Qualitative Social Research on ICT 2005 Graham P Guest Editorial Reflections on the Ethics of Web Archiving Journal of Archival Organization 2019 S 103 110 doi 10 1080 15332748 2018 1517589 Jaffe E Kirkpatrick S Architecture of The Internet Archive Proceedings of of SYSTOR 2009 The Israeli Experimental Systems Conference 2009 Haifa Israel May 4 6 2009 2009 doi 10 1145 1534530 1534545 Kahle B Brewster Kahle Founder WAIS Internet Archive Alexa Internet Founders at Work Stories of Startups Early Days 2008 S 265 280 Karolina Holub Croatian Web Archive An Overview Pregled NCD 2014 Vyp 25 S 11 16 Kimpton M Ubois J Year by Year From an Archive of the Internet to an Archive on the Internet Web Archiving 2006 S 201 212 Lischer Katz Z Conceptualizing emergent archival forms A case study of the occupy wall street archive Association for Information Science amp Technology 2013 doi 10 1002 meet 14504901275 Lerner A Kohno T Roesner F Rewriting History Changing the Archived Web from the Present Association for Computing Machinery 2017 doi 10 1145 3133956 3134042 Maemura E Worby N Milligan I Becker C If These Crawls Could Talk Studying and Documenting Web Archives Provenance Journal of the association for information science and technology 2018 T 69 vyp 10 S 1223 1233 Milligan I Lost in the Infinite Archive The Promise and Pitfalls of Web Archives International Journal of Humanities and Arts Computing 2016 Mohr G Stack M Ranitovic I Avery D Kimpton M An Introduction to Heritrix 4th International Web Archiving Workshop 2004 2004 Murphy J Hashim N O Connor P Take Me Back Validating the Wayback Machine Journal of Computer Mediated Communication 2008 Vyp 13 S 60 75 Niels Brugger Ditte Laursen The Historical Web and Digital Humanities The Case of National Web Domain Routledge 2019 206 s ISBN 9780367671181 Notess G The Wayback Machine The Web s Archive Online 2002 T 26 vyp 2 Ojala M Controlled Digital Lending Legal Lending or Piracy Information Today 2021 T 45 vyp 1 Pearce D Charlton B Plagiarism of online material may be proven using the Internet Archive Wayback Machine archive org Medical Hypothesis 2009 S 875 Rackley M Internet Archive Encyclopedia of Library and Information Sciences 2010 T 1 vyp 1 S 2966 2976 Rogers R Doing Web history with the Internet Archive screencast documentaries Internet Histories 2017 T 1 vyp 1 2 S 160 172 doi 10 1080 24701475 2017 1307542 Simon J Center for Research Libraries Middle Eastern Political Parties Web Harvesting and other efforts International Collections Development Workshop 2006 Shawn M Jones Michele C Weigle Alexander Nwala Michael L Nelson The Many Shapes of Archive It Characteristics of Archive It Collections ArXiv org 2018 Schwarz T Baker M Bassi S Baumgart B Flagg W Ingen C Joste K Manasse M Shah M Disk Failure Investigations at the Internet Archive NASA IEEE Conference on Mass Storage Systems and Technologies 2006 Toyoda M Kitsuregawa M The History of Web Archiving Proceedings of the IEEE 2012 T 100 S 1441 1443 Witten I Gori M Numerico T Literature and the web Web Dragons 2007 S 29 59 Savickaya T E Proekt Million knig rus Bibliotekovedenie 2019 T 68 vyp 1 S 67 76 SsylkiOficialnyj sajt EU Web Archive Arhivnaya kopiya ot 19 iyunya 2021 na Wayback Machine


















