AnatTs (sted_ats_02) wrote,
AnatTs
sted_ats_02

День беспамятства

Как сообщают СМИ 1 сентября 2015 года Роскомнадзор заблокировал крупнейший архив интернета сайт archive.org.


Internet Archive — американская некоммерческая организация, поддерживающая,  самый крупный в мире цифровой архив. Архив состоит из двух частей: открытого архива веба (знаменитая Wayback Machine, которая хранит и показывает веб-страницы в том виде, в каком они были 5–10–15 лет назад) и библиотеки цифровых копий книг, фильмов, музыки, новостных телепрограмм, радиопередач, программ и т.д., находящихся в общественном достоянии.


Этот сайт имеет  примерно 45 млн посетителей в месяц и он занимает 239-е место в рейтинге самых популярных сайтов, где-то между skype.com и wikimedia.org. Запросы из России занимают (занимали!) почетное третье место общего трафика сайта archive.org (5,7%, после запросов из США и Индии). То есть примерно 2,5 млн россиян каждый месяц пользовались archive.org.


Собственно, с архива копий веб-страниц архив интернета когда-то и начался. Брюстер Кале, специалист по компьютерным наукам и довольно удачливый интернет-предприниматель, создал сайт Wayback Machine в 1996 году, когда понял, что веб нуждается в точно таком же сохранении, как и, например, журналы и газеты, которые хранят в библиотеках. Сайты исчезают, домены меняют владельцев. Особенно недолговечна жизнь новостных страниц. Если верить специалистам из Университета в Норфолке, за год исчезает 11% всех новостных материалов в интернете, около 20% архивируется и тоже исчезает из открытого доступа. Через 30 месяцев умирает около 30% новостных страниц и 40% архивируется. Можно ли как-то сохранить и сделать доступным то, что было опубликовано, но исчезло? Ведь время от времени так хочется посмотреть, как выглядел тот или иной сайт в разное время?


Этим и занялся архив интернета. Какие-то сайты архив записывает чаще, какие-то реже. Сейчас на archive.org можно найти 434 млрд сохраненных веб-страниц с более чем 200 млн сайтов. Под влиянием и при непосредственном участии американского архива интернета аналогичные крупные сервисы и библиотеки, как правило, при государственной или академической поддержке, организуются по всему миру, а технология архивирования, разработанная в Сан-Франциско, где базируется архив интернета, Archive-It используется тысячами организаций и сотнями тысяч сайтов по всему миру, в том числе Международным консорциумом по сохранению интернета.



Постепенно к веб-страницам архив начал добавлять другие виды материалов. Сегодня коллекция оцифрованных старых фильмов, которые хранит и дает возможность посмотреть архив, — одна из самых больших в мире. Фильмы архив хранит не как YouTube, а с толком — классифицируя, комментируя, снабжая метаданными, создавая полезные подборки. Хотите посмотреть хроникальные и пропагандистские фильмы времен холодной войны? Пожалуйста! Тем более что по американскому закону произведения, созданные за счет налогоплательщиков, автоматически становятся общественным достоянием. Собираетесь разобраться в том, как события 11 сентября 2001 года отражали разные мировые медиа? Вот вам синхронизированные по времени теленовости той страшной недели.


Собирает архив интернета и программы. Они тоже нуждаются в сохранении, причем в программном окружении, которое позволяет их воспроизвести. В архиве работают живые люди, поэтому среди сотни тысяч программ на archive.org можно не только найти отличную подборку игр под MS-DOS, но и сыграть в «Принца Персии», «Дюну 2», «Замок Вольфенштайн» и еще в несколько тысяч компьютерных игр.


Архив интернета — проект уникальный: 20 тысяч терабайт цифрового контента, самые передовые технологии хранения и представления цифровой информации; золотое дно для ученых — исследователей интернета и журналистов, работающих в сфере расследований. И, конечно, полезное место для культурного отдыха. И все это бесплатно для пользователей. И никакой рекламы.


Пока я пишу этот текст, archive.org в России недоступен, если только не пользоваться какими-нибудь инструментами по обходу блокировок. Потому что Генпрокуратуре не понравилось какое-то исламистское видео в запасниках архива, а Роскомнадзор внес в реестр для блокировки IP-адрес всего архива. К тому же с 1 января 2016 года появится более подходящий повод для блокировки, когда вступит в силу очередной дурацкий российский закон — на этот раз о «праве на забвение». Вот тогда архива интернета нам и не видать. Ведь он про «помнить все», а не «забыть любой ценой», как это сейчас принято в России.


Владимир ХАРИТОНОВ,
исполнительный директор
Ассоциации интернет-издателей
Tags: Интернет, перепост
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments