Часть Интернета полностью исчезла. Фото: Yale Alumni Magazine . |
Мы живём в современную цифровую эпоху с неограниченным хранилищем данных. Сегодня большинство поколений публикуют фотографии и видео в интернете, чтобы безопасно хранить воспоминания. Однако, как ни парадоксально, информация сейчас теряется легче, чем когда-либо.
По данным IDC, к 2025 году мир будет генерировать более 180 зеттабайт данных в год, но значительная их часть будет носить временный характер и не будет управляться должным образом. Сегодня у каждого человека в 4000 раз больше контента, чем 15 лет назад, не говоря уже о почтовом ящике с тысячами писем.
Специалисты по цифровым архивам опасаются наступления «цифровой тьмы», когда данные за определённый период времени настолько скудны или не поддаются обнаружению, что полностью исчезают. Более того, с развитием искусственного интеллекта оригинальный контент, созданный человеком, становится особенно редким.
Переполнение цифровой памяти
Почти 90–95% всех данных в мире было создано в последние годы. Digital Silk прогнозирует, что с появлением множества социальных сетей к 2028 году объём контента более чем удвоится по сравнению с сегодняшним днём и достигнет 394 зеттабайт.
Каждый человек производит и потребляет невероятное количество данных. По данным Digital Silk, пользователи Instagram ежедневно публикуют на платформе 95 миллионов фотографий и видео. Каждый час, проведённый в TikTok, потребляет 840 МБ данных. Прослушивание музыки и просмотр видео на Spotify и YouTube также потребляют огромное количество цифровых ресурсов.
Архивирование данных — бесконечная задача, и она становится всё сложнее. Современное общество производит так много информации, что мы сами каждый год удаляем всё больше и больше, чтобы поддерживать этот цикл. Архивистам также приходится выбирать, что сохранить, а что выбросить, чтобы освободить место.
Информация о знаменитостях — одна из самых сложных для архивирования. В Британской библиотеке, когда к нам поступает ноутбук или телефон влиятельного человека, Каллум Маккин, главный цифровой архивист библиотеки, копирует весь жёсткий диск, создавая мастер-копию.
![]() |
Архивисты не справляются с объёмом данных. Фото: The Atlantic. |
Затем архивисты создают проверенную версию, дезинфицируя конфиденциальную информацию, подобно тому, как они обрабатывают бумажные документы. Существуют программы, которые, как утверждается, помогают в этом, но они не идеальны. В некоторых случаях им приходится просматривать каждый файл вручную.
Миллионы сообщений и изображений отправляются каждый час через бесчисленные приложения для обмена сообщениями. Журнал MIT Technology утверждает, что информация сейчас более хрупкая, чем когда-либо, а такие платформы, как YouTube и Facebook, могут однажды полностью исчезнуть.
Такое уже случалось. MySpace, первая крупная социальная сеть, по-видимому, по ошибке удалила все фотографии, видео и аудиофайлы, загруженные до 2016 года. В июне 2024 года более 20 лет музыкальной журналистики исчезли, когда архив новостей MTV был удалён из интернета.
Содержание ИИ неразличимо
В других местах, несмотря на обилие контента в последнее время, не весь контент гарантированно аутентичен. Эксперты Cloudflare, компании, управляющей одной из крупнейших интернет-сетей в мире, выразили обеспокоенность тем, что генеративный ИИ «загрязнил» исходные человеческие данные.
Искусственный интеллект обучен учиться у людей. Но поскольку большая часть онлайн-контента генерируется ИИ, он с большей вероятностью будет копировать сам себя, что снизит качество.
Ученые сравнивают это явление с катастрофическим загрязнением стали после Второй мировой войны, когда вся сталь на земле была поражена радиацией, что сделало невозможным гарантировать точность данных. Документы, созданные до 2022 года, когда будет запущен искусственный интеллект, становятся все более редкими и подвергаются высокому риску исчезновения, если их не сохранить вовремя.
Многие форумы, которые когда-то служили площадками для обмена информацией и цифрового культурного досуга молодёжи, такие как Yahoo 360, исчезли из интернета. Между тем, современные платформы, такие как Facebook, TikTok и даже Reddit, которые когда-то были площадками для обмена информацией, теперь находятся под влиянием алгоритмов и контента, создаваемого искусственным интеллектом.
![]() |
Wayback Machine — один из проектов, архивирующих скриншоты исчезнувших веб-сайтов. Фото: Internet Archive. |
Сегодня оригинальный контент, созданный человеком, быстро удаляется из-за политик конфиденциальности или правил краткосрочного хранения. Многие мессенджеры, такие как Instagram, WhatsApp и Snapchat, позволяют пользователям настроить удаление сообщений по истечении определённого времени. Кроме того, многие функции, такие как истории и режим «исчезновения», созданы специально для поощрения краткосрочного контента.
Оригинальный контент важен, поскольку он служит основой для большинства последующих открытий. По данным Business Insider, сохранение этих данных позволяет нам строить надёжное будущее.
Каждый день создаётся всё больше неотфильтрованной информации, заменяющей старый контент. Издание The Atlantic отмечает, что историки могут потерять доступ к крайне разоблачающим личным документам, что может привести к «цифровому тёмному веку».
Источник: https://znews.vn/ky-nguyen-den-toi-ky-thuat-so-dang-den-post1560393.html
Комментарий (0)