Большие Данные в России: императивы ситуации

В течение последнего года практически ежемесячно, а то и чаще в стране проводятся различного рода конференции по Большим Данным. О чем же идет речь на подобных конференциях?

Так на только что закончившемся Global Entrepreneurship Congress 2014 "Большие возможности Больших Данных", как сообщают электронные СМИ "участники дискуссии привели многочисленные примеры использования технологий Big Data и связанной с этим серьезной экономии средств компаний. Среди таких примеров – система анализа поведения оборудования самолетов, предсказание сбоев и поломок и упредительная замена изношенных частей в аэропорту, в который направляется конкретное воздушное судно; анализ открытых спутниковых данных для оптимального планирования парковок; управление показами рекламных баннеров на сайте в зависимости от того, какую именно покупку совершает пользователь с помощью своей кредитной карты; сервис, информирующий автовладельцев о планах городских властей произвести ремонт или уборку улицы в том месте, где они оставили припаркованный автомобиль; прогнозирование спроса на отдельные наименования товаров и управление складами онлайн-магазинов; использование беспилотных аппаратов для сбора информации о состоянии линий электропередач в отдаленных районах, которое приводит к исключению ненужных дальних поездок сервисных бригад; наконец, использование сенсоров на лопастях ветряных мельниц, данные с которых помогают спрогнозировать, откуда именно поступит электроэнергия в следующую минуту (поскольку цены на электроэнергию на глобальном рынке меняются ежеминутно, экономия измеряется миллионами долларов".

Конечно обсуждение "ветряных мельниц" и рекламных баннеров на сайтах впечатляет, но куда важнее следующие обстоятельства:

во-первых, на всех подобных конференциях речь идет о Больших Данных в их вчерашнем, а то и позавчерашнем понимании. Большие Данные, как правило, связываются исключительно с бизнес-аналитикой и с возрастанием объемов, многообразия и скорости передачи данных. Так понимали Большие Данные в США, Европе, Японии три- пять лет назад, когда собственно и появился этот термин;

во-вторых, речь на конференциях идет, как правило, о будущем времени. По мнению большинства участников, например, одного из руководителей компании Форс – Центра внедрения Oracle О. Горчинской "Практически нет проблем с наличием и доступностью технологий Больших Данных, готовностью поставщиков и интеграторов к их внедрению. Но в большинстве своем российские организации пока еще только присматриваются к таким решениям";

в-третьих, ключевыми докладчиками, а то и организаторами таких конференций выступают, прежде всего, зарубежные компании, в первую очередь IBM, Oracle, SAP и т.п. Безусловно, взаимовыгодное, многостороннее сотрудничество с транснациональными гигантами IT-индустрии весьма полезно и выгодно как для российской экономики, так и для российских разработчиков. Углубление такого сотрудничества соответствует интересам бизнеса, способствует оптимальному углублению разделения труда в IT-сфере в глобальном масштабе.

Однако, в нынешней непростой геополитической обстановке нельзя закрывать глаза на одно неочевидное обстоятельство. Сегодня все зарубежные СМИ полны аналитическими статьями об использовании Россией энергетических ресурсов в качестве своеобразного геополитического оружия и средства достижения национальных целей. В этой связи вполне закономерно и логично предположить, что США, являющиеся бесспорными лидерами в сфере информационных технологий также рассматривают их как своего рода технологическое оружие и средство научно-технического, экономического и геополитического давления.

Зарубежные специалисты полагают, что рынок в сфере Больших Данных в России достаточно ограничен с точки зрения готовности российских потребителей к использованию кластера этих технологий. Однако представляется, что подобная ограниченность не является единственной причиной повестки дня конференций. Другая, непроговариваемая причина состоит в том, что, по сути, зарубежные производители программных продуктов, связанных с Большими Данными, навязывают российскому рынку своего рода "консервирующую динамику". Эта динамика закрепляет отставание российской экономики вообще, и IT-отрасли в частности от зарубежных конкурентов и поддерживает господство зарубежных производителей на этом стратегическом сегменте IT-рынка.

Любой профессионал в сфере Больших Данных на вопрос, какие темы сегодня обсуждаются на конференциях по Большим Данным за рубежом, ответит, что там речь идет, в первую очередь, о так называемой "предсказательной" аналитике, поведенческом маркетинге на основе Больших Данных, экспертных системах, базирующихся на когнитивных вычислениях Больших Данных и т.п. Ни о чем подобном в практическом плане на российских конференциях, организованных транснациональными IT-компаниями, речь не ведется.

Как же быть в сложившейся ситуации?

Представляется, что начинать сегодня наверстывать упущенное и повторять уже пройденный путь вряд ли целесообразно. В подобном случае российский IT-сегмент Больших Данных, обслуживающий, в том числе, не только интересы бизнеса, но и государственного управления, включая вопросы национальной безопасности, окажется вечно отстающем. Видимо, есть смысл сразу задуматься о реализации решений завтрашнего дня. Тем более, предпосылки в виде отечественной математической и программистской школ, кадрового потенциала, финансовых ресурсов и т.п. в нашей стране имеется.

Что же будет выступать завтрашним днем Больших Данных? Чтобы ответить на этот вопрос, необходимо внимательно присмотреться к наиболее динамично развивающимся направлениям сегодняшнего дня. Среди них выделяются:

третья производственная революция с массовой роботизацией, автоматизацией производства, внедрением 3D печати, базирующаяся на информационных технологиях и Больших Данных, как на несущей конструкции;

повсеместное распространение "интернета вещей" и ускоренный переход от "интернета вещей" к "интернету всего". "Интернет всего" предполагает, что к всемирной сети будут подключены практически все устройства, предметы и инфраструктуры во всех сферах жизнедеятельности социума и отдельного человека;

широкое распространение автоматизированных систем поддержки и принятия решений на основе Больших Данных. Наиболее значительным прорывом в этой сфере на сегодняшний день стали системы высокочастотного, полностью роботизированного трейдинга. Ежедневно эти системы при минимальном участии человека или без оного, осуществляют торговые сделки, измеряемые сотнями миллиардов долларов. Ширится мнение, что на высокочастотном трейдинге отрабатываются человеко-машинные и автоматизированные системы принятия решений для сложных и сверхсложных систем.

Все три магистральных направления развития информационных технологий ведут к появлению в ближайшем будущем распределенных самообучающихся систем когнитивных вычислений. Поясним, о чем идет речь на самом простом примере. Всем хорошо известно, что Google активнейшим образом развивает программу полностью автоматизированных автомобилей, способных к нормальной эксплуатации в напряженной городской среде. В рамках этой программы реализуется следующий важнейший принцип. Каждый автомобиль снабжен как автономным бортовым компьютером со встроенной программой машинного обучения, так и подключением к общей базе сверхбольших Данных для всех эксплуатируемых автомобилей. Т.е. на каждой дорожной ситуации, на каждом ЧП, в которое попадает машина, программа учится, находит имеющиеся в ней ошибки, устраняет их с тем, чтобы в последующем не попадать в подобные ситуации. В этом смысле машина, пускай грубо, но имитирует принцип жизнедеятельности человека, который, как известно, учится на собственных ошибках. Одновременно программа сообщает о найденной ошибке, ее решении в общую распределенную базу сверхбольших Данных, к которой подключены все автомобили. Тем самым, каждая машина учится не только на собственных ошибках, но и на ошибках, которые совершаются другими автомобилями. Более того, найденное программой одного автомобиля удачное программное решение становится достоянием всех. Фактически мы имеем дело со своего рода стаей, соединенной тесными связями взаимного обучения. Применительно к производственным роботам подобная программа сейчас реализуется в Германии. К роботам, занимающимся уборкой домов – в Японии.

О чем это все говорит? Мы видим, что повсеместно Большие Данные используются для коллективного обучения и выработки все более эффективных решений. Фактически это, по сути, является имитацией памяти и логического мышления. Ведь память тоже аккумулирует знания о прошлом, о том, что удалось и не удалось, закрепляет удачные образцы, которые в дальнейшем и используются в поведении и, как открыл П. Анохин, в опережающем реагировании на изменения внешней среды.

Сначала человек использовал только возможности своего физического тела и соответственно своей психо-физиологической памяти. Всем хорошо известно, что помнит человек практически все, но вот использовать все, что находится в памяти, не многим причинам.

В дальнейшем с появлением развитых языков и письменности человек, по сути, выстроил вторую, коллективную память, где фиксировались индивидуальные и групповые успехи и неудачи, к которым мог иметь доступ любой участник социума. В этом смысле тексты, фильмы, аудиозаписи и т.п. представляют собой память "второго рода".

Несложно заметить, что Большие Данные есть не что иное, как память "третьего рода", ориентированная на эксплуатацию человеко-машинными системами. Эта память имеет распределенный характер, в ней ничего не забывается, к ней постоянно открыт доступ, она используется в режиме 24/7 и построена так, чтобы быть удобной для применения мощнейших средств интеллектуального, прежде всего, математического анализа. Наконец, мощность этой памяти и возможность обработки хранящейся в ней информации при помощи самых различных методов значительно превышает мощность любого индивидуального интеллекта.

В этом смысле создание действующих систем хранения, обработки и восприятия Больших Данных, как памяти "третьего рода" является прорывом, сравнимым с появлением самих по себе компьютеров, а также других эпохальных технических решений. При этом, в данном случае речь идет не только о чисто техническом, но о социотехническом решении, которое затрагивает все стороны практической жизни людей. Также понятно, что создание и эксплуатация памяти "третьего рода" становится одним из решающих преимуществ, обеспечивающих ее обладателям доминирование в любых сферах жизнедеятельности.

В этой связи с особой остротой встает тема, которую в течение последнего года активнейшим образом разрабатывает один из самых известных людей в российской IT-индустрии Игорь Ашманов. Это тема информационного суверенитета.

Информационный суверенитет – это "возможность государства управлять информацией". Информационный или цифровой суверенитет, как справедливо отмечает И. Ашманов, включает несколько компонентов. Это и техническая инфраструктура, и программные продукты, и собственные поисковые системы, и социальные сети и т.п.

В ближайшем будущем несущей конструкцией и ключевым ресурсом, определяющим цифровой суверенитет, становятся Большие Данные, как третий вид памяти. Именно Большие Данные аккумулируют в себе архивы и поисковых систем, и социальных сетей, и торговых платформ, и бизнес-и государственные базы самого различного рода и т.п.

Особо проблема цифрового суверенитета обостряется в современном мире. Не секрет, что сегодня происходит не только слом однополярной мировой системы, но и де факто мир прощается с Потсдамской системой мироустройства. Реальностью становится факт, что все большую роль в международных отношениях начинает играть не право, а сила.

Собственно процесс этот начался давно. Наиболее ярко он проявил себя в конце 90-х г. в связи с распадом бывшей Югославии и событиями в Косово. Сегодня же мы являемся свидетелями конца монополии на односторонний демонтаж прежнего миропорядка. Прекрасно отдавая себе отчет в возрастании значения силового компонента, Соединенные Штаты и их союзники одновременно не испытывают иллюзий относительно возможностей применения наиболее разрушительных видов вооружения. По мнению большинства экспертов ни Соединенные Штаты, ни Западная Европа не технически, не организационно, не, главное, ментально, не готовы к серьезной "горячей" войне.

В этой связи последние 30 лет, прежде всего, в США и Великобритании ведется неустанный поиск новых видов вооружений, которые позволяют реализовать Оруэллианскую концепцию: "мир – это война, свобода – это рабство". Первыми в ряду этих вооружений были кажущиеся сегодня простыми информационно-психологические вооружения, базирующиеся на традиционной пропаганде и достижениях классической психологии. Затем стали использоваться более изощренные технологии программирования деструктивных действий в виде "цветных" революций и т.п.

Не секрет, что до сих пор наиболее обсуждаемыми темами среди российского экспертного сообщества остаются темы цветных революций, так называемого "управляемого хаоса" и т.п. Между тем, эти темы всерьез уже перестали рассматриваться западным военно-разведывательным сообществом как последние, и наиболее совершенные военные технологии. При этом в США, Великобритании и т.п. продолжают активно издаваться книги по цветным революциям, управляемому хаосу, деструктивным восстаниям и т.п. Проводятся соответствующие конференции. Однако ничего принципиально нового на них не появляется. Детальный анализ участников конференций и авторов книг, а также конструктивное рассмотрение их содержания показывает, что последние полтора-два года подобные мероприятия выполняют скорее отвлекающую роль. Фактически есть основания полагать, что эта работа в немалой степени стала элементом большой операции прикрытия и дезинформации, направленной на отвлечение интеллектуальных усилий цивилизационного противника.

На практике же главные усилия, как мы постарались показать в серии статей, сосредоточены на разработке принципиально нового поколения вооружений, так называемых "поведенческих" вооружений. Поведенческие вооружения базируются на трех китах: Больших Данных, как памяти "третьего рода", когнитивных вычислениях, объединяющих мощь математических методов с пусть грубой, но уже имитацией работы человеческого мозга и аккумуляции достижений поведенческой психологии.

Как показывает анализ видимого и невидимого сегментов интернета, подавляющая часть публикаций на эту тему засекречена. Можно найти лишь отдельные фрагменты, куски работ или исследований, касающихся этих тем, но прямо не связанных с военно-разведывательной тематикой. Тем не менее, недавно появились прямые доказательства разработки, по крайней мере, в США и Великобритании, поведенческих вооружений, ориентированных на скрытое управление групповым поведением коллективов различной размерности. Так, в конце прошлого года Институт оборонного анализа, финансируемый Пентагоном, разведывательным сообществом и Государственным Департаментом опубликовал документ Pathways to Cooperation between the Intelligence Community and the Social and Behavioral Science Communities. В нем упоминается, что в прошлом году было проведено большое совещание по программе Minerva Research Initiative. Это закрытая программа IARPA в области управления групповым поведением на основе Больших Данных, которая получила статус стратегической важности с точки зрения национальной безопасности США.

В подготовленном в прошлом году Министерством обороны Великобритании докладе Global Strategic Trends out to 2040 в качестве одной из целей ближнего прицела также выделено скрытое управление групповым поведением на основе Больших Данных. Этот доклад в определенной степени стал осмыслением британского военного бестселлера последнего года, книги бывшего командующего британскими подразделениями в Северной Ирландии, Косово, Ираке, Ливане и Афганистане генерал-майора Э. Маккея и коммандера С. Тотама "Поведенческий конфликт" (Behavioural Conflict: Why Understanding People and Their Motives Will Prove Decisive in Future Conflict). Выводом книги стали следующие слова: "Наша способность понять и незаметно изменять поведение групп людей станет определяющей характеристикой вооруженных конфликтов нового типа".

Нет сомнений, что в современной сложной геополитической ситуации Большие Данные являются стратегическим ресурсом и приоритетом не только развития экономики и социума, но и важнейшим вопросом обеспечения национальной безопасности. В этой связи представляется целесообразным:

Во-первых, сориентировать Фонд Развития Интернет Инициатив, Фонд Сколково и Фонд перспективных исследований на государственное и негосударственное финансирование стартапов и отечественных разработок в сфере Больших Данных, нацеленных в первую очередь на межотраслевое использование, а также решение задач в области охраны правопорядка и национальной безопасности.

Во-вторых, организовать в ведущих университетах страны с мощными математическими школами и кафедрами по программированию, системному анализу, лингвистике и т.п. кафедры Data Science (наука о данных). В оперативном режиме открыть при кафедрах магистратуры и группы ускоренного обучения Data Science и когнитивным вычислениям. Организовать перевод на русский язык имеющихся онлайн видеокурсов по Большим Данным, когнитивным вычислениям и поведенческому анализу.

В-третьих, провести научно-практическое совещание по использованию Больших Данных, когнитивных вычислений и поведенческих наук для прогнозирования и противодействию скрытому управлению поведением. В рамах подготовки к совещанию осуществить инвентаризацию отечественных разработок и имеющихся кадров по указанному направлению.

В-четвертых, организовать с привлечением лучших вне зависимости от академических званий и занимаемых должностей специалистов межотраслевые и вневедомственные коллективы по разработке методологии, математического аппарата и программных решений по прогнозированию сложных социальных систем и противодействию скрытому управлению групповым поведением.

В-пятых, инициировать разработку пакета нормативных документов, связанных с вопросами государственного регулирования Больших Данных, включая их сбор, накопление, использование и возможность трансграничной передачи. При необходимости проработать вопрос о подготовке государственной концепции в сфере Больших Данных.

Авторы статьи: Е. Ларина, В. Овчинский
Tweet

HRазведка (16.07.2014 в 11:37) | вверх страницы | к списку статей