Большие данные
Недавно ко мне обратилась представительница издательства «Манн, Иванов и Фербер» с предложением прочитать и написать отзыв об одной из их новых книг. Тема предложенной книги мне была не интересна и в ответ на мой отказ, она предложила выбрать для обзора любую из изданных этим издательством книг. Я выбрал книгу «Большие данные». Тут надо сделать небольшое отступление: из русскоязычных издательств «МИФ» мне нравиться, пожалуй, больше всех, так что сильно упрашивать меня не пришлось. (Бросить все это программирование? Стать известным литературным критиком?)
Следует сразу сделать небольшое замечание касаемо самого этого термина «большие данные». Лично для меня это было новостью. Авторы книги пишут что под словом «большие» следует понимать не столько объем данных, сколько полноту выборки («N = все»). В докомпьютерную эпоху для анализа каких-то данных необходимо было для начала выполнить из них случайную выборку такого объема, который еще поддается ручному анализу. На основе анализа этого небольшого объема делалось предположение о всех данных целиком (это и сейчас актуально, например, для социологических исследований, только тут сложность в самом сборе данных). Когда мы входим в мир больших данных, то уже нет необходимости делать предварительный отбор из всего их объема, мы анализируем все целиком. В книге приводиться пример выявления договорных боев в японской борьбе сумо с помощью статистического анализа. Весь входной объем данных, это всего чуть больше 64000 поединков — совершенно смешной объем для того что мы привыкли подразумевать под термином «большие данные». Однако, с точки зрения авторов книги, это большие данные и есть, ведь для анализа были использованы результаты всех боев (N = все) за много лет.
Нет смысла пересказывать области применения больших данных, которые упомянуты в книге — лучше ее просто прочитать. Там много примеров. А для интересующихся темой сейчас вообще время хорошее: большие данные в моде, в новостях постоянно описывают все новые их применения.
Эпоха больших данных — это не что-то такое, к чему надо готовиться, это уже наша объективная реальность, ставшая возможной благодаря повсеместной датификации (перевода информации в пригодный для анализа цифровой вид). И как у любой мощной технологии у нее есть две стороны.
С одной стороны, большие данные буквально спасают жизни. Например непрерывный мониторинг медицинских показаний недоношенных младенцев, с учетом ранее проанализированных замеров, позволяет распознать начало развития инфекции, когда никаких внешних признаков еще нет. В данных инфекция уже заметна, и лечение можно начать сразу.
С другой стороны, большие данные бросают вызов сохранению конфиденциальности и приватности. Анализируя потребления электроэнергии человеком можно многое узнать о его привычках. Или сравнивая поведение людей на сайтах скрывающих реальные имена и сайтах где реальные имена известны, можно с достаточно высокой точностью идентифицировать конкретного человека (в книге есть пример раскрытия реальных имен пользователей на основе анонимизированных данных с сервиса проката фильмов Netflix при сравнении их с реальными именами пользователей сайта IMDb).
Также есть риск захода совсем уже на темную сторону. Скажем может появиться искушение прогнозирования будущего поведения человека, для пресечения возможных правонарушений, до их непосредственного совершения. Просто потому, что анализ данных показал высокую вероятность таких событий. Антиутопия в чистом виде — человек еще ничего не сделал, но проблемы у него уже есть.
Важно понимать, большие данные показывают нам что-то на основе того что уже было. Предсказать нечто принципиально новое они не в состоянии. Так что мир человеческого интеллекта, творчества, прозрений, изобретательности остаются, к счастью, за нами, несмотря на весь прогресс в гигагерцах, терабайтах и алгоритмах.
Про удаленную работу
Прочитал книжку REMOTE от 37signals. Книжка посвящена вопросам организации удаленной работы. Написана на их собственном опыте существования в условиях когда большая часть штата компании географически находится далеко друг от друга. Книжку рекомендую, мне очень понравилась.
В этом декабре исполнилось 6 лет как я сам работаю из дома, и чем дальше тем больше мне это нравится. Опыта руководства географически распределенных команд у меня нет, но опыт работы в таких командах есть, и вот в честь юбилея моей домашней работы (10 в шестиричной системе счисления, в следующем году будет 10 в семиричной, очень удобно) я бы хотел поделится своим опытом.
Про стояние с кнутом
По моему опыту, большинство потенциальных менеджеров задумывающихся об организации удаленной работы, больше всего переживают что без стоящего над душой начальника с кнутом работа вообще сделана не будет. Господа, ну это полная ерунда, как будто в офисе мало возможности ничего не делать. Даже попытки закрывать доступ к разным там одноклассникам и вконтактам приводит просто к росту доступа к ним с мобильных. Сейчас, я так понимаю, доля таких пользователей соцсетей измеряется десятками процентов. И там очень много вот как раз таких, работающих в компаниях с ограниченным интернетом. Додумались ли где-то уже отбирать сотовые в начале рабочего дня я не знаю. Но рабов к галере лучше всего сразу цепью приковывать.
Выполнение современной работы, особенно в IT, особенно у программистов, совершенно тривиально отслеживается просто по факту выполнения нужной работы. За эти 6 лет ни разу никого не заинтересовало в какое время я работаю или сколько часов провожу за монитором или как часто захожу в соцсети. Вопрос был только один — как движется работа.
Про самомотивацию
Обратная сторона предыдущей медали. «Если меня не пинать постоянно, я и делать ничего не буду», — распространенная мысль многих наемных работников. Это, на самом деле, довольно серьезная проблема. Разбирайтесь зачем вам нужна работа и какая она должна быть, может удастся найти хоть какую-то положительную мотивацию чтоб ее выполнять, или сменить работу на ту что больше по душе. С мотивацией основанной на страхе жить не очень приятно. Как краевед говорю.
Про настоящие трудности
Единственная большая проблема с которой лично я столкнулся за эти годы — это дефицит общения. Если из дома выходишь только в магазин, да еще и домашние куда-нибудь разъехались, начинаешь натурально дичать. В офисе хоть коллеги есть, и по пути на работу и с работу какое-никакое общение, живых людей видишь. А тут надо серьезно думать что делать. Помогают разные там хобби, я, например, дважды в неделю собираю небольшую группу занимающихся цигун у себя дома, вместе занимаемся, потом чай пьем. И польза от цигуна и польза от общения.
Про физическую нагрузку
Это тоже проблема. Когда расстояние кровать-кухня-компьютер в сумме метров 20, физическая форма сами понимаете какая становится. 37signals пишут, что они даже компенсируют расходу на фитнес клубы для своих работников — замечательная идея.
Тут мне, надо сказать, нечем похвастаться, я что-то делаю в смысле спорта, но этого явно мне недостаточно. Продолжаю работать над этим вопросом.
Про организацию рабочего места
Тут мне натурально повезло, у меня есть возможность дома одну комнату занять под кабинет где я и работаю. В REMOTE перечисляются разные варианты где можно еще работать: кафе, коворкинг центры и т.п. Я пока не пробовал, мне дома нормально.
С интернетом сейчас тоже все замечательно. Периодически я в деревню уезжаю, там нет воды в кране (как и самого крана), нет канализации, дорог тоже можно сказать что нет, но быстрый интернет в телефоне там есть, такой вот изгиб технического прогресса.
Про плюсы
Много времени высвобождается. Никакого переполненного общественного транспорта (или стояния в пробках), где и теряются эти 1-2-3-… часа в день у офисных работников.
Рабочее место организована как угодно по собственному вкусу. Хороший монитор, клавиатура, кресло.
Рабочее время выбирается по вкусу. Можно хоть в 6 утра начать работать и к обеду все переделать, можно рано утром часть работы, потом еще немного вечером. В середине дня можно в магазин сходить, а не толкаться там в 19 часов когда туда все после офисного рабочего дня приходят.
С семьей больше времени проводишь. Папа конечно днем занят и работает, но иногда отвлечь можно.
Питаться можно вкусной домашней только что приготовленной едой, а не в непонятных кафешках и столовых.
Про хорошо
Я, как и авторы книжки REMOTE, считаю что чем дальше тем больше людей будет удаленно работать. Плюсов много, минусов мало.
Если вы работодатель, прочитайте REMOTE и подумайте об организации удаленной работы у себя.
Если вы работник, прочитайте REMOTE и агитируйте своего работодателя начать организацию удаленной работы. Можно вот как раз с вас.
UPD: В издательстве «Манн, Иванов и Фербер» вышел русский перевод книги.
Игры разума
Я сейчас читаю книгу Оливера Сакса "Человек, который принял жену за шляпу". Книга в жанре документальных медицинских новелл. Оливер Сакс – врач невролог из США, описывает внутренний мир своих пациентов, большинство из которых, с обычной точки зрения являются умственно неполноценными. Но автор показывает внутренний мир своих пациентов, как мир совершенно особой, не понятной "нормальным" людям гармонии и красоты. Вот отрывок про двух умственно неполноценных близнецов, обладающих феноменальной памятью и необъяснимыми математическими способностями (всем сумасшедшим математикам посвящается :) ):