12 июля в Одессе, в концерт-холле «Сады Победы» Яндекс провел свою четвертую летнюю конференцию, собравшую специалистов по интернет-маркетингу из разных городов Украины, Белоруссии и России.

На конференции присутствовало 850 человек, и было зафиксировано более 10 тысяч подключений к прямой трансляции мероприятия, которая велась с места событий.

Программа конференции состояла из трех секций, выступления докладчиков шли в один поток и перемежались общими обсуждениями – такой формат проведения мероприятия за несколько лет успел зарекомендовать себя с самой лучшей стороны.

Читать обзор первой секции «Enterprise Social Technologies»

Читать обзор второй секции «Мобильные технологии и геосервисы»

Третья, заключительная секция конференции была посвящена обсуждению Big Data и была призвана добавить еще немного штрихов к портрету маркетинга как количественной науки.

Вступительное слово сказал Андрей Себрант, который считает, что аналитика – это история про то, как количественно описать счастье пользователя от того или иного продукта.

Современный маркетолог просто обязан уметь работать с данными. Вопрос – что считать данными? Огромное количество людей уже себя считают продвинутыми, потому что они знают слово Google Analytics, а на сайте у них стоит Яндекс.Метрика. Это правильный и хороший, но только самый первый шаг. В современном интернете только этих инструментов уже недостаточно.

Как количественно описать счастье пользователя от использования продукта, как количественно описать характеристики, которые определяют его развитие, как правильно количественно описать аудиторию – эти вопросы в маркетинге решаются либо поверхностно, либо никак. Мы пытаемся понять, как и какие данные (которым в интернете нет числа) правильно использовать.

Проблема сейчас заключается не в том, как найти данные, а какие данные нужны, чтобы наш бизнес чувствовал себя лучше, как эти данные можно быстро обработать и как результаты этой аналитики представить наглядно.

Первым в рамках секции выступил Игорь Ашманов (Ашманов и Партнеры), именно он открыл эту самую трудную, но и самую важную секцию про аналитику.

Игорь Станиславович рассказал о том, почему большие данные, Big Data – это что-то такое необычное, не то, что можно увидеть на своем сайте, проанализировав посещаемость. Понятно, что большие данные – это то, что нельзя посмотреть глазами. А второе свойство больших данных – это то, что по маленькому кусочку данных нельзя получить того, что вы можете получить с большими данными. То есть, для того, чтобы получить выводы, нужны все данные, не хватит 10%, не хватит и половины. Вот это и есть ключевое свойство больших данных.

Первое, что приходит в голову, когда говорят о больших данных – это сведения о посещаемости и сведения о поисковых запросах, вообще о поведении пользователей в сети. То есть, это те данные, которые могут получить очень большие проекты или какие-то большие интернет-системы, связанные со счетчиками, или какие-то рекламные системы, которые видят очень много пользователей на разных сайтах. И вот там как раз и можно получить сведения обо всех пользователях. При этом, это никак не похоже на то, что может вебмастер увидеть на своем сайте.

Ну, например, что позволяют увидеть большие объемы данных? Допустим, есть какой-то уникальный человек – один на миллион. Условно говоря, Google знает 7000 тысяч таких, как этот человек, точнее еще 6999. Соответственно, когда подобный пользователь войдет в сеть и проделает несколько прыжков по сайтам, Google быстро вычислит, что этот человек сделает дальше. По сути, имея эти большие данные, он может кластеризовать пользователя, и предсказывать пользовательское поведение. Здесь даже не нужная какая-то особая математика, можно просто предположить, опираясь на аналогии, на какие сайты этот пользователь будет ходить.

Следующий шаг – то, что позволит рекламной системе, поисковику или крупному проекту из пользовательских походов по интернету вывести какие-то производные характеристики, которые на самом деле, так просто в интернете не видны. Если в первом случае сопоставлялся вектор каких-то пользовательских характеристик, например, предпочитаемая тематика сайта, то следующий уровень – это когда предоставляются социумные характеристики. Смотрят на те 7 тысяч похожих человек, какую-то долю из них опрашивают или берут сведения из почты или откуда-то еще, где пользователь о себе что-то сообщает. То есть, по поведению пользователя пытаются понять – мужчина это или женщина, какого возраста, какого дохода и так далее. Все делается с помощью метода машинного обучения. Выбрали кластер, затем по нему взяли какую-то выборку, взяли эти характеристики. Понятно, что там точность может быть невысокая – 80% или 90%, но рекламодателей это устраивает вполне, потому что там весь вопрос в конверсии.

На следующем этапе появляются психологи – это те, кто изобрел какую-то классификацию психотипов. Дело в том, что психологи – это гуманитарии. И когда они догадываются, что два раза параметр дает комбинацию два в квадрате, то есть, четыре, то дающие рекомендации получаются: сангвиник, меланхолик, флегматик, холерик. А кто-то в этом мире из психологов делает матрицу 3х3. На самом деле никакая классификация не соответствует действительности. Люди слишком разнообразны. Но, тем не менее, психологи эти приходят в рекламные системы, крупные порталы и говорят: «Мы беремся! Вот, если вы нам дадите пользовательское поведение, определим психотип человека». И я много видел проектов, где используется именно такая классификация – по вектору личных характеристик. Но я не видел ни одного случая, когда бы это сработало. Может быть, я ошибаюсь и где-нибудь есть теория, где эта классификация людей соответствует реальной какой-то классификации людей и поэтому можно получить реальные надежные результаты. То есть, некоторое количество людей расклассифицировать, посмотреть, как они себя ведут в сети и остальным психотипы присваивать автоматически. Это то, что можно видеть, если у тебя есть счетчик, если у тебя есть огромный портал и ты видишь реальное поведение пользователя.

Далее Игорь Станиславович рассказал о том, что можно увидеть снаружи, когда не видно поведение пользователя, а видно лишь то, что он пишет. Имеются в виду большие массивы блогов и так далее. Там тоже есть большие данные, анализируя которые, можно получить знания, которые нельзя получить рассмотрением отдельного блога, отдельного сервиса и так далее.

Можно увидеть общее соотношение позитива и негатива. Известно, что в среднем по какому-нибудь продукту позитива в 4 раза меньше, чем негатива, люди любят ругаться в сети. Эти знания нельзя получить, не рассмотрев все. Если там соотношение другое, то это начинает что-то означать. Второе – можно увидеть информационные вбросы. Если какая-то штука быстро распространяется по сети, и мы видим график этого распространения, то мы видим, что вброс происходит очень резко на дневном графике. То есть, можно определять вбросы, можно определять попытки повлиять на кого-то, компании по очернению или, наоборот, по рекламе. Для этого нужны данные во всем пространстве мнений: Facebook, Twitter, ЖЖ…

Можно видеть сообщества ботов. Этих ботов очень много. Если не анализировать специально, то трудно понять, что здесь сообщества, состоящее из десятков тысяч ботов, иногда тысяч, чужих твитов, например. И обмениваются ими годами, чтобы создать впечатление реальной жизни в этом пространстве ботов: они вредят в Facebook, они обмениваются бессмысленными, устаревшими высказываниями и так далее. Но в нужный момент эти боты включаются, чтобы зашумить какой-то канал.

Так, например, когда демонстрация после выборов в декабре собиралась идти громить Лубянку, они договаривались между собой, как они пойдут на Лубянку. Это делало одно из пяти или четырех сообществ ботов, которое мы уже к этому времени наблюдали. Вот это можно видеть, когда ты видишь эти данные с птичьего полета. Потому что иначе нельзя понять что это.

Дальше при помощи Big Data можно вычислять такую вещь, как сила блоггера, можно считать среднее количество его перепостов, тех, кто сделал его перепосты и так далее. Если уже было определено, что это вброс, то дальше, наблюдая вбросы, можно каждому блоггеру приписать степень его значимости участия в этих вбросах, и можно предположить и просчитать его приверженность к определенным темам. И потом можно сравнивать, на какие темы этот человек пишет и как часто, определить его рейтинг проплаченности.

Тренды. В трендах тоже влияние можно видеть только сверху. Если смотреть сверху, можно обнаружить новую тему, еще до того, как она начала взлетать. Это довольно сложная штука – тренды. Мы сейчас алгоритмы пишем и уже начали кое-что обнаруживать. Понятно, вам нужно для начала какие-то объекты в сети обнаруживать – это не очень просто. Понятно, что в блоге видна география, и ее тоже можно мерить и сопоставлять все эти данные, флажки на карте. Вот если анализировать задним числом какое-то событие – теракт или какой-то конфликт в определенном регионе, то оказывается, что посылы, как некие потрескивания, появляются задолго до того, как произойдет землетрясение. То есть, в принципе, если научиться отличать такое потрескивание от звона, то можно предсказывать события или, по крайней мере, растущую напряженность в том или ином регионе.

Все эти данные довольно стремные. Они раскрывают отношения, которые так просто не видны и могут стать материалами для политического преследования. Эти данные реально стремные и это надо понимать.

Далее с докладом «О чем молчат цифры, или немного об отчетности» выступил Алексей Бакун (Gemius Ukraine).

В своем докладе Алексей решил немного рассказать об accountability. Что это такое? Лет семь назад, условно говоря, на заре аналитики, об этом слове только начинали говорить. Accountability – это отчетность, но это не очень хороший перевод этого понятия.

Раньше отчетность строилась исключительно на данных счетчиков, которые показывались клиенту. Это были счетчики, показывающие посещаемость, показывающие куки, показывающие показы баннеров и так далее. На самом деле к настоящей отчетности и анализу эффективности это имеет слабое отношение. На самом деле 15% рекламы никто не видит, и об этом мало кто знает, а те, кто знает, используют это в своих целях.

Обязательно должны были быть способы, которые должны были учитывать эти 15% и проверять, видны они рекламодателям или нет. Рекламных систем очень много – некоторые досчитывают эти 15%, некоторые – нет, некоторых систем в Украине просто еще нет. Отсюда и вытекает то, что хочет видеть рекламодатель – он хочет видеть вполне понятные вещи. Такие как:

- реальный охват нужной ему целевой аудитории

- не только показы и клики, но и реальные затраты на каждый рекламный канал

- соцдем параметры целевой аудитории рекламной кампании и целевого сайта

- что делали потребители на сайте после взаимодействия с рекламой

Как это все можно проверить? Для этого существует целый комплекс исследований, включающий в себя измерение онлайн-аудитории, исследование сайта, исследование потребителей, мониторинг рекламных кампаний, измерение видео-рекламы и мобильной рекламы. Кроме того, разработан специальный код, который прошивается в баннер и позволяет достоверно узнать о том, какие люди видели рекламу, какие не видели, сколько кликнули, а сколько нет.

В код рекламной кампании прошивается код gDE, и, объединяя эти данные с данными мультимедиа-панели, можно получить наидостовернейший соцдем профиль. Клиент получает качественный и простой отчет, при помощи которого может анализировать и оптимизировать свою рекламную кампанию.

Алексей привел несколько кейсов компаний, которые пользовались возможностями, предоставляемыми компанией Gemius. Все подсчеты в системе сегодня происходят онлайн, уже не нужно как раньше заказывать и ждать какие-то отчеты, все данные можно получать в режиме реального времени в интерфейсе web 2.0.

Причем здесь Big Data? При том, что эти большие объемы данных, эти 80 млн. куков, которые объединяются с данными 80 тыс. панелистов, и десятками тысяч людей, которые поставили себе специальное программное обеспечение, только и позволяют с достоверностью сказать, была ли рекламная кампания эффективна как с точки зрения вложений, так и с точки зрения полученной прибыли. Все эти данные подтверждаются независимым аудитом и все это реально уже сейчас.

Следующим на сцену поднялся Федор Вирин (Data Insight), который представил доклад на тему «Особенности создания репрезентативных опросов в интернете».

В своем выступлении Федор рассказал, что есть еще один способ сбора больших объемов данных, который сейчас активно развивается – это опросы и опросы через интернет. По мнению докладчика, сейчас опросы, которые проводились в офлайне, плавно переползают в интернет и это очень приятно. Офлайновые и онлайновые опросы отличаются. Отличаются они существенно – тем, как обрабатываются данные.

Проведение онлайн-опросов. Самый простой способ проведения такого опроса, который чаще всего используется – это повесить анкету на сайте. Он никогда не работает. В подтверждение своих слов, Федор привел в пример кубики для голосования, стоящие на столах участников конференции. Кубики с 4 гранями – две красные и две зеленые, на которых нарисованы QR-коды. Вот это как раз то, что происходит во время опросов на сайтах – совершено незначительная и нерепрезентативная выборка, эти результаты, хоть и любопытные, совершенно не пригодны для того, чтобы их использовать дальше. Потому что они отражают некоторое очень незначительное количество людей, которые не поленились достать телефон и сфотографировать вот эти грани. А на самом деле, большинство людей не сфотографируют – поленятся.

Какой инструментарий сегодня еще используется? Это панели, сайты, рассылки, мобильный интернет.

Панели. Существует большое количество компаний, у которых в реестре есть сотни тысяч пользователей, готовых участвовать в опросах. Это панельные компании, которые предоставляют аудиторию для опроса, которая абсолютно никак не связана с определенным бизнесом, никак не привязана к какому-то кусочку случайно выбранного места. То есть, это большие совокупности, из которых легко выбирать.

Сайты. Если вы проводите опросы на сайтах, вы проводите их на большом количестве сайтов. Яндекс – большой хороший сайт. Но даже, если проводить на этом одном хорошем сайте опрос, он будет скособочен, причем очень сильно. Потому что есть значительная часть аудитории, которая Яндексом не пользуется, и эта аудитория отличается от той аудитории, которая пользуется.

Рассылки по своим базам данных. Полезный инструмент, редко используется сейчас и используется для CRM.

Мобильный интернет и опросы через мобильный интернет. Очень активно используют в Европе сейчас, но на самом деле, очень мало используют в России.

Вот эти четыре инструмента, которые сейчас используют, и которые сейчас есть.

В Москве сейчас появилось очень большое количество реклам, когда висит огромный щит, а на нем написано: «Вы это видите, значит оно работает». Реклама после этого на этом щите все равно не работает конечно, но надпись видят, да.

Есть группы, которые недостижимы через онлайн-опросы. Аудитория интернета очень велика – это больше 50% населения страны. И вот среди этих 50% населения страны есть совершенно недостижимые категории людей. Это: очень богатые люди (они, кстати, интернетом пользуются мало), бедные они вообще в опросах не участвуют, пенсионеры и новички (те, кто недавно пользуется интернетом).

Отсутствие бедных и богатых в наших опросах можно пережить, но в нашем опросе будет мало новичков, т.е. тех, которые подключились к интернету – 2-3 года назад. Поэтому нам необходимо перевзвешивание. Любой репрезентативный опрос нужно перевзвешивать, это социологическая процедура, необходимая для того, чтобы опрос был репрезентативным: неважно в онлайне, в офлайне, через мобильный телефоны, как угодно.

Раз у нас мало новичков, мы должны дать их анкетам больший вес, и тогда у нас получается картинка, более менее похожая на правду. И еще очень важна география. В больших городах, в Киеве, интернетом пользуются давно, а в небольших городах и в городах, где велика доля населения, занятого в промышленности, синих воротничков – там большее количество людей, которые интернетом пользуются недавно и, соответственно, этот географический кусок будет перекошен. Это то, что касается особенностей перевзвешивания.

Далее необходима очистка выборки. Есть такая вещь, как социальная желательность, какие-то такие вещи, которые показывают, что опрашиваемый лучше, чем он есть есть. Это может быть приписывание себе каких-то желаемых качеств, преувеличение или преуменьшение зарплаты и так далее. В интернете этого гораздо меньше, чем в оффлайн-опросах потому, что перед нами никто не сидит и кажется, что мы защищены. В интернете социальная желательность меньше, но она тоже есть. И она касается использования интернета и покупок через интернет. Все вопросы, связанные с использованием гаджетов, каких-то интернет историй – вот эти все вопросы дают завышенные оценки. Всегда можно провести такой опрос, чтобы получить желаемый результат – это несложно. Говорят, что в интернете гораздо легче ответить на провокационный вопрос, на который люди будут отвечать так, как хочет того спрашивающий.

Списки. Вот у нас есть список. Когда интервьюер зачитывает с листа варианты ответов, он эти варианты может перемешивать иногда. Так вот, на самом деле, первый вариант ответа всегда получает больше. Это нормально. Человек смотрит на варианты ответов и отвечает на первый. В интернете мы можем форсировать. А еще лучше, вместо списков использовать баллы. Когда человек использует ползунок и выбирает то, что ему нужно. Вот эти самые штуки, которые используют для интернет-опросов – лучше использовать. Длительность заполнения анкеты в оффлайне 40-50 минут – это запредельное время, но это прокатывает. Длина опросов в онлайне больше 10-15 минут – не прокатывает почти никогда. В итоге получается, что мы можем использовать этот инструмент с некоторыми ограничениями, потому что по факту опрос в онлайне – дешевле в 7-8 раз, чем в оффлайне. Это хороший инструмент и его надо использовать.

Далее с докладом «Изменение демографии внутри воронки продаж» выступил Дмитрий Сатин (UsabilityLab), который рассказал, что ему перед выступлением кто-то подошел и сказал: «Знаете, вас уже в Одессе все знают. Еще пару раз приедете, и мы поймем, чем же вы все-таки занимаетесь».

Дмитрий признался, что по образованию он психолог и поэтому просто обязан ответить Игорю Ашманову, который сказал в своем выступлении, что не видел еще психологов, которые бы делали адекватные выводы на основе каких-то данных.

По словам докладчика, аккумулировать данные мы умеем, и вопрос заключается вовсе не в ценности этих данных, они на самом деле ничего не стоят, если мы не можем делать вывод из этих данных. Когда мы смотрим на средства веб-аналитики, новичок всегда испытывает одни и те же эмоции: «Ух, ты! Сколько данных! Можно посмотреть на аудиторию и так и этак». Но через полчаса этого наблюдения, ловишь себя на мысли: «Я много видел, но много ли я понял?».

Как же можно произвести эти самые выводы из данных? Психологи на самом деле, поучаствовали в том, что развили статистику, и они, в том числе, поучаствовали в разработке таких методов, как кластерный и факторный анализ. А кластерный анализ на западе называют уменьшением количества данных, это попытка увидеть за объемными данными какие-то факторы. А факторы – это объяснение того, что происходит.

Интересная вещь. Развитие знания происходит через наблюдение аномалий. Пока мир укладывается в прежние сложившиеся схемы понимания, мы ничего нового о нем не узнаем, мы не становимся другими. А когда мы сталкиваемся с чем-то, что не укладывается наше представление, нам нужно либо игнорировать эту аномалию, либо попытаться сформировать новое представление о мире, который мы пытаемся анализировать.

Пример. Один из способов увидеть аномалию – демография двух сайтов. Разница между ними состоит в том, что на первом сайте больше молодежи – от 18 до 24, а на втором тот же сегмент занимает аудитория в возрасте 25-34. Два сайта, у них разная демография, про что могут быть эти сайты?

Первый сайт – это сайт поиска работы, одесский ресурс, который называется «Работа и труд». Теперь мы понимаем, что подобный ресурс востребован молодежью, которая получила образование, но еще не нашла себя в профессиональной среде и поэтому они являются активными потребителями. А второй ресурс – это московский сайт, который посвящен поиску климатического и отопительного оборудования для загородных домов. То есть, основным клиентом этого ресурса являются домовладельцы, которые покупают себе котел или еще что-нибудь.

То есть, первая мысль, которую мы можем отметить – если вы видите, что демография вашего ресурса как-то отличается от общей демографии интернета, есть повод задуматься. Либо это норма – вы нишевой сегмент, либо – вы работаете как все.

Очень часто, когда я начинаю работать с клиентом и спрашиваю: «Кто ваша аудитория?», – мне отвечают: «18+, мужчины-женщины 50 на 50». Но лучше ничего не говорить, чем сказать это, потому что не понятно, куда двигаться. И поэтому я предлагаю взять любой инструмент веб-аналитики и почувствовать характер своего ресурса.

Поскольку мы чаще говорим про онлайн-бизнес, мы будем давать еще один источник аномалии – это не только отличие от общей демографии, но внутренние трансформации клиента. Воронка продаж для нашего сайта появляется конверсионным путем. А с конверсионным путем есть для меня один фундаментальный вопрос. Воронка продаж – это что? Это фильтры? Это решение проблемы? Или это проблема сама по себе?

Бывает так, что на входе в воронку продаж – большая аудитория, а на выходе (на странице подтверждения) у нас очень мало людей. И одно из двух: либо мы всех растеряли и нужно как-то перестраивать сайт, чтобы их ловить, а может быть и не надо ничего не менять, потому что на самом деле, это бюрократия, это навязывание клиентам интерфейса, которое удобно тебе, а не ему. И очень часто обслуживающая компания не в состоянии физически осчастливить все Разнообразие клиентов, и поэтому она их фильтрует.

В качестве примера подобных аномалий, встречающихся на сайтах, Дмитрий привел кейсы украинских интернет-ресурсов.

Один из примеров – украинский сайт «Сокол». Здесь, если смотреть на распределение по регионам, можно увидеть, что на входе в воронку продаж жителей киевской области чуть меньше половины, а в конце воронки продаж, на странице подтверждения, их почти ¾. Почему? Вообще-то те, кто знаком с «Соколом», знают, что там доставка работает только по Киеву, по регионам она не сильно адаптирована. Хорошо это или плохо – нужно решать бизнесу. Где здесь интересный вопрос? Реклама – это то, что привело людей к началу воронки, она захватила регионалов, но они отсеялись, они не заказали на «Соколе» то, что хотели.

Другой пример – это московский сайт по доставке цветов. Он называется «Обрадовал.ру». Название как бы позиционирует, что это сайт для мужчин. Но мы смотрим, что на входе в воронку продаж женщин подавляющее большинство, а на выходе – покупатели мужчины. Как это могло произойти? Почему женщины больше смотрят, но меньше покупают, а мужчины меньше смотрят и больше покупают? Обсуждая это с клиентом, я услышал очень примечательную вещь: «Вообще-то сайт продает любые цветы: букеты и корзины, в россыпи и собранные в некоторые композиции». Но когда клиента спрашиваешь, какой наиболее распространенный кейс, что к вам обратились, они говорят: «Доставка букета невесты». По русской традиции невеста не должна видеть свой букет до самой свадьбы, также как жених не должен видеть ее платья. Но по факту, ни одна невеста не позволит жениху выбрать цветы, а вдруг букет не подойдет к платью. Это она выбирает себе букет, а потом пересылает ему ссылку и он удовлетворяет ее запрос. Это интересно.

Рассмотренные кейсы все разные, но что в них главное – данные описывают то, что происходит, но сами по себе ничего не объясняют, здесь обязательно нужен объяснительный принцип. И ценность психологии в этом смысле заключается в том, что когда они идут на упрощение, на те самые 4 типа, потом оставляют у нас понимание, что нам делать с этим дальше.

Обязательно пользуйтесь метриками и обязательно смотрите на то, что в начале и что в конце. Возможно, вы у себя увидите подобные аномалии, и потом они вас наведут на идею изменения маркетинговой компании. Может быть, вы забираете не тех людей с рынка, а может быть, это как-то связано с логикой вашего ресурса или даже с психологией людей, с их социальными отношениями.

Далее с докладом «Как Big Data делает вашу жизнь лучше» выступил Владислав Флакс (OWOX).

В начале своего выступления Владислав рассказал о том, что это за данные Big Data и почему мы о них говорим. Как они собираются? Не трудно догадаться, что первые данные начали собирать финансовые институты, биржа и все те, кто около нее вращается. Есть спутники, которые генерят массу данных, есть телеком… Но что интересно, со временем данных в нашей жизни становится все больше и больше, и не только связанных с финансами.

Мобильный телефон у нас в руках генерит большое количество данных, а большое количество мобильных телефонов (например, в Индии) – это уже генерация Big Data. Использование танометра , взвешивание, использование секундомера – все это генерация данных. На самом деле, каждый из нас – это Big Datа, только еще не полностью оцифрованный. То, что сегодня происходит в нашем мире – это оцифровка всего, что связано с человеком.

Кто и как использует большие массивы данных? Вот слайд, демонстрирующий, какие сферы бизнеса используют большие данные и сравнение того, как связано это использование с прибылями компании. Давайте быть честными. Нам всем хочется быть более успешными, но для бизнеса зачастую охват такой же.

В онлайн-ритейле от того, используется ли Big Data или нет, зависит прибыль. Представьте, что вы зашли в крупный интернет-магазин. В офлайне витрина магазина одинакова для всех пользователей, а в онлайне – разная. Например, товарная выдача Amazon формируется на основе алгоритма анализа больших данных, и большинство пользователей видят разную подборку товаров.

В 2010 году YouTube перешел на алгоритм Amazon. Но алгоритм, разработанный более 6 лет назад Amazon, лучше себя показывал, нежели было в YouTube. В прошлом году активно начали обновляться программы, инструменты для сбора и обработки данных.

А что делать, если вы владелец бизнеса и хотите быть ближе к Big Data и хоть как-то его использовать? У вас есть какие-то данные и есть желание что-то из них получить. Владислав рекомендует начать с двух простых инструментов.

Это Google Prediction – это cloud-сервис машинного обучения, которая позволяет загрузить определенную матрицу данных и выявить общую тенденцию, понять, что выделяет вашу аудиторию среди других пользователей.

Второй инструмент – Amazon Elastic Preview. Является также cloud-сервисом для распределенных вычислений, который тоже позволяет строить эту модель, когда у вас есть много данных и надо их распределить на серверах, чтобы получить какой-то вывод.

Данные, действительно есть и их, действительно, много, и я не знаю, как их применить для среднего и малого бизнеса завтра, но я точно уверен, что вы их будете использовать через несколько лет. Чем раньше вы примите решение об использовании Big Data, тем будет лучше, эффективней и веселее.

 

Источник: www.searchengines.ru

Поделиться в соц. сетях

Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Одноклассники
Опубликовать в Яндекс
Опубликовать в Мой Мир

Рекомендуем ещё