Какой объем данных может помочь вашей организации превзойти ваших коллег

Большие данные могут принести пользу организациям в любой отрасли по всему миру. Большие данные — это гораздо больше, чем просто много данных, и особенно объединение различных наборов данных даст организациям реальное представление, которое можно использовать для принятия решений и улучшения финансового положения организации. Прежде чем мы поймем, какой объем данных может помочь вашей организации, давайте посмотрим, что такое действительно большие данные:

Общепринято, что большие данные могут быть объяснены в соответствии с тремя буквами V: скорость, разнообразие и объем. Тем не менее, я хотел бы добавить еще несколько, чтобы лучше объяснить влияние и последствия хорошо продуманной стратегии больших данных.

скорость

Скорость — это скорость, с которой данные создаются, хранятся, анализируются и визуализируются. В прошлом, когда пакетная обработка была обычной практикой, было нормальным получать обновления базы данных каждую ночь или даже еженедельно. Компьютерам и серверам требуется значительное время для обработки данных и обновления баз данных. В эпоху больших коллекций данные создаются в реальном времени или почти в реальном времени. Благодаря наличию устройств, подключенных к Интернету, беспроводным или проводным, машины и устройства могут передавать свои данные при создании.

Скорость создания данных в настоящее время практически невообразима: каждую минуту мы отправляем 100 часов видео на YouTube. Кроме того, каждую минуту отправляется более 200 миллионов электронных писем, просматривается около 20 миллионов фотографий, 30 000 отправляются на Flickr, отправляется почти 300 000 твитов и почти 2,5 миллиона запросов от Google.

Задача организации — справиться с огромной скоростью создания данных и их использования в реальном времени.

разнообразие

В прошлом все данные, которые были созданы, были структурированными данными, тщательно подобранными столбцами и строками, но эти дни прошли. В настоящее время 90% данных, генерируемых организацией, являются неструктурированными данными. Сегодня данные доступны в различных форматах: структурированные данные, полуструктурированные данные, неструктурированные данные и даже сложные структурированные данные. Широкий диапазон данных требует другого подхода, а также различных методов хранения всех необработанных данных.

Существует много различных типов данных, и каждый из этих типов данных требует различных типов анализа или различных инструментов для использования. Социальные сети, такие как посты в Facebook или твиты, могут дать различную информацию, например, проанализировать настроение вашего бренда, а сенсорные данные предоставят информацию о том, как используется продукт и каковы ошибки.

объем

90% всех когда-либо созданных данных было создано за последние 2 года. Отныне количество данных в мире будет удваиваться каждые два года. К 2020 году у нас будет в 50 раз больше данных, чем в 2011 году. Огромный объем данных огромен, и Интернет вещей с сенсорами по всему миру является огромным вкладом в постоянно растущую цифровую вселенную. все устройства, которые создают данные каждую секунду.

Если вы посмотрите на самолеты, они генерируют около 2,5 миллиардов терабайт данных каждый год от датчиков, установленных в двигателях. Сельскохозяйственная отрасль также генерирует огромные объемы данных, используя датчики, установленные в тракторах. Например, John Deere использует данные датчиков для мониторинга оптимизации машин, управления растущим парком сельскохозяйственной техники и помощи фермерам в принятии более правильных решений. Shell использует сверхчувствительные датчики, чтобы найти дополнительную нефть для скважины, и если они установят эти датчики на все 10 000 скважин, они будут собирать около 10 данных Exabyte в год. Это абсолютно ничего, если мы сравним их с телескопом квадратного километра, который генерирует 1 эксабайт данных в день.

В прошлом создание такого большого количества данных вызывало бы серьезные проблемы. В настоящее время, с уменьшением затрат на хранение, улучшенными вариантами хранения, такими как Hadoop и алгоритмы для создания значений из всех этих данных, это не проблема.

правда

Наличие большого количества данных в разных объемах, поступающих на высокой скорости, бесполезно, если данные неверны. Неверные данные могут вызвать много проблем как для организаций, так и для потребителей. Поэтому организации должны убедиться, что данные верны, а анализы, проведенные на данных, верны. Особенно в автоматическом принятии решений, когда людей больше нет, вы должны быть уверены, что и данные, и анализ верны.

Если вы хотите, чтобы ваша организация стала ориентированной на информацию, вы должны быть в состоянии доверять этим данным и анализу. Шокирует то, что каждый третий лидер бизнеса не доверяет информации, которую они используют в процессе принятия решений. Поэтому, если вы хотите разработать стратегию больших данных, вам следует сосредоточиться на правильности данных и правильности анализа.

летучесть

Большие данные крайне изменчивы. Брайан Хопкинс, главный аналитик Forrester, определяет изменчивость как «дисперсию значения в лексиконе». Это относится к суперкомпьютеру Уотсона, который выиграл Jeopardy. Суперкомпьютер должен был «разделить ответ на его значение и [… ] чтобы выяснить, какой был правильный вопрос. «Это чрезвычайно сложно, потому что слова имеют разные значения, все зависит от контекста». Чтобы получить правильный ответ, Ватсон должен был понять контекст.

Волатильность часто путают с разнообразием. Допустим, у вас есть пекарня, которая продает 10 различных видов хлеба. Это разнообразие. А теперь представьте, что вы ходите в пекарню три дня подряд, и каждый день вы покупаете один и тот же вид хлеба, но каждый день на вкус и запах по-разному. Это волатильность.

Поэтому волатильность очень важна при проведении анализа настроения. Волатильность означает, что значение меняется (быстро). В (почти) одних и тех же твитах слово может иметь совершенно другое значение. Чтобы провести надлежащий анализ чувств, алгоритмы должны уметь понимать контекст и уметь расшифровывать точное значение слова в этом контексте. Это все еще очень сложно.

воображающий

Это сложная часть больших данных. Делать все огромные объемы данных понятными и легкими для понимания и чтения. Благодаря соответствующей визуализации можно использовать необработанные данные. Очевидно, визуализации не означают обычных графиков или круговых диаграмм. Это сложный график, который может содержать много переменных данных, будучи понятным и разборчивым.

Визуализация не может быть самой технологически сложной частью; это, безусловно, самая сложная часть. Хранить сложную историю на графике очень сложно, но также чрезвычайно важно. К счастью, есть все больше и больше крупных стартапов, которые фокусируются на этом аспекте, и, наконец, визуализация будет иметь значение.

значение

Все эти доступные данные создадут большую ценность для организаций, обществ и потребителей. Большие данные означают большой бизнес, и каждая отрасль получает выгоду от больших наборов данных. McKinsey утверждает, что потенциальная годовая стоимость больших данных для службы здравоохранения США составляет 300 миллиардов долларов, что более чем вдвое превышает ежегодные расходы на здравоохранение в Испании. Они также отмечают, что большие объемы данных могут составить 250 миллиардов евро в год для администраций государственного сектора в Европе. Более того, в хорошо полученном отчете за 2011 год они обнаружили, что потенциальный годовой излишек потребителя в результате использования персональных данных о местонахождении в глобальном масштабе может достигнуть 600 миллиардов долларов в 2020 году. Это большая ценность.

Конечно, сами данные не являются ценными. Ценность заключается в анализе этих данных и в том, как данные преобразуются в информацию и, в конечном итоге, превращаются в знания. Ценность заключается в том, как организации используют эти данные и преобразуют свою организацию в информационную компанию, основывающую свои решения на анализе, полученном в результате анализа данных.

Случаи использования

Знайте, что определение больших данных ясно, давайте рассмотрим различные возможные варианты использования. Конечно, для каждой отрасли и каждого отдельного типа организации возможные варианты использования различаются. Тем не менее, есть несколько общих случаев использования больших наборов данных, которые показывают возможности больших наборов данных для вашей организации.

1. Действительно знать своих клиентов, все они в режиме реального времени.

В прошлом мы использовали фокус-группы и опросы, чтобы выяснить, кто наши клиенты. Когда результаты появлялись, это всегда было устаревшим, и оно было слишком высоким. Для больших данных это больше не нужно. Большие данные позволяют компаниям полностью воспроизводить ДНК своих клиентов. Знание клиента является ключом к эффективным продажам. Преимущества реальных знаний клиентов состоят в том, что вы можете давать рекомендации или показывать объявления, соответствующие вашим индивидуальным потребностям.

2. Создавайте, улучшайте и обновляйте свои продукты в режиме реального времени.

Большой анализ данных может помочь организациям лучше понять, что клиенты думают о своих продуктах или услугах. Прослушивая социальные сети и блоги о том, что люди говорят о продукте, они могут предоставить больше информации по этой теме, чем с помощью традиционной анкеты. Особенно если измерять в реальном времени, компании могут немедленно реагировать на возможные проблемы. Вы можете не только оценить любовь к продуктам, но и то, как они отличаются в разных демографических группах или в разных географических точках в разное время.

3. Определите, насколько велик риск для вашей организации.

Выявление рисков, с которыми сталкивается компания, является важным аспектом современной деятельности. Чтобы определить риск потенциального клиента или поставщика, вы можете создать подробный профиль клиента и поместить его в определенную категорию, каждый со своим собственным уровнем риска. В настоящее время этот процесс часто слишком широк и неоднозначен, и часто покупатель или поставщик попадают в неправильную категорию и, таким образом, получают неправильный профиль риска. Профиль со слишком высоким риском не причиняет вреда, кроме потери дохода, но слишком маленький профиль риска может нанести серьезный вред организации. Благодаря большому количеству данных можно определить категорию риска для каждого отдельного клиента или поставщика на основе всех их прошлых и настоящих данных в режиме реального времени.

4. Персонализация вашего сайта и цены в режиме реального времени по отношению к отдельным клиентам.

В течение нескольких лет компании использовали сплит-тесты и A / B-тесты, чтобы определить лучший макет для своих клиентов в режиме реального времени. С большими данными этот процесс изменится навсегда. Многие различные данные сети могут быть проанализированы непрерывно, в режиме реального времени, а также в сочетании. Благодаря этому компании смогут использовать текучую систему, в которой внешний вид, стиль и компоновка изменяются, отражая множество факторов, влияющих. В этот момент каждому посетителю будет предоставлен сайт, специально адаптированный к его пожеланиям и потребностям. Вернувшийся клиент может увидеть другую страницу неделю или месяц спустя, в зависимости от его личных потребностей на данный момент.

5. Улучшите обслуживание ваших услуг для ваших клиентов.

Благодаря большому количеству данных можно отслеживать машины на большом расстоянии и проверять их работу. Благодаря телематике каждая другая часть машины может контролироваться в режиме реального времени. Данные будут отправлены производителю и сохранены для анализа в реальном времени. Каждая вибрация, шум или ошибка обнаруживаются автоматически, и когда алгоритм обнаруживает отклонение от нормальной работы, вы можете предупредить обслуживающий персонал. Машина может даже автоматически планировать график технического обслуживания, когда устройство не используется. Когда инженер приходит на ремонт машины, он точно знает, что делать из-за всей доступной информации.

6. Найдите новые рынки и новые возможности для бизнеса, объединив свои собственные данные с общедоступными данными.

Компании могут также обнаружить неудовлетворенные потребности клиентов, используя большие наборы данных. Анализируя дизайн и / или регрессионный анализ на ваших собственных данных, вы можете найти потребности и пожелания клиентов, которых вы не знали. Объединение различных наборов данных может дать совершенно новый смысл существующим данным и позволяет организациям находить новые рынки, целевые группы или бизнес-возможности, о которых они не знали раньше.

7. Лучше понять ваших конкурентов и, что еще важнее, обогнать их.

То, что вы можете сделать для своей организации, может быть сделано более или менее для вашего соревнования. Это поможет организациям лучше понять конкуренцию и узнать, где они находятся. Это может обеспечить ценное начало. Используя аналитику больших наборов данных, алгоритмы могут выяснить, например, изменяет ли конкурент свои цены и автоматически корректирует цены, чтобы оставаться конкурентоспособными.

8. Организуйте свой бизнес более эффективно и сэкономьте деньги.

Анализируя все данные в организации, вы можете найти области, которые можно улучшить и которые можно лучше организовать. В частности, индустрия логистики может стать более эффективной благодаря новому большому источнику данных, доступному в цепочке поставок. Электронные бортовые самописцы в грузовиках информируют нас о том, где они находятся, как быстро они едут, где они едут и т. Д. Датчики и радиочастотные метки в прицепах и их распределение помогают повысить эффективность погрузки и разгрузки грузовых автомобилей, объединяя дорожные условия, информацию о дорожной обстановке и погодные условия. в местах расположения клиентов можно значительно сэкономить время и деньги.

Конечно, это всего лишь варианты использования, это лишь малая часть огромной возможности больших наборов данных, но это показывает, что существуют бесконечные возможности для использования больших объемов данных. Каждая организация имеет разные потребности и требует своего подхода на основе больших данных. Правильное использование этих возможностей повысит ценность бизнеса и поможет выделиться на фоне конкурентов.

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *