Что такое большие данные?
Большие данные (big data): это набор данных, которые невозможно захватить, управлять и обрабатывать с помощью обычных программных инструментов в определенный промежуток времени; это требует новой модели обработки, чтобы иметь более сильные возможности для принятия решений, обнаружения инсайтов и оптимизации процессов, является массивным, высоко растущим и разнообразным информационным активом. (Цитата из Baidu Baike)
Большие данные в нашей жизни весьма распространены, например, Taobao может с помощью больших данных вычислить, какие виды товаров продаются больше всего на платформе Taobao каждый день, и в каком регионе в среднем происходит наибольшее количество сделок с товарами каждый день и так далее...
У моего друга есть магазин на ПинСиСи, он с помощью специально разработанного программного обеспечения каждый день выставляет на свой магазин 100 самых продаваемых товаров с платформы ПинСиСи, так как на ПинСиСи открытие личного магазина не ограничено, он выставляет высокие цены и открывает много магазинов для продажи популярных товаров, и его доход может достигать нескольких тысяч юаней в день, это очень практичный аспект больших данных для нас.
Есть ли прямая или косвенная связь между большими данными и блокчейном?
Анализ и извлечение больших данных — это вычисления, требующие значительных распределенных вычислительных мощностей. Управление узлами, планирование задач, отказоустойчивость и высокая надежность — ключевые технологии. Google является представителем такой технологии распределенных вычислений, которая позволяет линейно расширять общую производительность системы за счет добавления узлов серверов, что дает большие преимущества как в стоимости, так и в масштабируемости.
Механизм согласия блокчейна заключается в том, как все распределенные узлы достигают согласия, генерируя и обновляя данные с помощью алгоритмов, чтобы определить действительность записи; это как средство определения, так и средство предотвращения подделки. Блокчейн в основном включает четыре различных механизма согласия, которые подходят для различных сценариев применения, достигая баланса между эффективностью и безопасностью.
Большие данные обычно используются для описания наборов данных, которые достаточно велики и сложны, чтобы их было сложно обрабатывать традиционными методами. Информация, которую может содержать блокчейн, ограничена и далеко от стандарта "больших данных".
Однако технология блокчейн также является специфической технологией базы данных. Благодаря характеристикам децентрализованных баз данных в области безопасности и удобства, многие профессионалы в отрасли ожидают её развития и считают, что это является улучшением и дополнением существующих интернет-технологий. Блокчейн — это чисто распределенная система.
Различия между большими данными и блокчейном
Структурированные vs Неструктурированные: Блокчейн представляет собой строго структурированные блоки, соединенные цепочкой через указатели, типичные для структурированных данных, в то время как большие данные больше всего требуют обработки неструктурированных данных.
Независимость vs Интеграция: Блокчейн-системы для обеспечения безопасности имеют относительно независимую информацию, в то время как большие данные акцентируются на интеграции и анализе информации.
Прямое vs Косвенное: Блокчейн-система сама по себе является базой данных, в то время как большие данные относятся к глубоком анализе и извлечению данных, это косвенные данные.
Математика vs Данные: Блокчейн пытается говорить на языке математики, блокчейн утверждает, что "код — это закон", в то время как большие данные пытаются говорить на языке данных.
Анонимность vs Индивидуальность: Блокчейн анонимен (открытая книга, анонимные владельцы, в отличие от открытых аккаунтов традиционных финансовых учреждений, книга конфиденциальна), в то время как большие данные стремятся к индивидуализации.